SPSS 缺失值等.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS 缺失值等.doc

1 数据的采集、录入阶段数据产生差错的原因 1. 1 被试差错 多见于自陈式问卷调查中. 如: 由于社会赞 许等原因导致被试对某问题不能真实回答从而造成数据偏 态; 由于敏感的问题导致被试拒绝回答从而造成数据不全. 1. 2 仪器差错 多见于使用心理测评仪进行测量的时候. 1. 3 主试差错 由于心理学数据常常非常庞大, 因此在数据 录入时难免出错; 另外数据在文本文件、EXCEL、ACCESS、 SPSS 等不同格式、不同版本之间转换时, 在心理测评仪向计算机传输数据时也常会发生错行、乱码等错误[1 ]. 2 数据的检查与筛选 保证数据准确的最好方法是将原始 数据与计算机所呈现的数据清单进行核对. 但对庞大的数据 这几乎是不可能的. 这时就需要应用描述性统计量和统计图 来进行筛选和检测. 最重要的是解决三个问题: 所有的数据 都在允许的范围内吗? 平均数和标准差都比较合理吗? 有无超 出取值范围的数据? 2. 1 缺失值(missing values)? 缺失值是数据分析中一个非 常常见的现象, 出现的主要原因有: 设备故障、拒绝回答、测验 时走神等, 对此应: 2. 1. 1 缺失值的检测SPSS 默认缺失值以黑点表示, 可以 通过快速浏览数据列表(data view ) 发现, 记录下缺失值所在 的变量即数据的列. 2. 1. 2 对缺失值的处理(1) 剔除有缺失值的观测单位, 即 删除SPSS 数据列表中缺失值所在的数据行; 在SPSS 的统计 分析程序中, 打开options 按钮, 便会出现缺失值的处理栏 (missing values) , 可分别选择下列选项: exclude cases analysis by analysis (剔除正在分析的变量中带缺失值的观察单 位) ; exclude case list wise (剔除所有分析变量中带缺失值的 观察单位) ; (2) 对缺失值进行估计后补上. 主要有两种方法: 一是根据文献报道等知识经验进行估计; 二是用SPSS 提供 的工具进行估计. 在“transform ”菜单下的“replace missing values”列出了5 种替代的方法: (a) series mean: 以列的算术 平均值进行替代; (b)mean of nearly point: 以缺失值邻近点的 算术平均值进行替代; (c)Median of nearly point: 以缺失值临 近点的中位数替代; (d) linear interpolation: 根据缺失值前后 的2 个观察值进行线性内查法估计和替代; (e) linear trend at point: 用线形回归法进行估计和替代; (3)将缺失值作为常数值, 如: 作为“0”. 2. 2 奇异值(outliers) 和极端值(extreme values)  奇异值和极端值是指各变量中与整体数据相距太远的极值, 由于它的 夸大作用, 常常会歪曲统计结果, 导致犯一类和二类错误. 通 常有四种原因可导致奇异值的出现: (1) 数据输入时出错; (2) 在不同数据格式之间进行转换时,缺失值处的数码代号被当 成了实际观测值; (3) 出现奇异值的样本并非属于所要考察的 总体; (4) 考察的样本相对于正态分布有比较多的极值. 2. 2. 1 奇异值和极端值的检测 用柱状图箱丝图、茎叶图、 正态检验的Q 2Q 图等检测有无极端值和奇异值.以箱丝图为 例箱丝图中都标有奇异值的行号, 看不清时可拖动边框将箱丝图放大查看. 2. 2. 2 减少奇异值和极端值影响的方法 (1) 将奇异值和极端值作为缺失值处理: 在“variable view ”视图中点击 “missing”栏下含有奇异值和极端值的变量, 弹出“missing values”对话框, 有3个选项可以使用: (a)“discrete missing values”最多可以指定3个数值为缺失值, (b)“range of missing values”指定某一取值范围内的数值为缺失值; (c)“range plus one op t ional discrete missing”指定某一取值范围和某一特定数值为缺失值; (2) 根据检测的奇异值和极端值, 用“data ? select cases”工具中的“if??”对数据的取值范围进行限定, 然后再进行统计分析; (3) 对奇异值进行估计. 方法同缺失值 的估计; (4) 将原始数据转换成标准Z 分数 或进行其他 的转换后再进行统计分析; (5) 删除奇异值所在的观察单位. 2. 3 统计分析前的假设检验 许多统计检验都需要样本数 据服从正态分布, 并且相关联的变量之间应方差齐同. 若不 符合上述条件便应进行数据

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档