- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS 缺失值等.doc
1 数据的采集、录入阶段数据产生差错的原因1. 1 被试差错 多见于自陈式问卷调查中. 如: 由于社会赞许等原因导致被试对某问题不能真实回答从而造成数据偏态; 由于敏感的问题导致被试拒绝回答从而造成数据不全.1. 2 仪器差错 多见于使用心理测评仪进行测量的时候.1. 3 主试差错 由于心理学数据常常非常庞大, 因此在数据录入时难免出错; 另外数据在文本文件、EXCEL、ACCESS、SPSS 等不同格式、不同版本之间转换时, 在心理测评仪向计算机传输数据时也常会发生错行、乱码等错误[1 ].
2 数据的检查与筛选 保证数据准确的最好方法是将原始数据与计算机所呈现的数据清单进行核对. 但对庞大的数据这几乎是不可能的. 这时就需要应用描述性统计量和统计图来进行筛选和检测. 最重要的是解决三个问题: 所有的数据都在允许的范围内吗? 平均数和标准差都比较合理吗? 有无超出取值范围的数据?
2. 1 缺失值(missing values)? 缺失值是数据分析中一个非常常见的现象, 出现的主要原因有: 设备故障、拒绝回答、测验时走神等, 对此应:
2. 1. 1 缺失值的检测SPSS 默认缺失值以黑点表示, 可以通过快速浏览数据列表(data view ) 发现, 记录下缺失值所在的变量即数据的列.
2. 1. 2 对缺失值的处理(1) 剔除有缺失值的观测单位, 即删除SPSS 数据列表中缺失值所在的数据行; 在SPSS 的统计分析程序中, 打开options 按钮, 便会出现缺失值的处理栏(missing values) , 可分别选择下列选项: exclude cases analysis by analysis (剔除正在分析的变量中带缺失值的观察单位) ; exclude case list wise (剔除所有分析变量中带缺失值的观察单位) ; (2) 对缺失值进行估计后补上. 主要有两种方法:一是根据文献报道等知识经验进行估计; 二是用SPSS 提供的工具进行估计. 在“transform ”菜单下的“replace missingvalues”列出了5 种替代的方法: (a) series mean: 以列的算术平均值进行替代; (b)mean of nearly point: 以缺失值邻近点的算术平均值进行替代; (c)Median of nearly point: 以缺失值临近点的中位数替代; (d) linear interpolation: 根据缺失值前后的2 个观察值进行线性内查法估计和替代; (e) linear trend atpoint: 用线形回归法进行估计和替代; (3)将缺失值作为常数值, 如: 作为“0”.
2. 2 奇异值(outliers) 和极端值(extreme values) 奇异值和极端值是指各变量中与整体数据相距太远的极值, 由于它的夸大作用, 常常会歪曲统计结果, 导致犯一类和二类错误. 通常有四种原因可导致奇异值的出现: (1) 数据输入时出错; (2)在不同数据格式之间进行转换时,缺失值处的数码代号被当成了实际观测值; (3) 出现奇异值的样本并非属于所要考察的总体; (4) 考察的样本相对于正态分布有比较多的极值.2. 2. 1 奇异值和极端值的检测 用柱状图箱丝图、茎叶图、正态检验的Q 2Q 图等检测有无极端值和奇异值.以箱丝图为例箱丝图中都标有奇异值的行号, 看不清时可拖动边框将箱丝图放大查看.
2. 2. 2 减少奇异值和极端值影响的方法 (1) 将奇异值和极端值作为缺失值处理: 在“variable view ”视图中点击“missing”栏下含有奇异值和极端值的变量, 弹出“missingvalues”对话框, 有3个选项可以使用: (a)“discrete missingvalues”最多可以指定3个数值为缺失值, (b)“range of missing values”指定某一取值范围内的数值为缺失值; (c)“rangeplus one op t ional discrete missing”指定某一取值范围和某一特定数值为缺失值; (2) 根据检测的奇异值和极端值, 用“data? select cases”工具中的“if??”对数据的取值范围进行限定,然后再进行统计分析; (3) 对奇异值进行估计. 方法同缺失值的估计; (4) 将原始数据转换成标准Z 分数 或进行其他的转换后再进行统计分析; (5) 删除奇异值所在的观察单位.
2. 3 统计分析前的假设检验 许多统计检验都需要样本数据服从正态分布, 并且相关联的变量之间应方差齐同. 若不符合上述条件便应进行数据
文档评论(0)