第四章 关于基本统计分析.ppt

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
上机作业4 1.自己学习报告分析的各项命令。 2.熟练掌握频次分析、描述性统计分析和探索分析的基本功能和运用技巧。 3.上机练习4,完成第一个统计分析报告。 交叉分组下的频数分析 目的和基本任务 交叉列联表的主要内容 交叉列联表行列变量间关系的分析 交叉分组下的频数分析 针对定类数据和定序数据的频数分析 目的:通过了解不同变量在不同水平下的数据分布情况 ,判断水平对变量是否有影响 例:女生的学习成绩比男生好吗?(两变量) 不同专业的女生学习成绩都比男生好吗? (三变量) 产生交叉列联表 什么是列联表 多个变量在不同取值下的数据分布频数表 列变量 行变量 工商管理 控制变量 频数 性别 成绩 优 良 差 男 女 目的和任务 交叉分组下的频数分析又称列联表分析 两大基本任务: 第一:根据收集到的样本数据编制交叉列联表。 第二:在交叉列联表的基础上,对两两变量间 是否存在一定的相关性进行分析。 交叉列联表的主要内容 交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。 以“数据加工(职工数据).sav”编制一张涉及两变量的二维交叉列联表。反映了不同职称和不同文化程度交叉分组下的职工频数分布情况。 (演示) 任务一 产生交叉列联表 基本操作步骤 (1)菜单选项: analyze-descriptive statistics- crosstabs (2)选择一个变量作为行变量到row框. (3)选择一个变量作为列变量到column框. (4)可选一个或多个变量作为控制变量到layer框. (5)是否显示各分组的条图(display clustered bar charts ) 产生交叉列联表 定距数据可做适当分组后再产生列联表 仅利用频数,信息利用不充分 进一步计算 cells选项:选择在频数分析表中输出各种百分比. row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct); 职称变量称为行变量(row)、文化程度称为列变量(column))。表格中间是观测频数(observed counts)和各种百分比。 交叉列联表的列(行)边缘分布;(文化程度4,4,5,3) 频数数据构成的分布称为交叉列联表的条件分布,即在行变量(列变量)取值条件下的列变量(行变量)的分布。 三维交叉列联表,反映了不同性别和不同职称以及不同文化程度交叉分组下的职工频数分布情况。 分析列联表中变量间的关系 目的: 通过列联表分析,检验行列变量之间是否独立。 方法: 卡方检验:对分类数据的相关性进行度量(这里两变量均为定类数据或定序数据) 任务二 分析列联表中变量间的关系 卡方检验基本步骤 (1)H0:行列变量之间无关联或相互独立 (2)构造卡方统计量 统计量服从(r-1)*(c-1)个自由度的卡方分布 count:观察(实际)频数 expected count:期望频数 (期望频数反映的是H0成立情况下的数据分布特征) 期望频数的分布反映的是行列变量互不相干下的分布,反映了行列变量间的相互独立关系 当观测频数与期望频数的总差值越大时,卡方值也越大,实际分布与期望分布的差距越大,表明行列变量之间越相关; 当总差值越小时,卡方值也越小,实际分布与期望分布越接近,表明行列变量之间越独立 分析列联表中变量间的关系 (3)计算卡方统计量的值,并得到该统计量值的概率P值 (4)决策。概率P与显著性水平比较,小于等于则拒绝H0,否则不能拒绝 实现步骤 statistics选项 cells选项 交叉列表卡方检验的要求 列联表各单元格中期望频数大小的问题: 一般要求列联表中不应有期望频数小于1 ,或小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以采用精确检验。 样本量大小的问题: 卡方值的大小会受到样本量的影响 n=40, T=5, Pearson卡方检验,若P≈α,改用确切概率法检验 n40,或T5, 确切概率法检验 交叉列联表分析 应用举例 以“居民储蓄调查数据”为例,有两个分析目标: 目标一:分析城镇和农村储户对“未来两年内收入状况的变化趋势”是否持相同的态度。 目标二:分析城镇和农村储户对储蓄是否合算的认同是否一致。 分析方法: 利用交叉分组下频数分析来实现 对不同户口状况进行分析: 对不同看法进行分析: 基本描述分析: 多选项分析 什么是多选项问题? (1) 即:在回答某些问题时,答案在两个以上 例如:请问您平时主要的休闲娱乐方式是: a.看电视、听广播 b.玩游戏 c.体育运动 d.逛街购物 e.经常去港澳游玩 f.看书

文档评论(0)

YL20200908 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档