第四章基本统计分析.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 SPSS的基本统计分析 SPSS的基本统计分析 频数分析 目的 粗略把握变量的总体分布状况。 例: 对某个问题的总体看法,如新业务的使用愿望、教学效果等 对某事物的客观描述,如通话的漫游类型、大客户的行业分布 采用的方法 制作频数分布表:包括计算 频数、累计频数、百分比、累计百分比 绘制统计图形:条形图(品质数据)、饼图、 直方图(数量数据) 频数分析 基本操作步骤 (1)菜单选项:Analyze-Descriptive Statistics-Frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形 例:班级男女生频数分布表、成绩分布表 计算描述统计量 目的 精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。 基本方法 计算基本描述统计量 计算描述统计量 描述集中趋势的统计量 均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。 适用于定距数据。 特点:利用了全部数据,易受极端值的影响。 描述离散程度的统计量 标准差(standard deviation--Std Dev):表示某变量的所有变量值离散趋势的统计量。 SPSS中计算的是样本标准差。 方差(variance):标准差的平方。 SPSS中计算的是样本方差。 极差 (range):最大值(minimum)-最小值(minimum) 计算描述统计量 描述对称程度的统计量 偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量. 偏度为0表示对称; 大于0表示正偏差大(右偏),众数比均值小,极值大于均值; 小于0表示负偏差大(左偏)。 计算描述统计量 描述陡峭程度的统计量 峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。 峭度为0表示与正态分布峭度相同。 大于0表示比正态分布陡,尖峰。 小于0表示比正态分布缓;平峰。 计算描述统计量 其他统计量 均值标准误差(S.E means) 中心极限定理认为:样本均值~N(u,?2/n) 反映样本均值与总体真值间的平均离散程度 样本数越大,样本均值的离散程度越小,对真值的估计越准确 计算描述统计量 基本操作步骤 (1)菜单选项:Analyze-Descriptive Statistics -Descripive (2)选择将参加计算的数值型变量名到Variables框。 ——仅适用于数值型变量 分析比较男生和女生的学习成绩 比较集中趋势 比较离散趋势 比较偏斜程度 比较陡峭程度 实现方式:数据拆分 计算描述统计量 其他功能 数据标准化处理 新变量的均值为0,标准差为1; 小于0表示在平均水平下,大于0反之. 正态分布的数据标准化后呈标准正态分布(68%,95%,99%) save standardized values as variables选项 将变量作标准化后,结果存入名为“Z+原变量名”的新变量中. 数据标准化处理应用举例 快速找到移动话费出众的客户 网通集团企业效益评价 探索性描述分析 目的:在未知数据分布特点情况下,通过计算详尽描述统计量,辅助全面的统计图,认识数据分布。 基本操作步骤 (1)菜单选项:analyze-descriptive statistics-Explore (2)选择将参加计算的数值型变量名到Dependent list框 (3)进行分组描述分析时,将分组变量选入Fact list框 描述统计量: M统计量:集中趋势的估计值,不受极端值影响。用于判断有无异常值。 探索性描述分析 相关图形 箱线图 茎叶图 直方图 正态分布图:检验变量是否符合正态分布 方差齐性检验:各组离散程度是否相同 H0:方差相等 举例:两班学生成绩分布情况,离散程度是否相同。 交叉分组下的频数分析 针对定类数据和定序数据的频数分析(用于定类定序数据分析有custom table\logistic\loglinear) 目的:通过了解不同变量在不同水平下的数据分布情况 ,判断水平对变量是否有影响 例:女生的学习成绩比男生好吗?(两变量) 不同专业的女生学习成绩都比男生好吗? (三变量) 分析的主要步骤 产生交叉列联表 分析列联表中变量间的关系 产生交叉列联表 产生交叉列联表 基本操作步骤 (1)菜单选项: analyze-descriptive statistics- crosstabs (2)选择一个变量作为行变量到row框. (3)选择一个变量作为列变量到column框. (4)可选一个或多个变量作为控制变量到layer框. (5)是否显示各分组的条图(display clustered bar charts )

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档