统计学第一章作业.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 描述性统计 某生产车间 50 名工人日加工零件数如下(单位:个) 。试在 minitabe 下画直方图 ,并分析数据特征。 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121 15 均值 123.0 标准差 8.027 12 N 50 9 频数(人) 6 3 105 110 115 120 125 130 135 140 日加工零件数 某生产车间 5 0 名工人日加工零件数 1.给数据排序 2.拿数据最大值减最小值,确定组数 3.由于组距一般为 5 或 10,因此确定组距为 5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。 数据特征:大多数人的日加工零件数在 120 到 125 之间。 2. 为了了解车间加工零件误差与原材料供应商以及工人的关系, 收集如下数据,试画多元箱线图展示该数据并进行分析 原材料供 员工编号 应商 1 2 3 4 5 6 7 甲 0.379 0.331 0.259 0.233 0.223 0.289 0.396 甲 0.400 0.305 0.277 0.231 0.434 0.475 0.329 乙 0.267 0.325 0.299 0.372 0.157 0.257 0.399 乙 0.098 0.617 0.236 0.219 0.305 0.212 0.334 丙 0.266 0.451 0.304 0.423 0.274 0.299 0.173 丙 0.299 0.546 0.392 0.434 0.312 0.318 0.218 丁 0.122 0.342 0.176 0.242 0.427 0.265 0.136 丁 0.248 0.258 0.269 0.172 0.303 0.390 0.034 6 5 4 3 2 1 0 甲 乙 丙 丁 原材料供应商的箱线图 6 5 4 3 2 1 0 员工 1 员工 2 员工 3 员工 4 员工 5 员工 6 员工 7 名工人的的箱线图 由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大, 但从工人的箱线图看出, 工人的数据起伏波动较大, 尤其是工人 2 的数据,跟其 他工人的数据相比有很大的差异, 因此原材料供应商对加工零部件误差的影响要 小于工人对加工零部件的影响。 甲乙两个班各有 40 名学生,期末统计学考试成绩的分布如下: 考试成 人数 绩 甲班 乙班 优 3 6 良 6 15 中 18 9 及格 9 8 不及格 4 2 1)根据上面的数据, 在 Excel 中画出两个班考试成绩的复合柱形图、 环形图和图饼图。 (2)比较两个班考试成绩分布的特点。 3)在 Excel 中画出雷达图,比较两个班考试成绩的分布是否相似。 1) 2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。 3) 从上图可知,甲乙两班考试成绩的分布不相似。 随机抽取 25 个网络用户,得到他们的年龄数据(单位:周岁)如下: 15 16 17 18 19 19 19 20 20 21 22 22 网民年龄 23 23 24 24 25 27 29 30 31 34 38 23 1) 计算众数、中位数。(exlce 数据分析:众数 19,中位数 22.5) 2) 根据定义公式计算四分位数(上四分位数的位置为 3( 24+1) /4=18.75,所以上四分位数是 26.5 ,下四分位数的位置是( 24+1)/4=6.25,所以下四分位数是 19)。 3) 计算平均数和标准差(平均数是 23.29,标准差是 5.75)。 4) 计算偏态系数和峰态系数(偏态系数是 0.93,峰度系数是 0.59)。 5) 对网民年龄的分布特征进行综合分析。 (根据以上的分析得出, 网民的年龄主要集中在 19 岁,偏态系数大于 0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数, 峰态系数大于 0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。 ) 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列; 另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短, 两种排队方式各随机 抽取的 9 名顾客,得到第一中排队方式的平均等

文档评论(0)

zdq6737 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档