- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 描述性统计
某生产车间 50 名工人日加工零件数如下(单位:个) 。试在 minitabe 下画直方图 ,并分析数据特征。
117
122
124
129
139
107
117
130
122
125
108
131
125
117
122
133
126
122
118
108
110
118
123
126
133
134
127
123
118
112
112
134
127
123
119
113
120
123
127
135
137
114
120
128
124
115
139
128
124
121
15
均值
123.0
标准差
8.027
12
N
50
9
频数(人)
6
3
105
110
115
120
125
130
135
140
日加工零件数
某生产车间
5 0 名工人日加工零件数
1.给数据排序 2.拿数据最大值减最小值,确定组数 3.由于组距一般为 5 或 10,因此确定组距为 5 4.计算频数 5.绘制直方图,再编辑横轴和纵轴的区间。
数据特征:大多数人的日加工零件数在 120 到 125 之间。
2. 为了了解车间加工零件误差与原材料供应商以及工人的关系, 收集如下数据,试画多元箱线图展示该数据并进行分析
原材料供
员工编号
应商
1
2
3
4
5
6
7
甲
0.379
0.331
0.259
0.233
0.223
0.289
0.396
甲
0.400
0.305
0.277
0.231
0.434
0.475
0.329
乙
0.267
0.325
0.299
0.372
0.157
0.257
0.399
乙
0.098
0.617
0.236
0.219
0.305
0.212
0.334
丙
0.266
0.451
0.304
0.423
0.274
0.299
0.173
丙
0.299
0.546
0.392
0.434
0.312
0.318
0.218
丁
0.122
0.342
0.176
0.242
0.427
0.265
0.136
丁
0.248
0.258
0.269
0.172
0.303
0.390
0.034
6
5
4
3
2
1
0
甲 乙 丙 丁
原材料供应商的箱线图
6
5
4
3
2
1
0
员工 1 员工 2 员工 3 员工 4 员工 5 员工 6 员工 7
名工人的的箱线图
由原材料供应商的箱线图可知,原材料供应商的数据比较集中,差距不大,
但从工人的箱线图看出, 工人的数据起伏波动较大, 尤其是工人 2 的数据,跟其
他工人的数据相比有很大的差异, 因此原材料供应商对加工零部件误差的影响要
小于工人对加工零部件的影响。
甲乙两个班各有 40 名学生,期末统计学考试成绩的分布如下:
考试成
人数
绩
甲班
乙班
优
3
6
良
6
15
中
18
9
及格
9
8
不及格
4
2
1)根据上面的数据, 在 Excel 中画出两个班考试成绩的复合柱形图、 环形图和图饼图。
(2)比较两个班考试成绩分布的特点。
3)在 Excel 中画出雷达图,比较两个班考试成绩的分布是否相似。
1)
2)从上面的图标可以看出,甲班同学的考试成绩主要分布在中,乙班同学的考试成绩主要分布在良。甲班的不及格人数比乙班的不及格人数多。
3)
从上图可知,甲乙两班考试成绩的分布不相似。
随机抽取 25 个网络用户,得到他们的年龄数据(单位:周岁)如下:
15
16
17
18
19
19
19
20
20
21
22
22
网民年龄
23
23
24
24
25
27
29
30
31
34
38
23
1) 计算众数、中位数。(exlce 数据分析:众数 19,中位数 22.5)
2) 根据定义公式计算四分位数(上四分位数的位置为 3( 24+1) /4=18.75,所以上四分位数是 26.5 ,下四分位数的位置是( 24+1)/4=6.25,所以下四分位数是 19)。
3) 计算平均数和标准差(平均数是 23.29,标准差是 5.75)。
4) 计算偏态系数和峰态系数(偏态系数是 0.93,峰度系数是 0.59)。
5) 对网民年龄的分布特征进行综合分析。 (根据以上的分析得出, 网民的年龄主要集中在 19 岁,偏态系数大于 0,说明网民的年龄分布呈现右偏分布,即年龄较小的网民占绝大多数, 峰态系数大于 0,说明网民的年龄分布为尖峰分布,表明年龄较小的网民占较大比重。 )
某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列; 另一种是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短, 两种排队方式各随机
抽取的 9 名顾客,得到第一中排队方式的平均等
您可能关注的文档
最近下载
- 安徽省合肥市瑶海区2022-2023学年九年级上学期期中考试英语试题 .docx VIP
- 2025年一建一级建造师项目管理考点重点知识总计中范围预测记忆笔记.pdf
- 2024北师大版四年级下册数学全册教案.pdf VIP
- [疾病的隐喻].桑塔格(大全).pdf
- 《军事理论》考试题库大全(含各章节)-共600多题.docx
- AI助力教育创造性学习的未来.pptx
- YB∕T 4001.3-2020- 钢格栅板及配套件 第3部分:钢格板楼梯踏板.pdf
- 国家开发银行招聘考试真题汇编.docx
- 括号里最大能填几基础训练一.pdf VIP
- 党课PPT课件含讲稿:二十届三中全会解读人才自主培养机制造就高水平创新型人才队伍.pptx VIP
文档评论(0)