- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据的分析
从总体中抽取样本,收集测定的数据,这些数据总是参差不齐的,即具有散差。我们需要对收集的数据进行整理和分析,然后才能对总体作出推测和判断。
一、数据的种类
数据大体可以分为计量值和计数值二种。所谓计数值数据,是指1,2,3,……这种非连续性取值的数据,如一批产品的不合格品数,缺陷的个数以及工厂的事故发生件数等。把不合格数用全部产品所除得到的不合格率,仍是计数值。而计量值数据,是指一些可以连续取值的数据。如钢材的厚度、抗拉强度,零件的尺寸等测定值都属于计量值数据。
计量值与计数值数据差别,决定了数据所反映的统计的性质不同,进而数据的处理方法也有变化。例如,计量数据属于连续概率分布,最典型的使正态分布;而计数值数据属于离散概率分布,最典型的是二项分布和泊松分布。
二、数据的分布
即时在同样的条件下制造的产品,其质量都会有差别,故我们收集到的数据总是大小不等的,称这种数据的不均一性为具有散差。如果把数据控制在一定的范围哪,数据间的散差就会有某种规律性,我们称之为分布。可以构造频数分布来了解分布状态。
们如下图所示,为某一个样本所反映的频数分布图。(相当于直方图)
16
16
14
12
10
8
6
4
2
0
频度
1.69 1.7 1.71 1.72 1.73 1.74 1.75
16
16
14
12
10
8
6
4
2
0
频度
1.69 1.7 1.71 1.72 1.73 1.74 1.75
从两个图可以看出两个分布的不同,也很容易看出两个样本的差别,进而反映了总体的分布状况。
三、数据分布的定量表示
上面的频数直方图,可以用来观察数据的大致离散情况即分布的形状,但是得不到数量方面的信息。特别是比较两个以上的分布时,尽管可以凭视觉观察出分布状态上的差异,却不能定量地求出他们的差别。如果能把分布状态的特性予以数量化,就便于比较。一般需要有表示数据整体即分布中心位臵(中心趋向)和离散程度的尺度。前者可以用平均值,后者可以用标准偏差。有时,还需要从数量上表示分布状态的偏斜程度(可用偏斜度)以及表示分布峰顶的陡峭程度(可用陡度)
1.中心位臵的表示
表示中心位臵的量有平均值、中位值、最多值、中值以及众数等。最常使用平均值。平均值:各个测定值的总和除以测定值的个数,称为平均值(算术平均值),用表示X。
计算分式为:
x?x???xx? 1 2 n
n
??n x
i
i?1
中位值:将测定值按大小顺序排列,位居正中的那个数值称为中位值。若测定值的个数为奇数,则中位值为居于中央位臵的那个数值;若测定值的个数为偶数,则中位值为中间两个数的平均值。
中值M:测定值的最大值和最小值的平均值,称为中值。2、散差的表示
极差(range)R
测定值的最大值和最小值之差为极差,用R表示。通常,当测定个数n小于10的场合,用极差R表示离散程度;而当n大于10时,则用标准偏差s表示离散程度。
偏差的平方和(sumofsquares)S
各个测定值与平均值之差称为偏差。各测定值的偏差的平方和称为偏差平方和,简称平方和,用S表示。设各个测定值与为X,X,……X,其平均值为:
x??n
i?1
则:
x/n
i
1 2 n
?n
s?(x
1?
x)2
(x
2
?x)2
???(x
n
?x)2?
i?1
(x?x)2
i
??n
x2?nx2
i
??n
x2?(?n
i
2
x) /n
i
i?1 i?1 i?1
无偏方差(unbiasedvariance)S2
各个测定值的偏差平方和除以(n-1)后,所得到的值称为无偏方差(简称为差),用S2
表示,其中n为测定值个数,由S的计算公式可以得到S2的公式为:
S 1 ?n
S2?
n?1?
n?1
i?1
(x?x)2
i
方差的单位为测定值单位的平方。
标准偏差(Standarddeviation)s
方差S2的平方根称为标准偏差(简称标准差),s表示,标准差s的单位与测定值的单位相同,标准差的公式为:
S2Sn?11n?
S2
S
n?1
1
n?1
?n
i?1
(x?x)2
i
附录:
方差的含义
标准偏差是测量由于取样引起的估计的可变性。它指出样本估计的可变性,它可以从所有已知设计和规模的样本中获得。标准偏差用来测量从一组特定样本得到的数据的精确度。如果所有可能的样本都在类似的条件下接受调查,标准偏差在+1.96到-1.96的范围内的概率分布包括了95%的样品的情况,这个区间被成作是95%臵信区间.
测定值3.723.613.573.51
测定值
3.72
您可能关注的文档
- 品管圈常用表格.docx
- 品管圈会议记录.docx
- 品管圈会议记录1.docx
- 品管圈活动对提高稳定期COPD患者肺康复锻炼的依从性.docx
- 品牌部岗位设置.docx
- 品牌传播的要素.docx
- 品牌服装网代理协议书范本.docx
- 品牌顾问合同书.docx
- 品牌管理教学大纲.docx
- 品牌广告部部长工作流程图DOC.docx
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)