课件含预备知识随机样本.pptxVIP

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数理统计与随机过程;统计可以做什么?;由于大量随机现象必然呈现出其规律性,因而从理论上讲,只要对随机现象进行足够多次的观察,随机现象的规律性就一定能够清楚地呈现出来。;数理统计的任务就是研究:;数理统计不同于一般的资料统计;

它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。;数理统计中的方法和支持这些方法的相应理论相当丰富,其中最基本、最主要的是两大类:;;§6.1随机样本—总体与样本;实际上,我们真正关心的并不一定是总体或个体本身,而真正关心的是总体或个体的某项数量指标。

如:某电子产品的使用寿命;

某天的最高气温;

加工出来的某零件长度等数量指标。

因此,有时也将总体理解为那些研究对象的某项数量指标的全体。;为评价某种产品质量的好坏,通常的做法是:

样本:——从全部产品中随机(任意)地抽取一些样品进行观测(检测),统计学上称这些样品为一个样本。

同样,我们也将样本的数量指标称为样本。

因此,今后当说到总体及样本时,既指研究对象本身又指它们的数量指标。;例6.1.1研究某地区N个农户的年收人。

在这里,总体既指这N个农户,又指我们所关心的N个农户的数量指标──他们的年收入(N个数字)。

如果从这N个农户中随机地抽出n个农户作为调查对象,那么,这n个农户以及他们的数量指标──年收入(n个数字)就是样本。;例6.1.2用一把尺子测量一件物体的长度。

假定n次测量值分别为X1,X2,…,Xn.

显然,该问题中,我们把测量值X1,X2,…,Xn看成样本,但总体是什么呢?;又如:研究某种安眠药的药效。

让n个病人同时服用这种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数X1,X2,…,Xn,

则这些数字就是样本。;对一个总体,如果用X表示其数量指标,那么,X的值对不同的个体就取不同的值。因此,如果我们随机地抽取个体,则X的值就随抽取个体的不同而不同。所以,X是一个随机变量。

既然总体是随机变量X,自然就有其概率分布。我们把X的分布称为总体分布。

总体的特性是由总体分布来刻画的。因此,常把总体和总体分布视为同义语。;例6.1.3(例6.1.l续)

在例6.1.l中,若农户年收入以万元计,假定N户的收入X只取以下各值:0.5,0.8,l.0,1.2和1.5。取上述值的户数分别n1,n2,n3,n4和n5(n1+n2+n3+n4+n5=N)。则X为离散型随机变量,概率分布为:;例6.1.4(例6.1.2续)

在例6.1.2中,假定物体真实长度为?(未知)。一般说来,测量值X就是总体,它取?附近值的概率要大一些,而离?越远的值被取到的概率就越小。

如果测量过程没有系统性误差,则X取大于?和小于?的概率也会相等。

在这种情况下,人们往往认为X服从均值为?,方差为?2的正态分布。?2反映了测量的精度。于是,总体X的分布为N(?,?2)。;说明:这里有一个问题。

即物体长度的测量值总是在其真值?的附近,它不可能取负值。而正态分布取值在(-∞,∞)上。那么,怎么可能认为测量值X服从正态分布呢???

回答这个问题,有如下两方面的理由:;(1)前面已讲过,对于X~N(?,?2),有

P{?-3?X?+3?}=0.9974.

理由:

查表:

(注意:要会查表);例如:假定物体长度?=10厘米,测量误差为0.01厘米,则?2=0.012。

这时,(?-3?,?+3?)=(9.97,10.03)。于是,测量值落在这个区间之外的概率最多只有0.003,可忽略不计。;如若不然,就需要用一个定义在有限区间(a,b)内取值的随机变量X来描述测量值。那么,a和b到底取什么值呢?测量者事先很难确定。

再退一步,即使能够确定出a和b,却仍很难找出一个定义在(a,b)上的非均匀分布用来恰当地描述测量值。

与其这样,还不如干脆就把取值区间放大到(-∞,∞),并用正态分布来描述测量值。这样,既简化了问题,又不致引起较大的误差。;●如果总体所包含的个体数量是有限的,则称

该总体为有限总体。

有限总体的分布显然是离散型的,

文档评论(0)

ericxiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档