统计学基础.docVIP

下载本文档

9
0
约 11页
2017-02-11 发布于天津
举报
版权申诉

统计学基础.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计学基础

統計學基礎統計學是指搜集、整理及分析解釋資料，並藉科學的統計推論方法，在不確定的情況下，由樣本資料所獲得的結果，來推論母體的特性，從而做出適切決策的一門學科。 1.母體、樣本與隨機變數統計學中，把所研究對象的全體稱為母體，母體中的每個元素稱為個體，母體中個體的數目稱為母體總量，以N表示。N可以是有限的，也可以是無限的，對應的母體分別稱為有限母體和無限母體，當N很大時，有限母體可以近似地看作無限母體。由母體中的若干個體組成的集合稱為一個樣本，樣本中個體的數目稱為樣本數量，用n表示。樣本是母體的子集。根據樣本的信息來推測母體的情況，並給出這個推測的可靠程度，稱為統計推論。統計推論要求從母體中抽取樣本需滿足隨機原則，及抽樣時母體中的每個個體都有相同的機會成為樣本中的元素。如果每次抽取一個個體不放回去，再抽取第二個個體，連續抽許n次，稱為不重複抽樣；如果每次抽取一個個體又放回去，再抽取第二個個體，連續抽取n次，稱為重複抽樣。對無限母體，不重複抽樣定價於重複抽樣，當N很大時，不重複抽樣則近似於重複抽樣。隨機實驗是一種過程(process)，是一種不能確定預知會發生何種結果的實驗方式。在實驗前已知所有可能出現的結果，而實驗後的結果為所有可能結果之一，但實驗前並未能確定的、肯定的預知會出現何種結果。隨機實驗可重複進行，而經過長期重複實驗，出現的結果會遵循某些規則。有些隨機實驗的結果會產生某些數值，如擲一定骰子，其結果為1,2,3,4,5,6。另外有些隨機實驗的結果卻是出現一些文字、符號。例如擲銅板，其結果不是正面，就是反面。另銅板出現正面的次數為X，則擲2枚銅板出現正面次數為X=0,1,2。當X=2時，表示2枚銅板都出現正面。這個X就是所謂的隨機變數(random variable)。換句話說，隨機變數(X)是隨機實驗結果的數值表現。以上所述即是間斷的隨機變數，間斷隨機變數是隨機實驗中對應樣本點的實數值函數。間斷隨機變數的機率分配是討論那些隨機變數的個數有限或個數無限但可數的隨機變數。然而，很多的隨機變數是不可數的，例如薪資、銷貨收入、飲料容量、商品價格、時間、溫度等，其數值介於某一區間，而在此區間內的數值是無限的，不可數的。對於這樣的隨機變數，我們不能像處理間斷隨機變數那樣，列出它們的每一個隨機變數及其相對應的機率，因為在一個樣本點無限多且不可數的連續樣本空間，任一點的機率為零，其樣本空間的樣本點是密接的，其機率是以一個區間的面積來表示，這種隨機變數即是所謂的連續隨機變數。 2.母體分布的數字特徵-------參數母體分布是由它的某些數字特徵決定的，稱之為參數，用θ等表示。常用的參數有兩個。期望值期望值也稱做均值，他表示母體的平均水平，記為μ或E(?)。離散型隨機變數的期望值定義為=，連續型隨機變數的期望值定義為=。期望值滿足：若a為常數，則=a；若為隨機變數，a、b為常數，則若為相互獨立的隨機變數， (2) 變方變方表示母體相對均值的離散程度，記為或，定義為。由期望值的性質他等於。變方滿足：若a為常數，則Var(a)=0；若為相互獨立的隨機變數，a、b為常數，則稱為母體標準差，它與母體的觀察值有相同的量測單位。顯然，參數不是隨機變數。 3.樣本分布的數字特徵-----統計量樣本分布的數字特徵稱為統計量。常用的統計量有以下兩種。樣本平均數樣本平均數表示樣本的平均水平。若為一個樣本，其樣本平均值定義為。樣本變方樣本變方表示樣本相對其樣本平均數的離散程度，定義為，它等於。稱為樣本標準差，它與樣本觀測值有相同的量測單位。顯然，由不同的樣本可以得到不同的樣本平均數的樣本變方，因此統計量是隨機變數。可以證明，。 4.重要的連續型隨機變數的分布若隨機變數的密度函數，其中為常數，0，則稱服從常態分布，記為。當時，為標準化常態分布，記為。常態分布在統計中具有重要的理論和實用意義，現實世界中的許多隨機現象都服從或近似服從常態分布；隨著樣本量的增大，很多統計量近似於常態分布；許多離散型隨機變數可用常態分布來逼近。可以證明，證常態分布滿足： (1)； (2)若隨機變數相互獨立，不全為0，則； (3)若，則。 5.抽樣分布如果母體為常態分布，我們可以算出一些重要統計量的抽樣分布，這些精確的抽樣分布為常態母體參數估計和檢定提供了理論架構。以下為在統計學中佔有重要地位的三大分布：分布、.t分布及.F分布。 1. 分布若為服從N(0,1)的常態母體的樣本，則稱為服從n個自由度的分布，記為。分布滿足： (1) ； (2)若隨機變數相互獨立，，則，其中； (3)若隨機變數相互獨立，，則。 2. t分布若隨機變數，，互相獨立，則稱為服從自由度為n的t分布，記為t~t〈n〉。可以證明：隨著n的增加而減少，，當n3