- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
母数的估计步骤
母數估計之步驟
(Estimation Procedures)
本單元目標:
說明估計的邏輯以及樣本、抽樣分配與母群體的角色。
定義及解釋偏誤(bias)與有效性(efficiency)的概念。
建構及解釋樣本平均數與樣本比例之信賴區間(confidence intervals)。
說明信賴水準(confidence level)、樣本大小,及信賴區間之間的關係。
前言
在了解了抽樣分配(sampling distribution)的概念及其兩個重要定理後,我們即可從事推論統計兩大任務之一:母數(parameters)估計的方法有兩種:一為點估計(a point estimate),如果您做了一個民意調查後,報告說全部選民中有42%的人會投給某候選人,此即為點估計的例子(就是估計有42%選民會投給此人)。另一為區間估計(an interval estimate)。如果您報告說大約有「39%到45%的選民」會投給某人,就是一種區間估計之例子。
、偏誤Bias)與有效性(Efficiency)
不論是點估計或區間估計,我們都是用樣本統計(sample statistics)來做為推估母數之估計數(estimators),那麼在我們目前所學的諸多統計中,那一項是可用來當估計數呢?問此問題是因做為一個「好」的估計數要有兩大特性,一即為不偏性(unbiased),另一為具有相當有效性(efficiency)。
Bias 一個不偏的(unbiased)估計數是「若且唯若」(if and only if),此估計數(即樣本統計)之「抽樣分配」的平均數(mean)是與(此估計數所要推估之)母數相等。如我們已學到,算術平均數()是一種具有此不偏性的,因為(樣本平均數)之抽樣分配之平均數(或μ )即為μ(母群體之平均數)。 其次,我們已學到的樣本比例(proportion)也是有此特性,即Ps (樣本比例)之抽樣分配的平均數,μp,等於母群體之比例,Pμ。 要求一估計數有不偏性,最主要的理由是和此估計數之抽樣分配的特性有關。以樣本之平均數()為例,其抽樣分配為一常態分配(為什麼?),且此分配之平均數為μ。因此,我們可知約有68%的樣本平均數是在μ ± 1σ的範圍內(見圖一),以此類推。σ的範圍內σ的範圍內σ是多少?)
圖一 樣本平均數之抽樣分配各種面積
μ-3σ μ-2σ μ-1σ μ=μ μ+1σ μ+2σ μ+3σ
(相對應於Z scores的樣本平均數)
Efficiency ─
所謂一個估計要有相當好的有效性(efficiency),是說此估計數之抽樣分配之標準差要小,也就是說所有可能的此種樣本估計數應要集中在抽樣分配之平均數(即母數)附近。如我們已學到的,樣本平均數()之抽樣分配的標準差(σ)是等於。由此公式可知,此σ之值和成反比,所以要σ小,就要增加N的數目。(要注意的是當N以某種倍數增加時,σ不是以同樣倍數減少,為什麼?)
、估計之步驟
點估計之步驟是相當簡單的,你只要確定樣本是以EPSEM抽樣方法取得的後,求得樣本之平均數或比例此樣本平均數或比例,即可推論母群體之平均數或比例和樣本是一樣的要注意的是,不論抽樣方法如何嚴謹,樣本不論多大,估計數永遠有可能是非常不準的。 相對於點估計而言,區間估計是較保險之估計法,因為我們是在推論母數是在某個範圍內區間估計之建立有以下幾個步驟: 1、首先,我們要確定到底我們要冒多少犯錯的危險,所謂犯錯,即我們的區間估計所指的範圍,並未包含母數。這種犯錯機會是以機率來表示的,我們以α(alpha)來表示此一犯錯的機率(the probability of error)。到底此一α要多大,須視研究的目的及其它狀況來定,通常我們是取0.05,如果我們決定冒0.05機率犯錯之險(也就是說,以長期眼光看,100次內有次,我們以樣本平均數或比例為中心點所設定之區間估計不包含其欲推估的母數),則我們可說有95%的信賴水準(confidence level)。 、其次,在決定了α水準後,我們最好是畫一抽樣分配的常態分配圖,並將α此一機率除以2,在圖之兩旁尾端找出此α/2之面積後找到相對此α/2面積的Z分數。若以α=0.05為例,則α/2=0.025。α=0.05由圖可知,當α=0.05時,相對應的兩個Z分數是±1.96,另查書中Appendix A之表,可知當α=0.01時Z分數為±2.58;當α=0.10時,Z分數為±1.65。圖 α=0.05及相對應之Z分數的抽樣分配圖
上圖若是一樣本平均數的抽樣分配的話,那我們應知道95%的所有可能的樣本平均數是在此分配的平均數(亦即母群體的平均數)加減1.96個Z分數的範
文档评论(0)