第11章 抽樣推斷_第1頁
第11章 抽樣推斷_第2頁
第11章 抽樣推斷_第3頁
第11章 抽樣推斷_第4頁
第11章 抽樣推斷_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第11章抽樣推斷 本章主要闡述統(tǒng)計推斷兩個最基本的又相互聯(lián)系的問題 參數(shù)估計和假設檢驗 其核心是怎樣根據(jù)隨機樣本對總體作出科學的推斷 湖南商學院信息系龔曙明 2 11 1抽樣推斷的基本概念 抽樣推斷又叫抽樣統(tǒng)計 是指根據(jù)統(tǒng)計研究的任務和要求 從被研究總體中抽出部分單位進行調(diào)查 然后根據(jù)這一部分單位所求得的樣本指標推斷總體指標的統(tǒng)計方法 抽樣推斷包括抽樣和推斷兩個緊密相聯(lián)的環(huán)節(jié) 而推斷又包括參數(shù)估計和假設檢驗兩個方面 要理解抽樣分布 參數(shù)估計 假設檢驗 必須先理解抽樣推斷的一些基本概念 3 11 1 1總體與樣本 抽樣推斷中的總體有時又稱為全及總體 即被研究現(xiàn)象的全體 具有大量性 同質(zhì)性和差異性的許多個別事物的集合體 總體單位數(shù)通常用N表示 總體中某一隨機變量的不同的取值及其相應的頻率或概率組成的分布 稱為總體分布 樣本是根據(jù)隨機原則從總體中抽出來的進行調(diào)查的那一部分總體單位所組成的集合體 樣本中包含的單位個數(shù)記作n 又稱樣本容量 n N稱為抽樣比例 4 總體平均值 期望值 記作或總體方差或標準差 記作或 總體比率 記作P 11 1 2參數(shù)和統(tǒng)計量 參數(shù)是總體的數(shù)量特征 亦即總體指標 總體的某個參數(shù)在抽樣時往往是未知的 是需要進行推斷的 總體指標通常有 5 統(tǒng)計量是樣本的數(shù)量特征 亦即樣本指標 統(tǒng)計量隨著樣本的不同而不同 因而是個隨機變量 從總體中抽出的所有可能的樣本的統(tǒng)計量及其相應的概率構(gòu)成的分布 稱為抽樣分布 統(tǒng)計量通常有 樣本均值 樣本方差S2 樣本標準差S 樣本比例p 6 11 1 3重復抽樣與不重復抽樣 從N個總體單位中抽取n個組成樣本 有重復抽樣與不重復抽樣兩種抽取方法 重復抽樣是 每抽出一個總體單位進行調(diào)查登記以后 放回去 混合均勻 再抽下一個 直到抽滿n個為止 不重復抽樣方法是 每次抽出一個總體單位進行調(diào)查登記以后 不再放回 因此凡是前面已經(jīng)抽到過的總體單位 以后便不能再被抽到 7 抽樣方法不同 會使可能抽到的樣本個數(shù) M 不相同 1 重復抽樣條件下 M Nn2 不重復抽樣條件下 M 8 11 1 4抽樣誤差與抽樣標準誤差 統(tǒng)計中的誤差有兩大類 一是登記性誤差 即在點數(shù) 測量 登記 計算 抄錄等工作過程中產(chǎn)生的誤差 這種誤差是可以而且應當盡可能避免的 二是代表性誤差 即用非全面資料推算或代替總體指標時產(chǎn)生的誤差 代表性誤差又分為系統(tǒng)性代表性誤差和偶然性代表性誤差兩種 系統(tǒng)性誤差是指沒有遵守隨機原則而有意選取變量值較大或較小的單位組成樣本而造成的誤差 這是應當避免的 偶然性代表性誤差是遵守隨機原則仍會產(chǎn)生的不可避免的誤差 9 抽樣誤差是指在遵守隨機原則條件下 樣本指標與總體指標的差異 它是一種偶然性的代表性誤差 不包括系統(tǒng)性代表性誤差和登記性誤差 抽樣標準誤差通常是指所有可能的樣本平均數(shù) 或樣本比率 對總體平均數(shù) 或總體比率 的標準差 抽樣標準誤差的平方稱為抽樣方差 依定義有 式中代表樣本平均數(shù)的抽樣標準誤差 代表樣本比率的抽樣標準誤差 M代表樣本個數(shù) 10 上述定義公式可用來解釋抽樣誤差的實質(zhì) 但不能實際應用 因為可能的樣本個數(shù)太多 而且總體平均數(shù)或總體比率是未知的 是需要推斷的 影響抽樣誤差大小的因素有四個 一是樣本容量n 樣本容量越大 抽樣誤差就小 大到n N時 抽樣誤差就等于0 二是總體標準差 總體標準差越大 各總體單位間的標志值的差異越大 抽樣誤差就越大 11 三是抽樣方法的影響 不重復抽樣可以避免極端樣本的出現(xiàn) 故抽樣誤差比重復抽樣的抽樣誤差小 四是抽樣方式的影響 抽樣方式不同 抽樣誤差也就不同 第12章將介紹不同抽樣方式下的抽樣誤差 12 11 2抽樣分布 抽樣分布就是統(tǒng)計量 樣本指標 的概率分布 又稱統(tǒng)計量分布 抽樣分布是一種理論分布 其目的于揭示統(tǒng)計量的分布規(guī)律 測量抽樣推斷誤差的大小和不確定程度的大小 13 樣本平均數(shù)的抽樣分布是指從總體中抽取的所有可能的樣本平均數(shù)構(gòu)成的概率分布 若從正態(tài)分布總體N 中隨機抽取樣本容量為n的樣本 則樣本平均數(shù)分布具有如下性質(zhì) 1 樣本平均數(shù) 的分布也是正態(tài)分布2 所有樣本平均數(shù)的平均數(shù)等于總體平均數(shù) E 11 2 1樣本平均數(shù) 的抽樣分布 14 3 在重復抽樣下 樣本平均數(shù)分布的抽樣方差等于總體方差除以樣本容量n 即 4 在不重復抽樣下 樣本平均數(shù)分布的抽樣方差為 1 例11 1 15 11 2 2中心極限定理 中心極限定理是指對任何一個具有總體平均數(shù) 數(shù)學期望 為 方差為的總體 不論總體是什么分布 只要樣本容量大 則樣本平均數(shù)逼近總體平均數(shù)為 抽樣方差為的分布 令 Z 則當n足夠大時 Z分布以標準正態(tài)分布為極限 16 1 在重復抽樣條件下 當n足夠大時 n 30 樣本平均數(shù)逼近服從數(shù)學期望為 方差為 n的正態(tài)分布 記為N n 2 在不重復抽樣條件下 當n足夠大時 n 30 樣本平均數(shù)逼近服從數(shù)學期望為 方差為的正態(tài)分布 記作N 例11 2 例11 3 17 11 2 3樣本比率的抽樣分布 樣本比率又稱樣本成數(shù)從二項分布總體中抽樣 樣本中成功的單位數(shù)占樣本容量的比率 稱為樣本比率 p 樣本比率是個隨機變量 當樣本容量n足夠大時 np和n 1 p 均大于5 根據(jù)中心極限定理 樣本比率的抽樣分布也近似服從正態(tài)分布 18 1 重復抽樣條件下 樣本成數(shù)的平均數(shù)等于總體成數(shù) 樣本比率的抽樣方差是總體比率方差的1 n 即 E p P 2 不重復抽樣條件下 樣本成數(shù)的平均數(shù)亦等于總體平均數(shù) 樣本比率的抽樣方差是總體比率方差的再乘上 即 19 E p P 例11 4 20 如果有兩個正態(tài)分布總體 其平均數(shù)分別為和 方差分別為和 由第一個總體抽出樣本容量為n1的樣本 樣本平均數(shù)為 由第二個總體抽出樣本容量為n2的樣本 樣本平均數(shù)為 根據(jù)正態(tài)分布隨機變量的線性組合定理 相互獨立的正態(tài)分布隨機變量的線性組合仍為正態(tài)分布 可知兩個獨立樣本之差也一定服從正態(tài)分布 11 2 4兩個樣本平均數(shù)之差的分布 21 其數(shù)學期望值和抽樣方差為 在兩個正態(tài)分布總體方差 已知的情形下 利用 x1 x2 的抽樣分布 可以進行兩個正態(tài)分布總體平均數(shù)的推斷 22 表示標準正態(tài)分布隨機變量Z的平方和 若樣本容量為n x1 x2 xn為n個隨機變量來自同一正態(tài)分布總體 則統(tǒng)計量為 i 1 2 n 11 2 5分布 卡方分布 從正態(tài)分布總體中抽樣 當樣本容量為n時 其有個可能樣本 而每一個樣本均可求得一個統(tǒng)計量 這些所有可能的統(tǒng)計量及其出現(xiàn)的概率構(gòu)成的抽樣分布稱為自由度為n的分布 23 其圖形如圖11 l 可看出n越小 分布則為高狹峰的右偏分布 n越大 分布趨近于正態(tài)分布 分布具有如下性質(zhì) 1 期望值E n 方差V 2n 2 卡方統(tǒng)計量為 3 N 分布趨于正態(tài)分布 4 具有可加性 24 5 當總體平均數(shù)未知時 可用代替 則卡方統(tǒng)計量的實用公式為 自由度為n 1 6 當總體方差未知時 可在一定概率下由分布表查出的理論值 由下式作出估計 25 若有兩個正態(tài)分布總體N1 u1 和N2 u2 從中分別抽取樣本 樣本容量分別為n1 n2 并分別求出兩個樣本的卡方統(tǒng)計量 則統(tǒng)計量F為 則來自兩個正態(tài)總體的所有可能的統(tǒng)計量F及其相應的概率組成的抽樣分布稱為自由度為 n1 n2 的F分布 其圖形如圖11 2 11 2 6F分布 26 曲線形狀隨n1 n2的取值不同而不同 F分布不以正態(tài)分布為極限 是一個正偏形分布 F分布具有以下重要性質(zhì) 1 期望值 E F n2 2 方差 V F n2 4 27 2 若隨機變量x的分布為F n1 n2 隨機變量y的分布為F n2 n1 則有 為置信概率 3 F統(tǒng)計量的實用公式為 F 稱為自由度為 n 1 n2 1 的F分布 4 當 時 F 兩個樣本方差之比服從自由度為 n 1 n2 1 的F分布 28 假設總體為正態(tài)分布N 自其中隨機抽取n個個體為樣本 并計算出統(tǒng)計量Z和卡方統(tǒng)計量 由于Z分布與分布相互獨立 則統(tǒng)計量t定義為 11 2 7t分布 29 由總體中抽出的所有樣本的統(tǒng)計量t及其出現(xiàn)的概率構(gòu)成的分布稱為服從自由度為n的t分布 其圖形如10 3 t分布縱軸為對稱分布的中心 當n 時 t分布趨向于標準正態(tài)分布 t分布的重要性質(zhì)有 1 期望值 E t 0 方差V t n 2 2 當總體方差未知時 可用樣本方差估計 統(tǒng)計量t的實用公式為t 稱為服從自由n 1的t分布 30 11 3參數(shù)估計 11 3 1點估計與區(qū)間估計 參數(shù)估計是指用樣本統(tǒng)計量 樣本指標 來估計總體參數(shù) 總體指標 1 點估計點估計也叫定值估計 當樣本容量足夠大時 可直接用樣本平均數(shù)代替總體平均數(shù) 用樣本比率代替總體比率 并據(jù)此計算有關總量指標 就是點估計 31 衡量一個樣本統(tǒng)計量是否是總體參數(shù)的優(yōu)良估計量的準則為 1 無偏性 即如果樣本統(tǒng)計量的數(shù)學期望值等于被估計的參數(shù)本身 則該樣本統(tǒng)計量就是被估計參數(shù)的無偏估計量 2 一致性 即當樣本容量n充分大時 樣本統(tǒng)計量充分地靠近被估計的參數(shù)本身 則該樣本統(tǒng)計量是被估計參數(shù)的一致估計量 3 有效性 即如果一個樣本統(tǒng)計量的方差比其他估計量的方差小 則該樣本統(tǒng)計量是被估計參數(shù)的有效估計量 例11 5 32 2 區(qū)間估計區(qū)間估計是用樣本統(tǒng)計量和抽樣標準誤差 抽樣方差的平方根 構(gòu)成的區(qū)間來估計總體參數(shù) 并用一定的概率來保證總體參數(shù)落在所估計的區(qū)間內(nèi) 其中 Z為標準正態(tài)分布條件下的概率保證程度 如概率為90 Z 1 645 概率為95 Z 1 96 概率為95 44 Z 2等等 33 稱為極限誤差 即 為置信區(qū)間下限 為置信區(qū)間上限 一般地置信概率越大 置信度越大 置信區(qū)間越長 總體平均數(shù) 落在置信區(qū)間的把握程度越大 可靠度越大 但估計的準確度降低 稱為抽樣標準誤差 是抽樣方差的平方根 34 11 3 2總體平均數(shù)的估計 1 大樣本 n 30 采用標準正態(tài)分布 Z分布 進行區(qū)間估計 估計公式為 例11 6 在參數(shù)估計時 總體方差往往是不知道的 則可用以往的 類似的 估計的總體方差代替 亦可用樣本方差代替總體方差 只要樣本容量n足夠大 大樣本 仍可用z分布來估計總體平均數(shù)的置信區(qū)間 35 2 小樣本n 30 用t分布估計若樣本容量n 30 且總體方差又未知 需采用t分布進行區(qū)間估計 總體平均數(shù) 的置信區(qū)間是 其中 t為t分布的概率保證程度 通常根據(jù)自由度n 1和給定的置信概率 從t分布表中找出對應的t值 為抽樣標準誤差的估計值 即用樣本的調(diào)整方差來估計抽樣標準誤差 36 樣本方差 S2 樣本方差S2是總體方差的有偏估計量 而樣本的調(diào)整方差是總體方差的無偏估計量 則抽樣標準誤差為 重復抽樣下 不重復抽樣下 例11 8 37 兩個總體平均數(shù)之差為 1 2 采用標準正態(tài)分布進行區(qū)間估計 估計公式為 例11 9 1 兩個大樣本 用Z分布估計 11 3 3兩個總體平均數(shù)之差的區(qū)間估計 38 2 兩個小樣本 用t分布估計 采用t分布進行兩總體平均數(shù)之差的區(qū)間估計 首先應根據(jù)兩個樣本方差用加權(quán)平均法求出二者的共同方差作為總體方差的無偏估計量 即 39 然后根據(jù)置信概率和自由度 n1 n2 2 查出t分布的t值 得如下估計公式 例11 10 40 1 總體比率的區(qū)間估計 若樣本容量n 30 而np和n 1 p 均大于5時 可根據(jù)標準正態(tài)分布用樣本比率估計未知的總體比率P 估計公式為 41 在實際抽樣時 由于總體比率P常常是未知數(shù) 總體方差P 1 P 也難獲知 可用樣本比率p代替上述公式中的總體比率P 例11 11 2 兩個總體比率之差的估計 設兩個總體的比率分別為P1和P2 從兩個總體中各抽取一個樣本 樣本容量分別為n1和n2 當n1p1 1 p1 和n2p2 1 p2 皆大于5時 兩個樣本比率之差p1 p2近似服從正態(tài)分布 因而可用標準正態(tài)分布估計兩個總體比率之差 P1 P2 的置信區(qū)間 當總體比率未知時 樣本容量很大時 可用樣本比率代替總體比率進行區(qū)間估計 42 估計公式為 例11 12 43 1 假設檢驗的意義假設檢驗是統(tǒng)計推斷的一對孿生分支 它是以樣本統(tǒng)計量 樣本指標 來驗證假設的總體參數(shù) 總體指標 是否成立 借以決定采取適當行動的統(tǒng)計方法 又稱為假設檢定或假設測驗 包括假設和檢驗兩個基本環(huán)節(jié) 統(tǒng)計假設是指對總體參數(shù)作出假設 這種假設可能正確 也可能是錯誤的 而統(tǒng)計檢驗是檢驗所作的統(tǒng)計假設是否成立 即對某一統(tǒng)計假設作出肯定 接受 或作出否定 拒絕 的結(jié)論 11 4 1假設檢驗的意義與程序 11 4假設檢驗 44 2 假設檢驗的程序 1 提出原假設H0和備選假設H1 關于總體平均數(shù)的假設有三種狀況 H0 0 H1 0 H0 0 H1 0 H0 u0 H1 0 其中 第一種假設檢驗稱為雙尾檢驗 第二 三種稱為單尾檢驗 2 確定樣本統(tǒng)計量及其分布 樣本統(tǒng)計量通常有樣本均值 樣本比率 樣本方差等 45 3 選擇顯著水平 一般先認為提出的原假設是正確的 發(fā)生的概率大 而事件A在原假設為真的條件下發(fā)生的概率很小 這里概率小的程度就是顯著水平 最常用的 取0 05或0 01 假設檢驗是以樣本統(tǒng)計量驗證假定的總體參數(shù) 在檢驗時 存在著犯兩種錯誤的可能性 第一類錯誤是當原假設本是正確的 由于 值選擇過大 我們拒絕了原假設 即棄真錯誤 第二類錯誤是當原假設本身是錯誤的 由于概率 值選擇過小 而我們接受了原假設 即取偽錯誤 46 大小的選擇 沒有統(tǒng)一的標準 一般地 越大 犯第一類錯誤的可能性越大 所以如果犯第一類錯誤會造成嚴重損失 那么 就設小一些 反之 可設大一些 4 計算檢驗統(tǒng)計量或構(gòu)建置信區(qū)間 不同的檢驗統(tǒng)計量有不同的計算公式 基本形式可表述為 47 5 作出決策 即比較計算的檢驗統(tǒng)計量和理論分布值 決定是否接受原假設 采用雙尾檢驗時 檢驗統(tǒng)計量落在接受區(qū)域內(nèi) 接受原假設 反之 則拒絕原假設 采用單尾檢驗時 若檢驗統(tǒng)計量的絕對值大于理論臨界值的絕對值 則拒絕原假設 反之 則接受原假設 見圖10 4 圖10 4 48 1 總體平均數(shù)的假設檢驗 1 總體為正態(tài)分布且方差已知 采用Z檢驗 若總體為正態(tài)分布 且總體方差已知 則可先根據(jù)樣本平均數(shù) 被假設的總體平均數(shù) 總體方差和樣本容量 計算檢驗統(tǒng)計量Z 11 4 2常用參數(shù)的假設檢驗 其次選擇顯著水平 查Z分表 求得兩個臨界值 然后判斷檢驗統(tǒng)計量Z是否落在兩個臨界值構(gòu)成的區(qū)域內(nèi) 即可作出是否接受原假設的決策 49 2 總體為正態(tài)分布 總體方差未知 當總體為正態(tài)分布 總體方差未知 而樣本為大樣本 n 30 時 可采用樣本方差代替總體方差 仍可采用Z檢驗 如果小樣本 n 30 則需要采用t檢驗 由于總體方差未知 則可用樣本方差先估計總體方差 再計算檢驗統(tǒng)計量t進行假設檢驗 它服從自由度為n 1的t分布 例11 14 3 總體為非正態(tài)分布 大樣本 采用Z檢驗 檢驗方法同前一樣 50 2 兩個總體平均數(shù)之差的檢驗 1 大樣本 n 30 采用Z檢驗 在檢驗兩個總體平均數(shù)之差的假設時 無論總體是否服從正態(tài)分布 當樣本為大樣本時 來自兩個總體的樣本平均數(shù)之差趨近于正態(tài)分布 故可采用Z檢驗 其檢驗統(tǒng)計量為 若兩個總體的方差未知 在大樣本條件下 可用樣本方差代替或估計總體方差 例11 15 51 2 小樣本 n 30 兩個正態(tài)總體方差未知 采用t檢驗 如果兩個正態(tài)總體方差已知 而樣本容量n 30時 仍可采用Z檢驗 但是 如果兩個正態(tài)總體的方差相等而又未知 且是小樣本 則應采用t分布檢驗兩個總體平均數(shù)之差 首先可利用兩個樣本的方差求出它們共同方差的估計值 即 檢驗統(tǒng)計量為 52 當時 t服從自由度為n1 n2的t分布 在給定的顯著水平 的條件下 查t分布表 得出臨界值t 2 當 t t 2 時 拒絕原假設H0 反之則接受原假設H0 例11 16 3 總體比率的假設檢驗 1 單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論