第5章 抽樣與參數(shù)統(tǒng)計(jì)_第1頁(yè)
第5章 抽樣與參數(shù)統(tǒng)計(jì)_第2頁(yè)
第5章 抽樣與參數(shù)統(tǒng)計(jì)_第3頁(yè)
第5章 抽樣與參數(shù)統(tǒng)計(jì)_第4頁(yè)
第5章 抽樣與參數(shù)統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 抽樣與參數(shù)估計(jì)學(xué)習(xí)內(nèi)容一、抽樣推斷概述二、抽樣分布及其應(yīng)用三、常見(jiàn)的抽樣分布四、參數(shù)估計(jì)五、區(qū)間估計(jì)的計(jì)算學(xué)習(xí)目標(biāo)1. 了解抽樣和抽樣分布的基本概念。2. 理解抽樣分布與總體分布的關(guān)系。3. 了解點(diǎn)估計(jì)的概念和估計(jì)量的優(yōu)良標(biāo)準(zhǔn)。4. 掌握總體均值、總體比例和總體方差的區(qū)間估計(jì)。一、抽樣推斷概述推斷統(tǒng)計(jì)的內(nèi)容抽樣推斷的過(guò)程統(tǒng)計(jì)推斷的基本假定a) 總體看作是一個(gè)隨機(jī)變量X,其概率分布為f(x)。b) 樣本看作是n個(gè)獨(dú)立的隨機(jī)變量(X1, X2, , Xn),每個(gè)都具有與總體X相同的分布。c) 樣本中每個(gè)個(gè)體必須取自同一總體, X1, X2, , Xn相互獨(dú)立。統(tǒng)計(jì)推斷涉及的概念參數(shù)與統(tǒng)計(jì)量

2、 參數(shù):描述總體分布特征的量,如平均數(shù),標(biāo)準(zhǔn)差。 統(tǒng)計(jì)量:由樣本觀察值算出的量,如 ,S2,S。 統(tǒng)計(jì)量是隨機(jī)變量。抽樣分布及其形成過(guò)程抽樣分布(概念要點(diǎn))所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱為抽樣分布。抽樣分布是一種理論概率的分布。抽樣分布的結(jié)果來(lái)自容量相同的所有可能樣本。單選題樣本平均數(shù)和總體平均數(shù)( ) A、前者是一個(gè)確定值,后者是隨機(jī)變量 B、前者是隨機(jī)變量,后者是一個(gè)確定值 C、兩者都是隨機(jī)變量 D、兩者都是確定值抽樣推斷的理論基礎(chǔ)(1)大數(shù)定律a) 大數(shù)定律在統(tǒng)計(jì)中是指一切關(guān)于大量隨機(jī)現(xiàn)象之平均結(jié)果穩(wěn)定性的定理。 盡管單個(gè)隨機(jī)現(xiàn)象的具體表現(xiàn)不可避免地引起隨機(jī)偏差,然而

3、在大量隨機(jī)現(xiàn)象共同作用時(shí),由于這些隨機(jī)偏差互相抵消、補(bǔ)償和拉平,致使總的平均結(jié)果趨于穩(wěn)定。 b) 為整個(gè)推斷統(tǒng)計(jì)提供了最基本的理論依據(jù)。猜硬幣賭局賭局1: 擲10次硬幣,賭正面朝上的頻率為0.4到0.6次。賭局2: 擲100次硬幣,賭正面朝上的頻率0.4到0.6次。賭局3: 擲1000次硬幣,賭正面朝上的頻率0.4到0.6次。貝努利大數(shù)定律設(shè)nA是n次獨(dú)立試驗(yàn)中事件A發(fā)生的頻數(shù); p表示事件A 在每次試驗(yàn)中發(fā)生的概率,則對(duì)于任意正數(shù)有:切比雪夫大數(shù)定律(2)中心極限定理 設(shè)從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),多次抽樣得到的樣本均值近似服從均值為、方差為2/n的

4、正態(tài)分布。(一) 大數(shù)定律揭示了大量隨機(jī)變量的平均結(jié)果,但并沒(méi)有涉及到隨機(jī)變量的分布規(guī)律。(二) 中心極限定理是指在一定的條件下,大量相互獨(dú)立的隨機(jī)現(xiàn)象的概率分布是以正態(tài)分布為極限的定理。(三) 中心極限定理則說(shuō)明了許多隨機(jī)變量的分布是正態(tài)或近似正態(tài)的。棣莫弗-拉普拉斯定理a) 隨機(jī)變量取的概率為、取非的概率為q=1-p時(shí),抽取個(gè)單位組成樣本。b) 出現(xiàn)的次數(shù)組成的隨機(jī)變量叫做服從二項(xiàng)分布的隨機(jī)變量。二、抽樣分布及其應(yīng)用1. 樣本均值的抽樣分布現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表:所有樣本均值的均值和方差:式中:M為樣本數(shù)目。比較及結(jié)論

5、:1. 樣本均值的均值(數(shù)學(xué)期望)等于總體均值。2. 樣本均值的方差等于總體方差的1/n。樣本均值的分布與總體分布的比較在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布。一種理論概率分布。推斷總體均值的理論基礎(chǔ)。樣本均值的抽樣分布與中心極限定理當(dāng)總體服從正態(tài)分布N (,2 )時(shí),來(lái)自該總體的所有容量為n的樣本的均值 也服從正態(tài)分布, 的數(shù)學(xué)期望為,方差為2/n,即 N(,2/n)。核心結(jié)論:樣本均值的數(shù)學(xué)期望;樣本均值的方差樣本均值 的分布形式。 與總體分布有關(guān) 總體為正態(tài)分布,抽樣分布也為正態(tài),與樣本容量無(wú)關(guān)。b) 與樣本量有關(guān) 總體不是正態(tài)分布,樣本量越大(n30),

6、抽樣分布越接近正態(tài)分布。抽樣分布與總體分布的關(guān)系2. 樣本比例的抽樣分布比例:總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比。 不同性別的人與全部人數(shù)之比。 合格品(或不合格品) 與全部產(chǎn)品總數(shù)之比。1) 容量相同的所有可能樣本的樣本比例的概率分布。2) 當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似。3) 是一種理論概率分布。4) 推斷總體比例的理論基礎(chǔ)。核心結(jié)論樣本比例的數(shù)學(xué)期望:;樣本比例的方差:重復(fù)抽樣3. 樣本方差的抽樣分布正態(tài)總體樣本方差的抽樣分布設(shè)總體服從正態(tài)分布N (,2 ), X1,X2, Xn為來(lái)自該正態(tài)總體的樣本,則樣本方差 s2 的分布為:將2(n 1)稱為

7、自由度為(n-1)的卡方分布。樣本方差抽樣分布(2分布)的形成過(guò)程4. 抽樣分布的應(yīng)用例1 BTL商店的經(jīng)理想知道供貨商給他的電視質(zhì)量是否低于平均水平。他的研究表明電視機(jī)置換時(shí)間的均值為8.2年,標(biāo)準(zhǔn)差為1.1年。然后他隨機(jī)抽取50臺(tái)過(guò)去售出的電視機(jī),發(fā)現(xiàn)這些電視機(jī)平均置換時(shí)間為7.8年。計(jì)算這50個(gè)隨機(jī)抽取的電視機(jī)的平均置換時(shí)間為7.8年或更短的概率。例2娛樂(lè)報(bào)道雜志發(fā)起了一項(xiàng)旨在增加訂閱的有獎(jiǎng)活動(dòng)。在過(guò)去,收到有獎(jiǎng)活動(dòng)參與材料的人中有26%最終參與了競(jìng)賽,訂閱了雜志。當(dāng)有獎(jiǎng)活動(dòng)的參與材料發(fā)放給500個(gè)隨機(jī)挑選的住戶時(shí),估計(jì)新增訂閱結(jié)果的數(shù)量在125150(包括120和150)的概率。抽樣分

8、布應(yīng)用練習(xí)某高校學(xué)生的入學(xué)考試成績(jī)均值為550分,標(biāo)準(zhǔn)差為250分,若從中隨機(jī)抽取100名,求: 樣本平均成績(jī)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差值 分析樣本均值的抽樣分布 樣本平均成績(jī)?cè)?20分到580分之間的概率有多大? 樣本平均成績(jī)小于580分的概率有多大?三、常見(jiàn)的抽樣分布1. 正態(tài)分布a) 正態(tài)分布的數(shù)理統(tǒng)計(jì)學(xué)概念。如果隨機(jī)變量(X)的概率密度函數(shù)為:,則該隨機(jī)變量服從正態(tài)分布。b) 式中為總體標(biāo)準(zhǔn)差;為總體均數(shù);為圓周率,即3.14159···;e為自然對(duì)數(shù)的底,即2.71828···。密度函數(shù)的特性對(duì)稱性非負(fù)性2. 卡方分布設(shè)隨機(jī)變量相互

9、獨(dú)立,且都服從標(biāo)準(zhǔn)正態(tài)分布,則隨機(jī)變量:卡方分布的性質(zhì)a) 恒為正值 。b) 卡方分布的期望值是自由度n,方差為2n。c) 卡方分布具有可加性??ǚ椒植寂c正態(tài)分布的關(guān)系3. T分布T分布的性質(zhì)a) 不同的樣本容量, t分布有所不同。b) 大致對(duì)稱的鐘型形狀,但對(duì)于小樣本,它顯示出更大的方差(n/(n-2))。c) 分布的均值為 =0。d) 分布的標(biāo)準(zhǔn)差隨著樣本容量的變化而變化,但它是大于1的。e) 隨著樣本容的增大,趨近于標(biāo)準(zhǔn)正態(tài)分布。當(dāng)n30時(shí),二者之間的差異就很小了。正態(tài)分布、卡方分布與T分布的關(guān)系多選題T分布具有以下特征( ) A、均值取決于自由度,方差等于1 B、均值為零,方差小于1

10、C、均值為零,方差大于1 D、方差隨自由度的增加而降低 E、方差隨自由度的增加而增加4. F分布F分布的性質(zhì)a) 不對(duì)稱性。b) 和卡方分布一樣, 分布的值也是非負(fù)的。c) 分布的準(zhǔn)確形狀取決于兩個(gè)不同的自由度。四、參數(shù)估計(jì)參數(shù)估計(jì)的方法被估計(jì)的總體參數(shù) 1. 點(diǎn)估計(jì)(概念要點(diǎn))a) 從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì)。 例如: 用樣本均值作為總體未知均值的估計(jì)值就是一個(gè)點(diǎn)估計(jì)。b) 點(diǎn)估計(jì)沒(méi)有給出估計(jì)值接近總體未知參數(shù)程度的信息。c) 點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等。2. 區(qū)間估計(jì)(概念要點(diǎn))a) 根據(jù)一個(gè)樣本的觀察值

11、給出總體參數(shù)的估計(jì)范圍。b) 給出總體參數(shù)落在這一區(qū)間的概率。 例如: 總體均值落在5070之間,置信度為 95%。3. 置信區(qū)間 (confidence interval)a) 統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間。b) 用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。c) 我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。4. 置信水平a) 總體未知參數(shù)落在區(qū)間內(nèi)的概率。b) 表示為 (1 - ) % 為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的

12、概率。c) 常用的置信水平值有 99%、95%、90%。相應(yīng)的 為0.01、0.05、0.10。置信區(qū)間與置信水平回顧:經(jīng)驗(yàn)法則(落在總體均值某一區(qū)間內(nèi)的樣本)5. 影響區(qū)間寬度的因素a) 數(shù)據(jù)的離散程度,用 來(lái)測(cè)度。b) 樣本容量c) 置信水平 (1 - ),影響 Z 的大小。判斷題1) 有95%的樣本均值會(huì)落在總體真值的1.96個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)。2) 有95%的樣本均值所構(gòu)造的1.96個(gè)標(biāo)準(zhǔn)差的區(qū)間會(huì)包括總體真值。3) 某個(gè)樣本均值所構(gòu)造的1.96個(gè)標(biāo)準(zhǔn)差的區(qū)間包含總體真值的概率約為95%。6. 評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)1)估計(jì)量用于估計(jì)總體某一參數(shù)的隨機(jī)變量。 如樣本均值,樣本比例、樣本中位數(shù)

13、等。 例如: 樣本均值就是總體均值的一個(gè)估計(jì)量。 如果樣本均值 x = 3 ,則 3 就是 的估計(jì)值。2)理論基礎(chǔ)是抽樣分布。無(wú)偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。 一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。 單選題無(wú)偏性是指( ) A、抽樣指標(biāo)的平均數(shù)等于被估計(jì)的總體指標(biāo) B、當(dāng)樣本容量n充分大時(shí),樣本指標(biāo)充分靠近總體指標(biāo) C、隨著n的無(wú)限增大,樣本指標(biāo)與未知的總體指標(biāo)之間的離差任意小的可能性趨于實(shí)際必然性 D、作為估計(jì)量的方差比其他估計(jì)量的方差小若甲估計(jì)量的方差小于乙估計(jì)量的方差,

14、則稱( ) A、甲是無(wú)偏估計(jì)量 B、乙是一致估計(jì)量 C、乙比甲有效 D、甲比乙有效五、區(qū)間估計(jì)的計(jì)算² 區(qū)間估計(jì)的內(nèi)容² 區(qū)間估計(jì)的計(jì)算a) 總體均值的區(qū)間估計(jì)b) 總體比率的區(qū)間估計(jì)c) 樣本容量的確定1. 總體均值的區(qū)間估計(jì)(正態(tài)總體,方差已知)a) 假定條件總體服從正態(tài)分布,且總體方差()已知。不是正態(tài)分布,可以由正態(tài)分布來(lái)近似 (n 30)。b) 使用正態(tài)分布統(tǒng)計(jì)量:c) 總體均值 在1-置信水平下的置信區(qū)間為:例 某種零件長(zhǎng)度服從正態(tài)分布,從該批產(chǎn)品中隨機(jī)抽取件,測(cè)得其平長(zhǎng)度為2 1 . 4mm。已知總體標(biāo)準(zhǔn)差 =0.15mm,試建立該種零件平均長(zhǎng)度的置信區(qū)間,給

15、定置信水平為0.95。2. 總體均值的區(qū)間估計(jì)(正態(tài)分布,方差未知,小樣本)a) 假定條件: 總體方差()未知??傮w必須服從正態(tài)分布。小樣本 (n < 30)。b) 使用 t 分布統(tǒng)計(jì)量:c) 總體均值 在1-置信水平下的置信區(qū)間為:例從一個(gè)正態(tài)總體中抽取一個(gè)隨機(jī)樣本, n=25,其均值x = 50 ,標(biāo)準(zhǔn)差 s =8。 建立總體均值m 的95 %的置信區(qū)間。例 已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測(cè)得其使用壽命(小時(shí))如下。建立該批燈泡平均使用壽命95%的置信區(qū)間。(16只燈泡使用壽命的數(shù)據(jù):1510、1520、1480、1500、1450、1480、1510

16、、1520、1480、1490、1530、1510、1460、1460、1470、1470)3. 總體均值的區(qū)間估計(jì)(大樣本,方差未知)a) 假定條件總體方差() 未知。大樣本(n 30)。b) 使用正態(tài)分布統(tǒng)計(jì)量 z:c) 總體均值 在1- 置信水平下的置信區(qū)間為:【例】某大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為26分鐘。試以95的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差為36分鐘)?!纠恳患冶kU(xiǎn)公司收集到由36投保個(gè)人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間。計(jì)算題假設(shè)已知某品牌電視

17、機(jī)顯像管壽命的標(biāo)準(zhǔn)差是500,但是其壽命均值是未知的。不過(guò),顯像管壽命可以假設(shè)為近似服從正態(tài)分布。一個(gè)n15的樣本的壽命均值8 900小時(shí)。計(jì)算總體均值的:(a)95%置信區(qū)間;(b)90%置信區(qū)間。假設(shè)你希望估計(jì)去年某種消費(fèi)品在每家零售店里的平均銷售額。零售店數(shù)量很多。如果總體是正態(tài)分布的且已知: $3425,s=$200,n =25;試計(jì)算其95%置信區(qū)間。4. 總體比率的區(qū)間估計(jì)a) 假定條件總體服從二項(xiàng)分布。大樣本(nP>=5,n(1- P)>=5)。b) 使用正態(tài)分布統(tǒng)計(jì)量:c) 總體比例的置信區(qū)間為:【例】某企業(yè)在一項(xiàng)關(guān)于職工流動(dòng)原因的研究中,從該企業(yè)前職工的總體中隨機(jī)

18、選取了200人組成一個(gè)樣本。在對(duì)其進(jìn)行訪問(wèn)時(shí),有140人說(shuō)他們離開(kāi)該企業(yè)是由于同管理人員不能融洽相處。試對(duì)由于這種原因而離開(kāi)該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間。【例】某城市想要估計(jì)下崗職工中女性所占的比率,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比率的置信區(qū)間。5. 樣本容量的確定a) 確定樣本容量的公式根據(jù)“允許誤差”的公式推導(dǎo)而來(lái)。b) 抽樣平均誤差即樣本均值的標(biāo)準(zhǔn)差樣本容量越大,抽樣平均誤差越小。c) 允許誤差:d) 估計(jì)總體均值時(shí)樣本容量n為:e) 樣本容量n與總體方差 2、允許誤差E、可靠性系數(shù)z或t之間的關(guān)系為: 與總體方差成正比。 與允許誤差成反比。 與可靠性系數(shù)成正比。單選題在其他條件不變情況下,要使樣本均值的抽樣平均誤差為原來(lái)的1/3,則樣本單位數(shù)必須() A、增大到原來(lái)的3倍 B、增大到原來(lái)的9倍 C、增大到原來(lái)的6倍 D、也是原來(lái)的1/3【例】擁有工商管理學(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論