抽樣調(diào)查1-2PPT課件.ppt_第1頁(yè)
抽樣調(diào)查1-2PPT課件.ppt_第2頁(yè)
抽樣調(diào)查1-2PPT課件.ppt_第3頁(yè)
抽樣調(diào)查1-2PPT課件.ppt_第4頁(yè)
抽樣調(diào)查1-2PPT課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩102頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2020/9/11,第五章,抽樣調(diào)查,2020/9/11,本 章 內(nèi) 容,第一節(jié) 抽樣調(diào)查概述,第二節(jié) 抽樣調(diào)查的數(shù)理基礎(chǔ),第三節(jié) 抽樣誤差與參數(shù)估計(jì),第四節(jié) 抽樣調(diào)查的組織方式,2020/9/11,綜合指標(biāo),總量指標(biāo),相對(duì)指標(biāo),平均指標(biāo),變異指標(biāo),反映總體數(shù)量特征,如何取得總體指標(biāo)數(shù)據(jù)? 一是通過(guò)全面調(diào)查方式,如普查、全面統(tǒng)計(jì)報(bào)表等。 二是通過(guò)抽樣調(diào)查(即抽樣推斷)方式。,2020/9/11,.,第一節(jié) 抽樣調(diào)查概述,一、抽樣調(diào)查的概念、特點(diǎn)及作用 二、抽樣調(diào)查中的基本概念 三、抽樣調(diào)查的一般步驟,2020/9/11,(一)抽樣調(diào)查的概念 (二)抽樣調(diào)查的特點(diǎn) (三)抽樣調(diào)查的應(yīng)用場(chǎng)合 (四

2、)抽樣調(diào)查推斷總體的兩種類型,一、抽樣調(diào)查的概念、特點(diǎn)及作用,2020/9/11,抽樣調(diào)查是以概率論和數(shù)理統(tǒng)計(jì)理論為基礎(chǔ),按照隨機(jī)原則從調(diào)查總體中抽取一部分單位作為樣本進(jìn)行調(diào)查,再用樣本數(shù)值,對(duì)總體數(shù)量特征作出具有一定可靠程度的推斷。 也稱為抽樣推斷、抽樣估計(jì)或統(tǒng)計(jì)推斷,是一種非全面調(diào)查。,,,(一)抽樣調(diào)查的概念,2020/9/11,抽樣,樣本,n = 100,總體,N =10000,推斷,(總體指標(biāo)),(樣本指標(biāo)),【例】要得到某廠生產(chǎn)10000只燈泡的平均耐用時(shí)間,就只能采用抽樣調(diào)查的方法,從中隨機(jī)抽取100只燈泡組成樣本,對(duì)樣本進(jìn)行檢驗(yàn)。,2020/9/11,(二) 抽樣調(diào)查的特點(diǎn),實(shí)

3、施隨機(jī)抽樣的原因: 能使樣本分布與總體分布相同或相近,使樣本代表性變強(qiáng)。 能使樣本統(tǒng)計(jì)量成為具有一定分布規(guī)律的隨機(jī)變量,可以根據(jù)樣本統(tǒng)計(jì)量的分布規(guī)律,運(yùn)用概率理論對(duì)抽樣調(diào)查結(jié)果的誤差進(jìn)行計(jì)算和評(píng)價(jià)。,2、調(diào)查目的是根據(jù)樣本指標(biāo)來(lái)推斷總體; 3、在調(diào)查之前可以計(jì)算出抽樣誤差和控制大小; 4、運(yùn)用概率對(duì)總體進(jìn)行估計(jì)和推斷。,1、實(shí)施隨機(jī)抽樣,即按照隨機(jī)原則從總體中抽取樣本,使各個(gè)調(diào)查單位被抽中的概率相等。,2020/9/11,(三)抽樣調(diào)查的應(yīng)用 用于不能用全面調(diào)查方式進(jìn)行調(diào)查的現(xiàn)象。,用于通過(guò)全面調(diào)查后結(jié)果將失去意義的現(xiàn)象。,如調(diào)查某地區(qū)的礦藏、某城市的空氣質(zhì)量等。,如炮彈射程的測(cè)量,電視、燈泡

4、等耐用時(shí)數(shù)的檢驗(yàn)等屬于破壞性調(diào)查。,用于經(jīng)全面調(diào)查后成本過(guò)高或調(diào)查精度要求不高的現(xiàn)象。,如某市居民家計(jì)調(diào)查,某林區(qū)的木材儲(chǔ)存量調(diào)查等。,2020/9/11,用于調(diào)查時(shí)效性要求較強(qiáng)的現(xiàn)象。,如為滿足領(lǐng)導(dǎo)機(jī)關(guān)及時(shí)制訂政策、安排工作需要而進(jìn)行的民意測(cè)驗(yàn),某農(nóng)產(chǎn)品的產(chǎn)量調(diào)查等。,1994年,我國(guó)確立了以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體,同時(shí)輔之以重點(diǎn)調(diào)查、科學(xué)核算等綜合運(yùn)用的統(tǒng)計(jì)調(diào)查方法體系,抽樣調(diào)查的主體方法地位得以正式確立。,5.用于修正全面調(diào)查的結(jié)果。,如在人口普查結(jié)束后,運(yùn)用抽樣調(diào)查的方法對(duì)普查結(jié)果進(jìn)行修正等。,2020/9/11,(四)抽樣調(diào)查推斷總體的兩種類型 一類是參數(shù)估計(jì):研究

5、的是用樣本指標(biāo)(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)(參數(shù))的方法。 一類是假設(shè)檢驗(yàn): 它是先對(duì)總體參數(shù)或特征提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。如果成立,就接受這個(gè)假設(shè);如果不成立,就放棄這個(gè)假設(shè)。 例:,【例】對(duì)可口可樂(lè)公司生產(chǎn)的一種瓶裝雪碧產(chǎn)品進(jìn)行檢查,包裝上標(biāo)明其凈含量是500ml。在市場(chǎng)上隨機(jī)抽取了50瓶,測(cè)得到其平均含量為499.5ml,標(biāo)準(zhǔn)差為2.63ml。根據(jù)這些數(shù)據(jù)可以進(jìn)行:,一是參數(shù)估計(jì):用95%的概率保證,該種包裝的雪碧平均含量在498.77-500.23ml之間;,二是假設(shè)檢驗(yàn):根據(jù)樣本數(shù)據(jù)結(jié)合統(tǒng)計(jì)分布規(guī)律,對(duì) “該種瓶裝雪碧重量不符合所標(biāo)明的重量”假設(shè)進(jìn)行否定或肯定

6、。,2020/9/11,二、抽樣調(diào)查中的基本概念,(一)抽樣調(diào)查中常用的指標(biāo) (二)抽樣方法 (三)抽樣框 (四)樣本的可能個(gè)數(shù),2020/9/11,總體:即根據(jù)研究目的確定的所要研究的同類事物的全體,也稱為全集總體、母體。 總體單位:組成總體的各個(gè)單位,也稱為個(gè)體或子體。 總體容量:總體單位的總數(shù),一般用“N”表示。,1、總體與總體指標(biāo),2020/9/11,總體參數(shù)的具體形式見(jiàn)后表:抽樣調(diào)查中常用的指標(biāo),總體指標(biāo),或總體參數(shù):它是用來(lái)反映總體數(shù)量特征的指標(biāo)。,總體,是唯一確定的,注意:由于總體是唯一確定的,所以總體指標(biāo)也是唯一確定的,但又是未知的,需要用樣本指標(biāo)來(lái)估計(jì)。,總體參數(shù),2020/

7、9/11,總體,是唯一確定的,樣本:也稱為抽樣總體,是從總體中按隨機(jī)原則抽取出來(lái)的一部分單位的組成集合體,作為總體的代表。,樣本容量:樣本中包含的單位數(shù),一般用n表示。 n30為大樣本,n30為小樣本,樣本k,由于抽樣方法和樣本容量的不同,從一個(gè)總體中可以抽出許多個(gè)不同的樣本。在實(shí)際調(diào)查時(shí),一般只從總體中抽取一個(gè)或幾個(gè)樣本進(jìn)行調(diào)查,哪一個(gè)樣本被抽到完全是隨機(jī)的。,2、樣本與樣本指標(biāo),不是唯一確定的,2020/9/11,樣本指標(biāo)是隨機(jī)變量,它會(huì)隨著樣本的不同而有不同的取值。,樣本指標(biāo),也稱為樣本統(tǒng)計(jì)量、估計(jì)量:是根據(jù)樣本中各個(gè)單位數(shù)據(jù)計(jì)算的反映樣本特征的指標(biāo)。,抽樣調(diào)查中常用的指標(biāo): 總量指標(biāo)

8、平均數(shù)(均值) 方差或標(biāo)準(zhǔn)差 成數(shù)或比例(是非標(biāo)志比重) (計(jì)算公式見(jiàn)下表),注意:總體指標(biāo)(參數(shù))和樣本指標(biāo)(統(tǒng)計(jì)量)是一一對(duì)應(yīng)的。,2020/9/11,是唯一確定的,是隨機(jī)變量,它會(huì)隨著樣本的不同而有不同的取值,總體平均 數(shù),總體標(biāo)準(zhǔn) 差,樣本平均 數(shù),樣本標(biāo)準(zhǔn) 差,總體平均 數(shù),總體標(biāo)準(zhǔn) 差,樣本平均 數(shù),總體成數(shù),樣本標(biāo)準(zhǔn) 差,變量 總 體,屬性 總 體,性質(zhì),變量 樣 本,屬性 樣 本,性質(zhì),表5-1 抽樣調(diào)查中常用指標(biāo)及計(jì)算公式,2020/9/11,(二)抽樣方法,重復(fù)抽樣 不重復(fù)抽樣,2020/9/11,1、重復(fù)抽樣,即指要從總體的N個(gè)單位中隨機(jī)抽取一個(gè)單位數(shù)為n的樣本,每次抽出

9、一個(gè)單位記錄其特征后,再放回總體中參加下一次抽選。這樣連續(xù)抽n次即得到所需樣本。,(即每次抽取是獨(dú)立的,條件相同),(重置抽樣,有放回的抽樣),2020/9/11,2、不重復(fù)抽樣(不重置抽樣,無(wú)放回的抽樣),即每次從總體N個(gè)單位中隨機(jī)抽出一個(gè)單位后,就不再放回總體中,下一個(gè)樣本單位再?gòu)挠嘞碌目傮w單位中抽取。這樣連續(xù)抽n次即得到一個(gè)單位數(shù)為n的樣本。,(即每次抽取不是獨(dú)立的,條件不同),2020/9/11,概率抽樣(隨機(jī)抽樣):是指按照隨機(jī)原則抽取樣本單位。,非概率抽樣(非隨機(jī)抽樣):是指調(diào)查單位的抽取是非隨機(jī)的。 重點(diǎn)調(diào)查、典型調(diào)查、方便抽樣中單位的選取就屬于非隨機(jī)抽樣形式。在抽樣調(diào)查中有時(shí)也

10、采用非概率抽樣方式抽取樣本。,此外,從抽取樣本的隨機(jī)性看,分為兩類形式:,2020/9/11,抽樣框是包括全部總體單位名單的框架。 實(shí)施概率抽樣必須具備抽樣框。,抽樣框的形式有:,名單抽樣框:列出全部單位名單的一覽表。,區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小的 區(qū)域,以小區(qū)域?yàn)槌闃訂挝弧?時(shí)間表抽樣框:將總體全部單位按時(shí)間順序排列,把總 體的時(shí)間分為若干小段時(shí)間,以各個(gè)小 段的時(shí)間單位為抽樣單位。,(三)抽樣框,2020/9/11,(四)樣本的可能個(gè)數(shù) 它是指從總體N個(gè)單位中隨機(jī)抽選n個(gè)單位構(gòu)成樣本,結(jié)果有排列組合,一種排列組合便構(gòu)成一個(gè)可能的樣本,排列組合的總數(shù)稱為樣本的可能個(gè)數(shù)。,【

11、例】假設(shè)總體有A、B、C、D、E五個(gè)單位,現(xiàn)純隨機(jī)重復(fù)抽取2個(gè)單位組成樣本,求全部可能樣本個(gè)數(shù)。,(N = 5 n = 2),2020/9/11,(1)在 n 次抽樣中,總體每個(gè)單位在各次抽樣中被抽取的概率都相同(即均為 1N );,重復(fù)抽樣的特點(diǎn):,(2)共可組成 個(gè)樣本,每個(gè)樣本在各次抽樣中被抽取的概率都相同(即均為1k) 。,(抽后放回),第二次抽?。?則所有可能的樣本個(gè)數(shù)為:,AA AB AC AD AE BA BB BC BD BE CA CB CC CD CE DA DB DC DD DE EA EB EC ED EE,即:,第一次抽取:,解:,2020/9/11,【例】假設(shè)總體有

12、A、B、C、D、E五個(gè)單位,現(xiàn)純隨機(jī)不重復(fù)抽取2個(gè)單位組成樣本,求全部可能樣本個(gè)數(shù)。,(N = 5 n = 2),第一次抽取:,第二次抽?。?則所有可能的樣本個(gè)數(shù)為:, AB AC AD AE BA BC BD BE CA CB CD CE DA DB DC DE EA EB EC ED ,(抽后不放回),解:,2020/9/11,(1)n次抽樣中,總體每個(gè)單位在各次抽樣中被抽取的概率不相同(第1次是1N,第2次是1N1, );,(2)可組成k = N(N1) (N 2) (N n + 1)個(gè)樣本,每個(gè)樣本在各次抽樣中被抽取的概率都相同(即均為1k) 。,不重復(fù)抽樣的特點(diǎn):,2020/9/11

13、,可能的樣本個(gè)數(shù)計(jì)算公式,2020/9/11,設(shè)計(jì)抽樣方案,抽取樣本單位,收集樣本數(shù)據(jù),計(jì)算樣本統(tǒng)計(jì)量,推斷總體,三、抽樣調(diào)查的一般步驟,界定調(diào)查總體 選擇收集資料的方式 選擇抽樣框 確定抽樣組織形式 確定抽樣方法 確定樣本單位數(shù),抽取樣本 評(píng)估樣本,2020/9/11,.,.,隨機(jī)原則,樣本,n = 100,總體,N =10000,推斷,(抽樣誤差),(總體指標(biāo)),(樣本指標(biāo)),M個(gè)樣本,抽樣實(shí)際誤差,抽樣平均誤差,(可以計(jì)算),(無(wú)法計(jì)算),抽樣極限誤差,概率度,置信度(概率),2020/9/11,.,第二節(jié) 抽樣調(diào)查的數(shù)理基礎(chǔ),一、概率 二、隨機(jī)變量及其分布 三、大數(shù)定律和中心極限定理

14、四、抽樣分布,2020/9/11,一、概率,(一)隨機(jī)事件 (二)事件的概率 (三)概率的基本性質(zhì),2020/9/11,隨機(jī)現(xiàn)象:在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象。 如,“一分鐘內(nèi)從某十字路口通過(guò)30輛汽車” “拋一次硬幣,正面朝上”。,隨機(jī)試驗(yàn):對(duì)隨機(jī)現(xiàn)象進(jìn)行觀察的過(guò)程。,可在相同條件下重復(fù)進(jìn)行; 所有可能結(jié)果可知; 事先不能肯定哪一結(jié)果出現(xiàn)。,須滿足三 個(gè)條件:,與隨機(jī)現(xiàn)象相對(duì)應(yīng)的是確定性現(xiàn)象,是指在一定條件下,能夠明確預(yù)見(jiàn)其結(jié)果的現(xiàn)象。,(一)隨機(jī)事件,2020/9/11,隨機(jī)事件:隨機(jī)試驗(yàn)的每一可能結(jié)果。,基本事件(樣本點(diǎn)):不可能再分的事件; 例如:擲一枚骰子出現(xiàn)的點(diǎn)數(shù),有“1

15、”、“2”“6”6個(gè) 樣本空間 (基本空間):基本事件的全體()。 一個(gè)試驗(yàn)中所有基本事件的集合,用表示 例如:在擲枚骰子的試驗(yàn)中, 1,2,3,4,5,6 在投擲硬幣的試驗(yàn)中,正面,反面,2020/9/11,復(fù)雜事件:由某些基本事件組合而成的事件。 必然事件:每次試驗(yàn)必然發(fā)生的事件()。,不可能事件:每次試驗(yàn)必然不會(huì)發(fā)生的事件()。,例如,在擲一枚骰子觀察點(diǎn)數(shù)的試驗(yàn)中, “出現(xiàn)的點(diǎn)數(shù)不超過(guò)6”是必然事件; “出現(xiàn)8點(diǎn)”是不可能事件; “出現(xiàn)點(diǎn)數(shù)是奇數(shù)”是復(fù)雜事件,是由若干個(gè)基本事件組合而成的。,2020/9/11,(二)事件的概率,概率(幾率)是指隨機(jī)事件發(fā)生的可能性。事件A的概率是對(duì)事件A

16、在試驗(yàn)中出現(xiàn)的可能性大小的一種度量; 表示事件A出現(xiàn)可能性大小的數(shù)值; 事件A的概率表示為P(A); 概率的定義有:古典定義、統(tǒng)計(jì)定義和主觀概率定義,2020/9/11,古典定義: 某一事件A發(fā)生的概率,是該事件所包含的基本事件數(shù) m與基本空間中基本事件總數(shù)n 的比值。(客觀存在),【例】投擲 2 枚骰子,求 2 枚骰子中至少有一枚出現(xiàn) 6 點(diǎn),且點(diǎn)數(shù)之和為偶數(shù)的概率。,解:A有“(6,2),(6,4),(6,6),(2,6),(4,6)”5種;,2020/9/11,【例】某鋼鐵公司所屬三個(gè)工廠的職工人數(shù)如下表。從該公司中隨機(jī)抽取1人,問(wèn): (1)該職工為男性的概率; (2)該職工為煉鋼廠職工

17、的概率。,2020/9/11,解: (1)用A 表示“抽中的職工為男性”這一事件;A為全公司男職工的集合;基本空間為全公司職工的集合。則,(2) 用B 表示“抽中的職工為煉鋼廠職工”;B為煉鋼廠 全體職工的集合;基本空間為全體職工的集合。則,2020/9/11, 統(tǒng)計(jì)定義: 在相同條件下重復(fù)進(jìn)行n次試驗(yàn),事件A發(fā)生m次,隨著試驗(yàn)次數(shù)n的增大,事件A發(fā)生的頻率 m/n 圍繞某一常數(shù)p上下波動(dòng)的幅度愈來(lái)愈小,且逐步趨于穩(wěn)定,則稱p為事件A的概率。(多次試驗(yàn)),(5.2),如:,2020/9/11,【例】投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù) n 的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左

18、右,2020/9/11,【例】某工廠為節(jié)約用電,規(guī)定每天的用電量指標(biāo)為1000度。按照上個(gè)月的用電記錄,30天中有12天的用電量超過(guò)規(guī)定指標(biāo),若第二個(gè)月仍沒(méi)有具體的節(jié)電措施,試問(wèn)該廠第一天用電量超過(guò)指標(biāo)的概率。 解:上個(gè)月30天的記錄可以看作是重復(fù)進(jìn)行了30次試驗(yàn),試驗(yàn)A表示用電超過(guò)指標(biāo)出現(xiàn)了12次。根據(jù)概率的統(tǒng)計(jì)定義有,2020/9/11, 主觀定義: 人們根據(jù)經(jīng)驗(yàn)和所掌握的有關(guān)信息,對(duì)事件發(fā)生的可能性大小給出的估計(jì)值。(調(diào)查研究),例如,高考填志愿時(shí),某考生估計(jì)自己被一本第一志愿錄取的可能性為80%;如果一本落榜,被二本第一志愿錄取的可能性為99%。,2020/9/11,(三)概率的基本性

19、質(zhì),非負(fù)性 對(duì)任意事件A,有 0 P 1 規(guī)范性 必然事件的概率為1;不可能事件的概率為0。即P ( ) = 1; P ( ) = 0 可加性 若A與B互斥,則P( AB ) = P( A ) + P( B ) 推廣到多個(gè)兩兩互斥事件A1,A2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),2020/9/11,(四)概率的加法法則(兩個(gè))法則1:兩個(gè)互斥事件之和的概率,等于兩個(gè)事件概率之和。假設(shè)A和B是互斥事件,則:,法則2:對(duì)于任意兩個(gè)隨機(jī)事件,它們之和的概率等于兩事件的概率之和減去兩事件之交的概率。即:,2020/9/11,【例】設(shè)某

20、地有甲、乙兩種報(bào)紙,該地成年人中有20讀甲報(bào)紙,16讀乙報(bào)紙,8兩種報(bào)紙都讀,問(wèn)成年人中有百分之幾至少讀一種報(bào)紙?解:設(shè)A讀甲報(bào)紙,B讀乙報(bào)紙,C至少讀一種報(bào)紙,則:由題意知 于是 即有28的成年人至少讀一種報(bào)紙。,2020/9/11,二、隨機(jī)變量及其分布,(一)隨機(jī)變量 (二)離散型隨機(jī)變量的概率分布 (三)連續(xù)型隨機(jī)變量的概率分布 (四) 正態(tài)分布,2020/9/11,隨機(jī)變量的概念:描述隨機(jī)現(xiàn)象某一側(cè)面的變量,是對(duì)一次試驗(yàn)的結(jié)果的數(shù)值性描述。 一般用 X、Y、Z 來(lái)表示。,隨機(jī)變量的特點(diǎn): 取值的隨機(jī)性;取值的規(guī)律性。,3.隨機(jī)變量的種類:根據(jù)取值情況的不同分 離散型隨機(jī)變量 連續(xù)型隨機(jī)

21、變量,(一)隨機(jī)變量,2020/9/11,(1)離散型隨機(jī)變量,概念:隨機(jī)變量 X 取有限個(gè)值或所有取值都可以逐個(gè)列舉出來(lái) X1 , X2, 離散型隨機(jī)變量的例子:,2020/9/11,(2)連續(xù)型隨機(jī)變量,概念:隨機(jī)變量 X 取無(wú)限個(gè)值。 取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)。 所有可能取值不可以逐個(gè)列舉出來(lái)。 連續(xù)型隨機(jī)變量的例子:,2020/9/11,1、概念:先列出離散型隨機(jī)變量X的所有可能取值;再列出隨機(jī)變量取這些值的概率。 用下面的表格來(lái)表示:,P(X =xi)=pi稱為離散型隨機(jī)變量的概率函數(shù),(二)離散型隨機(jī)變量的概率分布,pi0,2020/9/11,2、離散型隨機(jī)變量的概率分布舉例:,

22、【例】如規(guī)定打靶中域得3分,中域得2分,中域得1分,中域外得0分。 今某射手每100次射擊,平均有30次中域,55次中域,10次中,5次中域外。則考察每次射擊得分為0,1,2,3這一離散型隨機(jī)變量,其概率分布為,2020/9/11,3、離散型隨機(jī)變量的概率分布的類型,2020/9/11,(1) 二項(xiàng)分布(01分布),產(chǎn)生二項(xiàng)分布的過(guò)程稱為貝努里試驗(yàn)。每一次試驗(yàn)只有兩個(gè)結(jié)果的重復(fù)試驗(yàn)稱為貝努里試驗(yàn)。,貝努里試驗(yàn)的特點(diǎn):,第一,每次試驗(yàn)只有兩種可能結(jié)果:成功或失敗、是或否 第二,不管進(jìn)行多少次,任何一次試驗(yàn)結(jié)果的概率是固定的 第三,試驗(yàn)是相互獨(dú)立的,2020/9/11,一個(gè)離散型隨機(jī)變量X只取兩個(gè)

23、可能的值; 例如: 男性用 1表示,女性用0表示; 合格品用 1 表示,不合格品用0表示 列出隨機(jī)變量取這兩個(gè)值的概率,就形成二項(xiàng)分布。,隨機(jī)變量X服從參數(shù)n和p的二項(xiàng)分布,記為: ,其期望值等于 ,其方差等于 。,2020/9/11,【例】已知一批產(chǎn)品的次品率為p0.05,合格率為q=1-p=1-0.5=0.95。并指定廢品用1表示,合格品用0表示。則任取一件為廢品或合格品這一離散型隨機(jī)變量,其概率分布為,二項(xiàng)分布的概率分布表達(dá)式:,2020/9/11,(2)泊松分布,泊松分布是一種描述離散型隨機(jī)變量的概率分布。若 代表離散型隨機(jī)變量, 值可以取 ,用小寫(xiě)的 表示變量 可能取的某個(gè)具體值,則

24、事件恰好發(fā)生 次的泊松分布公式為:,式中:,是 的期望和方差,是自然對(duì)數(shù)的底,約等于2.71828,是 的階乘,2020/9/11,=2,= 3,= 5,= 10,= 15,泊松分布圖一般是正偏斜的, 值越小,偏斜度越大,隨著 的值的增大,偏斜度逐漸縮小。如左圖所示。,2020/9/11,當(dāng)要研究在指定時(shí)間或空間區(qū)間內(nèi)隨機(jī)現(xiàn)象發(fā)生的問(wèn)題時(shí),比如說(shuō),單位時(shí)間、單位長(zhǎng)度或單位面積上觀察到的次品數(shù),或在某一固定時(shí)間區(qū)間內(nèi)到達(dá)某加油站的顧客數(shù),以及某企業(yè)每月發(fā)生的工傷事故次數(shù)等等,就產(chǎn)生了泊松分布的重要應(yīng)用。泊松分布可以用于解決指定時(shí)間或空間區(qū)間內(nèi)隨機(jī)現(xiàn)象發(fā)生的問(wèn)題。,當(dāng)二項(xiàng)試驗(yàn)中樣本容量 很大而成功

25、的概率 很小時(shí),那么,二項(xiàng)概率一般可以采用泊松分布所產(chǎn)生的相應(yīng)概率來(lái)逼近。為了逼近二項(xiàng)概率分布,可以令 。當(dāng) 很大而 又很小 ( 為最佳)時(shí),泊松分布就成了二項(xiàng)概率的良好近似方法。,2020/9/11,(3)超幾何分布,二項(xiàng)分布主要用于計(jì)算有限總體重復(fù)抽樣的概率,而如果在有限總體中進(jìn)行不重復(fù)抽樣,就會(huì)破壞有關(guān)貝努里試驗(yàn)獨(dú)立性的條件。而超幾何分布就是研究不重復(fù)抽樣的適當(dāng)?shù)哪P汀?若隨機(jī)變量具有下述概率密度函數(shù),則稱為服從 超幾何分布,2020/9/11,一個(gè)離散型隨機(jī)變量取各個(gè)值的概率相同。 列出隨機(jī)變量取值及其取值的概率,就形成了均勻分布。,(4) 均勻分布,2020/9/11,【例】投擲一枚

26、骰子,出現(xiàn)的點(diǎn)數(shù)是個(gè)離散型隨機(jī)變量,其概率分布為,2020/9/11,期望值在描述具體的統(tǒng)計(jì)數(shù)據(jù)時(shí),我們使用均值來(lái)描述數(shù)據(jù)的集中趨勢(shì)。而期望值是均值的一種推廣,它反映隨機(jī)變量的平均水平。 方差除了隨機(jī)變量的平均水平之外,有時(shí)我們還要測(cè)定它的離散程度。前面我們?cè)梅讲顏?lái)描述數(shù)據(jù)的離散程度。同樣,這里我們用隨機(jī)變量的方差來(lái)反映隨機(jī)變量取值的離散程度。,4、離散型隨機(jī)變量的數(shù)學(xué)期望和方差,2020/9/11,離散型隨機(jī)變量的數(shù)學(xué)期望,概念:在離散型隨機(jī)變量X的一切可能取值的完備組中,各可能取值xi與其取相對(duì)應(yīng)的概率pi乘積之和。 作用:描述離散型隨機(jī)變量取值的集中程度 公式:,2020/9/11,概

27、念:隨機(jī)變量X的每一個(gè)取值與期望值的離差平方和的數(shù)學(xué)期望,記為D(X)。 作用:描述離散型隨機(jī)變量取值的分散程度 公式:,離散型隨機(jī)變量的方差,2020/9/11,例:離散型隨機(jī)變量的指標(biāo)計(jì)算,【例】投擲一枚骰子,出現(xiàn)的點(diǎn)數(shù)是個(gè)離散型隨機(jī)變量,其概率分布為如下。計(jì)算數(shù)學(xué)期望和方差,解:數(shù)學(xué)期望為:,方差為:,2020/9/11,(三)連續(xù)型隨機(jī)變量的概率分布,由于連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值,它取任何一個(gè)特定的值的概率都等于0,所以不能列出每一個(gè)值及其相應(yīng)的概率。通常研究它取某一區(qū)間值的概率。 連續(xù)型隨機(jī)變量的概率分布用數(shù)學(xué)函數(shù)的形式和分布函數(shù)的形式來(lái)描述。,2020

28、/9/11,1、概率密度函數(shù)的概念,設(shè)X為一連續(xù)型隨機(jī)變量,x 為任意實(shí)數(shù),X的概率密度函數(shù)記為f(x),它滿足條件,注意:f(x)不是概率,是一種函數(shù),2020/9/11,密度函數(shù) f(x)表示X 的所有取值 x 及其頻數(shù)f(x),2020/9/11,在平面直角坐標(biāo)系中畫(huà)出f(x)的圖形,則對(duì)于任何實(shí)數(shù) x1x2,P(x1Xx2)是該曲線下從x1 到 x2的面積,概率是曲線下的面積,2020/9/11,2、分布函數(shù),連續(xù)型隨機(jī)變量的概率也可以用分布函數(shù)F(x)來(lái)表示 分布函數(shù)定義為:,根據(jù)分布函數(shù),P(aXb)可以寫(xiě)為:,2020/9/11,3、分布函數(shù)與密度函數(shù)的圖示,密度函數(shù)曲線下的面積

29、等于1; 分布函數(shù)是曲線下小于 x0 的面積。,2020/9/11,4、連續(xù)型隨機(jī)變量的期望和方差,數(shù)學(xué)期望為 方差為,2020/9/11,5、常見(jiàn)的連續(xù)型隨機(jī)變量的概率分布,2020/9/11,(四) 正態(tài)分布,1. 正態(tài)分布在統(tǒng)計(jì)學(xué)中的地位,正態(tài)分布是統(tǒng)計(jì)和抽樣的基礎(chǔ),在統(tǒng)計(jì)中具有極其重要的理論意義和實(shí)踐意義,主要表現(xiàn)在:,(1)客觀世界中有許多隨機(jī)現(xiàn)象都服從或近似服從正態(tài)分布; (2)正態(tài)分布具有很好的數(shù)學(xué)性質(zhì),根據(jù)中心極限定理,很多分布的極限是正態(tài)分布,在抽樣時(shí)有些總體雖然不知道其確定的分布,但隨著樣本容量的增大,很多統(tǒng)計(jì)量可以看作近似正態(tài)分布;可用于近似離散型隨機(jī)變量的分布。 (3)

30、盡管經(jīng)濟(jì)管理活動(dòng)中的有些變量是正偏斜的,但并不影響正態(tài)分布在抽樣應(yīng)用中的地位。,2020/9/11,f(x) = 隨機(jī)變量 X 的頻數(shù) = 總體方差 =3.14159; e = 2.71828 x = 隨機(jī)變量的取值 (- x ) = 總體均值,2、正態(tài)分布的概率密度函數(shù),2020/9/11,3、正態(tài)分布函數(shù)的性質(zhì),概率密度函數(shù)在x 的上方,即f (x)0; 正態(tài)曲線的最高點(diǎn)在均值,它也是分布的中位數(shù)和眾數(shù); 正態(tài)分布是一個(gè)分布族,每一特定正態(tài)分布通過(guò)均值的標(biāo)準(zhǔn)差來(lái)區(qū)分。 決定曲線的高度,決定曲線的平緩程度,即寬度; 曲線f(x)相對(duì)于均值對(duì)稱,尾端向兩個(gè)方向無(wú)限延伸,且理論上永遠(yuǎn)不會(huì)與橫軸相

31、交; 正態(tài)曲線下的總面積等于1; 隨機(jī)變量的概率由曲線下的面積給出。,2020/9/11,4、參數(shù)和對(duì)正態(tài)曲線的影響,平均數(shù)決定密度函數(shù) f(x)的中心位置。 如圖:,2020/9/11,標(biāo)準(zhǔn)差決定 f(x)曲線的陡緩程度,越大曲線越平緩,越小曲線越陡峭。 如圖:,2020/9/11,正態(tài)分布的概率,概率是曲線下的面積。,2020/9/11,5、標(biāo)準(zhǔn)正態(tài)分布,一般的正態(tài)分布取決于均值和標(biāo)準(zhǔn)差 ,計(jì)算概率時(shí) ,每一個(gè)正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無(wú)窮多的,若能將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,計(jì)算概率時(shí)只需要查一張表即可。,(1)標(biāo)準(zhǔn)正態(tài)分布的重要性,2020/9/11,(2

32、)標(biāo)準(zhǔn)正態(tài)分布函數(shù),標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù),任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù),2020/9/11,標(biāo)準(zhǔn)正態(tài)分布形式,2020/9/11,(3)標(biāo)準(zhǔn)正態(tài)分布表的使用,將一個(gè)一般的轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,在計(jì)算概率時(shí) ,查標(biāo)準(zhǔn)正態(tài)概率分布表 對(duì)于負(fù)的 x ,可由 (-x) x得到; 對(duì)于標(biāo)準(zhǔn)正態(tài)分布,即X N(0,1),有 P (a X b) b a P (|X| a) 2 a 1 對(duì)于一般正態(tài)分布,即X N( , ),有,2020/9/11,【例】設(shè)X N(5,10),計(jì)算 P(5 X 6.2),查表P=0.5478-0.5=0.0478,2

33、020/9/11,【例】設(shè)X N(5,10),計(jì)算P(2.9 X 7.1),一般正態(tài)分布,2020/9/11,【例】設(shè)X N(5,32),求以下概率 (1) P(X 10) ; (2) P(2X 10) 解: (1),(2),注意: (-x) x,2020/9/11,三、大數(shù)定律與中心極限定理,(一)大數(shù)定律 (二)中心極限定理,2020/9/11,(一)大數(shù)定律,大數(shù)定律是闡述大量隨機(jī)變量的平均結(jié)果具有穩(wěn)定性的一系列定律的總稱。 本節(jié)只介紹兩個(gè)最常用的大數(shù)定律。,獨(dú)立同分布大數(shù)定律:獨(dú)立隨機(jī)變量x1,x2,具有相同分布,且存在有限的數(shù)學(xué)期望和方差2,則對(duì)于任意小的正數(shù),有,2020/9/11

34、,該定律表明,當(dāng)n足夠大時(shí),獨(dú)立同分布的一系列隨機(jī)變量的均值接近(依概率收斂于)數(shù)學(xué)期望,即平均數(shù)具有穩(wěn)定性。,2020/9/11,例如,調(diào)查成年男性的平均身高,可能會(huì)有如下結(jié)果:,2020/9/11,該定律表明,當(dāng)n足夠大時(shí),事件A發(fā)生的頻率接近于事件A發(fā)生的概率,即頻率具有穩(wěn)定性。,貝努力大數(shù)定律: 設(shè)m是n次獨(dú)立隨機(jī)試驗(yàn)中事件A 發(fā)生(“成功”)的次數(shù),p是事件A在每次試驗(yàn) 中發(fā)生的概率,則對(duì)于任意小的正數(shù),有,2020/9/11,(二)中心極限定理,中心極限定理是闡述大量隨機(jī)變量之和的極限分布是正態(tài)分布的一系列定理的總稱。,獨(dú)立同分布中心極限定理:設(shè)x1,x2,是獨(dú)立同分布的隨機(jī)變量序

35、列,且存在有限的數(shù)學(xué)期望和方差2,那么當(dāng)n時(shí),,2020/9/11,該定理表明,不論總體服從什么分布,只要其數(shù)學(xué)期望和方差存在,對(duì)這一總體進(jìn)行重復(fù)抽樣,當(dāng)樣本容量n充分大時(shí),其標(biāo)志總量或均值就趨于正態(tài)分布。,例如,調(diào)查成年男性的平均身高,可能會(huì)有如右圖。,2020/9/11,四、抽樣分布,樣本統(tǒng)計(jì)量的概率分布(理論分布),構(gòu)造抽樣分布的步驟:,樣本統(tǒng)計(jì)量全部可能的數(shù)值對(duì)應(yīng)的頻數(shù)分布,即抽樣分布。,2020/9/11,樣本平均數(shù)的抽樣分布(例題分析),【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體) ,即總體單位數(shù)N=4。4 個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4 。總體的均值、方差及分布如下:,均值和方差,2020/9/11, 現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為:,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二個(gè)觀察值,第一個(gè) 觀察值,所有可能的n = 2 的樣本(共16個(gè)),2020/9/11,計(jì)算出各樣本的均值,如下表。并給出樣本均值的 抽樣分布。,3.5,3.0,2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論