概率論與數(shù)理統(tǒng)計chap07samplingandsamplingdistributions課件_第1頁
概率論與數(shù)理統(tǒng)計chap07samplingandsamplingdistributions課件_第2頁
概率論與數(shù)理統(tǒng)計chap07samplingandsamplingdistributions課件_第3頁
概率論與數(shù)理統(tǒng)計chap07samplingandsamplingdistributions課件_第4頁
概率論與數(shù)理統(tǒng)計chap07samplingandsamplingdistributions課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、概率論與數(shù)理統(tǒng)計chap07samplingandsamplingdistributions課件概率論與數(shù)理統(tǒng)計chap07samplingandsampl2022/9/11 牛牛文庫文檔分享2Why do we need sampling? 為什么需要抽樣?General Census might be difficult. 全面調(diào)查可能十分困難人口普查,經(jīng)濟普查General census might be infeasible. 全面調(diào)查是不可行的燈泡或汽車輪胎壽命General census might be impossible. 全面調(diào)查根本不可能藥效Sampling might

2、reduce cost. 抽樣可能省時、省人、省物、省力;Sampling might be more accurate. 如果做法得當,抽樣調(diào)查的結(jié)果有可能比全面調(diào)查更準確。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享3Purpose of Sampling抽樣目的The purpose of sampling is to estimate population parameters of interest using information contained in samples.抽樣的目的是利用樣本中所包含的信息對感興趣的總體參數(shù)進行估計。In this ch

3、apter, we will show how data obtained from a simple random sample can be used to compute estimates of a population mean, a population standard deviation, and a population proportion. We will also introduce the important concept of sampling distribution.我們將在本章介紹怎樣利用樣本信息對總體均值、總體標準差和總體比率進行估計。我們還將介紹抽樣分布

4、概念。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享4Simple Random Sampling 簡單隨機抽樣The purpose of statistical inference is to develop estimates and test hypotheses about the characteristics of a population using information contained in a sample.統(tǒng)計推斷:從樣本含有的信息中提取有關(guān)總體特征的信息。P165 (English Version p243),EAI(Electronics

5、 Associates, Inc.)公司人力資源調(diào)查:如何從2500名員工中抽取出一個包含有30個個體的樣本,并利用樣本信息對總體參數(shù)進行推斷?2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享5The definition of a simple random sampling and the process of selecting a simple random sample depend on whether the population is finite or infinite.簡單隨機抽樣方法取決于總體本身是有限的還是無限的。For Finite Popula

6、tion: A simple random sample of size n from a finite population of size N is a smaple selected such that each possible sample of size n has the same probability of being selected. 對于有限總體:如果總體中的每一個個體被抽中的概率都一樣,則稱這種抽樣方法為(有限總體的)簡單隨機抽樣。For Infinite Population: (1) Each element selected comes from the sam

7、e population. (2) Each element is selected independently. 對于無限總體:如果(1)每個個體都來自同一個總體,(2)每個個體的選擇都是獨立的,則稱這種抽樣方法為(無限總體的)簡單隨機抽樣。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享6Methods to generate a simple random sampling產(chǎn)生簡單隨機抽樣樣本的常用方法應(yīng)用實例:從300人的工廠中選取一個包含30個個體的樣本。把工人編號1到300用Excel中的均勻分布隨機數(shù)發(fā)生函數(shù)生成隨機數(shù)(采用小數(shù)點后保留三位)根據(jù)生成的隨機數(shù)

8、表選擇樣本中的個體組成樣本。Sampling with replacement有放回抽樣Sampling without replacement無放回抽樣Lot 抓鬮Random Numbers (English Version p245)隨機數(shù)表,中文版p167Random Numbers generated by computer.使用計算機產(chǎn)生隨機數(shù)Excel2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享7Application 應(yīng)用實例第169頁第8題:選6個籃球隊組成一個簡單隨機樣本 (similar to English Version p248 Appli

9、cations 8)采用第167頁(EV p245)隨機數(shù)表采用第9列每行前二位數(shù)結(jié)果13,8,23,25,18,5 或馬里蘭州,衣阿華,佛羅利達州,弗吉尼亞,匹茲堡,俄克拉何馬2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享8Return to EAI problem回到EAI問題(p165 ,English Version p242)EAI公司的人事主管為了制定一份簡報,需要了解關(guān)于公司全體2500名管理人員的平均年薪以及公司中已經(jīng)完成公司管理培訓(xùn)項目的管理人員所占的比例。公司全體管理人員的平均年薪總體均值完成公司管理培訓(xùn)項目的管理人員所占的比例總體比率為此,該公司的

10、人事主管選擇了一個由30個管理人員組成的簡單隨機樣本(說明使用Excel均勻分布隨機數(shù)發(fā)生函數(shù)RANDBETWEEN產(chǎn)生樣本)。對由30個管理人員組成的樣本,人事主管調(diào)查了他們的年薪和參加管理培訓(xùn)項目的情況,數(shù)據(jù)見P185EAI.xls。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享9Point Estimation 點估計對于一個我們感興趣的總體參數(shù)(比如:平均值或標準差等),怎樣從樣本數(shù)據(jù)獲得關(guān)于它們的估計?Point Estimation: we use the data from the sample to compute a value of a sample

11、 statistic that serves as an estimate of a population parameter.點估計:用樣本數(shù)據(jù)計算一個樣本統(tǒng)計量的值,并用這個值作為對應(yīng)總體參數(shù)的估計。在EAI公司的問題中,我們用樣本均值 作為總體均值 的點估計量,用樣本比率 作為總體比率 的點估計量。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享10EAI公司問題估計結(jié)果總體參數(shù)參數(shù)值(真值)點估計量點估計值年薪的總體均值51800美元年薪的樣本均值51814美元年薪的總體標準差4000美元年薪的樣本標準差s3347.72美元已完成管理培訓(xùn)項目的總體比率p0.60已

12、完成管理培訓(xùn)項目的樣本比率0.632022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享11Common Point Estimations常用點估計 總體參數(shù)點估計總體均值樣本均值總體標準差樣本標準差總體比率樣本比率2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享12More Cases 更多的實例加利福尼亞高速公路巡警保留著一項事故從報告到警員抵達事故現(xiàn)場所需要時間的記錄。一個由十條記錄組成的簡單隨機樣本(以分鐘為單位)如下:126 34 48 50 68 23 36 81 25 103a.事故從報告到警員抵達事故現(xiàn)場所需時間總體平均值的點估計為多少?

13、b.事故從報告到警員抵達事故現(xiàn)場所需時間總體標準差的點估計是多少?樣本均值 = 59.4分鐘 = 的點估計樣本標準差 = 34.6分鐘 = 的點估計2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享13More Cases 更多的實例1996年Louis Harris民意測驗通過一項對1005名成人的調(diào)查來了解人們使用Internet 的情況,調(diào)查結(jié)果如下:874名成人知道Internet.503名成人是計算機使用者191名成人在過去的12個月中使用過Internet.試求如下總體參數(shù)的點估計。a.知道Internet的成人所占的比率。b.成人中計算機使用者所占比率。c.成

14、人中在過去的12個月中使用過Internet的人所占比率知道Internet的成人所占的比率(總體比率)的點估計為0.87.成人中計算機使用者所占比率(總體比率)的點估計為0.5.成人中在過去的12個月中使用過Internet的人所占比率(總體比率)的點估計為0.19.2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享14Sampling Distribution抽樣分布Taking sampling mean as an example以樣本均值 為例:Sampling distribution: A probability distribution consisting

15、 of all possible values of a sample statistic.每一次簡單隨機抽樣將得到不同的樣本組成,不同的樣本將產(chǎn)生不同的樣本估計值,由所有可能的樣本估計值以及它們發(fā)生的概率組成的隨機變量稱為抽樣分布。Why to discuss the sampling distribution of 為什么要討論 的抽樣分布?點估計的代表性如何度量?要回答這個問題,我們需要對抽樣誤差的大小作出概率度量。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享15Sampling Distribution 抽樣分布例1:從2,5,8,9中隨機地抽取包含2個個體的

16、樣本,計算樣本均值,共有多少種不同的情況?(這個總體的均值為6,方差為7.5)這是一個新的隨機變量,稱為樣本容量為2的樣本均值 的抽樣分布,它的均值為6,方差為2.5。樣本組成樣本均值概率2,53.51/62,851/62,95.51/65,86.51/65,971/68,98.51/62022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享16Sampling Distribution of 樣本均值 的抽樣分布The sampling distribution of is the probability distribution of all possible values

17、of the sample mean ,簡單隨機抽樣的樣本均值 的抽樣分布是樣本均值 的所有可能值的概率分布。Expected Value of 的期望值 where 2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享17This result shows that with simple random sampling, the expected value or mean for is equal to the mean of the population.樣本均值 的數(shù)學(xué)期望 ,其中 是總體均值,即樣本均值的數(shù)學(xué)期望就是總體均值,因此我們用樣本均值的觀測值作為總體均值

18、的估計值。Sampling Distribution of 樣本均值 的抽樣分布2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享18Sampling Distribution of 樣本均值 的抽樣分布The standard deviation of 樣本均值 的標準差:Infinite Population Finite Population無限總體 有限總體 the standard deviation of the sampling distribution of 樣本均值抽樣分布的標準差 the standard deviation of the populat

19、ion 總體標準差 the sample size 樣本容量 the population size 有限總體的總體容量Finite population correction factor有限總體的修正系數(shù)2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享19Further Thought 概念深入思考樣本標準差對于一個給定的樣本,它是一個數(shù)值;對于所有可能的樣本,它是一個隨機變量;度量樣本數(shù)據(jù)的變異程度。樣本均值的標準差對于給定的總體,它總是一個數(shù)值;度量樣本均值(作為隨機變量)的變異程度。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享20Cal

20、culation of the Standard Deviation of 樣本均值標準差的計算When the population is infinite; or the population is finite and the sample size is less then or equal to 5%of the population size當總體是無限的(infinite)或雖然總體是有限的(finite),但是樣本容量(sample size)不大于總體容量(population)的5時,用以下公式計算樣本均值的標準差: 即不用修正。回到例1,計算樣本均值的標準差。例1回到EA

21、I公司問題,計算樣本均值的標準差。樣本標準差是多少?P185EAI2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享21Meaning of Standard Deviation of Sample Mean樣本均值的標準差的意義Why it is important? 為什么需要討論樣本均值的標準差?The smaller the sample means standard deviation is, the more typical the sample mean is as an estimate of population mean. 樣本均值的標準差越小,用樣本均

22、值作為總體均值的點估計越有代表性??傮w方差越小,用樣本均值作為總體均值的點估計越有代表性。樣本容量越大,用樣本均值作為總體均值的點估計越有代表性。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享22Central Limit Theorem中心極限定理In selecting simple random samples of size n from a population, the sampling distribution of the sample mean can be approximated by a normal probability distributi

23、on as the sample size becomes large.從總體中抽取樣本容量很大的簡單隨機樣本,當樣本容量很大時,樣本均值 的抽樣分布可以用正態(tài)分布來近似。具體來說就是,當樣本容量很大時,可近似為均值為 標準差為 的正態(tài)分布。上述結(jié)論也可以表述為:當樣本容量很大時, 標準正態(tài)分布2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享23Practical Value of the Central Limit Theorem中心極限定理的應(yīng)用無論總體服從什么分布,只要樣本容量充分大,都可以用正態(tài)分布近似樣本均值的抽樣分布。中P177, 18 English p26

24、3 18 可以利用中心極限定理,求樣本均值的取值落在某一區(qū)間內(nèi)的概率。P177, 19 English p263 19樣本容量越大,采用樣本均值的觀測值作為總體均值的估計值就越有意義。P177, 20 English p263 20關(guān)于樣本容量:當總體服從正態(tài)分布時,對于任何樣本容量,簡單隨機樣本的樣本均值都服從正態(tài)分布。對于其他總體分布,一般當樣本容量不小于30時,我們就認為它是大樣本,可以采用中心極限定理。對于0-1分布的總體,樣本容量多大才算大樣本不僅取決于樣本容量 ,還依賴于成功的概率 。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享24Sampling Dis

25、tribution of 樣本比率 的抽樣分布Sampling Distribution 的抽樣分布是樣本比率 的所有可能取值的抽樣分布。Expected Value 的數(shù)學(xué)期望為 ,其中 為總體比率。Standard Deviation 的標準差為Infinite population無限總體: Finite population 有限總體:0-1分布總體情況下的中心極限定理:當 且 時,樣本比率 的抽樣分布可以用正態(tài)分布近似。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享25Applications 應(yīng)用實例中文版English VersionP181, 31 P2

26、69,33P181, 32P269,34P181, 34P269,36P181, 35P270,372022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享26Properties of point estimation 點估計的評價標準UnbiasednessThe sample statistic is an unbiased estimator of the population parameter ifWhere無偏性:如果樣本統(tǒng)計量 滿足條件 ,其中 為總體參數(shù),則稱樣本統(tǒng)計量 為總體參數(shù) 的無偏估計量。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔

27、分享27Biased estimation 有偏估計123Unbiased estimation 無偏估計123Properties of point estimation 點估計的評價標準2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享28Common Unbiased Estimates常用無偏估計樣本均值 是總體均值 的無偏估計樣本比率 是總體比率 的無偏估計樣本方差 是總體方差 的無偏估計 2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享29Properties of point estimation 點估計的評價標準Efficiency:

28、Assume that a simple random sample of n elements can be used to provide two unbiased point estimators of the same population parameters.In this situation, we would prefer to use the point estimator with the smaller standard deviation. 有效性:對于樣本容量相同的同一總體參數(shù)的兩個無偏估計量,我們稱標準差較小的那個估計量比另一個更有效。 比 更有效2022/9/9

29、牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享30Properties of point estimation 點估計的評價標準ConsistencyLoosely speaking, a point estimator is consistent if the values of the point estimator tend to become closer to the population parameter as the sample size becomes larger.一致性粗略的講,樣本容量越大,點估計量的值越接近于總體參數(shù)。我們前面討論過的樣本均值和樣本比率都滿足一

30、致性要求。滿足一致性要求的有效估計量成為一致有效無偏估計量。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享31Other Sampling Methods其他抽樣方法Stratified Sampling 分層抽樣The population is first divided into groups of elements (each element in the population belongs to one and only one stratum). And then, combining the stratum sample results which ar

31、e taken from each stratum into one population parameter estimate. It is called Stratified Sampling.將總體分成若干子總體(每一個個體屬于且僅屬于一個子總體),然后對每一個子總體采用一定的抽樣方法進行抽樣,將得到的各個樣本合起來組成總體的一個樣本,這個抽樣方法稱為分層抽樣。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享32Stratified Random Sampling 分層隨機抽樣Stratified Random Sampling 分層隨機抽樣If a simple

32、random sample is taken from each stratum, and was combined into one population parameter estimate, this method is called Stratified Random Sampling.如果對各子總體采用簡單隨機抽樣,并將各樣本合起來組成總體的一個樣本,這個抽樣方法稱為分層隨機抽樣。If strata are homogeneous, this method is as “precise” as simple random sampling but with a smaller tot

33、al sample size.當每一個層內(nèi)部的個體特征比較接近(同質(zhì)性高,因而方差小)時,分層隨機抽樣的樣本較具代表性。Advantage: We can get the stratum parameter estimate together with the population parameter estimate.它的好處是:在得到總體參數(shù)的估計的同時,還可以得到各子總體參數(shù)的估計。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享33Cluster sampling整群抽樣The population is first divided into separate g

34、roups of elements called clusters. Ideally, each cluster is a representative small-scale version of the population, and then A simple random sample of the clusters is then taken. All elements within each sampled (chosen) cluster form the sample. This sampling method is called Cluster sampling.將總體分成獨

35、立的個體群體,總體中的每一個個體都屬于且僅屬于某一個群。簡單隨機抽樣的單位為群,這種抽樣方法稱為整群抽樣。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享34Cluster sampling整群抽樣If all clusters are alike in this regards, sampling a small number of clusters will provide good estimated of the population parameters.如果所有的群在意義上是同質(zhì)的,則抽取小量的群就可以得到對總體參數(shù)好的估計。One of the primar

36、y applications of cluster sampling is area sampling. We can obtain a larger sample with a significantly lower total cost.整群抽樣適用于區(qū)域抽樣。它具有省時、省力、省錢的特點。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享35Systematic Sampling 系統(tǒng)抽樣First finding a random number and then counting or searching through the list of the popula

37、tion until the corresponding element is found. It is call Systematic Sampling.隨機選定抽樣的起始個體,然后按照一定的間隔選定樣本的其他個體組成樣本,這樣的抽樣方法稱為系統(tǒng)抽樣。There is only one element selected randomly. the other elements are decided by the first randomly selected element.系統(tǒng)抽樣只有一個個體是隨機抽取的,初始個體一旦被選定,其余個體均由間隔大小唯一決定。2022/9/9 牛牛文庫文檔分享2022/9/11 牛牛文庫文檔分享36Systematic Sampling 系統(tǒng)抽樣There is only one element selected randomly. the other elements are decided by the first randomly selected element.系統(tǒng)抽樣只有一個個體是隨機抽取的,初始個體一旦被選定,其余個體均由間隔大小唯一決定。This

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論