模塊五-抽樣估計2_第1頁
模塊五-抽樣估計2_第2頁
模塊五-抽樣估計2_第3頁
模塊五-抽樣估計2_第4頁
模塊五-抽樣估計2_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

模塊五抽樣估計任務1抽樣與抽樣分布任務2總體均值的區(qū)間估計任務3總體比例的區(qū)間估計任務4必要樣本量的確定模塊五抽樣估計2模塊五抽樣估計2知識目標了解抽樣方法的選擇了解抽樣分布原理能力目標能夠恰當地選擇抽樣方法并實施抽樣模塊五抽樣估計2任務引入某大學經管學院希望了解在校大學生的消費水平和消費結構。學院共有2200名學生,要求隨機抽取40名學生作為樣本,應當怎樣隨機抽取這40名學生呢?模塊五抽樣估計2任務分析在市場調查工作中,為了獲得研究對象總體的數量特征值,可以采用普查的方法。但很多時候,不可能實施普查或普查在時間、人力、物力、財力上不夠經濟。這時,通常選擇抽樣估計的方法,即從總體中隨機抽選一部分個體構成樣本,計算樣本的綜合特征值,用樣本信息去推算總體指標。本任務完成的是抽樣估計的第一個環(huán)節(jié)———抽取樣本。同時介紹抽樣分布的有關知識,為下一個任務———參數估計的學習打下基礎。模塊五抽樣估計2相關知識一、抽樣估計抽樣估計是指在隨機抽樣的基礎上,利用樣本的實際資料計算樣本統(tǒng)計量,并以樣本統(tǒng)計量對總體參數作出具有一定可靠程度估計的一種統(tǒng)計分析方法。抽樣估計具有以下幾個特點:1.是一種通過部分認識總體的統(tǒng)計分析方法。2.以概率抽樣為基礎,按隨機原則抽取樣本。3.可以用一定的概率將估計誤差控制在一定的范圍之內。模塊五抽樣估計2抽樣估計要點圖解模塊五抽樣估計2二、概率抽樣方法概率抽樣又稱為等概率抽樣或隨機抽樣,是調查者按照隨機原則抽取樣本的方法。非概率抽樣又稱為不等概率抽樣或非隨機抽樣,是調查者根據自己的方便或主觀判斷抽取樣本的方法。模塊五抽樣估計2概率抽樣與非概率抽樣的區(qū)別模塊五抽樣估計2概率抽樣方法模塊五抽樣估計21.簡單隨機抽樣簡單隨機抽樣是按隨機原則直接從總體N

個單位中抽取n

個單位組成樣本,總體中每個單位都有被抽中的機會。簡單隨機抽樣分兩種。(1)重復抽樣重復抽樣也稱回置抽樣,是指每次抽取一個樣本單位登記后再放回總體中參加下一次抽取的方法,每一個樣本單位都有被重復抽中的可能。模塊五抽樣估計2(2)不重復抽樣不重復抽樣也稱不回置抽樣,是指每次抽取一個樣本登記后不放回總體中參加下一次抽取的方法,每一個樣本單位只有一次被抽取的可能。簡單隨機抽樣的優(yōu)點是當總體單位數不大或總體容量雖然較大但比較集中時,采用簡單隨機抽樣容易取得較好的抽樣效果。模塊五抽樣估計22.等距抽樣等距抽樣又稱系統(tǒng)抽樣或機械抽樣,是將總體各單位按一定標志或次序排列,然后按相等的距離或間隔抽取樣本單位。系統(tǒng)抽樣兩種抽取方式。(1)等概率系統(tǒng)抽樣等概率系統(tǒng)抽樣是指每個單位被抽中的概率是相等的。(2)不等概率系統(tǒng)抽樣(PPS系統(tǒng)抽樣)不等概率系統(tǒng)抽樣是指每個單位被抽中的概率是與該單位的規(guī)模成比例的。模塊五抽樣估計23.分層抽樣分層抽樣也稱類型抽樣,先將總體所有單位按與研究內容密切相關的主要因素分成若干層,然后在各層中按隨機原則抽取一定數量的單位構成樣本。分層抽樣的常用方法有比例抽樣法和加權比例抽樣法兩種。模塊五抽樣估計2(1)比例抽樣法比例抽樣法是按照每層單位數在總體中所占的比例抽取樣本單位數,適用于層與層之間變異程度大,各層內部變異程度不大的總體。各層的抽樣單位數為:式中,N

是總體單位總數,Ni

是每層的單位數,n

是應抽取的樣本單位總數,ni

是各層應抽取的樣本單位數,k

是分層的層數,是總體中各層單位數占總體單位總數的比重。模塊五抽樣估計2(2)加權比例抽樣法加權比例抽樣法是以每層的單位數與層內的標準差結合作為權數確定每層應抽取樣本數的方法。各層的抽樣單位數為:式中,n是應抽取的樣本單位總數,ni

是各層應抽取的樣本單位數,Wi

是各層單位數占總體單位數的比重,si

是各層內部的標準差,

是同時考慮到各組的單位數比重和標準差后確定的各層的權數。模塊五抽樣估計24.整群抽樣整群抽樣是先將所有總體單位分割為若干小群組,然后從中隨機抽取一部分群,對中選群中的所有單位實施全面調查的一種抽樣方法。優(yōu)點是以群為單位抽取,簡化了抽樣的工作量,節(jié)省了調查費用,也方便了調查的實施。缺點是樣本單位在總體中分布不均勻,因此抽樣誤差常常大于簡單隨機抽樣。5.多階段抽樣多階段抽樣又稱為多級抽樣,是指在抽取樣本時,分為兩個及兩個以上的階段從總體中抽取樣本的一種抽樣方式。模塊五抽樣估計2三、樣本統(tǒng)計量的抽樣分布1.幾個基本概念(1)參數與統(tǒng)計量總體參數是總體的綜合特征值,總體參數通常是未知的,需要通過樣本統(tǒng)計量推算獲得。樣本統(tǒng)計量是根據樣本數據計算出的樣本的綜合特征值。常用總體參數與樣本統(tǒng)計量的計算公式見表。模塊五抽樣估計2參數與統(tǒng)計量模塊五抽樣估計2總體參數與樣本統(tǒng)計量的計算公式模塊五抽樣估計2(2)樣本容量和樣本個數樣本容量是指一個樣本所包含的樣本單位數,一般用n

表示。樣本個數是指從總體中可能抽取的樣本個數。如果采用重復抽樣的方法,從總體N

個單位中,隨機抽取

n個單位構成一個樣本,則共可抽取Nn

個樣本。如果采用不重復抽樣的方法,共可抽取

個樣本。模塊五抽樣估計2

模塊五抽樣估計2重復抽樣和不重復抽樣條件下的樣本及樣本統(tǒng)計量模塊五抽樣估計2重復抽樣和不重復抽樣條件下的樣本及樣本統(tǒng)計量模塊五抽樣估計2重復抽樣和不重復抽樣條件下樣本均值的抽樣分布模塊五抽樣估計23.均值的抽樣分布與總體分布的關系抽樣分布與總體分布的關系模塊五抽樣估計2

模塊五抽樣估計2

模塊五抽樣估計24.樣本比例的抽樣分布比例是指總體中具有某種屬性或特征的單位數與總體單位數之比。若總體中具有某種屬性的單位數為N1

,不具有某種屬性的單位數為N0

,則將具有某種屬性的單位數與全部單位數之比稱為總體比例,即

;不具有某種屬性的單位數與全部單位數之比稱為

。相應的樣本比例為模塊五抽樣估計2對于一個樣本比例,如果n·p≥5和n·(1-p)≥5,就可以認為樣本容量足夠大。這時,樣本比例p

的期望值、抽樣方差和抽樣標準差為:樣本比例p

的期望值:E(p)=π樣本比例的抽樣方差σp2

:重復抽樣條件下:不重復抽樣條件下:模塊五抽樣估計2樣本比例的抽樣標準差σp2:重復抽樣條件下:不重復抽樣條件下:模塊五抽樣估計2任務實施第1步:對該大學經管學院2200名學生進行編號,從1號編至2200號。利用Excel抽樣的步驟模塊五抽樣估計2第2步:選擇“抽樣”工具:“工具”→“數據分析”→“抽樣”→“確定”,如圖所示。Excel中的“抽樣”命令模塊五抽樣估計2第3步:設置“抽樣”對話框并得到樣本?!俺闃印睂υ捒蛑?,在“輸入區(qū)域”輸入學生編號所在單元格區(qū)域“A1∶A2200”;在“樣本數”框中輸入樣本量“40”;在“輸出區(qū)域”輸入單元格C1,如圖所示。設置“抽樣”對話框模塊五抽樣估計2第4步:單擊“確定”按鈕,得到隨機抽取的40名學生的編號,排序后如圖所示。隨機抽出的40名學生的編號模塊五抽樣估計2知識目標掌握參數估計的方法掌握總體均值的區(qū)間估計能力目標能夠熟練掌握區(qū)間估計的步驟能夠使用Excel函數進行區(qū)間估計模塊五抽樣估計2任務引入模塊五任務1中,利用Excel的隨機抽樣程序從2200名學生中隨機抽取了40名學生構成樣本,現(xiàn)將這40名學生按每月手機話費金額排序得到表。要求根據所抽取學生的手機話費估計該大學經管學院2200名學生的人均月手機話費,分別用40名學生和其中20名學生的平均手機話費去估計學院全部學生的手機話費。模塊五抽樣估計2某大學經管學院40名學生每月手機話費金額單位:元模塊五抽樣估計2任務分析樣本抽取出來之后,就需要計算樣本統(tǒng)計量并用樣本統(tǒng)計量去估計總體參數。常用的樣本統(tǒng)計量有樣本均值、樣本比例和樣本方差,需要估計的總體參數相應的有總體均值、總體比例和總體方差,本任務的目的是引導大家學習怎樣用樣本均值去估計總體均值,以及怎樣用樣本均值去構造總體均值的置信區(qū)間。模塊五抽樣估計2相關知識一、參數估計的方法參數估計的方法模塊五抽樣估計2二、點估計點估計是用某一個樣本統(tǒng)計量的取值直接作為總體參數的估計值。點估計的優(yōu)點是簡單明了,缺點是無法判斷點估計的可靠性。但對于由點估計值構造的總體參數的置信區(qū)間,則可以給出估計的可靠程度。模塊五抽樣估計2三、總體均值的區(qū)間估計1.區(qū)間估計的基本原理(1)區(qū)間估計區(qū)間估計是在給定置信水平(1-α)的條件下,以點估計值為中心,構建總體參數的一個估計區(qū)間(或置信區(qū)間)。置信區(qū)間模塊五抽樣估計2(2)置信區(qū)間置信區(qū)間是指在一定置信水平下總體參數的估計區(qū)間,其中,區(qū)間的最小值稱為置信下限,最大值稱為置信上限。置信區(qū)間可表示為:點估計值±邊際誤差邊際誤差也稱為抽樣極限誤差或允許誤差,是指在抽樣估計時,根據所研究對象的變異程度和分析任務的要求確定的可允許的誤差范圍,它等于樣本統(tǒng)計量可允許變動的上限或下限與總體參數之差的絕對值。邊際誤差的大小由兩個因素決定:模塊五抽樣估計2

模塊五抽樣估計2總體均值的置信區(qū)間可表示為:即同理,總體比例的置信區(qū)間為:即模塊五抽樣估計2

模塊五抽樣估計2式中,

是抽樣估計的允許誤差,或稱邊際誤差;

為置信下限,

為置信上限;zα

/2是標準正態(tài)分布尾部單側面積為α/2時的z

值。常用的置信水平及與之對應的zα

/2值見表。常用的置信水平及與之對應的zα

/2值模塊五抽樣估計2如果總體標準差σ未知,也可用樣本標準差s

代替,公式為:若抽樣方式為不重復抽樣,則需要修正系數

對抽樣標準差進行修正。在這種情況下,總體均值的置信區(qū)間為:模塊五抽樣估計2

模塊五抽樣估計2綜上所述,在建立均值的置信區(qū)間時,關鍵是確定樣本的抽樣分布及與之相對應的統(tǒng)計量。具體判斷方法見表。不同情況下總體均值的置信區(qū)間模塊五抽樣估計2任務實施一、大樣本總體均值的區(qū)間估計1.數據準備2.利用Excel進行區(qū)間估計的操作步驟手機話費區(qū)間估計的步驟模塊五抽樣估計2第1步:計算點估計值,即40名學生的月平均手機話費①選擇“描述統(tǒng)計”工具計算樣本均值和樣本標準差:“工具”→“數據分析”→“描述統(tǒng)計”→“確定”。②設置“描述統(tǒng)計”對話框:在“輸入區(qū)域”輸入手機話費數據所在單元格“$A$2:$A$41”,在“輸出區(qū)域”選定B2,選中“匯總統(tǒng)計”,如圖所示。③單擊“確定”按鈕,得到描述統(tǒng)計結果,如圖所示。模塊五抽樣估計2設置“描述統(tǒng)計”對話框模塊五抽樣估計2“描述統(tǒng)計”結果模塊五抽樣估計2第2步:計算允許誤差或邊際誤差方法一:使用“CONFIDENCE”函數計算邊際誤差。單擊fX→“統(tǒng)計”→“CONFIDENCE”→“確定”按鈕,如圖所示;在“CONFIDENCE”對話框中,“Alpha”

框中輸入顯著性水平0.05(置信水平為95%),在“Sdandard_dev”

框中輸入樣本標準差27.7,在“Size”

框中輸入樣本容量40,則對話框下側顯示邊際誤差8.58,如圖所示。模塊五抽樣估計2選擇“CONFIDENCE”函數模塊五抽樣估計2設置“CONFIDENCE”對話框模塊五抽樣估計2

模塊五抽樣估計2選擇“NORMSINV”函數模塊五抽樣估計2設置“NORMSINV”函數對話框第3步:確定總體均值的置信區(qū)間模塊五抽樣估計2二、小樣本條件下總體均值的區(qū)間估計1.數據準備2.利用Excel進行區(qū)間估計的操作步驟第1步:計算點估計值,即20名學生的月平均短信話費使用“描述統(tǒng)計”工具可得20名學生短信話費的平均數及其標準差,如圖所示(步驟見上述手機話費計算過程)。模塊五抽樣估計2“描述統(tǒng)計”結果和區(qū)間估計結果模塊五抽樣估計2第2步:計算允許誤差或邊際誤差①樣本均值的抽樣標準差可直接從描述統(tǒng)計中引用標準誤差1.33;若用公式計算,在F4單元格中輸入公式“=F3/SQRT(20)”,可得。②使用“TINV”函數計算置信水平為95%時的tα

/2(n-1)值,單擊fX→“統(tǒng)計”→“TINV”→“確定”;在“TINV”對話框的“Probability”框中輸入0.05,在“Deg_freedom”框中輸入自由度19(20-1),單擊“確定”按鈕,t

值為2.093024705,如圖所示。③邊際誤差:計算公式為:

單擊F9,輸入公式“=F4?F8”,得邊際誤差為2.78,如圖上所示。模塊五抽樣估計2設置“TINV”函數對話框模塊五抽樣估計2第3步:確定總體均值的置信區(qū)間單擊F10,輸入公式“=F2+F9”,得估計區(qū)間上限18.68。單擊F11,輸入公式“=F2-F9”,得估計區(qū)間下限13.12,如上圖所示。由上述計算得知:在95%的置信水平下,該大學經管學院2200名學生平均每月短信話費的置信區(qū)間為(13.12,18.68)元。模塊五抽樣估計2知識目標了解總體比例的區(qū)間估計能力目標熟練掌握總體比例區(qū)間估計的步驟模塊五抽樣估計2任務引入模塊五任務1中,利用Excel的抽樣程序從2200名學生中隨機抽取了40名,得到了40名學生iPad的擁有情況。用這40名學生的iPad擁有率推算該大學經管學院2200名學生的iPad擁有率。40名學生iPad擁有情況見表。模塊五抽樣估計2某大學經管學院40名學生iPad擁有情況模塊五抽樣估計2任務分析模塊五任務2學習了總體均值的區(qū)間估計方法,均值的估計是實際中常見的估計。在實際中,有時需要用樣本比例對總體比例進行估計。本任務將學習總體比例的區(qū)間估計方法。模塊五抽樣估計2相關知識一、樣本比例的分布滿足正態(tài)分布的樣本比例特征值是:樣本比例p

的均值等于總體比例π,即E(p)=π;樣本比例的抽樣方差

等于1/n

倍的總體方差,即

。模塊五抽樣估計2二、總體比例的區(qū)間估計總體比例

π在置信水平為1-α

時的置信區(qū)間為:若總體比例π

未知,可用樣本比例p

代替,公式為:若抽樣方式為不重復抽樣時,則需要用到修正系數

。在這種情況下,總體比例在1-α

水平下的置信區(qū)間為:模塊五抽樣估計2任務實施一、總體比例的區(qū)間估計二、數據準備三、利用Excel進行區(qū)間估計的操作步驟總體比例區(qū)間估計的步驟模塊五抽樣估計2第1步:計算樣本比例①使用Excel中的“COUNTIF”

函數計算擁有iPad的人數,n1=24(人)。單擊fx→“統(tǒng)計”→“COUNTIF”函數→“確定”;在“COUNTIF”對話框的“Rang”

框中輸入“B2:B41”,在“Criteria”框中輸入代表“有”iPad的“1”,則對話框下方顯示了計算結果,有iPad的人數為24,如圖所示。②計算40人的iPad擁有率,在任一單元格中輸入公式“=24/40”,得:模塊五抽樣估計2設置“COUNTIF”函數對話框模塊五抽樣估計2第2步:計算比例的允許誤差或邊際誤差方法一:使用“CONFIDENCE”函數計算邊際誤差E。單擊fx→“統(tǒng)計”→“CONFIDENCE”→“確定”按鈕;在“CONFIDENCE”對話框中,“Alpha”框中輸入顯著性水平0.05(置信水平為95%),“Sdandard_dev”框中輸入樣本比例的標準差

,“Size”框中輸入樣本容量40,則對話框下側顯示邊際誤差為0.1518,如圖所示。模塊五抽樣估計2設置“CONFIDENCE”對話框模塊五抽樣估計2方法二:分步計算邊際誤差E。①樣本比例的抽樣標準差:②因為n·p=40×0.6=24>5,n·p(1-p)=40×0.4=16>5,所以抽取的樣本屬于大樣本,可以認為樣本服從正態(tài)分布。利用Excel的NORMSINV函數可求出置信水平為95%時的正態(tài)分布的分位數值zα

/2=1.96,操作步驟見總體均值的區(qū)間估計。③邊際誤差:模塊五抽樣估計2第3步:確定總體比例的置信區(qū)間置信區(qū)間為:(0.4482,0.7518)。在單元格E7輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論