版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第21章統(tǒng)計與統(tǒng)計數據
第一節(jié)統(tǒng)計學
【本節(jié)考點】
1、統(tǒng)計學的兩大分支
2、描述統(tǒng)計的含義、內容、舉例
3、推斷統(tǒng)計的含義、內容、舉例
【本節(jié)內容】
一、統(tǒng)計學的含義:
統(tǒng)計學是關于收集、整理、分析數據和從數據中得出結論的科學。
二統(tǒng)計學的兩大分支(描述統(tǒng)計和推斷統(tǒng)計)
類型含義及內容舉例
描述統(tǒng)計研究數據收集、整理和描述的統(tǒng)計方法。其為了解與居民生活相關的商
內容包括:品及服務價格水平的變動情
(1)如何取得所需要的數據;況,收集統(tǒng)計局發(fā)布的CPI
(2)如何用圖表或數學方法對數據進行數據,利用統(tǒng)計圖展示CPI,
整理和展示;利用增長率計算CPI的走
(3)如何描述數據的一般特征。勢。
推斷統(tǒng)計研究如何利用樣本數據推斷總體特征的統(tǒng)某公司評測顧客滿意度,隨
計方法。其內容包括:機抽取部分顧客進行調查,
1、參數估計:利用樣本信息推斷總體特征:再對顧客總體滿意度進行評
2、假設檢驗:利用樣本信息判斷對總體假估,此時需要用到參數估計
設是否成立。法,然后驗證滿意度高的客
戶更傾向于成為忠誠客戶。
【例題1:單選】描述統(tǒng)計的研究內容不包括。
A如何取得所需要的數據;
B如何用圖表或數學方法對數據進行整理和展示;
C如何描述數據的一般特征。
D如何利用樣本信息判斷對總體假設是否成立
【答案】D
【例題2:單選】收集統(tǒng)計局發(fā)布的CPI數據,利用統(tǒng)計圖展示CPI,利用增長率計算CPI的走勢,這種
統(tǒng)計方法是。。
A描述統(tǒng)計B推斷統(tǒng)計C客觀統(tǒng)計D心理統(tǒng)計
【答案】A
第二節(jié)變量和數據
【本節(jié)考點】
A.變量的含義及分類
B.數據的含義及分類
【本節(jié)內容】
項目含義分類
變量變量是研究對象的定量變量變量的取值是數量。
屬性或特征,它是(數量變量)如企業(yè)銷售額、注冊員工數
相對于常數而言分類變量的取值是類別。
的。常數只有一個變量變量如企業(yè)所屬行業(yè)、員工性別
固定取值,變量亙順序變量的取值是類別且有順序。
以有兩個或更多個變量如員工受教育水平
可能的取值。
數據數據是對變量進行定量數據是對定量變量的觀測結果,其取值表現
測量、觀測的結果。(數值型數據)為具體的數值。
數據可以是數值、如企業(yè)銷售額1000萬元。
文字或者圖像等形定性分類分類變量的觀測結果,表現為類別,二
式數據數據般用文字來表述,也可用數字描述。如,
用1表示男性,2表示女性。
順序順序變量的觀測結果,表現為類別,二
數據般用文字描述,也可用數字描述。如用
1表示碩士及以上,2表示本科,3表示
大專及以下。
「A分類變量
測量結果.分類數據
統(tǒng)
計
變
量
與
數
據
測量結果順序數據
數值型數據
對于不同類型的數據,可以采用不同的統(tǒng)計方法處理和分析。對分類數據可以計算出各類別的頻率,而數
值型數據則可以計算均值和方差等統(tǒng)計量。
【例題3:多選】定性變量的觀測結果是()。
A.順序變量
B.分類數據
C.順序數據
D.數值型數據
E.分類變量
【答案】BC
【例題4:09年多選題改編】下列變量中,通常用數值型數據表示的有。。
A.商品銷售額
B.上班出行方式
C.家庭收入
D.居住地區(qū)
E.年齡
【答案】ACE
第三節(jié)常用的數據特征測度
【本節(jié)考點】
1、均值和中位數
2、方差和標準差
【本節(jié)內容】
對統(tǒng)計數據特征的測度,主要從三個方面進行:
一是分布的集中趨勢,反映數據向其中心值靠攏或聚集的程度;
二是分布的離散程度,反映各數據遠離其中心值的趨勢;
三是分布的偏態(tài)和峰度,反映數據分布的形狀。
(-)均值和中位數(測度數據的集中趨勢)
集中趨勢是指一組數據向某一中心值靠攏的程度,它反映了一組數據中心點的位置所在。集中趨勢的測度
也就是尋找數據水平的代表值或中心值。
1、均值
均值也就是平均數,就是數據組中所有數值的總和除以該組數值的個數。
【注1】它是集中趨勢中最主要的測度值,是一組數據的重心所在,解釋了一組數據的平均水平。
[注2]均值主要適用于數值型數據,但不適用于分類數據和順序數據。
【注3】均值易受極端值的影響,極端值會使得均值向極大值或極小值方向傾斜,使得均值對數據組的代
表性減弱。
2、中位數
(1)含義:把一組數據按從小到大或從大到小的順序進行排列,位置居中的數值叫做中位數。中位數將
數據分為兩部分,其中一半的數據小于中位數,另一半數據大于中位數。
(2)計算:
根據未分組數據計算中位數時,要先對數據進行排序,然后確定中位數的位置,n為數據的個數,其公式
為:
(l)n為奇數:中位數位置是山,該位置所對應的數值就是中位數數值。
---2
(2)n為偶數:中位數位置是介于上和(匚+1)之間,中位數就是這兩個位置對應的數據的均值。
------21
(3)適用:中位數主要用于順序數據,也適用于數值型數據,但不適用于分類數據,中位數不受極端值
的影響,抗干擾性強。
【例題5:2008單選題】某小學六年級8個班的學生人數由少到多依次為34人、34人、34人、34人、
36人、36人、37人、37人,其中位數為()
A34
B35
C36
D37
【答案】B
【解析】n為偶數,中位數=(34+36)/2=35.
【例題6:單選】下面一組數據為9個家庭的人均月收入數據(單位:元):750;780;850;960;1080;
1250;1500;1650;2000;則中位數為()
A750
B1080
C1500
D2000
【答案】B
【解析】n為奇數,中位數位置為5,所對應的數值為1080。
【例題7:2011年單選】2010年某省8個地市的財政支出(單位:萬元)分別為:
59000500026560266450780007800078000132100這組數據的中位數是()萬元。
A.78000
B.72225
C.66450
D.75894
【答案】B
[解析]由于所給數據是8個,所以中位數的位置是第4個和第5個數據的平均數。(66450+78000)/2=72225
【例題8:2003年單選】集中趨勢最主要的測度值是()。
A.眾數
B.中位數
C.均值
D.幾何平均數
【答案】C
【解析】算術平均數也稱為均值,是集中趨勢最主要的測度值。
【例題9:2007年單選改編】某連鎖超市6個分店的職工人數有小到大排序后為57人、58人、58人、
60人、63人、70人其均值、中位數分別為()。
A.59、58
B.61、58
C.61、59
D.61、70
【答案】C.
【解析】均值=(57+58+58+60+63+70)/6=61
中位數=(58+60)/2=59
(二)方差和標準差(測度數據的離散趨勢)
離散程度反映的是各變量值遠離中心值的程度。
集中趨勢的測度值是對數據一般水平的一個概括性變量,它對一組數據的代表程度,取決于該組數據的離散水
平。數據的離散程度越大,集中趨勢的測度值對該組數據的代表性就越差,離散程度越小,其代表性就越好。
【例題10:2010年單選】集中趨勢的測度值對一組數據的代表程度,取決于該組數據的離散水平。數據
的離散程度越大,集中趨勢的測度值對該組數據的代表性()。
A.越好
B.越差
C.始終不變
D.在一定區(qū)間內反復變化
【答案】B
1、含義:
(1)左差是數據組中各數值與其均值離差平方的平均數。是實際中應用最廣泛的離散程度測度值。方差越小,
說明數據值與均值的平均距離越小,均值的代表性越好。
(2)標準差:方差的平方根,不僅能度量數值與均值的平均距離,還與原始數值具有相同的計量單位。
2、計算:
指標名稱總體樣本
方差
n代表樣本單位數。
【注】(1)在有放回的簡單隨機抽樣中,
N代表總體單位數。樣本方差T是總體方差匚的無偏估計
S(2)在不放回的簡單隨機抽樣中,
樣本方差,是總體方差7的無偏估計
量
標準差
【例題11】某售貨小組有5名營業(yè)員,元旦一天的銷售額分別為520元、600元、480元、750元和500
元,求該日平均銷售額及樣本方差和樣本標準差。
【解析】
A.平均銷售額=(520+600+480+750+500)/5=570元
B.樣本方差
第一步:計算差
520-570=-50;600-570=30;480-570=90;750-570=180;500-570=-70
第二步:計算差平方和
(-50)2+(30)2+(90)2+(180)2+(-70)2
第三步:計算方差
方差二----------------M--------------
=12200
(3)樣本標準差=J12200=110.45
3、適用
只適用于數值型數據,容易受極端值的影響。
【例題12:2010年多選題改編】數值型數據離散程度的測度指標有()。
A.中位數
B.幾何平均數
C.均值
D.標準差
E.方差
【答案】DE
第四節(jié)數據來源
【本節(jié)考點】
一、觀測數據和實驗數據
二、一手數據和二手數據
【本節(jié)內容】
分類類別內容
按收集方法觀測數據通過直接調查或測量而收集的數據。觀測數據是在沒有對
事物施加任何人為控制因素的條件下得到的。
幾乎所有與社會經濟現象有關的統(tǒng)計數據都是觀測數據,
如GDP、CPI、房價等。
實驗數據通過在實驗中控制實驗對象以及其所處的實驗環(huán)境收集到
的數據。如,一種新產品使用壽命的數據,一種新藥療效
的數據。
自然科學領域的數據大多都是實驗數據。
按來源一手數據來源于直接的調查和科學實驗的數據,對使用者來說這是
數據的直接來源。其來源主要有:調查或觀察;實驗。
二手數據來源于別人的調查或實驗的數據。對使用者來說這是數據
的間接來源。
【例題13:多選】統(tǒng)計數據按其收集方法,可以分為。。
A觀測數據
B一手數據
C主觀數據
D實驗數據
E二手數據
【答案】AD
【例題14:單選】幾乎所有與社會經濟現象有關的統(tǒng)計數據都是()
A觀測數據
B一手數據
C二手數據
D實驗數據
【答案】A
第五節(jié)統(tǒng)計調查
【本節(jié)考點】
1、統(tǒng)計調查的概念及分類
2、統(tǒng)計調查的方式
【本節(jié)內容】
一、統(tǒng)計調查的概念和和分類
1、統(tǒng)計調查的概念
統(tǒng)計調查過程有兩個重要特征:一是調查是一種有計劃、有方法、有程序的活動;二是調查的結果表現為
搜集到的數據。
2、統(tǒng)計調查的分類
種類具體內容
按調查對象的范全面調查全面統(tǒng)計報表和普查
圍不同非全面調查非全面統(tǒng)計報表、抽樣調查、重點調查和典型調
查
按調查登記的時連續(xù)調查觀察總體現象在一定時期內的數量變化,說明現
間是否連續(xù)象的發(fā)展過程,目的是為了解社會現象在一段時
期的總量。如工廠的產品生產、原材料的投入、
能源的消耗、人口的出生、死亡等。
不連續(xù)調查間隔相當長的時間所作的調查,為了對總體現象
在一定時點上的狀態(tài)進行研究。如生產設備擁有
量、耕地面積等。
【例題15:2008年多選題】下列調查方式中,屬于非全面調查的有()
A、重點調查
B、抽樣調查
C、典型調查
D、普查
E、全面報表
【答案】ABC
【例題16:多選】按調查登記的時間是否連續(xù),統(tǒng)計調查分為連續(xù)調查和不連續(xù)調查,下列現象適合不
連續(xù)調查的是()
A生產設備擁有量
B耕地面積
C人口的出生死亡
D原材料的投入
E工廠的產品生產
【答案】AB
(二)統(tǒng)計調查的方式
調查含義特征、分類及應用場合
方式
L按調查對象范圍的不同分為全面報表和非全面報
按照國家有關法規(guī)的規(guī)定,
表。目前的大多數統(tǒng)計報表都是全面報表。
統(tǒng)計自上而下地統(tǒng)一布置,自下
2.按報送周期長短,分為日報、月報、季報、年報等。
報表而上地逐級提供基本統(tǒng)計
3.按報表內容和實施范圍不同分為國家的、部門的、
數據的一種調查方式。
地方的統(tǒng)計報表。
特點:
1普.查通常是一次性的或者周期性的;
為某一特定目的而專門組
2.一般需要規(guī)定統(tǒng)一的標準調查時間,以避免調查數
織的一次性全面調查,主要
據的重復或遺漏,保證普查結果的準確性。
普查用于了解處于某一時點狀
3.數據一般比較準確,規(guī)范化程度較高,可以為抽樣
態(tài)上的社會經濟現象的基
調查或其他調查提供基本的依據。
本全貌。
4.使用范圍比較窄,只能調查一些最基本及特定的現
象。
(1).經濟性:
是抽樣調查的一
個顯著優(yōu)點。
(2)時效性強:
可以迅速、及時
的獲得所需要的
從調查對象的總體中抽取
信息O
一部分單位作為樣本進行
抽樣(3).適應面廣:
調查,并根據樣本調查結果
調查可用于全面調查
來推斷總體特征的一種非
能夠調查的現
全面調查
象,也能調查全
面調查所不能調
查的現象,特別
適合特殊現象的
調查。如:產品
質量檢驗、農產
品試驗、醫(yī)藥的
臨床實驗。
(4).準確性高:
調查的目的只要求了解基本狀況和發(fā)展趨勢,不要求
掌握全面數據,而調查少數重點單位就能滿足需要
從調查對象的全部單位中時,采用重點調查比較適宜。
選擇…部分重點單位進行(1)為了及時了解全國城市零售物價的變動趨勢,
調查。就可以對全國的35個大中型城市的零售物價的變化
重點
重點單位雖然只是全部單進行調查就是重點調查。
調查
位中的一部分,但就調查的(2)要及時了解全國工業(yè)企業(yè)的增加值和資產總額
標志值來說在總體中占絕情況,只需對全國大中型工業(yè)企業(yè)進行重點調查即
大比重???。
(3)國家統(tǒng)計局的全國5000家工業(yè)企業(yè)聯網直報制
度屬于重點調查。
有意識的選擇若干具有典作用:彌補全面調查的不足;在一定條件下可以驗證
典型
型意義的或有代表性的單全面調查數據的真實性。
調查
位進行的調查。
【注】抽樣調查和重點調查、典型調查的區(qū)別:
抽樣調查是隨機的抽取調查單位,可以根據抽樣結果推斷總體的數量特征;
重點調查和典型調查的單位不是隨機抽取的,具有一定的主觀性,因此調杳結果不能推斷總體。
【例題17:2006年單選題】能夠根據樣本結果推斷總體數量特征的調查方式是()
A.重點調查
B.抽樣調查
C.典型調查
D.所有非全面調查
【答案】B
【例題18:2009年單選題】為了解全國煤炭企業(yè)的生產安全狀況,找出安全隱患,專家根據經驗選擇10
個有代表性的企業(yè)進行深入細致的調查。這類調查方法屬于()。
A.專家調查
B.重點調查
C.系統(tǒng)調查
D.典型調查
【答案】D
【例題19:2012年單選題】在進行重點調查時,應選擇的調查單位是。。
A.就調查標志值來說在總體中占絕大比重的單位
B.有典型意義的單位
C.主動參與調查的單位
D.隨機抽取的單位
【答案】A
【例題20:2011年多選題改編】關于抽樣調查的說法,正確的有()。
A.抽樣調查中不存在非抽樣誤差
B.抽樣調查用樣本數據推斷總體特征
C.抽樣調查適應面廣
D.抽樣調查時效性差
E.抽樣調查通常從總體中選擇重點單位進行調查
【答案】BC
【第21章考點總結】
1、統(tǒng)計學的兩大分支
2、描述統(tǒng)計和推斷統(tǒng)計的含義及內容
3、變量和數據的含義及類型
4,均值及中位數的計算和適用范圍
5,方差和標準差的關系及二者的適用范圍
6、數據的來源(按收集方法及按來源)
7、統(tǒng)計調查的分類
8、統(tǒng)計調查的方式
第22章抽樣調查
第一節(jié)抽樣調查的基本概念
【本節(jié)考點】
1、總體、樣本;抽樣框、抽樣單位;總體參數、樣本統(tǒng)計量
2、概率抽樣的特點,非概率抽樣的主要方法
3、抽樣調查的步驟
4、抽樣調查中的誤差
【本節(jié)內容】
一、抽樣調查基本概念
概念含義例子
總體和總調查對象的全體,組成總體的各個如研究某公司所有注冊在職人員
體單元個體稱作總體單元或單位。(共有1000名)的工資狀況,總
體是公司所有注冊在職員工,每
個注冊在職人員是總體單元。
樣本、樣樣本是總體的一部分,由從總體中上例中,按一定原則從所有注冊
本單位及按一定原則或程序抽出的部分個體在職人員中抽取出200人調查。
樣本量所組成。樣本也是一個集合。每個這200名注冊在職員工就是樣
被抽中進入樣本的單位稱為人樣單本;而抽出的每一名員工就是入
位。樣本中包含的入樣單位的個數樣單位;該樣本的樣本量是200.
稱為樣本量。
抽樣框供抽樣所用的所有抽樣單元的名上述例子中,企業(yè)1000名注冊在
單,是抽樣總體的具體表現。常見職職工的名冊,就是抽樣框。
的抽樣框有名錄框,如企業(yè)名錄、
電話簿、人員名冊。抽樣框也可以
是一張地圖或其他適當的形式,不
管是那種形式,抽樣框中的單位必
須是有序的,便于編號。高質量的
抽樣框應當提供被調查單位更多的
信息,并且沒有重復和遺漏。
抽樣單元構成抽樣框的基本要素,抽樣單元要調查城市擁有兩套以上住房的
可以只包括一個總體單元,也可以人口比例,總體單元是該城市的
包括多個總體單元。每個人,但抽樣單元可以是該城
市的每戶家庭或是每個居委會。
總體參數總體參數就是總體指標值,它是未如研究某公司所有注冊在職人員
知的常數,是根據總體中所有單位(共有1000名)的工資狀況,公
的數值計算的,是通過調查想要了司所有注冊在職人員的平均工資
解的,不受樣本的抽選結果影響。就是總體參數。
常用的總體參數有總體總量、總體
均值、總體比例、總體方差。
樣本統(tǒng)計是根據樣本中各單位的數值計算如上例中,200名注冊在職職工
量(估計的,是對總體參數的估計,也稱估的平均工資就是該公司所有員工
量)計量。它是一個隨機變量,取決于平均工資的一個估計量(樣本統(tǒng)
樣本設計和正好被選入樣本的單元計量)
特定組合。常用的樣本統(tǒng)計量有樣
本均值、樣本比例、樣本方差。
【例題1:2012年單選】在研究某城市居民的家庭消費結構時,在全部50萬戶家庭中隨機抽取300
0戶進行入戶調查,這項抽樣調查中的樣本是指該城市中。。
B.抽取出來的3000戶家庭
B.50萬戶家庭
C.每一戶家庭
D.抽取出來的每一戶家庭
【答案】A
【例題2:單選】某工廠為了檢測出廠的十萬只燈泡的壽命,隨機抽取了1000只燈泡進行檢測.關于該抽
樣調查下列表述錯誤的是()。
A總體是出廠的十萬只燈泡
B樣本是抽取到的1000只燈泡
C全體燈泡的平均壽命是總體參數
D1000只燈泡的平均壽命是抽樣單元
【答案】D
【解析】1000只燈泡的平均壽命是樣本統(tǒng)計量,也稱為估計量。
二、概率抽樣和非概率抽樣
抽樣含義特點具體方式
方法
概率依據隨機1.按一定概率以隨機原則1.簡單隨機抽樣;
抽樣原則,按照抽取樣本。2.分層抽樣
某種事先2.總體中每個單元被抽中3.系統(tǒng)抽樣;
設計的程的概率是已知的或者是可4.整群抽樣
序,從總體以計算出來5.多階段抽樣
中抽取部3.當采用樣本對總體參數
分單元的進行估計時,要考慮到每個
方法。樣本單元被抽中的概率。若
每個單位被抽中的概率相
等,則成為等概率抽樣;否
則稱為非等概率抽樣。
非概調查者根抽取樣本時并不是依據隨L判斷抽樣:調查者依據調查目的
率抽據自己的機原則。和對調查對象的了解,人為確定樣
樣方便或主本單元;
觀判斷抽2.方便抽樣:攔截式
取樣本的3.自愿樣本:網上調查
方法。4.配額抽樣:總體劃分若干類型,
將樣本數額分配到各類型,從各類
型中抽取樣本的方法沒有嚴格限
制,一般采用方便抽樣。
【例題3:2011年單選題】下列抽樣方法中,屬于非概率抽樣的是()。
A.分層抽樣
B.整群抽樣
C.判斷抽樣
D.等距抽樣
【答案】C
【例題4:多選題】相對于非概率抽樣而言,概率抽樣的特點有。
A按一定的概率以隨機原則抽取樣本
B總體中每個單元被抽中的概率是已知的或可以計算出來
C每個單位被抽入樣本的概率相等
D抽取樣本時不需要依據隨機原則
E當采用樣本對總體參數進行估計時,要考慮到每個樣本單元被抽中的概率
【答案】ABE
三、抽樣調查的一般步驟
1、確定調查問題:
2、調查方案設計:明確如何實施調查,包括抽樣方案的設計和問卷設計。
3、實施調查過程:獲得樣本單元的調查數據,關鍵的問題是要保證原始數據的質量。
4、數據處理分析:對數據進行檢查核對、編碼、錄入、預處理、統(tǒng)計分析、對總體參數進行估計。
5、撰寫調查報告:調查活動的最終成果。
四、抽樣調查中的誤差
樣本估計值和總體參數值之間的差異稱為誤差,一般來說調查中的誤差分為抽樣誤差和非抽樣誤差兩類。
誤差形成原因
抽樣由抽樣的隨機性造成的,用樣本統(tǒng)計量估計總體參數時出現的誤差。抽到
誤差哪一個樣本完全是隨機的,而抽到不同的樣本,對總體的估計就會不同。
非抽樣誤除抽樣誤差外,由其他原因引起的樣本統(tǒng)計量與總體真值之間的差異。
1(1)抽樣框誤差:樣本框不完善造成的。如用工商局簽發(fā)的營業(yè)執(zhí)照作為
個體商業(yè)的抽樣框,對個體商業(yè)實施抽樣調查,以掌握個體商業(yè)零售額的
情況。但有些商販無照經營、有些商販雖有執(zhí)照但轉行,不再經商;有些
雖有一個攤點卻辦理多個營業(yè)執(zhí)照。這些情形均會導致估計結果失真。
(2)無回答誤差:調查人員沒能夠從被調查者那里得到所需要的數據。無
回答分為:
①由于隨機因素造成的。如被調查者恰巧不在家,這種會減少有效樣本量,
造成估計量方差增大。
②由于非隨機因素造成的:如被調查者不愿告訴實情而拒絕回答,這時,
回答者與不回答者在調查指標上存在數量的差異,調查的結果中只有回答
者的信息,卻沒有無回答者的信息,這種無回答不僅造成估計量方差增大,
還會帶來估計偏差。
(3)計量誤差:由于調查所獲得的數據與其真值之間不一致造成的誤差。這
種誤差可能是由調查人員、問卷設計、受訪者等原因造成的。
【例題5:單題】抽樣誤差形成的原因主要是。
A、抽樣的隨機性
B、有意虛報、瞞報
C、問卷設計缺陷
D、調查人員沒能夠從被調查者那里得到所需要的數據
【答案】A
【例題6:2010年多選題改編】統(tǒng)計數據的非抽樣誤差形成的原因主要有0。
A.受訪者提供虛假數字
B.抄錄錯誤
C.無回答誤差
D.抽樣的隨機性
E.抽樣框不完善
【答案】ABCE
【例題7:2010年多選題改編】人口普查統(tǒng)計數據可能存在的誤差來源有()。
A.填報錯誤
B.抽樣的隨機性
C.抄錄錯誤
D.匯總錯誤
E.有意瞞報
【答案】ACDE
【解析】普查只存在非抽樣誤差。所以本題實質是考核登記性誤差產生的原因。
第二節(jié)幾種基本的概率抽樣方法
【本節(jié)考點】
各種概率抽樣方法的含義、特點
【本節(jié)內容】
一、簡單隨機抽樣
(-)含義
1、有放回簡單隨機抽樣
從總體中隨機抽出一個樣本單位,記錄觀測結果后,將其放回到總體中去,再抽取第二個,如此類推,一直到
抽滿n個單位為止。
【注】單位有被重復抽中的可能,容易造成信息重疊而影響估計的效率,較少采用。
2、不放回簡單隨機抽樣
從包含N個單元的總體中逐個隨機抽取單元并無放回,每次都在所有尚未被抽入樣本的單元中等概率的抽
取下一個單元,直到抽取n個單元為止。
【注】每個單位最多只能被抽中一次,不會由于樣本單位被重復抽中而提供重疊信息,比放回抽樣有更低
的抽樣誤差。
(二)優(yōu)缺點
優(yōu)點:簡單隨機抽樣是最基本的隨機抽樣方法,操作簡單,且每個單位的入樣概率相同,樣本估計量形式
也比較簡單。
缺點:沒有利用抽樣框更多的輔助信息,用樣本統(tǒng)計量估計總體參數的效率受到影響,樣本的分布可能十
分分散,增加了調查過程中的費用和時間。
(三)適用條件
1、抽樣框中沒有更多可以利用的輔助信息
2、調查對象分布的范圍不廣闊
3、個體之間的差異不是很大
【例題8:單選】下列關于簡單隨機抽樣的表述錯誤的是
A總體的每個單位入樣概率相同
B是最基本的隨機抽樣方法
C沒有利用抽樣框更多的輔助信息
D適用個體之間差異較大的調查
【答案】D
二、分層抽樣
(-)含義
先按照某種規(guī)則把總體分為不同的層,然后在不同的層內獨立、隨機的抽取樣本,這樣所得到的樣本稱為分層
樣本。如果每層中的抽樣都是簡單隨機抽樣,則稱為分層隨機抽樣。
分層抽樣樣本量在各層分配的方法有兩類,如下表:
分配方法含義優(yōu)缺點
等比例層中單位數越多,抽取的樣本單位就操作容易,易于理解,在實踐中廣
分配越多,該層樣本單位比例與該層中的泛使用。但各層單位數相差懸殊或
總體單位比例相一致.層內方差過大時抽樣誤差會很大。
不等比例分層樣本單位比例與該層中的總體單如果各層的總體方差已知,不等比
配位比例不一致。例抽樣的抽樣誤差可能比等比例
抽樣更小。
【例題9:單選】某校高中生共有2700人,其中高一年級900人,高二年級1200人,高三年級600人,現采
取分層抽樣法抽取容量為135的樣本,那么高一、高二、高三各年級抽取的人數分別為()
A.45,75,15
B.45,45,45
C.30,90,15
D.45,60,30
【答案】D
【解析】樣本量占總體容量的比=135/2700=5%
-"900=5%,所以,n(?->=5%X900=45A
n(?-)/1200=5%,所以,一*二>=5%乂1200=60人
n8三"600=5%,所以,n*三>=5%X600=30人
(二)優(yōu)缺點
優(yōu)點:
1.不僅可以估計總體參數,同時也可以估計各層參數
【例】調查某市中小企業(yè)就業(yè)的相關指標,可以按照行業(yè)將該市中小企業(yè)進行分層,再在每個行業(yè)內獨立隨機
抽取一部分中小企業(yè)進行調查,這樣不僅能估計全市中小企業(yè)就業(yè)的相關指標,還可以在各行業(yè)進行推算。
2.便于抽樣工作的組織。
3.每層都要抽取一定的樣本單位,這樣樣本在總體中分布比較均勻,可以降低抽樣誤差。
(三)適用條件
抽樣框中有足夠的輔助信息,能夠將總體單位按某種標準劃分到各層之中,實現在同一層內,各單位之間
的差異盡可能小,不同層之間各單位的差異盡可能大。(層內差異小,層間差異大)
三、系統(tǒng)抽樣
(一)含義
系統(tǒng)抽樣指先將總體中的所有單元按一定順序排列,在規(guī)定范圍內隨機抽取一個初始單元,然后按事先規(guī)定的
規(guī)則抽取其他樣本單元。
最簡單的系統(tǒng)抽樣是等距抽樣。其步驟:
1.將總體N個單位按直線排列,依次編號1——N;
2.根據樣本量n確定抽樣間隔K
抽樣間隔=以曰匕1C勺最4
nn
【例】N=24,n=4,抽樣間隔是24/4=6
若N=23,n=4,抽樣間隔是23/4=5.6%6
3.在1——K的范圍內隨機抽取一個整數i,令位于i位置上的單位為起始單位,往后每間隔k抽取一個
單位,直至抽滿n。
【接上例】N=24,n=4,抽樣間隔是24/4=6,在1?6之間,隨機抽取一個整數2作為起始單位,以6為
間隔,可得到樣本到2+6=8;8+6=14;14+6=20
(二)優(yōu)缺點
1、優(yōu)點:
(1)操作簡便;
(2)對抽樣框的要求比較簡單,它只要求總體單位按一定順序排列,而不一定是一份具體的名錄清單。
系統(tǒng)抽樣的估計效果與總體排列順序有關。
①、無關標識排列:
排列順序與調查內容沒有聯系。這時系統(tǒng)抽樣估計與簡單隨機抽樣估計效率相仿。
【例】對汽車尾氣排放情況的調查中,是按汽車牌號排列,牌號與尾氣排放沒有關系,即屬于無關標識排
列。
②、有關標識排列:
排列順序與調查內容有關。其抽樣精度一般比簡單隨機抽樣的精度高。
【例】對汽車尾氣排放情況的調查中,按汽車價格排列,價格與尾氣排放量有相關性。
2、缺點:
方差估計比較復雜,這就給計算抽樣誤差帶來一定困難。
四、整群抽樣
(-)含義
整群抽樣是將總體中所有的基本單位按照一定規(guī)則劃分為互不重疊的群,抽樣時直接抽取群,對抽中的群調查
其全部的基本單位,對沒有抽中的群則不進行調查。
【例】調查某市在職的房地產行業(yè)人員工資水平,將房地產行業(yè)所有在職人員按照所屬企業(yè)分群,直接
抽取企業(yè)單位,入樣的企業(yè)單位內所有職工接受調查,沒有入樣的企業(yè)單位員工都不調查。
(二)優(yōu)缺點
1、優(yōu)點:
(1)實施調查方便,可以節(jié)省費用和時間。
(2)抽樣框編制得以簡化,抽樣時只需要群的抽樣框
2、缺點
群內各單位之間存在相似性,差異比較小,而群與群之間的差別比較大,使得整群抽樣的抽樣誤差比較大。
(三)適用
如果群內各單位之間存在較大差異,群與群的結果相似,整群抽樣會降低估”?誤差。
【例】調查某地區(qū)的男女比例,以家庭為群,整群抽樣估計男女比例的誤差就低于簡單隨機抽樣。
整群抽樣特別適合于對某些特殊群結構進行調查。
【例題10:2012單選】在調查某城市小學教師亞健康狀況時,從該城市的200所小學中隨機抽取40所,
每個被抽取小學中的所有教師都參與調查,這樣抽樣方法屬于()。
A.簡單隨機抽樣B.整群抽樣
C.分層抽樣D.等距抽樣
【答案】B
(五)多階段抽樣
(一)含義
在大規(guī)模抽樣調查中,一次抽取到最終樣本單位很難實現,往往需要經過二個或二個以上階段才能抽到最終樣
本單位,這就是多階段抽樣方法。首選從總體中采用隨機方法抽取若干個小總體,稱為初級單元;再在這些中
選的初級單元中隨機抽取若干個單位。
(二)優(yōu)缺點
在大范圍的抽樣調查中,采用多階段抽樣是必要的。首先,多階段抽樣是分階段進行的,抽樣框也可以分級進
行準備。其次因為多階段抽樣是在中選單位中的再抽選,這樣就使樣本的分布相對集中,從而可以節(jié)省調查中
的人力和財力。
多階段的抽樣設計比較復雜,其抽樣誤差計算也比較復雜。
第三節(jié)估計量和樣本量
【本節(jié)考點】
3、估計量的性質
4、抽樣誤差的估計
5、樣本量的影響因素
【本節(jié)內容】
一、估計量的性質(一無有,可記憶為“一無所有”)
性質內含
一致性隨著樣本量的增大,估計量的值如果穩(wěn)定于總體參數的真值,這個估計量
就有一致性,可稱為“一致估計量”。
無偏性對于不放回簡單隨機抽樣,所有可能的樣本均值取值的平均值總等于總體
現值(樣本均值的平均數等于總體均值),這就是樣本均值估計量的無偏性。
有效性在同一抽樣方案下,對某一總體參數,如果有兩個無偏估計量。1、82,由
于樣本的隨機性,如果e1的可能樣本取值較e2更密集在總體參數真值附
亞,則認為S比。更有效,此時e?的方差小于ez的方差。
【例題11:單選】抽樣統(tǒng)計中,估計量的性質不包括()。
A一致性
B相關性
C無偏性
D有效性
【答案】B
(二)抽樣誤差的估計
抽樣誤差無法避免,但是可計算的。
在不放回簡單隨機抽樣方法中,將樣本均值作為總體均值的估計量。則估計量的方差為:
樣本估計量的方差=
【結論】
C.抽樣誤差與總體分布有關,總體單位值之間差異越大,即總體方差越大,抽樣誤差越大。
D.抽樣誤差與樣本量n有關,其他條件相同,樣本量越大,抽樣誤差越小。
E.抽樣誤差與抽樣方式和估計量的選擇也有關。例如分層抽樣的估計量方差一般小于簡單隨機抽樣。
F.利用有效輔助信息的估計量也可以有效的減小抽樣誤差。
2、實踐中,總體方差是未知的,可以利用樣本方差來估計,因此估計量方差的的估計公式為:
樣本估計量的方胃
【例12】從某個N=1000的總體中抽出一個樣本容量為100的不放回簡單隨機樣本,樣本均值50,樣本方差
200,對總體均值的估計量等于樣本均值等于50,估計量的方差是。。
【解析】
樣樣本方
樣本估計量的方差=4-總體分羹C樣本看
=a_K)O)x2OC=18
10001OC
【例13:多選】下列關于抽樣誤差的表述正確的有()。
A抽樣誤差無法避免,但可計算
B抽樣誤差與總體分布有關,總體方差越大,抽樣誤差越大。
C其他條件相同,樣本量越大,抽樣誤差越小
D抽樣誤差與抽樣方式和估計量的選擇也有關
E分層抽樣的估計量方差一般大于簡單隨機抽樣
【答案】ABCD
三、樣本量的影響因素
1、調查的精度:用樣本數據對總體進行估計時可以接受的誤差水平,要求的調查精度越高,所需要的樣
本量就越大。
2、總體的離散程度:在其他條件相同情況下,總體的離散程度越大,所需要的樣本量也越大。
3、總體的規(guī)模:對于大規(guī)模的總體,總體規(guī)模對樣本量的需求則幾乎沒有影響(樣本量n可大致用
------、——公式表示)。但對于小規(guī)模的總體,總體規(guī)模越大,為保證相同估計精度,樣本量也要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- PLC控制技術考試模擬題(含答案)
- 養(yǎng)老院環(huán)境保護管理制度
- 交通安全教育課件
- 《打造學習型團隊》課件
- 2024年新能源項目投資委托居間合同范本3篇
- 教育合同范本
- 2024年度特殊工種委托招聘與職業(yè)安全防護用品供應合同3篇
- 臨床靜脈留置針護理及并發(fā)癥
- 2024年度綠色有機食材供應合作協議2篇
- 2024天津出租車租賃車輛安全性能檢測合同3篇
- 高考日語語法之授受關系的動詞課件
- 人體解剖生理學理論知識考核試題題庫及答案
- 國家開放大學電大建筑制圖基礎機考網考試題庫及答案
- 職業(yè)生涯訪談活動范文優(yōu)選5篇
- 園林景觀工程施工組織機構
- 坍落度試驗課件
- 消防設施操作員報名承諾書
- 中醫(yī)方劑學之祛濕劑課件
- 阿里巴巴管理三板斧
- 以“政府績效與公眾信任”為主題撰寫一篇小論文6篇
- 地理中考試題說題稿
評論
0/150
提交評論