版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章緒論
第一節(jié)統(tǒng)計(jì)與統(tǒng)計(jì)學(xué)
統(tǒng)計(jì)的含義
1.統(tǒng)計(jì)工作(統(tǒng)計(jì)實(shí)踐):是指對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行搜集、整理和分析的活動(dòng)
過程。
2.統(tǒng)計(jì)數(shù)據(jù)(統(tǒng)計(jì)資料):是統(tǒng)計(jì)工作的成果。統(tǒng)計(jì)數(shù)據(jù)的搜集是取得統(tǒng)
計(jì)數(shù)據(jù)的過程,它是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)。離開了統(tǒng)計(jì)數(shù)據(jù),統(tǒng)計(jì)方法就失去
了用武之地。
統(tǒng)計(jì)工作和統(tǒng)計(jì)數(shù)據(jù)的關(guān)系是過程和成果的關(guān)系。即統(tǒng)計(jì)數(shù)據(jù)是統(tǒng)計(jì)工作
提供的,是統(tǒng)計(jì)活動(dòng)的成果。
3.統(tǒng)計(jì)學(xué):是一門有關(guān)統(tǒng)計(jì)數(shù)據(jù)的科學(xué)。它研究如何搜集、整理資料和
進(jìn)行數(shù)量分析,推斷的一門方法論科學(xué)。是統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和概括。
統(tǒng)計(jì)工作和統(tǒng)計(jì)學(xué)是實(shí)踐和理論的關(guān)系。統(tǒng)計(jì)理論來源于統(tǒng)計(jì)實(shí)踐,它是
統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和概括。反過來,統(tǒng)計(jì)理論又是指導(dǎo)統(tǒng)計(jì)工作的原則和方
法。
總之,統(tǒng)計(jì)工作,統(tǒng)計(jì)數(shù)據(jù),統(tǒng)計(jì)學(xué)三者之中,統(tǒng)計(jì)工作是基礎(chǔ),是源。
沒有統(tǒng)計(jì)工作,就不會(huì)產(chǎn)生統(tǒng)計(jì)數(shù)據(jù),沒有統(tǒng)計(jì)工作,缺少這個(gè)實(shí)踐基礎(chǔ),統(tǒng)
計(jì)學(xué)也就不可能形成和發(fā)展。
統(tǒng)計(jì)規(guī)律與統(tǒng)計(jì)方法
統(tǒng)計(jì)規(guī)律即統(tǒng)計(jì)數(shù)據(jù)的內(nèi)在變化趨勢;統(tǒng)計(jì)方法即研究統(tǒng)計(jì)規(guī)律的數(shù)量方
法。前者如“恩格爾定律”,后者如ARMA模型。
第二節(jié)統(tǒng)計(jì)學(xué)的分科
統(tǒng)計(jì)學(xué)大致有以下兩種分類:
根據(jù)統(tǒng)計(jì)方法的構(gòu)成,統(tǒng)計(jì)學(xué)可以分為描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)
學(xué)。
1.描述統(tǒng)計(jì)學(xué):通過對現(xiàn)象的調(diào)查或觀察f得到大量的統(tǒng)計(jì)數(shù)據(jù)f用圖
表形式對所收集到的數(shù)據(jù)進(jìn)行加工處理與顯示一就這些數(shù)據(jù)的分布特征(如集
中趨勢,離散趨勢等)計(jì)算出一些概括性的數(shù)字(如平均數(shù),標(biāo)準(zhǔn)差,相關(guān)系
數(shù)等等)一得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。
2.推斷統(tǒng)計(jì)學(xué):推斷統(tǒng)計(jì)學(xué)是指只憑樣本數(shù)據(jù)去推斷總體數(shù)量特征的技
術(shù)方法。
概率論
(包括分布理論、大數(shù)定
律和中心極限定理等)
0
推斷統(tǒng)計(jì)學(xué)(利用樣本信
:為數(shù)乎據(jù)描述統(tǒng)計(jì)學(xué)(包括
-?1:>息和概率論對總體的數(shù)量
統(tǒng)計(jì)數(shù)據(jù)的收集、
特征進(jìn)行估計(jì)和檢驗(yàn)等)
,,整理、顯示和分析
本數(shù)據(jù)
\/
總體內(nèi)在1
的數(shù)量規(guī)
律性
圖1—1統(tǒng)計(jì)學(xué)探索客觀現(xiàn)象數(shù)量規(guī)律性的過程
注1:描述統(tǒng)計(jì)學(xué)不必深入一層地去試圖推論數(shù)據(jù)本身以外的任何事
情;推斷統(tǒng)計(jì)學(xué)則在樣本數(shù)據(jù)的基礎(chǔ)上深入一步地分析、研究和推斷,以推知
資料本身以外的情況和數(shù)量關(guān)系。
注2:描述統(tǒng)計(jì)學(xué)用的是總體數(shù)據(jù),推斷統(tǒng)計(jì)學(xué)則往往用樣本數(shù)據(jù)。
在現(xiàn)實(shí)問題中,我們得到的數(shù)據(jù)主要是樣本數(shù)據(jù),因此,推斷統(tǒng)計(jì)學(xué)越來越重
要,是統(tǒng)計(jì)學(xué)的核心內(nèi)容。
注3:統(tǒng)計(jì)學(xué)的發(fā)展過程中,先有描述統(tǒng)計(jì)學(xué),后有推斷統(tǒng)計(jì)學(xué),從
描述統(tǒng)計(jì)學(xué)發(fā)展到推斷統(tǒng)計(jì)學(xué),是統(tǒng)計(jì)學(xué)發(fā)展成熟的標(biāo)志。
從統(tǒng)計(jì)方法研究和統(tǒng)計(jì)方法的應(yīng)用角度看,統(tǒng)計(jì)學(xué)可分為理論統(tǒng)
計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)。
理論統(tǒng)計(jì)學(xué)主要是指統(tǒng)計(jì)學(xué)的數(shù)學(xué)原理和方法原理。從事統(tǒng)計(jì)理論和
方法研究的人員需要
有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)。理論統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)的理論基礎(chǔ)。統(tǒng)計(jì)學(xué)是一門分析
數(shù)據(jù)的科學(xué),因而統(tǒng)計(jì)方法的應(yīng)用兒乎擴(kuò)展到了所有的科學(xué)研究領(lǐng)域。
第三節(jié)基本概念
—.總體和單位
1.總體
總體是指根據(jù)研究目的確定的所要研究的同類事物的全體。
說明:⑴統(tǒng)計(jì)總體是根據(jù)統(tǒng)計(jì)研究目的確定的。
⑵統(tǒng)計(jì)總體是客觀存在的。
⑶統(tǒng)計(jì)總體中的所有個(gè)別事物具有某種同一性質(zhì)。
2.單位
單位是指構(gòu)成總體的個(gè)別事物(基本單元),也稱個(gè)體。例如:我們要
研究全國鄉(xiāng)鎮(zhèn)企業(yè)發(fā)展情況,則總體為全國鄉(xiāng)鎮(zhèn)企業(yè),單位為每個(gè)鄉(xiāng)鎮(zhèn)企業(yè)。
—.標(biāo)志和指標(biāo)
1.^^志
標(biāo)志是說明總體單位屬性和特征的名稱。標(biāo)志和總體單位的關(guān)系是非
常明確的,總體單位是標(biāo)志的直接承擔(dān)者,標(biāo)志是依附于總體單位的。
標(biāo)志按表現(xiàn)形式不同分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志。①品質(zhì)標(biāo)志:表示總
體單位性質(zhì)方面的特征;它只能用文字表示。②數(shù)量標(biāo)志:表示總體單位性數(shù)
量方面的特征;用數(shù)值表示。
標(biāo)志表現(xiàn):是標(biāo)志特征在各單位的具體表現(xiàn),有品質(zhì)標(biāo)志表現(xiàn)和數(shù)量
標(biāo)志表現(xiàn)之分。數(shù)量標(biāo)志的表現(xiàn)即標(biāo)志值。
2.指標(biāo)
①概念:指標(biāo)是反映總體數(shù)量特征的概念及其數(shù)值。
②分類
指標(biāo)按反映的數(shù)量特點(diǎn)不同可分為數(shù)量指標(biāo)和質(zhì)量指標(biāo)。
I.數(shù)量指標(biāo):說明總體規(guī)模大小,水平高低,數(shù)量多少的指標(biāo);用絕對
數(shù)表示。
II.質(zhì)量指標(biāo):說明總體相對水平或工作質(zhì)量的統(tǒng)計(jì)指標(biāo);用相對數(shù)、平
均數(shù)表示。
兩者關(guān)系:數(shù)量指標(biāo)是計(jì)算質(zhì)量指標(biāo)的基礎(chǔ)。
③特點(diǎn)
I.數(shù)量性(可量性)
II.綜合性
III.客觀性(具體性)
三.變異和變量
1.變異:可變標(biāo)志的屬性或特征由一種狀態(tài)變到另一種狀態(tài),統(tǒng)計(jì)上稱
之為變異。
2.變量:在統(tǒng)計(jì)中,一般把說明現(xiàn)象某種特征的概念稱為變量。變量的
具體表現(xiàn)稱為變量值。如果一個(gè)變量是由品質(zhì)數(shù)據(jù)來記錄的稱為品質(zhì)變量,如
“性別”就是一個(gè)品質(zhì)變量。如果一個(gè)變量是由數(shù)量數(shù)據(jù)來記錄的稱為數(shù)量變
量或數(shù)字變量。數(shù)字變量根據(jù)其取值的不同,可以分為離散變量和連續(xù)變量。
離散變量其取值都是以整數(shù)位斷開,可以一一列舉,如“企業(yè)數(shù)”等。連續(xù)變
量其取值是連續(xù)不斷的,不能一一列舉,如“溫度”等。但多數(shù)情況下我們所
說的變量都是指數(shù)字變量。
第二章統(tǒng)計(jì)數(shù)據(jù)的搜集與整理
教學(xué)重點(diǎn)和難點(diǎn):數(shù)據(jù)的搜集方法;調(diào)查方案設(shè)計(jì);數(shù)據(jù)分組。
第一節(jié)數(shù)據(jù)的計(jì)量與類型
數(shù)據(jù)的計(jì)量尺度
統(tǒng)計(jì)數(shù)據(jù)是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ),統(tǒng)計(jì)數(shù)據(jù)靠我們?nèi)ニ鸭拍艿玫?,但在?/p>
集數(shù)據(jù)之前,先要對現(xiàn)象進(jìn)行計(jì)量或測度,這就涉及到數(shù)據(jù)的計(jì)量尺度問題。按
照計(jì)量學(xué)的i般分類方法,對統(tǒng)計(jì)數(shù)據(jù)分為四種計(jì)量尺度或計(jì)量水準(zhǔn),即定類尺
度、定序尺度、定距尺度和定比尺度。
(一)定類尺度
定類尺度也稱類別尺度或列名尺度,是最粗略、計(jì)量層次最低的計(jì)量尺度。
這種計(jì)量尺度只能按照事物的某種屬性對其進(jìn)行平行的分類或分組。例如人口按
照性別分為男、女兩類等。分類就是將所觀察的個(gè)體(總體單位)分為不同的類
型。定類尺度只是測度了事物之間的類別差,對各類之間的其他差別卻沒有反映。
使用該尺度對事物所作的分類,各類別之間是平等的并列關(guān)系,無法區(qū)分優(yōu)劣或
大小,各類別之間的順序是可以改變的。對定類尺度的計(jì)量結(jié)果,通常是通過計(jì)
算出每一類別中各元素或個(gè)體出現(xiàn)的頻率或頻數(shù)來進(jìn)行分析。
在使用定類尺度對事物進(jìn)行分類時(shí),必須符合窮盡和互斥的要求。定類尺度
是對事物最基本的測度,是其他計(jì)量尺度的基礎(chǔ)。它具有=和W的數(shù)學(xué)特性。
(-)定序尺度
定序尺度又稱順序尺度,是對事物之間等級(jí)差或順序差別的一種測度。該尺
度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優(yōu)劣或順序。例
如,考試成績可以分為優(yōu)、良、中、及格、不及格等等。
定序尺度對事物的計(jì)量要比定類尺度精確一些,但它只測度了類別之間的順
序,而未測量出類別之間的準(zhǔn)確差值。因些該尺度具有>和<的數(shù)學(xué)特性,但不
能進(jìn)行加、減、乘、除等數(shù)學(xué)運(yùn)算。
(三)定距尺度
定距尺度也稱間隔尺度,它不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且
可以準(zhǔn)確地指出類別之間的差距是多少。定距尺度是對事物類別或次序之間間距
的測度。因此,定距尺度的計(jì)算結(jié)果表現(xiàn)為數(shù)值。如甲地區(qū)溫度是20°C,乙地
區(qū)的溫度是25°C,二者相差5°C。其結(jié)果可以進(jìn)行加、減運(yùn)算。
(四)定比尺度
定比尺度也稱為比率尺度,它除了具有上述三種計(jì)量尺度的全部特性以外,
還具有一個(gè)特性,那就是可以計(jì)算兩個(gè)測度值之間的比值。這就要求定比尺度中
必須有一個(gè)絕對固定的“零點(diǎn)”,這也是它與定距尺度的惟一差別。例如,一個(gè)
學(xué)生的數(shù)學(xué)成績?yōu)?分,是表示他的數(shù)學(xué)成績水平為0,并不表示他沒有考試成
績或沒有任何數(shù)學(xué)知識(shí);一個(gè)地區(qū)的溫度為0度,表示一種溫度的水平,并不是
沒有溫度。可見,定距尺度中的“0”是一個(gè)有意義的數(shù)值,定比尺度則不同,
它有一個(gè)絕對“零點(diǎn)”。在定比尺度中,“0”表示“沒有”或“不存在”,如某人
這個(gè)月的收入為“0”,表示這個(gè)人沒有收入。定比尺度可以進(jìn)行加、減、乘、除
運(yùn)算。
上述四種計(jì)量尺度對事物的測量層次由低級(jí)到高級(jí),由粗略到精確逐步遞進(jìn)
的。高層次的計(jì)量尺度可以具有低層次計(jì)量尺度的全部特性,但不能反過來。下
表給出了上述四種計(jì)量尺度的測量層次和數(shù)學(xué)特性。
四種計(jì)量尺度的比較
\計(jì)量定定序定距定比
限
類尺度尺度尺度尺度
X學(xué)
特性\
分類VV
(=、W)
排序VV
(>、<
間距VV
(一、+)
比值V
(X、+)
在統(tǒng)計(jì)分析中,一般要求測量的層次越高越好,因?yàn)楦邔哟蔚挠?jì)量尺度包
含更多的數(shù)學(xué)特性,所運(yùn)用的統(tǒng)計(jì)分析方法越多,分析時(shí)也就越方便,因此,應(yīng)
盡可能使用高層次的計(jì)量尺度。
數(shù)據(jù)的類型
從上述四種計(jì)量尺度的結(jié)果來看,可以將統(tǒng)計(jì)數(shù)據(jù)分為四種類型:
1.定類數(shù)據(jù):表現(xiàn)為類別,但不區(qū)分順序,是由定類尺度形成的。
2.定序數(shù)據(jù):表現(xiàn)為類別,但有順序,是由定序尺度計(jì)量形成的。
3.定距尺度:表現(xiàn)為數(shù)值,可以進(jìn)行加、減運(yùn)算,是由定距尺度計(jì)量形
成的。
4.定比數(shù)據(jù):表現(xiàn)為數(shù)值,可進(jìn)行加、減、乘、除運(yùn)算,是由定尺度形
成的。
前二類數(shù)據(jù)說明的是事物的品質(zhì)特征,不能用數(shù)值表示,其結(jié)果均表現(xiàn)
為類別,稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);后兩類數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征,能夠
用數(shù)值來表現(xiàn),因此稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。
區(qū)分測量的層次和數(shù)據(jù)的類型十分重要,因?yàn)閷Σ煌愋偷臄?shù)據(jù)將采用
不同的統(tǒng)計(jì)方法來處理。
三.統(tǒng)計(jì)數(shù)據(jù)的表現(xiàn)形式
/時(shí)期數(shù)
/絕聚數(shù)(數(shù)量指標(biāo))
/時(shí)點(diǎn)數(shù)
表平形式相對數(shù)比例(Proportion)
,比率(Ratio)
平均數(shù)(均值)
第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的搜集
我們站在統(tǒng)計(jì)數(shù)據(jù)使用者的角度看,統(tǒng)計(jì)數(shù)據(jù)主要來源于兩種渠道:一是
直接的調(diào)查和科學(xué)試驗(yàn),這是統(tǒng)計(jì)數(shù)據(jù)的直接來源,我們稱之為第一手資料或直
接的統(tǒng)計(jì)數(shù)據(jù);二是別人調(diào)查或試驗(yàn)的數(shù)據(jù),這是統(tǒng)計(jì)數(shù)據(jù)的間接來源,我們稱
之為第二手或間接的統(tǒng)計(jì)數(shù)據(jù)。
統(tǒng)計(jì)數(shù)據(jù)的直接來源
統(tǒng)計(jì)數(shù)據(jù)的直接來源主要有兩個(gè)渠道:一是專門組織的調(diào)查;專門調(diào)查是
取得社會(huì)經(jīng)濟(jì)數(shù)據(jù)的重要手段。二是科學(xué)試驗(yàn);科學(xué)試驗(yàn)是取得自然科學(xué)數(shù)據(jù)的
主要手段。
(一)統(tǒng)計(jì)調(diào)查方式
實(shí)際工作中常用的統(tǒng)計(jì)調(diào)查方式有:普查、重點(diǎn)調(diào)查、典型調(diào)查、抽樣調(diào)
查、統(tǒng)計(jì)報(bào)表等。
1.普查
①概念:普查是為某一特定目的而專門組織的一次性全面調(diào)查。我國五次人
口普查時(shí)間:1953年,1964年,1982年,1990年(7月1日零時(shí)),2000年(11
月1日零時(shí))。
②特點(diǎn):
a.普查通常是一次性的或周期性的;
b.普查一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間。目的是為了避免調(diào)
查數(shù)據(jù)的重復(fù)或遺漏。
c.為抽樣調(diào)查或其他調(diào)查提供基本依據(jù)。
d.普查的使用范圍比較窄。
2.抽樣調(diào)查
①概念:抽樣調(diào)查是從調(diào)查對象中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,
并根據(jù)調(diào)查結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查。
②特點(diǎn):i:經(jīng)濟(jì)性ii:時(shí)效性強(qiáng)iii:適應(yīng)面廣iv:準(zhǔn)確性高
3.統(tǒng)計(jì)報(bào)表
統(tǒng)計(jì)報(bào)表是國家和地方政府部門統(tǒng)計(jì)數(shù)據(jù)的主要來源。
①概念:統(tǒng)計(jì)報(bào)表是按照國家有關(guān)法規(guī)的規(guī)定,自上而下地逐級(jí)提供基本統(tǒng)
計(jì)數(shù)據(jù)的一種調(diào)查方式。
②種類
i:按調(diào)查范圍不同分為全面報(bào)表和非全面報(bào)表。
全面報(bào)表要求調(diào)查對象的每一個(gè)單位都填報(bào);非全面報(bào)表要求調(diào)查對象中的
一部分單位填報(bào)。
ii:按報(bào)表內(nèi)容和實(shí)施范圍不同分為國家統(tǒng)計(jì)報(bào)表、部門統(tǒng)計(jì)報(bào)表和地方統(tǒng)
計(jì)報(bào)表。
iii:按報(bào)送周期長短分為日報(bào)、旬報(bào)、月報(bào)、季報(bào)、半年報(bào)、年報(bào)。
iv:按報(bào)送單位不同分為基層統(tǒng)計(jì)報(bào)表和綜合統(tǒng)計(jì)報(bào)表。
4.重點(diǎn)調(diào)查
①概念:是指只在調(diào)查對象中選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,借以了解總體
基本情況的一-種非全面調(diào)查。重點(diǎn)單位是指在所要調(diào)查的數(shù)量特征上占有較大比
重的單位。
②特點(diǎn):i:重點(diǎn)單位的選擇具有客觀性。ii:重點(diǎn)調(diào)查的目的是為了
反映總體的基本情況。
5.典型調(diào)查
①概念:是根據(jù)調(diào)查目的和要求,在對研究對象進(jìn)行全面分析的基礎(chǔ)上,有
意識(shí)地選擇部分有代表性單位進(jìn)行調(diào)查,它是一種非全面調(diào)查。
②特點(diǎn):i:調(diào)查單位是根據(jù)調(diào)查目的有意識(shí)地選擇出來的少數(shù)具有代表性
的單位。
ii:典型調(diào)查是一種深入、細(xì)致的調(diào)查。
(-)數(shù)據(jù)的搜集方法
不論采取何種方式進(jìn)行調(diào)查,在取得統(tǒng)計(jì)數(shù)據(jù)時(shí),都有一些具體的數(shù)據(jù)搜
集方法,歸納起來有兩大類:
1.詢問調(diào)查:包括①訪問調(diào)查(派員調(diào)查):是調(diào)查者與被調(diào)查者通過面
對面交談從而得到所需資料的調(diào)查方法。②郵寄調(diào)查:是通過郵寄將調(diào)查表或
調(diào)查問卷送到被調(diào)查者手中,由被調(diào)查者填寫,然后寄回調(diào)查表的一種調(diào)查方法。
③電話調(diào)查:打電話,語言交流、搜集資料。④座談會(huì):把被調(diào)查者集中起來,
讓他們對調(diào)查主題發(fā)表意見,獲取資料。⑤個(gè)別深度訪問:一次只訪問一名被
調(diào)查者,詳細(xì)了解被調(diào)查者的思想和行為動(dòng)機(jī)。
2.觀察與實(shí)驗(yàn):包括①觀察法:調(diào)查人員邊觀察邊記錄以收集信息的方法。
②是在所設(shè)定的特殊實(shí)驗(yàn)場所,對調(diào)查對象進(jìn)行實(shí)驗(yàn)以取得資料的一種調(diào)查方
法。
統(tǒng)計(jì)數(shù)據(jù)的間接來源
第二手?jǐn)?shù)據(jù)主要是公開出版的或公開報(bào)道的數(shù)據(jù)。在我國,公開出版或報(bào)道
的社會(huì)經(jīng)濟(jì)數(shù)據(jù)主要來自國家和地方的統(tǒng)計(jì)部門以及各種報(bào)刊媒介。如公開出版
的《中國統(tǒng)計(jì)年鑒》,《中國市場統(tǒng)計(jì)年鑒》等,另外,廣泛分布在各種報(bào)刊、雜
志、圖書、廣播、電視傳媒中的各種數(shù)據(jù)資料也屬于第二手?jǐn)?shù)據(jù)。
第三節(jié)調(diào)查方案設(shè)計(jì)
在搜集直接統(tǒng)計(jì)數(shù)據(jù)之前,需要制定出一個(gè)周密、完整的調(diào)查方案,以指導(dǎo)
整個(gè)調(diào)查工作,一個(gè)完整的統(tǒng)計(jì)調(diào)查方案應(yīng)包括以下內(nèi)容:
一.確定調(diào)查目的(為什么要調(diào)查)
在調(diào)查方案中首先應(yīng)明確本次調(diào)查的目的,它要回答的是為什么調(diào)查,要解
決什么樣的問題。只有這些問題明確之后,才能確定向誰調(diào)查,調(diào)查什么以及采
用什么方法進(jìn)行調(diào)查。
二.確定調(diào)查對象和調(diào)查單位(向誰調(diào)查)
調(diào)查對象和調(diào)查單位要解決的是向誰調(diào)查,由誰來提供所需資料的問題。調(diào)
查對象是根據(jù)調(diào)查目的確定的調(diào)查研究的總體或調(diào)查范圍,調(diào)查單位是構(gòu)成調(diào)查
對象的每一個(gè)單位,是調(diào)查項(xiàng)目和指標(biāo)的承擔(dān)者或載體。
三.設(shè)計(jì)調(diào)查項(xiàng)目和調(diào)查表(調(diào)查什么)
調(diào)查項(xiàng)目是調(diào)查的具體內(nèi)容,它要回答的是調(diào)查什么問題。調(diào)查項(xiàng)目可以是
調(diào)查單位的數(shù)量特征,也可以是調(diào)查單位的某種屬性或品質(zhì)特征。調(diào)查項(xiàng)目常以
表格的形式來表現(xiàn),稱為調(diào)查表。
四.方案設(shè)計(jì)中的其他內(nèi)容
另外,調(diào)查方案還應(yīng)明確調(diào)查所采用的方式和方法,調(diào)查時(shí)間及調(diào)查的組織
與實(shí)施工作等。調(diào)查時(shí)間包括調(diào)查數(shù)據(jù)的所屬時(shí)間(若為時(shí)點(diǎn)現(xiàn)象,要明確規(guī)定
資料的統(tǒng)一時(shí)點(diǎn),即標(biāo)準(zhǔn)時(shí)點(diǎn);若為時(shí)期現(xiàn)象,要明確規(guī)定現(xiàn)象的起止時(shí)間)和
調(diào)查的工作期限(指調(diào)查工作從開始到結(jié)束的時(shí)間長度,包括:調(diào)查人員的選擇、
組織的培訓(xùn);調(diào)查經(jīng)費(fèi)的來源和開支預(yù)算等,調(diào)查表格、問卷、調(diào)查員手冊的印
刷等)。
第四節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理
把統(tǒng)計(jì)數(shù)據(jù)搜集上來之后,接下去的工作應(yīng)對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行加工整理,使之
系統(tǒng)化、條理化、以符合分析的需要。數(shù)據(jù)整理的步驟如下:
數(shù)據(jù)的預(yù)處理
在對數(shù)據(jù)進(jìn)行分類或分組之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的審核、
篩選、排序等。
1.數(shù)據(jù)的審核與篩選
①數(shù)據(jù)的審核
對數(shù)據(jù)進(jìn)行審核,主要是為了保證數(shù)據(jù)的質(zhì)量,對于通過直接調(diào)查取得的原
始數(shù)據(jù),主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查
的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全等。準(zhǔn)確性審核
主要包括兩個(gè)方面:一是檢查數(shù)據(jù)資料是否真實(shí)地反映了客觀實(shí)際情況,內(nèi)容是
否符合實(shí)際;二是檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等。第二手資料,除審核
數(shù)據(jù)的完整性和準(zhǔn)確性外,還應(yīng)審核數(shù)據(jù)的適應(yīng)性和時(shí)效性。
②數(shù)據(jù)的篩選
數(shù)據(jù)的篩選包括兩方面的內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤
的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來,對不符合條件的數(shù)
據(jù)予以剔除。
2.數(shù)據(jù)的排序
排序是按?定順序?qū)?shù)據(jù)排列,以便研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特
征或趨勢。對于定類數(shù)據(jù),如果是字母型數(shù)據(jù),排序有升序與降序之分,習(xí)慣上
使用升序;如果是漢字型數(shù)據(jù),排序方式既可按漢字的首位拼音字母排列,也可
按筆畫排序。定距數(shù)據(jù)和定比數(shù)據(jù)的排序只有兩種:即遞增和遞減。
數(shù)據(jù)分組與頻數(shù)分布
(一)數(shù)據(jù)分組的概念
統(tǒng)計(jì)數(shù)據(jù)經(jīng)過預(yù)處理后,可進(jìn)一步做分類或分組整理。統(tǒng)計(jì)分組是統(tǒng)計(jì)數(shù)據(jù)
整理的一項(xiàng)重要工作。統(tǒng)計(jì)數(shù)據(jù)整理的中心任務(wù)就是分組和編制頻數(shù)分布表。
統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將統(tǒng)計(jì)總體按照一定的標(biāo)志區(qū)分為若干
組成部分的一種統(tǒng)計(jì)方法。通過分組,可以劃分現(xiàn)象的類型、說明現(xiàn)象的內(nèi)部結(jié)
構(gòu)、提示現(xiàn)象與現(xiàn)象之間的依存關(guān)系。
(二)統(tǒng)計(jì)分組方法
按分組方法不同,分組的方法有:
1.按品質(zhì)標(biāo)志分組
即按事物的品質(zhì)特征進(jìn)行分組。按品質(zhì)標(biāo)志分組,在確定其分組界限時(shí),有
時(shí)比較簡單,有時(shí)卻很復(fù)雜。
2.按數(shù)量標(biāo)志分組
按數(shù)量標(biāo)志分組,就是按事物的數(shù)量特征進(jìn)行分組。按數(shù)量標(biāo)志分組,不僅
在于確定各組的數(shù)量標(biāo)志的差異,而且要通過數(shù)量差異來反映各組的不同類型和
性質(zhì)。按數(shù)量標(biāo)志分組,涉及到以下幾個(gè)問題:
①組距和組數(shù)
數(shù)量標(biāo)志也即前面講的數(shù)字變量。數(shù)字變量根據(jù)其取值不同,可以分為離散
變量和連續(xù)變量。
/\*離散變量變量值少,采用單項(xiàng)式分組。
7量、變量值多,采用組距分組。
連續(xù)變量一采用組距分組。
單項(xiàng)式分組:把一個(gè)變量值作為一組。組距分組:將全部變量值依次劃分為
幾個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組。組距宜取5或者10的倍數(shù),且第
一組的下限應(yīng)低于最小變量值,最后一組的上限應(yīng)高于最大變量值。
組距的大小與組數(shù)的多少是相互制約的,它們之間呈反比例關(guān)系。組距越大,
則可分的組就越少。確定組距與組數(shù),原則上應(yīng)該是通過分組能把總體單位的分
布特征顯示出來,即組與組之間應(yīng)該反映出現(xiàn)象的差異。
②等距分組與不等距分組
等距分組即變量值在各組保持相等的組距,就是說各變量值都限于相同的范
圍,在變量值比較均勻時(shí),采用等距分組。當(dāng)變量值變動(dòng)很不均勻,就應(yīng)采用不
等距分組。
③組限與組中值
組限即為組距兩端的數(shù)值,分為上限和下限。上限是各組的最大變量值,下
限是各組的最小變量值。
對于離散變量和連續(xù)變量,組限的劃分是不同的。對于離散型變量,由于其
只能取整數(shù),相鄰組的上下限可以不重疊,對于連續(xù)變量,相鄰兩組的組限應(yīng)重
疊,即上一組的上限同時(shí)也是下一組的下限。用“上組限不在內(nèi)”原則解決不重
問題。
組中值是上下限之間的中點(diǎn)數(shù)值,其計(jì)算公式為:組中值=(上限+下限)
?2o用組中值來反映組距分組中各組數(shù)據(jù)的一?般水平。實(shí)際工作中,對于開口
組的組中值,一般是用相鄰組的組距作為開口組的組距,因此,其組中值的計(jì)算
公式近似為:組中值=下限+鄰組組距/2(缺上限)或組中值=上限一鄰組組距/2
(缺下限)。用組中值來代表各組數(shù)據(jù)的一般水平,有一個(gè)假設(shè)條件:即各組數(shù)
據(jù)在本組內(nèi)呈均勻分布。
(三)頻數(shù)分布
1.頻數(shù)分布的概念和種類
①概念:頻數(shù)分布也叫次數(shù)分布或分布數(shù)列,即把全部數(shù)據(jù)按其分組標(biāo)志在
各組內(nèi)的分布狀況稱為頻數(shù)分布。分布在各組內(nèi)的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)或次數(shù),各
組頻數(shù)與全部頻數(shù)之和的比值稱為頻率或比重。將頻數(shù)分布用表格的形式表現(xiàn)出
來就是頻數(shù)分布表。
②種類
/品質(zhì)數(shù)列(按品質(zhì)標(biāo)志分組所形成)
4速數(shù)列/單項(xiàng)式變量數(shù)列
、變量數(shù)”等距數(shù)列
'組距式變量數(shù)列
不等距數(shù)列
2.累積頻數(shù)和累積頻率
累積頻數(shù)分為向上累積和向下累積兩種:向上累積從變量值小的一方向變量
值大的一方累加頻數(shù);向下累積從變量值大的一方向變量值小的一方累加頻數(shù)。
向上累積各累積數(shù)的意義是上限以下的累積頻數(shù)和累積頻率;向下累積各累
積數(shù)的意義是各組下限以上的累積頻數(shù)或累積頻率。
(四)頻數(shù)分布表的編制
編制步驟如下:
1.對數(shù)據(jù)進(jìn)行排序
2.進(jìn)行分組
采用組距分組的步驟如下:
①確定組數(shù)
按斯特格斯提出的經(jīng)驗(yàn)公式確定組數(shù)K:K=l+log1ON/Iog102N為數(shù)據(jù)的個(gè)
數(shù)。
②確定各組的組距
③根據(jù)分組整理成頻數(shù)分布表
三.次數(shù)分配的圖示和類型
(一)圖示法
通過頻數(shù)分布表,可以初步看出數(shù)據(jù)分布的一些特征和規(guī)律,但如果用圖形
來表示次數(shù)分布的結(jié)果,會(huì)更加形象和直觀。常用的顯示頻數(shù)分布特征的圖形有
直方圖、折線圖和曲線圖等。
1.直方圖
即用直方形的寬度和高度來表示頻數(shù)分布情況的圖形。繪制直方圖時(shí),橫軸
表示各組組限,縱軸表示頻數(shù)(一般標(biāo)在左方)和頻率(一般標(biāo)在右方),然后
按分布在各組的頻數(shù)及頻率確定各組在縱軸上的坐標(biāo),并依據(jù)各組組距的寬度與
頻數(shù)的高度繪成直方形。
學(xué)生按成績分
按成學(xué)生比重
績分組數(shù)(%)
60以下78.8
60-------2126.2
70
70-------2531.2
80
80-------1923.8
90
90-------810
100
合80100
計(jì)
口學(xué)生數(shù)
對于不等距數(shù)列,先要計(jì)算出各組的頻數(shù)密度,然后以組距為寬,以頻數(shù)密
度為高畫直方圖,其中頻數(shù)密度的計(jì)算公式為:頻數(shù)密度=頻數(shù)+組距。
2.折線圖
在直方圖的基礎(chǔ)上,將直方圖中的每個(gè)長方形的頂端中點(diǎn)用折線連點(diǎn)而成。
如果不繪制直方圖,可以用組中值與頻數(shù)求坐標(biāo)點(diǎn)連接而成。
3.曲線圖
當(dāng)變量值非常多,變量數(shù)列的組距無限增多時(shí),折線便近似地表現(xiàn)為一條平
滑的曲線,曲線圖的繪制方法與折線圖基本相同,只是連接各組頻數(shù)坐標(biāo)點(diǎn)的線
段應(yīng)當(dāng)是平滑曲線而不用折線。
(二)頻數(shù)分布的類型
常見的頻數(shù)分布曲線主要有正態(tài)分布、偏態(tài)分布、J型分布、V型分布等幾
種類型。
第三章數(shù)據(jù)分布特征的描述
教學(xué)重點(diǎn)和難點(diǎn):均值的計(jì)算方法;方差和標(biāo)準(zhǔn)差的計(jì)算;離散系數(shù)的適用
場合。
第一節(jié)分布集中趨勢的測度
統(tǒng)計(jì)數(shù)據(jù)經(jīng)過整理與顯示后,我們對數(shù)據(jù)分布的類型和特點(diǎn)就有了一個(gè)大致
的了解。但這種了解只是表面上的,還缺少代表性的數(shù)量特征值準(zhǔn)確地描述出統(tǒng)
計(jì)數(shù)據(jù)的分布。要進(jìn)一步掌握數(shù)據(jù)分布的特征和規(guī)律,還需要找到反映數(shù)據(jù)分布
特征的各個(gè)代表值。對統(tǒng)計(jì)數(shù)據(jù)分布的特征,可以從以下三個(gè)方面進(jìn)行測度和描
述:一是分布的集中趨勢,反映各統(tǒng)計(jì)數(shù)據(jù)向其中心值靠攏或聚集的程度;二是
分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢;三是分布的偏態(tài)和峰度,反
映數(shù)據(jù)分布的形狀。
集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢也就是尋找
數(shù)據(jù)一般水平的代表值或中心值。集中趨勢的測度值主要有:均值、幾何平均數(shù)、
眾數(shù)、中位數(shù)。
一.均值(Mean)
均值也叫算術(shù)平均數(shù)(Arithmeticmean),是全部數(shù)據(jù)的算術(shù)平均,是集中
趨勢的最主要測度值,它主要適用于定距數(shù)據(jù)和定比數(shù)據(jù),但不適用于定類數(shù)據(jù)
和定序數(shù)據(jù)。根據(jù)所掌握數(shù)據(jù)的不同,均值有不同的計(jì)算形式和計(jì)算公式。
(-)簡單均值與加權(quán)均值
1.根據(jù)未經(jīng)分組整理的原始數(shù)據(jù)計(jì)算均值
設(shè)一組數(shù)據(jù)為X],X2,X3,……Xn,則均值
注:簡單均值數(shù)值大小只與變量值的大小有關(guān)。
2.根據(jù)分組整理的數(shù)據(jù)計(jì)算均值
設(shè)原始數(shù)據(jù)被分成K組,各組的組中值為X「X2,X3,……,XK,各組變量
值為Fi,F(xiàn)2,F3,……,F(xiàn)KO則均值為:
注:①Fi:權(quán)數(shù)——起權(quán)衡輕重的作用。如果某一組的權(quán)數(shù)較大,則說明
該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對均值的影響就越大,反之則越小。
②均值受各組變量值大小和各組權(quán)數(shù)大小的影響。
③單變量分組時(shí)為精確值,組距分組時(shí)為近似值。
(二)均值的另一種表現(xiàn)形式——調(diào)和平均數(shù)
調(diào)和平均數(shù)(Harmonicmean)也稱調(diào)和均值,是均值的另一種表現(xiàn)形式。
在實(shí)際工作中,由于所獲得的數(shù)據(jù)不同,有時(shí)不能直接采用均值的計(jì)算形式來計(jì)
算平均數(shù),這就需要使用調(diào)和平均數(shù)的形式進(jìn)行計(jì)算。
調(diào)和平均數(shù)實(shí)際上是算術(shù)平均數(shù)的一種變形。二者在本質(zhì)上是一致的,唯一
的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。
(三)一種特殊的均值:兒何平均數(shù)
兒何平均數(shù)(Geometricmean)也稱兒何均值,它是N個(gè)變量值乘積的N次
方根,計(jì)算公式為:
應(yīng)用條件:①所掌握的變量值本身是比率的形式;②各比率的乘積等于總比
率。
兒何平均數(shù)是適用于特殊數(shù)據(jù)的一種平均數(shù),它主要用于計(jì)算比率或速度的
平均。
幾何平均數(shù)也可以看作是均值的一種變形,對幾何平均數(shù)的公式取對數(shù)得:
可以看出,兒何平均數(shù)的對數(shù)是各變量值對數(shù)的算術(shù)平均。
眾數(shù)
眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用Mo表示。它主要
用于作為定序數(shù)據(jù)以及定距和定比數(shù)據(jù)集中趨勢的測度值。
1.當(dāng)數(shù)據(jù)未分組時(shí),出現(xiàn)次數(shù)最多的變量值既為眾數(shù)。
2.當(dāng)數(shù)據(jù)經(jīng)過分組整理后,眾數(shù)的計(jì)算公式為:下限公式:
L:為眾數(shù)組的下限值;I:為眾數(shù)組的組距;F:眾數(shù)組的頻數(shù);
EL眾數(shù)組前一組的頻數(shù);F+i:眾數(shù)組后一組的頻數(shù);
上限公式:
三.中位數(shù)(Median)
中位數(shù)是一組數(shù)據(jù)按從小到大排序后,處于中間位置上的變量值,用Me表
示。中位數(shù)將全部數(shù)據(jù)等分成兩部分,每部分都包含50%的數(shù)據(jù),一部分?jǐn)?shù)據(jù)比
中位數(shù)大,另一部分則比中位數(shù)小。中位數(shù)是個(gè)位置代表值,它主要用于測度定
序數(shù)據(jù)的集中趨勢。
1.根據(jù)未分組數(shù)據(jù)計(jì)算中位數(shù)
先對數(shù)據(jù)進(jìn)行排序;然后確定中位數(shù)的位置。其公式為:中位數(shù)位置=N+l/2,
式中的N為數(shù)據(jù)的個(gè)數(shù)。最后確定中位數(shù)的具體數(shù)值。
若N為奇數(shù),則中位數(shù)為;若N為偶數(shù),則中位數(shù)為和
的平均數(shù)。
2.根據(jù)分組數(shù)據(jù)計(jì)算中位數(shù)
先根據(jù)公式N/2確定中位數(shù)的位置,并確定中位數(shù)所在組,然后用公式近似
確定中位數(shù)。
計(jì)算中位數(shù)時(shí),假定中位數(shù)所在組的頻數(shù)在該組內(nèi)是均勻分布的,中位數(shù)是
一個(gè)位置平均數(shù),其數(shù)值的大小不受極大值和極小值的影響。
四.眾數(shù)、中位數(shù)和均值的關(guān)系
第二節(jié)分布離散程度的測度
集中趨勢反映的是各變量值向其中心值聚集的程度,這只是數(shù)據(jù)分布的一個(gè)
特征,數(shù)據(jù)的分散程度是數(shù)據(jù)分布的另一個(gè)重要特征。它所反映的是各變量值遠(yuǎn)
離其中心值的程度,集中數(shù)據(jù)對一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水
平。
數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差,離散
程度越小,其代表性就越好。
描述數(shù)據(jù)離散程度的測度值主要有極差、平均差、方差和標(biāo)準(zhǔn)差、離散系數(shù)
等。
極差(全距)
是一?組數(shù)據(jù)的最大值與最小值之差,即R=max(Xi)—min(Xi)
對于組距分布數(shù)據(jù),極差也可以近似表示為:R=最高組上限值一最低組下
限值
極差計(jì)算簡單,易于理解,但它易受極端值的影響。
方差和標(biāo)準(zhǔn)差
方差(Variance)是各變量值與其均值離差平方的平均數(shù),是測定定距和定
比數(shù)據(jù)離散程度的最主要方法。根據(jù)總體數(shù)據(jù)和根據(jù)樣本數(shù)據(jù)計(jì)算的方差在數(shù)學(xué)
處理上略有不同。
1.總體方差和標(biāo)準(zhǔn)差
①未經(jīng)分組的原始數(shù)據(jù)
②對于組距分組數(shù)據(jù)
方差的平方即為標(biāo)準(zhǔn)差。與方差不同,標(biāo)準(zhǔn)差是計(jì)量單位的,計(jì)量單位與變
量值相同,其實(shí)際意義要比方差清楚。在對社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析時(shí),我們更多
地使用標(biāo)準(zhǔn)差。
2.樣本方差和標(biāo)準(zhǔn)差
①樣本方差:未分組數(shù)據(jù):組距分組數(shù)據(jù):
②樣本標(biāo)準(zhǔn)差:未分組數(shù)據(jù):組距分組數(shù)據(jù):
說明:i樣本方差與總體方差在計(jì)算上的區(qū)別是:總體方差是用數(shù)據(jù)個(gè)數(shù)或
總頻數(shù)去除離差平方,而樣本方差則是用樣本數(shù)據(jù)個(gè)數(shù)或總頻數(shù)減1去除離差平
方和。其中n-1稱為自由度。
五當(dāng)n很大時(shí),樣本方差S2與總體方差62的計(jì)算結(jié)果相差很小,這時(shí)樣本
方差也可以用總體方差的公式來計(jì)算。
三.離散系數(shù)
對于平均水平不同或計(jì)量單位不同的不同組別的變量值,不能用極差、平均
差、標(biāo)準(zhǔn)差等測度值比較其離散程度,必須消除變量值水平高低和計(jì)量單位不同
對離散程度測度值的影響,此時(shí)需計(jì)算離散系數(shù)。
離散系數(shù)通常是就標(biāo)準(zhǔn)差來計(jì)算的,因此也稱為標(biāo)準(zhǔn)差系數(shù),它是一組數(shù)據(jù)
的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測度數(shù)據(jù)離散程度的相對指標(biāo),其計(jì)算公式為:
離散系數(shù)的作用主要是用于比較不同總體或樣本數(shù)據(jù)的離散程度。離散程度
大的,說明數(shù)據(jù)的離散程度大,離散系數(shù)小的,說明數(shù)據(jù)的離散程度小。
第三節(jié)分布偏態(tài)與峰度的測度
前面講的集中趨勢和離散程度是數(shù)據(jù)分布的兩個(gè)重要特征,但要全面了解數(shù)
據(jù)分布的特點(diǎn),還需要知道數(shù)據(jù)分布的形狀是否對稱,偏斜的程度以及分布的扁
平程度等。
偏態(tài)及其測度
偏態(tài)是對數(shù)據(jù)分布的偏斜方向和程度的測度。要測度偏斜的程度則需要計(jì)算
偏態(tài)系數(shù),其計(jì)算公式為:a3=
式中:a3為偏態(tài)系數(shù);6為標(biāo)準(zhǔn)差的三次方。
對偏態(tài)系數(shù)的分析:
1.當(dāng)分布對稱時(shí),離差三次方后正負(fù)離差可以相互抵消,因而的分子等
于零,則aj=Oo
2.當(dāng)分布不對稱時(shí),則偏態(tài)系數(shù)a3為正值或負(fù)值。當(dāng)a3為正值時(shí),表示正
偏離差值較大;可以判斷為正偏或右偏,a3的數(shù)值越大,偏斜的程度就越大;當(dāng)
(X3為負(fù)值時(shí),表示負(fù)離差數(shù)值較大,可以判斷為負(fù)偏或左偏,a?的數(shù)值越大,向
左偏斜的程度就越大。
峰度及其測度
峰度是集中趨勢高峰的形狀,它是與正態(tài)分布相比較而言的。若分布的形狀
比正態(tài)更瘦更高,則稱為尖峰分布,若比正態(tài)分布更矮更胖,則稱為平峰分布。
峰度系數(shù)是離差四次方和平均數(shù)再除以標(biāo)準(zhǔn)差的四次方,其計(jì)算公式為:
式中:為峰度系數(shù)
大家知道,正態(tài)分布的峰度系數(shù)為3,當(dāng)04>3時(shí)為尖峰分布,當(dāng)O4<3時(shí)
為平峰分布。
第四節(jié)統(tǒng)計(jì)表
一?概念
統(tǒng)計(jì)表和統(tǒng)計(jì)圖是顯示統(tǒng)計(jì)數(shù)據(jù)的兩種形式,在數(shù)據(jù)的搜集、整理、描述和
分析過程中,都要使用統(tǒng)計(jì)表。統(tǒng)計(jì)表是縱橫交叉的線條所組成的一種表格。
統(tǒng)計(jì)表的構(gòu)成
統(tǒng)計(jì)表一般有由四個(gè)主要部分組成,即表頭(總標(biāo)題)、行標(biāo)題(橫行標(biāo)題)、
列標(biāo)題(縱欄標(biāo)題)和數(shù)字資料。表頭應(yīng)放在表的上方,它所要說明的是統(tǒng)計(jì)表
的主要內(nèi)容;行標(biāo)題和列標(biāo)題通常安排在統(tǒng)計(jì)表的第一列和第一行,它所表示的
主要是所研究問題的類別名稱和指標(biāo)名稱;表的其余部分是具體的數(shù)字資料。
第四章抽樣與抽樣估計(jì)
教學(xué)重點(diǎn)和難點(diǎn):抽樣中的基本概念;抽樣誤差;區(qū)間估計(jì);樣本容量的確
定。
第一節(jié)抽樣調(diào)查中的其本概念
抽樣的概念和特點(diǎn)
(一)抽樣的概念
從總體中抽取一個(gè)樣本作為總體的代表,這一過程稱為抽樣。即從總體中隨
機(jī)地取出其中一部分觀察,由此而獲得有關(guān)總體的信息。對樣本進(jìn)行調(diào)查,再根
據(jù)抽樣分布的原理利用樣本資料對總體數(shù)量特征進(jìn)行科學(xué)的估計(jì)與推斷,這就是
抽樣估計(jì)。
(二)抽樣的特點(diǎn)
1.遵守隨機(jī)原則
2.以部分推斷總體
3.抽樣推斷的誤差可以事先計(jì)算并加以控制。
有關(guān)抽樣的基本概念
(1)總體與樣本
1.總體:總體是指根據(jù)研究目的確定的所要研究事物的全體??傮w單位的
總數(shù)稱為總體容量,一般用N表示。
2.樣本:從總體中抽取的部分總體單位所構(gòu)成的整體,稱為該總體的一個(gè)
樣本。樣本所包含的總體單位個(gè)數(shù)稱為樣本容量,一般用n表示。樣本按照樣本
單位數(shù)的多少分為大樣本和小樣本。一般地說,n230為大樣本,n<30為小樣
本。從一個(gè)總體中可以抽取一個(gè)樣本也可以抽取多個(gè)樣本。
(二)總體參數(shù)與統(tǒng)計(jì)量
1.總體參數(shù)(總體指標(biāo))
在抽樣估計(jì)中,用來反映總體數(shù)量特征的指標(biāo)稱為總體指標(biāo),也叫總體參數(shù)。
我們所要估計(jì)的總體參數(shù)通常有總體平均數(shù)內(nèi)總體比例P,總體標(biāo)準(zhǔn)差6,總
體方差62等等??傮w參數(shù)的計(jì)算方法是明確的,但具體數(shù)值事先是未知的,需
要用統(tǒng)計(jì)量來估計(jì)它。
2.統(tǒng)計(jì)量(樣本指標(biāo))
樣本指標(biāo)又稱樣本統(tǒng)計(jì)量或估計(jì)量,是根據(jù)樣本資料計(jì)算的,用以估計(jì)和推
斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。常見的樣本統(tǒng)計(jì)量有樣本平均數(shù),樣本比例(也
叫樣本成數(shù))P,樣本標(biāo)準(zhǔn)差S或樣本方差S2等等。樣本統(tǒng)計(jì)量是隨樣本不同而
不同的隨機(jī)變量。
成數(shù)(比例)的抽樣平均誤差為:
-
-p)2
M一
抽樣平均誤差概括地反映了所有可能樣本的估計(jì)值(0)與相應(yīng)總體參數(shù)
(0)的平均誤差程度。抽樣平均誤差愈小,則樣本統(tǒng)計(jì)量的分布愈集中在總體
參數(shù)附近,平均說來,樣本估計(jì)量與總體參數(shù)之間抽樣誤差愈小,樣本對總體的
代表性愈大。A
A
注:抽樣方差即抽樣平均誤差的平方,估計(jì)量0的抽樣方差記為V(0)。
2、抽樣平均誤差的實(shí)際應(yīng)用公式
抽樣平均誤差的定義公式中,由于總體參數(shù)(9)未知,也不可能列出所有
可能的樣本估計(jì)值,所以抽樣平均誤差不能按定義公式來計(jì)算,只能根據(jù)概率論
和數(shù)量統(tǒng)計(jì)的有關(guān)理論來推導(dǎo)其計(jì)算公式。
(1)平均數(shù)的抽樣平均誤差
a、在重復(fù)抽樣條件下
1
說明:i:抽樣平均誤差比總體標(biāo)準(zhǔn)差小得多,僅為總體標(biāo)準(zhǔn)差的方。
ii:抽樣平均誤差和總體標(biāo)準(zhǔn)差成正比變化,和樣本單位數(shù)n的平方根成反
比變化。
b、在不重復(fù)抽樣條件下
說明:i:不重復(fù)抽樣的抽樣平均誤差公式比重復(fù)抽樣的相應(yīng)公式多一個(gè)系
數(shù)后音,這個(gè)系數(shù)稱為不重復(fù)抽樣修正系數(shù)(或校正因子)。
21-2
也"是抽樣比重,”是小于1大于0的數(shù),因此,在其他條件不變的情
況下,說明不重復(fù)抽樣下的抽樣平均誤差要小于重復(fù)抽
樣條件下的抽樣平均誤差,不重復(fù)抽樣的樣本代表性較大。
iii:總體單位數(shù)(總體容量)N總是比樣本單位數(shù)(n)大得多,£總是很
小的,1-^就是接近于lo在這種情況以下,不重復(fù)抽樣的抽樣平均誤差實(shí)際
上與重復(fù)抽樣的抽樣平均誤差相差無兒。
IV:在計(jì)算抽樣誤差時(shí),通常總體標(biāo)準(zhǔn)差(。)是未知的,經(jīng)常采用以下兒
種方法來代替總體標(biāo)準(zhǔn)差:用樣本標(biāo)準(zhǔn)差(S)代替總體標(biāo)準(zhǔn)差(。);用過去同
樣問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗(yàn)數(shù)據(jù)代替;在正式抽樣調(diào)查之前,先組織試驗(yàn)
性抽樣,用試驗(yàn)樣本資料代替。
(2)成數(shù)(比例)的抽樣平均誤差
a、在重復(fù)抽樣條件下
p:總體成數(shù)
b、在不重復(fù)抽樣條件下
PO-P)
b(p)=仁)
nN—1n
3、影響抽樣誤差的因素
(三)抽樣極限誤差
我們知道,以樣本指標(biāo)來估計(jì)總體指標(biāo),要達(dá)到完全準(zhǔn)確,這兒乎是不可能
的事情。當(dāng)然,在做估計(jì)時(shí)我們不希望誤差不大,誤差愈大,樣本的價(jià)值便愈小,
但也不是誤差愈小愈好,因?yàn)樵谝欢ㄏ薅戎鬁p少抽樣誤差勢必增加很多費(fèi)用,
因此,在做估計(jì)時(shí),需要確定一個(gè)可允許的誤差范圍,這種在一定概率下抽樣誤
差的可能范圍,即為抽樣極限誤差(也稱為允許誤差)。
在一定概率下:|9—0|^A0
具體為:
|x-x|<Ax
|p-p|w
將上面的等式變換為下列等價(jià)的不等式關(guān)系:
(1)
p-^p<p<p+^p⑵
(1)式表示被估計(jì)的總體平均數(shù)是以樣本平均數(shù)-為中心,在-_A-至
"+之間變動(dòng),區(qū)媽A嚏+]稱為平均數(shù)的估計(jì)區(qū)間(或置信
區(qū)間)。區(qū)間的總飯?bào)椤?/p>
(2)式表示被估計(jì)的總體成數(shù)是以抽樣成數(shù)P為中心,在p-屈至Sp+5之
間變動(dòng),區(qū)間[切,0+3]稱為成數(shù)的估計(jì)區(qū)間(或置信區(qū)間),區(qū)間的總長
度為2△7o
在抽樣實(shí)踐中,允許的抽樣誤差有時(shí)也用相對的允許誤差限來表示,相對的
極限誤差(抽樣誤差率)是將抽樣的極限誤差除以估計(jì)的均值或成數(shù),用△;和
?!硎荆瑒t:
晨'=唐
xP
用1減去相對的極限誤差稱為估計(jì)的精度。即:抽樣估計(jì)精度=1(100%)
一抽樣誤差率。
四、抽樣估計(jì)的置信度
抽樣估計(jì)的置信度是表明樣本指標(biāo)(統(tǒng)計(jì)量)和總體指標(biāo)(參數(shù))的誤差不
超過一定范圍的概率保證程度。習(xí)慣上稱之為可靠度,可信程度,把握程度等等。
用1-a表示。
制又一斤區(qū)△斤)=1一況或尸(|尸一。區(qū)AP)=l-a
=P(X-AX<X+AX)=l-a
=>p(X-Zaa(X)<X<X+Zaa(x))=\-a
2~2
說明:對于一般正態(tài)分布,又需設(shè)2=三二幺-
通過對x的線性交換后得到新隨機(jī)變量z是服從標(biāo)準(zhǔn)正態(tài)分布的,即
Z~N(O,1),因而求一般正態(tài)分布在某區(qū)間上的概率,就轉(zhuǎn)化為求標(biāo)準(zhǔn)正態(tài)分布
在相應(yīng)區(qū)間的概率。
五、總體參數(shù)估計(jì)
總體參數(shù)估計(jì)有如下兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。
(一)點(diǎn)估計(jì)
點(diǎn)估計(jì)是直接以樣本統(tǒng)計(jì)亶'o來估計(jì)總體參數(shù)0。如樣本均值彘總體均值京〃)
的點(diǎn)估計(jì)量,樣本方差S2是總體方差。2的點(diǎn)估計(jì)量。樣本比例P是總體比
例P的點(diǎn)估計(jì)量。
優(yōu)點(diǎn):能夠提供總體參數(shù)的具體估計(jì)值,簡便易行。
缺點(diǎn):沒有表明抽樣估計(jì)的誤差,也沒有指出誤差在一定范圍內(nèi)的概率保證
程度有多大。
點(diǎn)估計(jì)符合優(yōu)良估計(jì)的三個(gè)標(biāo)準(zhǔn),即無偏性、一致性、有效性。
(二)區(qū)間估計(jì)(只講總體均值的區(qū)間估計(jì))
1、科學(xué)的抽樣估計(jì)方法要具備三個(gè)基本要素。
(1)要有合適的統(tǒng)計(jì)量作為估計(jì)量G,p)
(2)要有合理的允許誤差范圍<Ax,Ap)
(3)要有一個(gè)可接受的置信度(1-。)
「Ax^Zaa(x)。為顯著性水平
-1-
Ip(\x-x\<Ax)-\-a
分析:說明估計(jì)的準(zhǔn)確性(Ax)和估計(jì)的可靠性是一對矛盾。
x-Ax<x<x+Ax
置信區(qū)間
p-\p<p<p+Ap
2、區(qū)間估計(jì)
置信度(1?。)
分析:(1)總體方差已知時(shí),正態(tài)總體均值的區(qū)間估計(jì)
x+
X-Za?cr(x)<〃(x)-^a?b(x)
上式即為置2信度為1-a時(shí)總體均2循的置信區(qū)間。
(2)總體方差未知時(shí);正態(tài)總均值的區(qū)間估計(jì)(小樣本)
—s——s
X~fa~~j=~M%)~x+ta
置信區(qū)間:52
\-a
-s
置信度:f6
抽樣極限誤差:
六、抽樣組織方式
基本的抽樣組織方式有簡單隨機(jī)抽樣,分層抽樣,等距抽樣和整群抽樣四種。
1、概念
(一)簡單隨機(jī)抽樣
簡單隨機(jī)抽樣是按隨機(jī)原則直接從總體N個(gè)單位中抽取n個(gè)單位作為樣本。
簡單隨機(jī)抽樣是抽樣中最基本也是最簡單的抽樣組織形式,它適用于均勻總體,
即具有某種特征的單位均勻地分布于總體的各個(gè)部分。在抽樣之前要對總體各單
位加以編號(hào),然后用抽簽的方式或根據(jù)《隨機(jī)數(shù)表》來抽選必要的單位數(shù)。
2、樣本容量的確定
樣本容量是指樣本中含有的總體單位數(shù)。樣本容量的多少,與抽樣誤差及調(diào)
查費(fèi)用都有直接的關(guān)系。如果樣本容量過大,雖然抽樣誤差很小,但調(diào)查工作量
增大,耗費(fèi)的時(shí)間和經(jīng)費(fèi)太多,體現(xiàn)不出抽樣調(diào)查的優(yōu)越性。反之,如果樣本容
量太小,雖然耗費(fèi)少,但抽樣誤差太大,抽樣推斷就會(huì)失去價(jià)值。因此,必要樣
本容量的確定在抽樣設(shè)計(jì)中十分重要。
(1)平均數(shù)必要樣本容量的確定
a、在重復(fù)抽樣條件下:
n=
*
公式推導(dǎo):
(y
b(x)丁
CT2a2
b(X)2=—=>n
n,(X)2
由于:△》=Z&?<T(X)
2
z”4
a2
=>〃=——=>n2
\xA-
Z7
~2
b、在不重復(fù)抽樣條件下
Nzy
n=2
N岸+Z、2
xa
2
既:
2
乙ze
鼻11
-2y2d--=-=>
ZqNn
~2
N^-+(y2Zl
----222=~=>
NZ^cr2n
~2
NZ;/
n=----------------
N《+Z"
2
(2)成數(shù)必要樣本容量的確定
只需將上述公式中
Ax換成年>,0"2換成p(l-夕)即可
a、在重復(fù)抽樣條件
Z;P(I-P)
b、在不重復(fù)抽樣條件下
NZ;P(1-P)
____I_______
NNp+Z;P(l-p)
從上述公式可見,必要的樣本容量受以下因素影響。
(1)總體方差。2
(2)允許誤差范圍△域△.
(3)置信度\-a
(4)抽樣方法
(5)抽樣組織方式
關(guān)于樣本容量確定的說明:
(1)上面公式計(jì)算的樣本容量是最低的,也是最必要的樣本容量。
(2)如果進(jìn)行一次抽樣調(diào)查,同時(shí)對總體平均數(shù)和成數(shù)進(jìn)行區(qū)間估計(jì),運(yùn)用
上面公式計(jì)算兩個(gè)樣本容量,一般情況下兩者不相等,為了同時(shí)滿足兩個(gè)推斷的
要求,一般在兩個(gè)樣本容量中選擇較大的一個(gè)。
(3)上面公式計(jì)算結(jié)果不一定是整取,如果帶小數(shù),一般不采取四舍五入辦
法化成整數(shù),而是用比這個(gè)數(shù)大的鄰近整數(shù)代替。
簡單隨機(jī)抽樣在實(shí)踐中受到許多限制,當(dāng)總體很大時(shí)對每個(gè)單位編號(hào),抽簽
等都會(huì)遇到困難,因此,實(shí)踐中,我們常常采用分層抽樣,等距抽樣或整群抽樣。
第五章假設(shè)檢驗(yàn)
教學(xué)重點(diǎn)和難點(diǎn):假設(shè)檢驗(yàn)的基本思想;檢驗(yàn)中的兩類錯(cuò)誤;總體均值;比
例和方差的假設(shè)檢驗(yàn)。
所謂假設(shè)檢驗(yàn),就是事先對總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利
用本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異從而
決定應(yīng)接受或否定原假設(shè)。
第一節(jié)假設(shè)檢驗(yàn)的一般問題
一、假設(shè)檢驗(yàn)的基本思想
假設(shè)檢驗(yàn)的基本思想是帶有概率性質(zhì)的反證法。具體說來,假設(shè)檢驗(yàn)主要有
以下兩個(gè)特點(diǎn):
第一,假設(shè)檢驗(yàn)所采用的邏輯推理方法是反證法。為了檢驗(yàn)?zāi)硞€(gè)假設(shè)是否成
立,先假定它是正確的。然后根據(jù)抽樣理論和樣本信息,觀察由此假設(shè)而導(dǎo)致的
結(jié)果是否合理,從而判斷是否接受原假設(shè)。
第二,這里的合理與否,所依據(jù)的是“小概率事件實(shí)際不可能發(fā)生的原理”。
即在一次觀察中小概率事件發(fā)生了,則認(rèn)為原假設(shè)是不合理的;反之,小概率事
件沒有出現(xiàn),則認(rèn)為原假設(shè)是合的。所以,假設(shè)檢驗(yàn)的反證法是帶有概率性質(zhì)的
反證法,并非嚴(yán)格的邏輯證明。
二、假設(shè)檢驗(yàn)的步驟
假設(shè)檢驗(yàn)一般有以下兒個(gè)步驟:
1、提出原假設(shè)和備擇假設(shè)
2、選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并確定其分布形式
3、選擇顯著性水平a,確定臨界值
4、作出結(jié)論
三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤
(一)第一類錯(cuò)誤
(-)第二類錯(cuò)誤
四、兩類錯(cuò)誤的概率a和B的關(guān)系
第二節(jié)總體均值、比例和方差的假設(shè)檢驗(yàn)
一、總體方差已知時(shí)對正態(tài)總體均值的假設(shè)檢驗(yàn)
二、總體方差未知時(shí)對正態(tài)總體均值的假設(shè)檢驗(yàn)
三、總體比例的假設(shè)檢驗(yàn)
四、總體方差的假設(shè)檢驗(yàn)
第三節(jié)假設(shè)檢驗(yàn)中的其他問題
一、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系
二、假設(shè)檢驗(yàn)中的P值
第六章方差分析
教學(xué)重點(diǎn)和難點(diǎn):方差分析的原理;單因素方關(guān)分析;雙因素方差分析。
在數(shù)理統(tǒng)計(jì)中所學(xué)的假設(shè)檢驗(yàn)主要討論兩個(gè)總體均值是否相等的顯著性檢
驗(yàn)問題,但是,當(dāng)總體增加到3個(gè)甚至更多時(shí),用假設(shè)檢驗(yàn)對總體均值進(jìn)行顯著
性檢驗(yàn),不僅工作量大,而且影響估計(jì)精度,此時(shí)就需采用方差分析。方差分析
(Analysisofvariance)能夠解決多個(gè)均值是否相等的檢驗(yàn)問題。節(jié)省時(shí)間是這
種方法的明顯優(yōu)點(diǎn)。
第一節(jié)方差分析的基本問題
一、方差分析的內(nèi)容
方差分析是對多個(gè)總體均值是否相等這一假設(shè)進(jìn)行檢驗(yàn)。
在方差分析中,有兒個(gè)術(shù)語需要了解。一個(gè)是因素,因素是一個(gè)獨(dú)立的變量,
是方差分析研究的對象。因素中的內(nèi)容稱為水平。
無色
粉色
橘黃色
綠色
因素
若方差分析只針對一個(gè)因素進(jìn)行,稱為單因素方差分析。如果同時(shí)針對
多個(gè)因素進(jìn)行,稱為多因素分析。在多因素方差分析中,雙因素方差分析里最常
見的。
用方差分析來檢驗(yàn)假設(shè)有三個(gè)假定:1、各個(gè)水平的觀察數(shù)據(jù)必須服從正態(tài)
分布;2、方差相同。3、相互獨(dú)立。
二、方差分析的原理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級(jí)英語Whatisyourfavorite課件
- 駕考題庫-70歲以上老年人C2駕照年審三力測試題
- 《證券銷戶寶典》課件
- 單位管理制度集粹選集【職工管理篇】十篇
- 2024服務(wù)合同范文(32篇)
- 單位管理制度合并選集【人員管理】
- 單位管理制度范例選集人事管理十篇
- 七年級(jí)英語Nationalheroes課件
- 3ds Max動(dòng)畫制作實(shí)戰(zhàn)訓(xùn)練(第3版)教學(xué)教案
- 2024年醫(yī)院個(gè)人工作總結(jié)范文
- 肌萎縮側(cè)索硬化癥查房課件
- 數(shù)學(xué)與語言學(xué)、語言藝術(shù)的交叉研究
- 醫(yī)院“無陪護(hù)”病房試點(diǎn)工作方案
- 清華大學(xué)大學(xué)物理-光的偏振
- 心理健康教育-網(wǎng)絡(luò)與青少年
- 高中英語人教版(2019) 選擇性必修一 Unit 3 課文語法填空(含答案)
- 2021-2022學(xué)年陜西省寶雞市陳倉區(qū)北師大版六年級(jí)上冊期末考試數(shù)學(xué)試卷(含答案解析)
- 水工-建筑物課件
- 應(yīng)用PDCA提高入院宣教的知曉率
- 線性系統(tǒng)理論鄭大鐘307張課件
- 2019-2020學(xué)年第一學(xué)期廣東省廣州市天河區(qū)3年級(jí)數(shù)學(xué)期末考試卷
評(píng)論
0/150
提交評(píng)論