統(tǒng)計(jì)學(xué)講義課件_第1頁
統(tǒng)計(jì)學(xué)講義課件_第2頁
統(tǒng)計(jì)學(xué)講義課件_第3頁
統(tǒng)計(jì)學(xué)講義課件_第4頁
統(tǒng)計(jì)學(xué)講義課件_第5頁
已閱讀5頁,還剩77頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章緒論

第一節(jié)統(tǒng)計(jì)與統(tǒng)計(jì)學(xué)

統(tǒng)計(jì)的含義

1.統(tǒng)計(jì)工作(統(tǒng)計(jì)實(shí)踐):是指對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行搜集、整理和分析的活動(dòng)

過程。

2.統(tǒng)計(jì)數(shù)據(jù)(統(tǒng)計(jì)資料):是統(tǒng)計(jì)工作的成果。統(tǒng)計(jì)數(shù)據(jù)的搜集是取得統(tǒng)

計(jì)數(shù)據(jù)的過程,它是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)。離開了統(tǒng)計(jì)數(shù)據(jù),統(tǒng)計(jì)方法就失去

了用武之地。

統(tǒng)計(jì)工作和統(tǒng)計(jì)數(shù)據(jù)的關(guān)系是過程和成果的關(guān)系。即統(tǒng)計(jì)數(shù)據(jù)是統(tǒng)計(jì)工作

提供的,是統(tǒng)計(jì)活動(dòng)的成果。

3.統(tǒng)計(jì)學(xué):是一門有關(guān)統(tǒng)計(jì)數(shù)據(jù)的科學(xué)。它研究如何搜集、整理資料和

進(jìn)行數(shù)量分析,推斷的一門方法論科學(xué)。是統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和概括。

統(tǒng)計(jì)工作和統(tǒng)計(jì)學(xué)是實(shí)踐和理論的關(guān)系。統(tǒng)計(jì)理論來源于統(tǒng)計(jì)實(shí)踐,它是

統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和概括。反過來,統(tǒng)計(jì)理論又是指導(dǎo)統(tǒng)計(jì)工作的原則和方

法。

總之,統(tǒng)計(jì)工作,統(tǒng)計(jì)數(shù)據(jù),統(tǒng)計(jì)學(xué)三者之中,統(tǒng)計(jì)工作是基礎(chǔ),是源。

沒有統(tǒng)計(jì)工作,就不會(huì)產(chǎn)生統(tǒng)計(jì)數(shù)據(jù),沒有統(tǒng)計(jì)工作,缺少這個(gè)實(shí)踐基礎(chǔ),統(tǒng)

計(jì)學(xué)也就不可能形成和發(fā)展。

統(tǒng)計(jì)規(guī)律與統(tǒng)計(jì)方法

統(tǒng)計(jì)規(guī)律即統(tǒng)計(jì)數(shù)據(jù)的內(nèi)在變化趨勢;統(tǒng)計(jì)方法即研究統(tǒng)計(jì)規(guī)律的數(shù)量方

法。前者如“恩格爾定律”,后者如ARMA模型。

第二節(jié)統(tǒng)計(jì)學(xué)的分科

統(tǒng)計(jì)學(xué)大致有以下兩種分類:

根據(jù)統(tǒng)計(jì)方法的構(gòu)成,統(tǒng)計(jì)學(xué)可以分為描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)

學(xué)。

1.描述統(tǒng)計(jì)學(xué):通過對現(xiàn)象的調(diào)查或觀察f得到大量的統(tǒng)計(jì)數(shù)據(jù)f用圖

表形式對所收集到的數(shù)據(jù)進(jìn)行加工處理與顯示一就這些數(shù)據(jù)的分布特征(如集

中趨勢,離散趨勢等)計(jì)算出一些概括性的數(shù)字(如平均數(shù),標(biāo)準(zhǔn)差,相關(guān)系

數(shù)等等)一得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。

2.推斷統(tǒng)計(jì)學(xué):推斷統(tǒng)計(jì)學(xué)是指只憑樣本數(shù)據(jù)去推斷總體數(shù)量特征的技

術(shù)方法。

概率論

(包括分布理論、大數(shù)定

律和中心極限定理等)

0

推斷統(tǒng)計(jì)學(xué)(利用樣本信

:為數(shù)乎據(jù)描述統(tǒng)計(jì)學(xué)(包括

-?1:>息和概率論對總體的數(shù)量

統(tǒng)計(jì)數(shù)據(jù)的收集、

特征進(jìn)行估計(jì)和檢驗(yàn)等)

,,整理、顯示和分析

本數(shù)據(jù)

\/

總體內(nèi)在1

的數(shù)量規(guī)

律性

圖1—1統(tǒng)計(jì)學(xué)探索客觀現(xiàn)象數(shù)量規(guī)律性的過程

注1:描述統(tǒng)計(jì)學(xué)不必深入一層地去試圖推論數(shù)據(jù)本身以外的任何事

情;推斷統(tǒng)計(jì)學(xué)則在樣本數(shù)據(jù)的基礎(chǔ)上深入一步地分析、研究和推斷,以推知

資料本身以外的情況和數(shù)量關(guān)系。

注2:描述統(tǒng)計(jì)學(xué)用的是總體數(shù)據(jù),推斷統(tǒng)計(jì)學(xué)則往往用樣本數(shù)據(jù)。

在現(xiàn)實(shí)問題中,我們得到的數(shù)據(jù)主要是樣本數(shù)據(jù),因此,推斷統(tǒng)計(jì)學(xué)越來越重

要,是統(tǒng)計(jì)學(xué)的核心內(nèi)容。

注3:統(tǒng)計(jì)學(xué)的發(fā)展過程中,先有描述統(tǒng)計(jì)學(xué),后有推斷統(tǒng)計(jì)學(xué),從

描述統(tǒng)計(jì)學(xué)發(fā)展到推斷統(tǒng)計(jì)學(xué),是統(tǒng)計(jì)學(xué)發(fā)展成熟的標(biāo)志。

從統(tǒng)計(jì)方法研究和統(tǒng)計(jì)方法的應(yīng)用角度看,統(tǒng)計(jì)學(xué)可分為理論統(tǒng)

計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)。

理論統(tǒng)計(jì)學(xué)主要是指統(tǒng)計(jì)學(xué)的數(shù)學(xué)原理和方法原理。從事統(tǒng)計(jì)理論和

方法研究的人員需要

有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)。理論統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)的理論基礎(chǔ)。統(tǒng)計(jì)學(xué)是一門分析

數(shù)據(jù)的科學(xué),因而統(tǒng)計(jì)方法的應(yīng)用兒乎擴(kuò)展到了所有的科學(xué)研究領(lǐng)域。

第三節(jié)基本概念

—.總體和單位

1.總體

總體是指根據(jù)研究目的確定的所要研究的同類事物的全體。

說明:⑴統(tǒng)計(jì)總體是根據(jù)統(tǒng)計(jì)研究目的確定的。

⑵統(tǒng)計(jì)總體是客觀存在的。

⑶統(tǒng)計(jì)總體中的所有個(gè)別事物具有某種同一性質(zhì)。

2.單位

單位是指構(gòu)成總體的個(gè)別事物(基本單元),也稱個(gè)體。例如:我們要

研究全國鄉(xiāng)鎮(zhèn)企業(yè)發(fā)展情況,則總體為全國鄉(xiāng)鎮(zhèn)企業(yè),單位為每個(gè)鄉(xiāng)鎮(zhèn)企業(yè)。

—.標(biāo)志和指標(biāo)

1.^^志

標(biāo)志是說明總體單位屬性和特征的名稱。標(biāo)志和總體單位的關(guān)系是非

常明確的,總體單位是標(biāo)志的直接承擔(dān)者,標(biāo)志是依附于總體單位的。

標(biāo)志按表現(xiàn)形式不同分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志。①品質(zhì)標(biāo)志:表示總

體單位性質(zhì)方面的特征;它只能用文字表示。②數(shù)量標(biāo)志:表示總體單位性數(shù)

量方面的特征;用數(shù)值表示。

標(biāo)志表現(xiàn):是標(biāo)志特征在各單位的具體表現(xiàn),有品質(zhì)標(biāo)志表現(xiàn)和數(shù)量

標(biāo)志表現(xiàn)之分。數(shù)量標(biāo)志的表現(xiàn)即標(biāo)志值。

2.指標(biāo)

①概念:指標(biāo)是反映總體數(shù)量特征的概念及其數(shù)值。

②分類

指標(biāo)按反映的數(shù)量特點(diǎn)不同可分為數(shù)量指標(biāo)和質(zhì)量指標(biāo)。

I.數(shù)量指標(biāo):說明總體規(guī)模大小,水平高低,數(shù)量多少的指標(biāo);用絕對

數(shù)表示。

II.質(zhì)量指標(biāo):說明總體相對水平或工作質(zhì)量的統(tǒng)計(jì)指標(biāo);用相對數(shù)、平

均數(shù)表示。

兩者關(guān)系:數(shù)量指標(biāo)是計(jì)算質(zhì)量指標(biāo)的基礎(chǔ)。

③特點(diǎn)

I.數(shù)量性(可量性)

II.綜合性

III.客觀性(具體性)

三.變異和變量

1.變異:可變標(biāo)志的屬性或特征由一種狀態(tài)變到另一種狀態(tài),統(tǒng)計(jì)上稱

之為變異。

2.變量:在統(tǒng)計(jì)中,一般把說明現(xiàn)象某種特征的概念稱為變量。變量的

具體表現(xiàn)稱為變量值。如果一個(gè)變量是由品質(zhì)數(shù)據(jù)來記錄的稱為品質(zhì)變量,如

“性別”就是一個(gè)品質(zhì)變量。如果一個(gè)變量是由數(shù)量數(shù)據(jù)來記錄的稱為數(shù)量變

量或數(shù)字變量。數(shù)字變量根據(jù)其取值的不同,可以分為離散變量和連續(xù)變量。

離散變量其取值都是以整數(shù)位斷開,可以一一列舉,如“企業(yè)數(shù)”等。連續(xù)變

量其取值是連續(xù)不斷的,不能一一列舉,如“溫度”等。但多數(shù)情況下我們所

說的變量都是指數(shù)字變量。

第二章統(tǒng)計(jì)數(shù)據(jù)的搜集與整理

教學(xué)重點(diǎn)和難點(diǎn):數(shù)據(jù)的搜集方法;調(diào)查方案設(shè)計(jì);數(shù)據(jù)分組。

第一節(jié)數(shù)據(jù)的計(jì)量與類型

數(shù)據(jù)的計(jì)量尺度

統(tǒng)計(jì)數(shù)據(jù)是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ),統(tǒng)計(jì)數(shù)據(jù)靠我們?nèi)ニ鸭拍艿玫?,但在?/p>

集數(shù)據(jù)之前,先要對現(xiàn)象進(jìn)行計(jì)量或測度,這就涉及到數(shù)據(jù)的計(jì)量尺度問題。按

照計(jì)量學(xué)的i般分類方法,對統(tǒng)計(jì)數(shù)據(jù)分為四種計(jì)量尺度或計(jì)量水準(zhǔn),即定類尺

度、定序尺度、定距尺度和定比尺度。

(一)定類尺度

定類尺度也稱類別尺度或列名尺度,是最粗略、計(jì)量層次最低的計(jì)量尺度。

這種計(jì)量尺度只能按照事物的某種屬性對其進(jìn)行平行的分類或分組。例如人口按

照性別分為男、女兩類等。分類就是將所觀察的個(gè)體(總體單位)分為不同的類

型。定類尺度只是測度了事物之間的類別差,對各類之間的其他差別卻沒有反映。

使用該尺度對事物所作的分類,各類別之間是平等的并列關(guān)系,無法區(qū)分優(yōu)劣或

大小,各類別之間的順序是可以改變的。對定類尺度的計(jì)量結(jié)果,通常是通過計(jì)

算出每一類別中各元素或個(gè)體出現(xiàn)的頻率或頻數(shù)來進(jìn)行分析。

在使用定類尺度對事物進(jìn)行分類時(shí),必須符合窮盡和互斥的要求。定類尺度

是對事物最基本的測度,是其他計(jì)量尺度的基礎(chǔ)。它具有=和W的數(shù)學(xué)特性。

(-)定序尺度

定序尺度又稱順序尺度,是對事物之間等級(jí)差或順序差別的一種測度。該尺

度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優(yōu)劣或順序。例

如,考試成績可以分為優(yōu)、良、中、及格、不及格等等。

定序尺度對事物的計(jì)量要比定類尺度精確一些,但它只測度了類別之間的順

序,而未測量出類別之間的準(zhǔn)確差值。因些該尺度具有>和<的數(shù)學(xué)特性,但不

能進(jìn)行加、減、乘、除等數(shù)學(xué)運(yùn)算。

(三)定距尺度

定距尺度也稱間隔尺度,它不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且

可以準(zhǔn)確地指出類別之間的差距是多少。定距尺度是對事物類別或次序之間間距

的測度。因此,定距尺度的計(jì)算結(jié)果表現(xiàn)為數(shù)值。如甲地區(qū)溫度是20°C,乙地

區(qū)的溫度是25°C,二者相差5°C。其結(jié)果可以進(jìn)行加、減運(yùn)算。

(四)定比尺度

定比尺度也稱為比率尺度,它除了具有上述三種計(jì)量尺度的全部特性以外,

還具有一個(gè)特性,那就是可以計(jì)算兩個(gè)測度值之間的比值。這就要求定比尺度中

必須有一個(gè)絕對固定的“零點(diǎn)”,這也是它與定距尺度的惟一差別。例如,一個(gè)

學(xué)生的數(shù)學(xué)成績?yōu)?分,是表示他的數(shù)學(xué)成績水平為0,并不表示他沒有考試成

績或沒有任何數(shù)學(xué)知識(shí);一個(gè)地區(qū)的溫度為0度,表示一種溫度的水平,并不是

沒有溫度。可見,定距尺度中的“0”是一個(gè)有意義的數(shù)值,定比尺度則不同,

它有一個(gè)絕對“零點(diǎn)”。在定比尺度中,“0”表示“沒有”或“不存在”,如某人

這個(gè)月的收入為“0”,表示這個(gè)人沒有收入。定比尺度可以進(jìn)行加、減、乘、除

運(yùn)算。

上述四種計(jì)量尺度對事物的測量層次由低級(jí)到高級(jí),由粗略到精確逐步遞進(jìn)

的。高層次的計(jì)量尺度可以具有低層次計(jì)量尺度的全部特性,但不能反過來。下

表給出了上述四種計(jì)量尺度的測量層次和數(shù)學(xué)特性。

四種計(jì)量尺度的比較

\計(jì)量定定序定距定比

類尺度尺度尺度尺度

X學(xué)

特性\

分類VV

(=、W)

排序VV

(>、<

間距VV

(一、+)

比值V

(X、+)

在統(tǒng)計(jì)分析中,一般要求測量的層次越高越好,因?yàn)楦邔哟蔚挠?jì)量尺度包

含更多的數(shù)學(xué)特性,所運(yùn)用的統(tǒng)計(jì)分析方法越多,分析時(shí)也就越方便,因此,應(yīng)

盡可能使用高層次的計(jì)量尺度。

數(shù)據(jù)的類型

從上述四種計(jì)量尺度的結(jié)果來看,可以將統(tǒng)計(jì)數(shù)據(jù)分為四種類型:

1.定類數(shù)據(jù):表現(xiàn)為類別,但不區(qū)分順序,是由定類尺度形成的。

2.定序數(shù)據(jù):表現(xiàn)為類別,但有順序,是由定序尺度計(jì)量形成的。

3.定距尺度:表現(xiàn)為數(shù)值,可以進(jìn)行加、減運(yùn)算,是由定距尺度計(jì)量形

成的。

4.定比數(shù)據(jù):表現(xiàn)為數(shù)值,可進(jìn)行加、減、乘、除運(yùn)算,是由定尺度形

成的。

前二類數(shù)據(jù)說明的是事物的品質(zhì)特征,不能用數(shù)值表示,其結(jié)果均表現(xiàn)

為類別,稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);后兩類數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征,能夠

用數(shù)值來表現(xiàn),因此稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。

區(qū)分測量的層次和數(shù)據(jù)的類型十分重要,因?yàn)閷Σ煌愋偷臄?shù)據(jù)將采用

不同的統(tǒng)計(jì)方法來處理。

三.統(tǒng)計(jì)數(shù)據(jù)的表現(xiàn)形式

/時(shí)期數(shù)

/絕聚數(shù)(數(shù)量指標(biāo))

/時(shí)點(diǎn)數(shù)

表平形式相對數(shù)比例(Proportion)

,比率(Ratio)

平均數(shù)(均值)

第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的搜集

我們站在統(tǒng)計(jì)數(shù)據(jù)使用者的角度看,統(tǒng)計(jì)數(shù)據(jù)主要來源于兩種渠道:一是

直接的調(diào)查和科學(xué)試驗(yàn),這是統(tǒng)計(jì)數(shù)據(jù)的直接來源,我們稱之為第一手資料或直

接的統(tǒng)計(jì)數(shù)據(jù);二是別人調(diào)查或試驗(yàn)的數(shù)據(jù),這是統(tǒng)計(jì)數(shù)據(jù)的間接來源,我們稱

之為第二手或間接的統(tǒng)計(jì)數(shù)據(jù)。

統(tǒng)計(jì)數(shù)據(jù)的直接來源

統(tǒng)計(jì)數(shù)據(jù)的直接來源主要有兩個(gè)渠道:一是專門組織的調(diào)查;專門調(diào)查是

取得社會(huì)經(jīng)濟(jì)數(shù)據(jù)的重要手段。二是科學(xué)試驗(yàn);科學(xué)試驗(yàn)是取得自然科學(xué)數(shù)據(jù)的

主要手段。

(一)統(tǒng)計(jì)調(diào)查方式

實(shí)際工作中常用的統(tǒng)計(jì)調(diào)查方式有:普查、重點(diǎn)調(diào)查、典型調(diào)查、抽樣調(diào)

查、統(tǒng)計(jì)報(bào)表等。

1.普查

①概念:普查是為某一特定目的而專門組織的一次性全面調(diào)查。我國五次人

口普查時(shí)間:1953年,1964年,1982年,1990年(7月1日零時(shí)),2000年(11

月1日零時(shí))。

②特點(diǎn):

a.普查通常是一次性的或周期性的;

b.普查一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間。目的是為了避免調(diào)

查數(shù)據(jù)的重復(fù)或遺漏。

c.為抽樣調(diào)查或其他調(diào)查提供基本依據(jù)。

d.普查的使用范圍比較窄。

2.抽樣調(diào)查

①概念:抽樣調(diào)查是從調(diào)查對象中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,

并根據(jù)調(diào)查結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查。

②特點(diǎn):i:經(jīng)濟(jì)性ii:時(shí)效性強(qiáng)iii:適應(yīng)面廣iv:準(zhǔn)確性高

3.統(tǒng)計(jì)報(bào)表

統(tǒng)計(jì)報(bào)表是國家和地方政府部門統(tǒng)計(jì)數(shù)據(jù)的主要來源。

①概念:統(tǒng)計(jì)報(bào)表是按照國家有關(guān)法規(guī)的規(guī)定,自上而下地逐級(jí)提供基本統(tǒng)

計(jì)數(shù)據(jù)的一種調(diào)查方式。

②種類

i:按調(diào)查范圍不同分為全面報(bào)表和非全面報(bào)表。

全面報(bào)表要求調(diào)查對象的每一個(gè)單位都填報(bào);非全面報(bào)表要求調(diào)查對象中的

一部分單位填報(bào)。

ii:按報(bào)表內(nèi)容和實(shí)施范圍不同分為國家統(tǒng)計(jì)報(bào)表、部門統(tǒng)計(jì)報(bào)表和地方統(tǒng)

計(jì)報(bào)表。

iii:按報(bào)送周期長短分為日報(bào)、旬報(bào)、月報(bào)、季報(bào)、半年報(bào)、年報(bào)。

iv:按報(bào)送單位不同分為基層統(tǒng)計(jì)報(bào)表和綜合統(tǒng)計(jì)報(bào)表。

4.重點(diǎn)調(diào)查

①概念:是指只在調(diào)查對象中選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,借以了解總體

基本情況的一-種非全面調(diào)查。重點(diǎn)單位是指在所要調(diào)查的數(shù)量特征上占有較大比

重的單位。

②特點(diǎn):i:重點(diǎn)單位的選擇具有客觀性。ii:重點(diǎn)調(diào)查的目的是為了

反映總體的基本情況。

5.典型調(diào)查

①概念:是根據(jù)調(diào)查目的和要求,在對研究對象進(jìn)行全面分析的基礎(chǔ)上,有

意識(shí)地選擇部分有代表性單位進(jìn)行調(diào)查,它是一種非全面調(diào)查。

②特點(diǎn):i:調(diào)查單位是根據(jù)調(diào)查目的有意識(shí)地選擇出來的少數(shù)具有代表性

的單位。

ii:典型調(diào)查是一種深入、細(xì)致的調(diào)查。

(-)數(shù)據(jù)的搜集方法

不論采取何種方式進(jìn)行調(diào)查,在取得統(tǒng)計(jì)數(shù)據(jù)時(shí),都有一些具體的數(shù)據(jù)搜

集方法,歸納起來有兩大類:

1.詢問調(diào)查:包括①訪問調(diào)查(派員調(diào)查):是調(diào)查者與被調(diào)查者通過面

對面交談從而得到所需資料的調(diào)查方法。②郵寄調(diào)查:是通過郵寄將調(diào)查表或

調(diào)查問卷送到被調(diào)查者手中,由被調(diào)查者填寫,然后寄回調(diào)查表的一種調(diào)查方法。

③電話調(diào)查:打電話,語言交流、搜集資料。④座談會(huì):把被調(diào)查者集中起來,

讓他們對調(diào)查主題發(fā)表意見,獲取資料。⑤個(gè)別深度訪問:一次只訪問一名被

調(diào)查者,詳細(xì)了解被調(diào)查者的思想和行為動(dòng)機(jī)。

2.觀察與實(shí)驗(yàn):包括①觀察法:調(diào)查人員邊觀察邊記錄以收集信息的方法。

②是在所設(shè)定的特殊實(shí)驗(yàn)場所,對調(diào)查對象進(jìn)行實(shí)驗(yàn)以取得資料的一種調(diào)查方

法。

統(tǒng)計(jì)數(shù)據(jù)的間接來源

第二手?jǐn)?shù)據(jù)主要是公開出版的或公開報(bào)道的數(shù)據(jù)。在我國,公開出版或報(bào)道

的社會(huì)經(jīng)濟(jì)數(shù)據(jù)主要來自國家和地方的統(tǒng)計(jì)部門以及各種報(bào)刊媒介。如公開出版

的《中國統(tǒng)計(jì)年鑒》,《中國市場統(tǒng)計(jì)年鑒》等,另外,廣泛分布在各種報(bào)刊、雜

志、圖書、廣播、電視傳媒中的各種數(shù)據(jù)資料也屬于第二手?jǐn)?shù)據(jù)。

第三節(jié)調(diào)查方案設(shè)計(jì)

在搜集直接統(tǒng)計(jì)數(shù)據(jù)之前,需要制定出一個(gè)周密、完整的調(diào)查方案,以指導(dǎo)

整個(gè)調(diào)查工作,一個(gè)完整的統(tǒng)計(jì)調(diào)查方案應(yīng)包括以下內(nèi)容:

一.確定調(diào)查目的(為什么要調(diào)查)

在調(diào)查方案中首先應(yīng)明確本次調(diào)查的目的,它要回答的是為什么調(diào)查,要解

決什么樣的問題。只有這些問題明確之后,才能確定向誰調(diào)查,調(diào)查什么以及采

用什么方法進(jìn)行調(diào)查。

二.確定調(diào)查對象和調(diào)查單位(向誰調(diào)查)

調(diào)查對象和調(diào)查單位要解決的是向誰調(diào)查,由誰來提供所需資料的問題。調(diào)

查對象是根據(jù)調(diào)查目的確定的調(diào)查研究的總體或調(diào)查范圍,調(diào)查單位是構(gòu)成調(diào)查

對象的每一個(gè)單位,是調(diào)查項(xiàng)目和指標(biāo)的承擔(dān)者或載體。

三.設(shè)計(jì)調(diào)查項(xiàng)目和調(diào)查表(調(diào)查什么)

調(diào)查項(xiàng)目是調(diào)查的具體內(nèi)容,它要回答的是調(diào)查什么問題。調(diào)查項(xiàng)目可以是

調(diào)查單位的數(shù)量特征,也可以是調(diào)查單位的某種屬性或品質(zhì)特征。調(diào)查項(xiàng)目常以

表格的形式來表現(xiàn),稱為調(diào)查表。

四.方案設(shè)計(jì)中的其他內(nèi)容

另外,調(diào)查方案還應(yīng)明確調(diào)查所采用的方式和方法,調(diào)查時(shí)間及調(diào)查的組織

與實(shí)施工作等。調(diào)查時(shí)間包括調(diào)查數(shù)據(jù)的所屬時(shí)間(若為時(shí)點(diǎn)現(xiàn)象,要明確規(guī)定

資料的統(tǒng)一時(shí)點(diǎn),即標(biāo)準(zhǔn)時(shí)點(diǎn);若為時(shí)期現(xiàn)象,要明確規(guī)定現(xiàn)象的起止時(shí)間)和

調(diào)查的工作期限(指調(diào)查工作從開始到結(jié)束的時(shí)間長度,包括:調(diào)查人員的選擇、

組織的培訓(xùn);調(diào)查經(jīng)費(fèi)的來源和開支預(yù)算等,調(diào)查表格、問卷、調(diào)查員手冊的印

刷等)。

第四節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理

把統(tǒng)計(jì)數(shù)據(jù)搜集上來之后,接下去的工作應(yīng)對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行加工整理,使之

系統(tǒng)化、條理化、以符合分析的需要。數(shù)據(jù)整理的步驟如下:

數(shù)據(jù)的預(yù)處理

在對數(shù)據(jù)進(jìn)行分類或分組之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的審核、

篩選、排序等。

1.數(shù)據(jù)的審核與篩選

①數(shù)據(jù)的審核

對數(shù)據(jù)進(jìn)行審核,主要是為了保證數(shù)據(jù)的質(zhì)量,對于通過直接調(diào)查取得的原

始數(shù)據(jù),主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查

的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全等。準(zhǔn)確性審核

主要包括兩個(gè)方面:一是檢查數(shù)據(jù)資料是否真實(shí)地反映了客觀實(shí)際情況,內(nèi)容是

否符合實(shí)際;二是檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等。第二手資料,除審核

數(shù)據(jù)的完整性和準(zhǔn)確性外,還應(yīng)審核數(shù)據(jù)的適應(yīng)性和時(shí)效性。

②數(shù)據(jù)的篩選

數(shù)據(jù)的篩選包括兩方面的內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤

的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來,對不符合條件的數(shù)

據(jù)予以剔除。

2.數(shù)據(jù)的排序

排序是按?定順序?qū)?shù)據(jù)排列,以便研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特

征或趨勢。對于定類數(shù)據(jù),如果是字母型數(shù)據(jù),排序有升序與降序之分,習(xí)慣上

使用升序;如果是漢字型數(shù)據(jù),排序方式既可按漢字的首位拼音字母排列,也可

按筆畫排序。定距數(shù)據(jù)和定比數(shù)據(jù)的排序只有兩種:即遞增和遞減。

數(shù)據(jù)分組與頻數(shù)分布

(一)數(shù)據(jù)分組的概念

統(tǒng)計(jì)數(shù)據(jù)經(jīng)過預(yù)處理后,可進(jìn)一步做分類或分組整理。統(tǒng)計(jì)分組是統(tǒng)計(jì)數(shù)據(jù)

整理的一項(xiàng)重要工作。統(tǒng)計(jì)數(shù)據(jù)整理的中心任務(wù)就是分組和編制頻數(shù)分布表。

統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將統(tǒng)計(jì)總體按照一定的標(biāo)志區(qū)分為若干

組成部分的一種統(tǒng)計(jì)方法。通過分組,可以劃分現(xiàn)象的類型、說明現(xiàn)象的內(nèi)部結(jié)

構(gòu)、提示現(xiàn)象與現(xiàn)象之間的依存關(guān)系。

(二)統(tǒng)計(jì)分組方法

按分組方法不同,分組的方法有:

1.按品質(zhì)標(biāo)志分組

即按事物的品質(zhì)特征進(jìn)行分組。按品質(zhì)標(biāo)志分組,在確定其分組界限時(shí),有

時(shí)比較簡單,有時(shí)卻很復(fù)雜。

2.按數(shù)量標(biāo)志分組

按數(shù)量標(biāo)志分組,就是按事物的數(shù)量特征進(jìn)行分組。按數(shù)量標(biāo)志分組,不僅

在于確定各組的數(shù)量標(biāo)志的差異,而且要通過數(shù)量差異來反映各組的不同類型和

性質(zhì)。按數(shù)量標(biāo)志分組,涉及到以下幾個(gè)問題:

①組距和組數(shù)

數(shù)量標(biāo)志也即前面講的數(shù)字變量。數(shù)字變量根據(jù)其取值不同,可以分為離散

變量和連續(xù)變量。

/\*離散變量變量值少,采用單項(xiàng)式分組。

7量、變量值多,采用組距分組。

連續(xù)變量一采用組距分組。

單項(xiàng)式分組:把一個(gè)變量值作為一組。組距分組:將全部變量值依次劃分為

幾個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組。組距宜取5或者10的倍數(shù),且第

一組的下限應(yīng)低于最小變量值,最后一組的上限應(yīng)高于最大變量值。

組距的大小與組數(shù)的多少是相互制約的,它們之間呈反比例關(guān)系。組距越大,

則可分的組就越少。確定組距與組數(shù),原則上應(yīng)該是通過分組能把總體單位的分

布特征顯示出來,即組與組之間應(yīng)該反映出現(xiàn)象的差異。

②等距分組與不等距分組

等距分組即變量值在各組保持相等的組距,就是說各變量值都限于相同的范

圍,在變量值比較均勻時(shí),采用等距分組。當(dāng)變量值變動(dòng)很不均勻,就應(yīng)采用不

等距分組。

③組限與組中值

組限即為組距兩端的數(shù)值,分為上限和下限。上限是各組的最大變量值,下

限是各組的最小變量值。

對于離散變量和連續(xù)變量,組限的劃分是不同的。對于離散型變量,由于其

只能取整數(shù),相鄰組的上下限可以不重疊,對于連續(xù)變量,相鄰兩組的組限應(yīng)重

疊,即上一組的上限同時(shí)也是下一組的下限。用“上組限不在內(nèi)”原則解決不重

問題。

組中值是上下限之間的中點(diǎn)數(shù)值,其計(jì)算公式為:組中值=(上限+下限)

?2o用組中值來反映組距分組中各組數(shù)據(jù)的一?般水平。實(shí)際工作中,對于開口

組的組中值,一般是用相鄰組的組距作為開口組的組距,因此,其組中值的計(jì)算

公式近似為:組中值=下限+鄰組組距/2(缺上限)或組中值=上限一鄰組組距/2

(缺下限)。用組中值來代表各組數(shù)據(jù)的一般水平,有一個(gè)假設(shè)條件:即各組數(shù)

據(jù)在本組內(nèi)呈均勻分布。

(三)頻數(shù)分布

1.頻數(shù)分布的概念和種類

①概念:頻數(shù)分布也叫次數(shù)分布或分布數(shù)列,即把全部數(shù)據(jù)按其分組標(biāo)志在

各組內(nèi)的分布狀況稱為頻數(shù)分布。分布在各組內(nèi)的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)或次數(shù),各

組頻數(shù)與全部頻數(shù)之和的比值稱為頻率或比重。將頻數(shù)分布用表格的形式表現(xiàn)出

來就是頻數(shù)分布表。

②種類

/品質(zhì)數(shù)列(按品質(zhì)標(biāo)志分組所形成)

4速數(shù)列/單項(xiàng)式變量數(shù)列

、變量數(shù)”等距數(shù)列

'組距式變量數(shù)列

不等距數(shù)列

2.累積頻數(shù)和累積頻率

累積頻數(shù)分為向上累積和向下累積兩種:向上累積從變量值小的一方向變量

值大的一方累加頻數(shù);向下累積從變量值大的一方向變量值小的一方累加頻數(shù)。

向上累積各累積數(shù)的意義是上限以下的累積頻數(shù)和累積頻率;向下累積各累

積數(shù)的意義是各組下限以上的累積頻數(shù)或累積頻率。

(四)頻數(shù)分布表的編制

編制步驟如下:

1.對數(shù)據(jù)進(jìn)行排序

2.進(jìn)行分組

采用組距分組的步驟如下:

①確定組數(shù)

按斯特格斯提出的經(jīng)驗(yàn)公式確定組數(shù)K:K=l+log1ON/Iog102N為數(shù)據(jù)的個(gè)

數(shù)。

②確定各組的組距

③根據(jù)分組整理成頻數(shù)分布表

三.次數(shù)分配的圖示和類型

(一)圖示法

通過頻數(shù)分布表,可以初步看出數(shù)據(jù)分布的一些特征和規(guī)律,但如果用圖形

來表示次數(shù)分布的結(jié)果,會(huì)更加形象和直觀。常用的顯示頻數(shù)分布特征的圖形有

直方圖、折線圖和曲線圖等。

1.直方圖

即用直方形的寬度和高度來表示頻數(shù)分布情況的圖形。繪制直方圖時(shí),橫軸

表示各組組限,縱軸表示頻數(shù)(一般標(biāo)在左方)和頻率(一般標(biāo)在右方),然后

按分布在各組的頻數(shù)及頻率確定各組在縱軸上的坐標(biāo),并依據(jù)各組組距的寬度與

頻數(shù)的高度繪成直方形。

學(xué)生按成績分

按成學(xué)生比重

績分組數(shù)(%)

60以下78.8

60-------2126.2

70

70-------2531.2

80

80-------1923.8

90

90-------810

100

合80100

計(jì)

口學(xué)生數(shù)

對于不等距數(shù)列,先要計(jì)算出各組的頻數(shù)密度,然后以組距為寬,以頻數(shù)密

度為高畫直方圖,其中頻數(shù)密度的計(jì)算公式為:頻數(shù)密度=頻數(shù)+組距。

2.折線圖

在直方圖的基礎(chǔ)上,將直方圖中的每個(gè)長方形的頂端中點(diǎn)用折線連點(diǎn)而成。

如果不繪制直方圖,可以用組中值與頻數(shù)求坐標(biāo)點(diǎn)連接而成。

3.曲線圖

當(dāng)變量值非常多,變量數(shù)列的組距無限增多時(shí),折線便近似地表現(xiàn)為一條平

滑的曲線,曲線圖的繪制方法與折線圖基本相同,只是連接各組頻數(shù)坐標(biāo)點(diǎn)的線

段應(yīng)當(dāng)是平滑曲線而不用折線。

(二)頻數(shù)分布的類型

常見的頻數(shù)分布曲線主要有正態(tài)分布、偏態(tài)分布、J型分布、V型分布等幾

種類型。

第三章數(shù)據(jù)分布特征的描述

教學(xué)重點(diǎn)和難點(diǎn):均值的計(jì)算方法;方差和標(biāo)準(zhǔn)差的計(jì)算;離散系數(shù)的適用

場合。

第一節(jié)分布集中趨勢的測度

統(tǒng)計(jì)數(shù)據(jù)經(jīng)過整理與顯示后,我們對數(shù)據(jù)分布的類型和特點(diǎn)就有了一個(gè)大致

的了解。但這種了解只是表面上的,還缺少代表性的數(shù)量特征值準(zhǔn)確地描述出統(tǒng)

計(jì)數(shù)據(jù)的分布。要進(jìn)一步掌握數(shù)據(jù)分布的特征和規(guī)律,還需要找到反映數(shù)據(jù)分布

特征的各個(gè)代表值。對統(tǒng)計(jì)數(shù)據(jù)分布的特征,可以從以下三個(gè)方面進(jìn)行測度和描

述:一是分布的集中趨勢,反映各統(tǒng)計(jì)數(shù)據(jù)向其中心值靠攏或聚集的程度;二是

分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢;三是分布的偏態(tài)和峰度,反

映數(shù)據(jù)分布的形狀。

集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢也就是尋找

數(shù)據(jù)一般水平的代表值或中心值。集中趨勢的測度值主要有:均值、幾何平均數(shù)、

眾數(shù)、中位數(shù)。

一.均值(Mean)

均值也叫算術(shù)平均數(shù)(Arithmeticmean),是全部數(shù)據(jù)的算術(shù)平均,是集中

趨勢的最主要測度值,它主要適用于定距數(shù)據(jù)和定比數(shù)據(jù),但不適用于定類數(shù)據(jù)

和定序數(shù)據(jù)。根據(jù)所掌握數(shù)據(jù)的不同,均值有不同的計(jì)算形式和計(jì)算公式。

(-)簡單均值與加權(quán)均值

1.根據(jù)未經(jīng)分組整理的原始數(shù)據(jù)計(jì)算均值

設(shè)一組數(shù)據(jù)為X],X2,X3,……Xn,則均值

注:簡單均值數(shù)值大小只與變量值的大小有關(guān)。

2.根據(jù)分組整理的數(shù)據(jù)計(jì)算均值

設(shè)原始數(shù)據(jù)被分成K組,各組的組中值為X「X2,X3,……,XK,各組變量

值為Fi,F(xiàn)2,F3,……,F(xiàn)KO則均值為:

注:①Fi:權(quán)數(shù)——起權(quán)衡輕重的作用。如果某一組的權(quán)數(shù)較大,則說明

該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對均值的影響就越大,反之則越小。

②均值受各組變量值大小和各組權(quán)數(shù)大小的影響。

③單變量分組時(shí)為精確值,組距分組時(shí)為近似值。

(二)均值的另一種表現(xiàn)形式——調(diào)和平均數(shù)

調(diào)和平均數(shù)(Harmonicmean)也稱調(diào)和均值,是均值的另一種表現(xiàn)形式。

在實(shí)際工作中,由于所獲得的數(shù)據(jù)不同,有時(shí)不能直接采用均值的計(jì)算形式來計(jì)

算平均數(shù),這就需要使用調(diào)和平均數(shù)的形式進(jìn)行計(jì)算。

調(diào)和平均數(shù)實(shí)際上是算術(shù)平均數(shù)的一種變形。二者在本質(zhì)上是一致的,唯一

的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。

(三)一種特殊的均值:兒何平均數(shù)

兒何平均數(shù)(Geometricmean)也稱兒何均值,它是N個(gè)變量值乘積的N次

方根,計(jì)算公式為:

應(yīng)用條件:①所掌握的變量值本身是比率的形式;②各比率的乘積等于總比

率。

兒何平均數(shù)是適用于特殊數(shù)據(jù)的一種平均數(shù),它主要用于計(jì)算比率或速度的

平均。

幾何平均數(shù)也可以看作是均值的一種變形,對幾何平均數(shù)的公式取對數(shù)得:

可以看出,兒何平均數(shù)的對數(shù)是各變量值對數(shù)的算術(shù)平均。

眾數(shù)

眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用Mo表示。它主要

用于作為定序數(shù)據(jù)以及定距和定比數(shù)據(jù)集中趨勢的測度值。

1.當(dāng)數(shù)據(jù)未分組時(shí),出現(xiàn)次數(shù)最多的變量值既為眾數(shù)。

2.當(dāng)數(shù)據(jù)經(jīng)過分組整理后,眾數(shù)的計(jì)算公式為:下限公式:

L:為眾數(shù)組的下限值;I:為眾數(shù)組的組距;F:眾數(shù)組的頻數(shù);

EL眾數(shù)組前一組的頻數(shù);F+i:眾數(shù)組后一組的頻數(shù);

上限公式:

三.中位數(shù)(Median)

中位數(shù)是一組數(shù)據(jù)按從小到大排序后,處于中間位置上的變量值,用Me表

示。中位數(shù)將全部數(shù)據(jù)等分成兩部分,每部分都包含50%的數(shù)據(jù),一部分?jǐn)?shù)據(jù)比

中位數(shù)大,另一部分則比中位數(shù)小。中位數(shù)是個(gè)位置代表值,它主要用于測度定

序數(shù)據(jù)的集中趨勢。

1.根據(jù)未分組數(shù)據(jù)計(jì)算中位數(shù)

先對數(shù)據(jù)進(jìn)行排序;然后確定中位數(shù)的位置。其公式為:中位數(shù)位置=N+l/2,

式中的N為數(shù)據(jù)的個(gè)數(shù)。最后確定中位數(shù)的具體數(shù)值。

若N為奇數(shù),則中位數(shù)為;若N為偶數(shù),則中位數(shù)為和

的平均數(shù)。

2.根據(jù)分組數(shù)據(jù)計(jì)算中位數(shù)

先根據(jù)公式N/2確定中位數(shù)的位置,并確定中位數(shù)所在組,然后用公式近似

確定中位數(shù)。

計(jì)算中位數(shù)時(shí),假定中位數(shù)所在組的頻數(shù)在該組內(nèi)是均勻分布的,中位數(shù)是

一個(gè)位置平均數(shù),其數(shù)值的大小不受極大值和極小值的影響。

四.眾數(shù)、中位數(shù)和均值的關(guān)系

第二節(jié)分布離散程度的測度

集中趨勢反映的是各變量值向其中心值聚集的程度,這只是數(shù)據(jù)分布的一個(gè)

特征,數(shù)據(jù)的分散程度是數(shù)據(jù)分布的另一個(gè)重要特征。它所反映的是各變量值遠(yuǎn)

離其中心值的程度,集中數(shù)據(jù)對一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水

平。

數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差,離散

程度越小,其代表性就越好。

描述數(shù)據(jù)離散程度的測度值主要有極差、平均差、方差和標(biāo)準(zhǔn)差、離散系數(shù)

等。

極差(全距)

是一?組數(shù)據(jù)的最大值與最小值之差,即R=max(Xi)—min(Xi)

對于組距分布數(shù)據(jù),極差也可以近似表示為:R=最高組上限值一最低組下

限值

極差計(jì)算簡單,易于理解,但它易受極端值的影響。

方差和標(biāo)準(zhǔn)差

方差(Variance)是各變量值與其均值離差平方的平均數(shù),是測定定距和定

比數(shù)據(jù)離散程度的最主要方法。根據(jù)總體數(shù)據(jù)和根據(jù)樣本數(shù)據(jù)計(jì)算的方差在數(shù)學(xué)

處理上略有不同。

1.總體方差和標(biāo)準(zhǔn)差

①未經(jīng)分組的原始數(shù)據(jù)

②對于組距分組數(shù)據(jù)

方差的平方即為標(biāo)準(zhǔn)差。與方差不同,標(biāo)準(zhǔn)差是計(jì)量單位的,計(jì)量單位與變

量值相同,其實(shí)際意義要比方差清楚。在對社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析時(shí),我們更多

地使用標(biāo)準(zhǔn)差。

2.樣本方差和標(biāo)準(zhǔn)差

①樣本方差:未分組數(shù)據(jù):組距分組數(shù)據(jù):

②樣本標(biāo)準(zhǔn)差:未分組數(shù)據(jù):組距分組數(shù)據(jù):

說明:i樣本方差與總體方差在計(jì)算上的區(qū)別是:總體方差是用數(shù)據(jù)個(gè)數(shù)或

總頻數(shù)去除離差平方,而樣本方差則是用樣本數(shù)據(jù)個(gè)數(shù)或總頻數(shù)減1去除離差平

方和。其中n-1稱為自由度。

五當(dāng)n很大時(shí),樣本方差S2與總體方差62的計(jì)算結(jié)果相差很小,這時(shí)樣本

方差也可以用總體方差的公式來計(jì)算。

三.離散系數(shù)

對于平均水平不同或計(jì)量單位不同的不同組別的變量值,不能用極差、平均

差、標(biāo)準(zhǔn)差等測度值比較其離散程度,必須消除變量值水平高低和計(jì)量單位不同

對離散程度測度值的影響,此時(shí)需計(jì)算離散系數(shù)。

離散系數(shù)通常是就標(biāo)準(zhǔn)差來計(jì)算的,因此也稱為標(biāo)準(zhǔn)差系數(shù),它是一組數(shù)據(jù)

的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測度數(shù)據(jù)離散程度的相對指標(biāo),其計(jì)算公式為:

離散系數(shù)的作用主要是用于比較不同總體或樣本數(shù)據(jù)的離散程度。離散程度

大的,說明數(shù)據(jù)的離散程度大,離散系數(shù)小的,說明數(shù)據(jù)的離散程度小。

第三節(jié)分布偏態(tài)與峰度的測度

前面講的集中趨勢和離散程度是數(shù)據(jù)分布的兩個(gè)重要特征,但要全面了解數(shù)

據(jù)分布的特點(diǎn),還需要知道數(shù)據(jù)分布的形狀是否對稱,偏斜的程度以及分布的扁

平程度等。

偏態(tài)及其測度

偏態(tài)是對數(shù)據(jù)分布的偏斜方向和程度的測度。要測度偏斜的程度則需要計(jì)算

偏態(tài)系數(shù),其計(jì)算公式為:a3=

式中:a3為偏態(tài)系數(shù);6為標(biāo)準(zhǔn)差的三次方。

對偏態(tài)系數(shù)的分析:

1.當(dāng)分布對稱時(shí),離差三次方后正負(fù)離差可以相互抵消,因而的分子等

于零,則aj=Oo

2.當(dāng)分布不對稱時(shí),則偏態(tài)系數(shù)a3為正值或負(fù)值。當(dāng)a3為正值時(shí),表示正

偏離差值較大;可以判斷為正偏或右偏,a3的數(shù)值越大,偏斜的程度就越大;當(dāng)

(X3為負(fù)值時(shí),表示負(fù)離差數(shù)值較大,可以判斷為負(fù)偏或左偏,a?的數(shù)值越大,向

左偏斜的程度就越大。

峰度及其測度

峰度是集中趨勢高峰的形狀,它是與正態(tài)分布相比較而言的。若分布的形狀

比正態(tài)更瘦更高,則稱為尖峰分布,若比正態(tài)分布更矮更胖,則稱為平峰分布。

峰度系數(shù)是離差四次方和平均數(shù)再除以標(biāo)準(zhǔn)差的四次方,其計(jì)算公式為:

式中:為峰度系數(shù)

大家知道,正態(tài)分布的峰度系數(shù)為3,當(dāng)04>3時(shí)為尖峰分布,當(dāng)O4<3時(shí)

為平峰分布。

第四節(jié)統(tǒng)計(jì)表

一?概念

統(tǒng)計(jì)表和統(tǒng)計(jì)圖是顯示統(tǒng)計(jì)數(shù)據(jù)的兩種形式,在數(shù)據(jù)的搜集、整理、描述和

分析過程中,都要使用統(tǒng)計(jì)表。統(tǒng)計(jì)表是縱橫交叉的線條所組成的一種表格。

統(tǒng)計(jì)表的構(gòu)成

統(tǒng)計(jì)表一般有由四個(gè)主要部分組成,即表頭(總標(biāo)題)、行標(biāo)題(橫行標(biāo)題)、

列標(biāo)題(縱欄標(biāo)題)和數(shù)字資料。表頭應(yīng)放在表的上方,它所要說明的是統(tǒng)計(jì)表

的主要內(nèi)容;行標(biāo)題和列標(biāo)題通常安排在統(tǒng)計(jì)表的第一列和第一行,它所表示的

主要是所研究問題的類別名稱和指標(biāo)名稱;表的其余部分是具體的數(shù)字資料。

第四章抽樣與抽樣估計(jì)

教學(xué)重點(diǎn)和難點(diǎn):抽樣中的基本概念;抽樣誤差;區(qū)間估計(jì);樣本容量的確

定。

第一節(jié)抽樣調(diào)查中的其本概念

抽樣的概念和特點(diǎn)

(一)抽樣的概念

從總體中抽取一個(gè)樣本作為總體的代表,這一過程稱為抽樣。即從總體中隨

機(jī)地取出其中一部分觀察,由此而獲得有關(guān)總體的信息。對樣本進(jìn)行調(diào)查,再根

據(jù)抽樣分布的原理利用樣本資料對總體數(shù)量特征進(jìn)行科學(xué)的估計(jì)與推斷,這就是

抽樣估計(jì)。

(二)抽樣的特點(diǎn)

1.遵守隨機(jī)原則

2.以部分推斷總體

3.抽樣推斷的誤差可以事先計(jì)算并加以控制。

有關(guān)抽樣的基本概念

(1)總體與樣本

1.總體:總體是指根據(jù)研究目的確定的所要研究事物的全體??傮w單位的

總數(shù)稱為總體容量,一般用N表示。

2.樣本:從總體中抽取的部分總體單位所構(gòu)成的整體,稱為該總體的一個(gè)

樣本。樣本所包含的總體單位個(gè)數(shù)稱為樣本容量,一般用n表示。樣本按照樣本

單位數(shù)的多少分為大樣本和小樣本。一般地說,n230為大樣本,n<30為小樣

本。從一個(gè)總體中可以抽取一個(gè)樣本也可以抽取多個(gè)樣本。

(二)總體參數(shù)與統(tǒng)計(jì)量

1.總體參數(shù)(總體指標(biāo))

在抽樣估計(jì)中,用來反映總體數(shù)量特征的指標(biāo)稱為總體指標(biāo),也叫總體參數(shù)。

我們所要估計(jì)的總體參數(shù)通常有總體平均數(shù)內(nèi)總體比例P,總體標(biāo)準(zhǔn)差6,總

體方差62等等??傮w參數(shù)的計(jì)算方法是明確的,但具體數(shù)值事先是未知的,需

要用統(tǒng)計(jì)量來估計(jì)它。

2.統(tǒng)計(jì)量(樣本指標(biāo))

樣本指標(biāo)又稱樣本統(tǒng)計(jì)量或估計(jì)量,是根據(jù)樣本資料計(jì)算的,用以估計(jì)和推

斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。常見的樣本統(tǒng)計(jì)量有樣本平均數(shù),樣本比例(也

叫樣本成數(shù))P,樣本標(biāo)準(zhǔn)差S或樣本方差S2等等。樣本統(tǒng)計(jì)量是隨樣本不同而

不同的隨機(jī)變量。

成數(shù)(比例)的抽樣平均誤差為:

-

-p)2

M一

抽樣平均誤差概括地反映了所有可能樣本的估計(jì)值(0)與相應(yīng)總體參數(shù)

(0)的平均誤差程度。抽樣平均誤差愈小,則樣本統(tǒng)計(jì)量的分布愈集中在總體

參數(shù)附近,平均說來,樣本估計(jì)量與總體參數(shù)之間抽樣誤差愈小,樣本對總體的

代表性愈大。A

A

注:抽樣方差即抽樣平均誤差的平方,估計(jì)量0的抽樣方差記為V(0)。

2、抽樣平均誤差的實(shí)際應(yīng)用公式

抽樣平均誤差的定義公式中,由于總體參數(shù)(9)未知,也不可能列出所有

可能的樣本估計(jì)值,所以抽樣平均誤差不能按定義公式來計(jì)算,只能根據(jù)概率論

和數(shù)量統(tǒng)計(jì)的有關(guān)理論來推導(dǎo)其計(jì)算公式。

(1)平均數(shù)的抽樣平均誤差

a、在重復(fù)抽樣條件下

1

說明:i:抽樣平均誤差比總體標(biāo)準(zhǔn)差小得多,僅為總體標(biāo)準(zhǔn)差的方。

ii:抽樣平均誤差和總體標(biāo)準(zhǔn)差成正比變化,和樣本單位數(shù)n的平方根成反

比變化。

b、在不重復(fù)抽樣條件下

說明:i:不重復(fù)抽樣的抽樣平均誤差公式比重復(fù)抽樣的相應(yīng)公式多一個(gè)系

數(shù)后音,這個(gè)系數(shù)稱為不重復(fù)抽樣修正系數(shù)(或校正因子)。

21-2

也"是抽樣比重,”是小于1大于0的數(shù),因此,在其他條件不變的情

況下,說明不重復(fù)抽樣下的抽樣平均誤差要小于重復(fù)抽

樣條件下的抽樣平均誤差,不重復(fù)抽樣的樣本代表性較大。

iii:總體單位數(shù)(總體容量)N總是比樣本單位數(shù)(n)大得多,£總是很

小的,1-^就是接近于lo在這種情況以下,不重復(fù)抽樣的抽樣平均誤差實(shí)際

上與重復(fù)抽樣的抽樣平均誤差相差無兒。

IV:在計(jì)算抽樣誤差時(shí),通常總體標(biāo)準(zhǔn)差(。)是未知的,經(jīng)常采用以下兒

種方法來代替總體標(biāo)準(zhǔn)差:用樣本標(biāo)準(zhǔn)差(S)代替總體標(biāo)準(zhǔn)差(。);用過去同

樣問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗(yàn)數(shù)據(jù)代替;在正式抽樣調(diào)查之前,先組織試驗(yàn)

性抽樣,用試驗(yàn)樣本資料代替。

(2)成數(shù)(比例)的抽樣平均誤差

a、在重復(fù)抽樣條件下

p:總體成數(shù)

b、在不重復(fù)抽樣條件下

PO-P)

b(p)=仁)

nN—1n

3、影響抽樣誤差的因素

(三)抽樣極限誤差

我們知道,以樣本指標(biāo)來估計(jì)總體指標(biāo),要達(dá)到完全準(zhǔn)確,這兒乎是不可能

的事情。當(dāng)然,在做估計(jì)時(shí)我們不希望誤差不大,誤差愈大,樣本的價(jià)值便愈小,

但也不是誤差愈小愈好,因?yàn)樵谝欢ㄏ薅戎鬁p少抽樣誤差勢必增加很多費(fèi)用,

因此,在做估計(jì)時(shí),需要確定一個(gè)可允許的誤差范圍,這種在一定概率下抽樣誤

差的可能范圍,即為抽樣極限誤差(也稱為允許誤差)。

在一定概率下:|9—0|^A0

具體為:

|x-x|<Ax

|p-p|w

將上面的等式變換為下列等價(jià)的不等式關(guān)系:

(1)

p-^p<p<p+^p⑵

(1)式表示被估計(jì)的總體平均數(shù)是以樣本平均數(shù)-為中心,在-_A-至

"+之間變動(dòng),區(qū)媽A嚏+]稱為平均數(shù)的估計(jì)區(qū)間(或置信

區(qū)間)。區(qū)間的總飯?bào)椤?/p>

(2)式表示被估計(jì)的總體成數(shù)是以抽樣成數(shù)P為中心,在p-屈至Sp+5之

間變動(dòng),區(qū)間[切,0+3]稱為成數(shù)的估計(jì)區(qū)間(或置信區(qū)間),區(qū)間的總長

度為2△7o

在抽樣實(shí)踐中,允許的抽樣誤差有時(shí)也用相對的允許誤差限來表示,相對的

極限誤差(抽樣誤差率)是將抽樣的極限誤差除以估計(jì)的均值或成數(shù),用△;和

?!硎荆瑒t:

晨'=唐

xP

用1減去相對的極限誤差稱為估計(jì)的精度。即:抽樣估計(jì)精度=1(100%)

一抽樣誤差率。

四、抽樣估計(jì)的置信度

抽樣估計(jì)的置信度是表明樣本指標(biāo)(統(tǒng)計(jì)量)和總體指標(biāo)(參數(shù))的誤差不

超過一定范圍的概率保證程度。習(xí)慣上稱之為可靠度,可信程度,把握程度等等。

用1-a表示。

制又一斤區(qū)△斤)=1一況或尸(|尸一。區(qū)AP)=l-a

=P(X-AX<X+AX)=l-a

=>p(X-Zaa(X)<X<X+Zaa(x))=\-a

2~2

說明:對于一般正態(tài)分布,又需設(shè)2=三二幺-

通過對x的線性交換后得到新隨機(jī)變量z是服從標(biāo)準(zhǔn)正態(tài)分布的,即

Z~N(O,1),因而求一般正態(tài)分布在某區(qū)間上的概率,就轉(zhuǎn)化為求標(biāo)準(zhǔn)正態(tài)分布

在相應(yīng)區(qū)間的概率。

五、總體參數(shù)估計(jì)

總體參數(shù)估計(jì)有如下兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。

(一)點(diǎn)估計(jì)

點(diǎn)估計(jì)是直接以樣本統(tǒng)計(jì)亶'o來估計(jì)總體參數(shù)0。如樣本均值彘總體均值京〃)

的點(diǎn)估計(jì)量,樣本方差S2是總體方差。2的點(diǎn)估計(jì)量。樣本比例P是總體比

例P的點(diǎn)估計(jì)量。

優(yōu)點(diǎn):能夠提供總體參數(shù)的具體估計(jì)值,簡便易行。

缺點(diǎn):沒有表明抽樣估計(jì)的誤差,也沒有指出誤差在一定范圍內(nèi)的概率保證

程度有多大。

點(diǎn)估計(jì)符合優(yōu)良估計(jì)的三個(gè)標(biāo)準(zhǔn),即無偏性、一致性、有效性。

(二)區(qū)間估計(jì)(只講總體均值的區(qū)間估計(jì))

1、科學(xué)的抽樣估計(jì)方法要具備三個(gè)基本要素。

(1)要有合適的統(tǒng)計(jì)量作為估計(jì)量G,p)

(2)要有合理的允許誤差范圍<Ax,Ap)

(3)要有一個(gè)可接受的置信度(1-。)

「Ax^Zaa(x)。為顯著性水平

-1-

Ip(\x-x\<Ax)-\-a

分析:說明估計(jì)的準(zhǔn)確性(Ax)和估計(jì)的可靠性是一對矛盾。

x-Ax<x<x+Ax

置信區(qū)間

p-\p<p<p+Ap

2、區(qū)間估計(jì)

置信度(1?。)

分析:(1)總體方差已知時(shí),正態(tài)總體均值的區(qū)間估計(jì)

x+

X-Za?cr(x)<〃(x)-^a?b(x)

上式即為置2信度為1-a時(shí)總體均2循的置信區(qū)間。

(2)總體方差未知時(shí);正態(tài)總均值的區(qū)間估計(jì)(小樣本)

—s——s

X~fa~~j=~M%)~x+ta

置信區(qū)間:52

\-a

-s

置信度:f6

抽樣極限誤差:

六、抽樣組織方式

基本的抽樣組織方式有簡單隨機(jī)抽樣,分層抽樣,等距抽樣和整群抽樣四種。

1、概念

(一)簡單隨機(jī)抽樣

簡單隨機(jī)抽樣是按隨機(jī)原則直接從總體N個(gè)單位中抽取n個(gè)單位作為樣本。

簡單隨機(jī)抽樣是抽樣中最基本也是最簡單的抽樣組織形式,它適用于均勻總體,

即具有某種特征的單位均勻地分布于總體的各個(gè)部分。在抽樣之前要對總體各單

位加以編號(hào),然后用抽簽的方式或根據(jù)《隨機(jī)數(shù)表》來抽選必要的單位數(shù)。

2、樣本容量的確定

樣本容量是指樣本中含有的總體單位數(shù)。樣本容量的多少,與抽樣誤差及調(diào)

查費(fèi)用都有直接的關(guān)系。如果樣本容量過大,雖然抽樣誤差很小,但調(diào)查工作量

增大,耗費(fèi)的時(shí)間和經(jīng)費(fèi)太多,體現(xiàn)不出抽樣調(diào)查的優(yōu)越性。反之,如果樣本容

量太小,雖然耗費(fèi)少,但抽樣誤差太大,抽樣推斷就會(huì)失去價(jià)值。因此,必要樣

本容量的確定在抽樣設(shè)計(jì)中十分重要。

(1)平均數(shù)必要樣本容量的確定

a、在重復(fù)抽樣條件下:

n=

*

公式推導(dǎo):

(y

b(x)丁

CT2a2

b(X)2=—=>n

n,(X)2

由于:△》=Z&?<T(X)

2

z”4

a2

=>〃=——=>n2

\xA-

Z7

~2

b、在不重復(fù)抽樣條件下

Nzy

n=2

N岸+Z、2

xa

2

既:

2

乙ze

鼻11

-2y2d--=-=>

ZqNn

~2

N^-+(y2Zl

----222=~=>

NZ^cr2n

~2

NZ;/

n=----------------

N《+Z"

2

(2)成數(shù)必要樣本容量的確定

只需將上述公式中

Ax換成年>,0"2換成p(l-夕)即可

a、在重復(fù)抽樣條件

Z;P(I-P)

b、在不重復(fù)抽樣條件下

NZ;P(1-P)

____I_______

NNp+Z;P(l-p)

從上述公式可見,必要的樣本容量受以下因素影響。

(1)總體方差。2

(2)允許誤差范圍△域△.

(3)置信度\-a

(4)抽樣方法

(5)抽樣組織方式

關(guān)于樣本容量確定的說明:

(1)上面公式計(jì)算的樣本容量是最低的,也是最必要的樣本容量。

(2)如果進(jìn)行一次抽樣調(diào)查,同時(shí)對總體平均數(shù)和成數(shù)進(jìn)行區(qū)間估計(jì),運(yùn)用

上面公式計(jì)算兩個(gè)樣本容量,一般情況下兩者不相等,為了同時(shí)滿足兩個(gè)推斷的

要求,一般在兩個(gè)樣本容量中選擇較大的一個(gè)。

(3)上面公式計(jì)算結(jié)果不一定是整取,如果帶小數(shù),一般不采取四舍五入辦

法化成整數(shù),而是用比這個(gè)數(shù)大的鄰近整數(shù)代替。

簡單隨機(jī)抽樣在實(shí)踐中受到許多限制,當(dāng)總體很大時(shí)對每個(gè)單位編號(hào),抽簽

等都會(huì)遇到困難,因此,實(shí)踐中,我們常常采用分層抽樣,等距抽樣或整群抽樣。

第五章假設(shè)檢驗(yàn)

教學(xué)重點(diǎn)和難點(diǎn):假設(shè)檢驗(yàn)的基本思想;檢驗(yàn)中的兩類錯(cuò)誤;總體均值;比

例和方差的假設(shè)檢驗(yàn)。

所謂假設(shè)檢驗(yàn),就是事先對總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利

用本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異從而

決定應(yīng)接受或否定原假設(shè)。

第一節(jié)假設(shè)檢驗(yàn)的一般問題

一、假設(shè)檢驗(yàn)的基本思想

假設(shè)檢驗(yàn)的基本思想是帶有概率性質(zhì)的反證法。具體說來,假設(shè)檢驗(yàn)主要有

以下兩個(gè)特點(diǎn):

第一,假設(shè)檢驗(yàn)所采用的邏輯推理方法是反證法。為了檢驗(yàn)?zāi)硞€(gè)假設(shè)是否成

立,先假定它是正確的。然后根據(jù)抽樣理論和樣本信息,觀察由此假設(shè)而導(dǎo)致的

結(jié)果是否合理,從而判斷是否接受原假設(shè)。

第二,這里的合理與否,所依據(jù)的是“小概率事件實(shí)際不可能發(fā)生的原理”。

即在一次觀察中小概率事件發(fā)生了,則認(rèn)為原假設(shè)是不合理的;反之,小概率事

件沒有出現(xiàn),則認(rèn)為原假設(shè)是合的。所以,假設(shè)檢驗(yàn)的反證法是帶有概率性質(zhì)的

反證法,并非嚴(yán)格的邏輯證明。

二、假設(shè)檢驗(yàn)的步驟

假設(shè)檢驗(yàn)一般有以下兒個(gè)步驟:

1、提出原假設(shè)和備擇假設(shè)

2、選擇適當(dāng)?shù)慕y(tǒng)計(jì)量,并確定其分布形式

3、選擇顯著性水平a,確定臨界值

4、作出結(jié)論

三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤

(一)第一類錯(cuò)誤

(-)第二類錯(cuò)誤

四、兩類錯(cuò)誤的概率a和B的關(guān)系

第二節(jié)總體均值、比例和方差的假設(shè)檢驗(yàn)

一、總體方差已知時(shí)對正態(tài)總體均值的假設(shè)檢驗(yàn)

二、總體方差未知時(shí)對正態(tài)總體均值的假設(shè)檢驗(yàn)

三、總體比例的假設(shè)檢驗(yàn)

四、總體方差的假設(shè)檢驗(yàn)

第三節(jié)假設(shè)檢驗(yàn)中的其他問題

一、區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系

二、假設(shè)檢驗(yàn)中的P值

第六章方差分析

教學(xué)重點(diǎn)和難點(diǎn):方差分析的原理;單因素方關(guān)分析;雙因素方差分析。

在數(shù)理統(tǒng)計(jì)中所學(xué)的假設(shè)檢驗(yàn)主要討論兩個(gè)總體均值是否相等的顯著性檢

驗(yàn)問題,但是,當(dāng)總體增加到3個(gè)甚至更多時(shí),用假設(shè)檢驗(yàn)對總體均值進(jìn)行顯著

性檢驗(yàn),不僅工作量大,而且影響估計(jì)精度,此時(shí)就需采用方差分析。方差分析

(Analysisofvariance)能夠解決多個(gè)均值是否相等的檢驗(yàn)問題。節(jié)省時(shí)間是這

種方法的明顯優(yōu)點(diǎn)。

第一節(jié)方差分析的基本問題

一、方差分析的內(nèi)容

方差分析是對多個(gè)總體均值是否相等這一假設(shè)進(jìn)行檢驗(yàn)。

在方差分析中,有兒個(gè)術(shù)語需要了解。一個(gè)是因素,因素是一個(gè)獨(dú)立的變量,

是方差分析研究的對象。因素中的內(nèi)容稱為水平。

無色

粉色

橘黃色

綠色

因素

若方差分析只針對一個(gè)因素進(jìn)行,稱為單因素方差分析。如果同時(shí)針對

多個(gè)因素進(jìn)行,稱為多因素分析。在多因素方差分析中,雙因素方差分析里最常

見的。

用方差分析來檢驗(yàn)假設(shè)有三個(gè)假定:1、各個(gè)水平的觀察數(shù)據(jù)必須服從正態(tài)

分布;2、方差相同。3、相互獨(dú)立。

二、方差分析的原理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論