統(tǒng)計(jì)學(xué)講義課件_第1頁
統(tǒng)計(jì)學(xué)講義課件_第2頁
統(tǒng)計(jì)學(xué)講義課件_第3頁
統(tǒng)計(jì)學(xué)講義課件_第4頁
統(tǒng)計(jì)學(xué)講義課件_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1

《統(tǒng)計(jì)學(xué)》講義

第一章緒論

教學(xué)重點(diǎn)和難點(diǎn):統(tǒng)計(jì)學(xué)的含義;統(tǒng)計(jì)學(xué)的分科。

第一節(jié)統(tǒng)計(jì)與統(tǒng)計(jì)學(xué)

一.統(tǒng)計(jì)學(xué)的含義

1.統(tǒng)計(jì)工作(統(tǒng)計(jì)實(shí)踐):是指對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行搜集、整理和分析的活動

過程。

2.統(tǒng)計(jì)數(shù)據(jù)(統(tǒng)計(jì)資料):是統(tǒng)計(jì)工作的成果。統(tǒng)計(jì)數(shù)據(jù)的搜集是取得統(tǒng)

計(jì)數(shù)據(jù)的過程,它是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)。離開了統(tǒng)計(jì)數(shù)據(jù),統(tǒng)計(jì)方法就失去

了用武之地。

統(tǒng)計(jì)工作和統(tǒng)計(jì)數(shù)據(jù)的關(guān)系是過程和成果的關(guān)系。即統(tǒng)計(jì)數(shù)據(jù)是統(tǒng)計(jì)工作

提供的,是統(tǒng)計(jì)活動的成果。

3.統(tǒng)計(jì)學(xué):是一門有關(guān)統(tǒng)計(jì)數(shù)據(jù)的科學(xué)。它研究如何搜集、整理資料

和進(jìn)行數(shù)量分析,推斷的一門方法論科學(xué)。是統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和概括。

統(tǒng)計(jì)工作和統(tǒng)計(jì)學(xué)是實(shí)踐和理論的關(guān)系。統(tǒng)計(jì)理論來源于統(tǒng)計(jì)實(shí)

踐,它是統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和概括。反過來,統(tǒng)計(jì)理論又是指導(dǎo)統(tǒng)計(jì)工作的

原則和方法。

總之,統(tǒng)計(jì)工作,統(tǒng)計(jì)數(shù)據(jù),統(tǒng)計(jì)學(xué)三者之中,統(tǒng)計(jì)工作是基礎(chǔ),

是源。沒有統(tǒng)計(jì)工作,就不會產(chǎn)生統(tǒng)計(jì)數(shù)據(jù),沒有統(tǒng)計(jì)工作,缺少這個(gè)實(shí)踐基

礎(chǔ),統(tǒng)計(jì)學(xué)也就不可能形成和發(fā)展。

二.統(tǒng)計(jì)數(shù)據(jù)的規(guī)律與統(tǒng)計(jì)方法

第二節(jié)統(tǒng)計(jì)學(xué)的分科

統(tǒng)計(jì)學(xué)大致有以下兩種分類:

根據(jù)統(tǒng)計(jì)方法的構(gòu)成,統(tǒng)計(jì)學(xué)可以分為描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)

學(xué)。

1.描述統(tǒng)計(jì)學(xué):通過對現(xiàn)象的調(diào)查或觀察一得到大量的統(tǒng)計(jì)數(shù)據(jù)一用圖

表形式對所收集到的數(shù)據(jù)進(jìn)行加工處理與顯示一就這些數(shù)據(jù)的分布特征(如集

中趨勢,離散趨勢等)計(jì)算出一些概括性的數(shù)字(如平均數(shù),標(biāo)準(zhǔn)差,相關(guān)系

2

數(shù)等等)一得出反映客觀現(xiàn)象的規(guī)律性數(shù)量特征。

2.推斷統(tǒng)計(jì)學(xué):推斷統(tǒng)計(jì)學(xué)是指只憑樣本數(shù)據(jù)去推斷總體數(shù)量特征的技

術(shù)方法。

樣本數(shù)據(jù)

總體數(shù)據(jù)

圖1-1統(tǒng)計(jì)學(xué)探索客觀現(xiàn)象數(shù)量規(guī)律性的過程

注1:描述統(tǒng)計(jì)學(xué)不必深入一層地去試圖推論數(shù)據(jù)本身以外的任何事

情;推斷統(tǒng)計(jì)學(xué)則在樣本數(shù)據(jù)的基礎(chǔ)上深入一步地分析、研究和推斷,以推知

資料本身以外的情況和數(shù)量關(guān)系。

注2:描述統(tǒng)計(jì)學(xué)用的是總體數(shù)據(jù),推斷統(tǒng)計(jì)學(xué)則往往用樣本數(shù)據(jù)。

在現(xiàn)實(shí)問題中,我們得到的數(shù)據(jù)主要是樣本數(shù)據(jù),因此,推斷統(tǒng)計(jì)學(xué)越來越重

要,是統(tǒng)計(jì)學(xué)的核心內(nèi)容。

注3:統(tǒng)計(jì)學(xué)的發(fā)展過程中,先有描述統(tǒng)計(jì)學(xué),后有推斷統(tǒng)計(jì)學(xué),從描

述統(tǒng)計(jì)學(xué)發(fā)展到推斷統(tǒng)計(jì)學(xué),是統(tǒng)計(jì)學(xué)發(fā)展成熟的標(biāo)志。

二.從統(tǒng)計(jì)方法研究和統(tǒng)計(jì)方法的應(yīng)用角度看,統(tǒng)計(jì)學(xué)可分為理論統(tǒng)

計(jì)學(xué)和應(yīng)用統(tǒng)計(jì)學(xué)。

理論統(tǒng)計(jì)學(xué)主要是指統(tǒng)計(jì)學(xué)的數(shù)學(xué)原理和方法原理。從事統(tǒng)計(jì)理論和

概率論

(包括分布理論、大數(shù)定

律和中心極限定理等)

反映客觀現(xiàn)

象的統(tǒng)計(jì)數(shù)

據(jù)

描述統(tǒng)計(jì)學(xué)(包

括統(tǒng)計(jì)數(shù)據(jù)的收

集、整理、顯示

和分析

推斷統(tǒng)計(jì)學(xué)(利用樣本信

息和概率論對總體的數(shù)量

特征進(jìn)行估計(jì)和檢驗(yàn)等)

總體內(nèi)

在的數(shù)

量規(guī)律

3

方法研究的人員需要有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ)。理論統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)的理論基礎(chǔ)。

統(tǒng)計(jì)學(xué)是一門分析數(shù)據(jù)的科學(xué),因而統(tǒng)計(jì)方法的應(yīng)用幾乎擴(kuò)展到了所有的

科學(xué)研究領(lǐng)域。

第三節(jié)統(tǒng)計(jì)學(xué)中的一些基本概念

總體和總體單位

1.總體

總體是指根據(jù)研究目的確定的所要研究的同類事物的全體。

說明:⑴統(tǒng)計(jì)總體是根據(jù)統(tǒng)計(jì)研究目的確定的。

⑵統(tǒng)計(jì)總體是客觀存在的。

⑶統(tǒng)計(jì)總體中的所有個(gè)別事物具有某種同一性質(zhì)。

2.總體單位

總體單位是指構(gòu)成總體的個(gè)別事物(基木單元),也稱個(gè)體。例如:我

們要研究全國鄉(xiāng)鎮(zhèn)企業(yè)發(fā)展情況,則總體為全國鄉(xiāng)鎮(zhèn)企業(yè),總體單位為每個(gè)鄉(xiāng)

鎮(zhèn)企業(yè)。

二.標(biāo)志和指標(biāo)

1.標(biāo)志

標(biāo)志是說明總體單位屬性和特征的名稱。標(biāo)志和總體單位的關(guān)系是非

常明確的,總體單位是標(biāo)志的直接承擔(dān)者,標(biāo)志是依附于總體單位的。

標(biāo)志按表現(xiàn)形式不同分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志。①品質(zhì)標(biāo)志:表示總

體單位性質(zhì)方面的特征;它只能用文字表示。②數(shù)量標(biāo)志:表示總體單位數(shù)量

方面的特征;用數(shù)值表示。

標(biāo)志表現(xiàn):是標(biāo)志特征在各單位的具體表現(xiàn),有品質(zhì)標(biāo)志表現(xiàn)和數(shù)量

標(biāo)志表現(xiàn)之分。數(shù)量標(biāo)志的表現(xiàn)即標(biāo)志值。

2.指標(biāo)

①概念:指標(biāo)是反映總體數(shù)量特征的概念及其數(shù)值。

②分類

指標(biāo)按反映的數(shù)量特點(diǎn)不同可分為數(shù)量指標(biāo)和質(zhì)量指標(biāo)。

I.數(shù)量指標(biāo):說明總體規(guī)模大小,水平高低,數(shù)量多少的指標(biāo);用絕對

數(shù)表示。

4

II.質(zhì)量指標(biāo):說明總體相對水平或工作質(zhì)量的統(tǒng)計(jì)指標(biāo);用相對數(shù)、平

均數(shù)表示。

兩者關(guān)系:數(shù)量指標(biāo)是計(jì)算質(zhì)量指標(biāo)的基礎(chǔ)。

③特點(diǎn)

I.數(shù)量性(可量性)

II.綜合性

III.客觀性(具體性)

三.變異和變量

1.變異:可變標(biāo)志的屬性或特征由一種狀態(tài)變到另一種狀態(tài),統(tǒng)計(jì)上稱

之為變異。

2.變量:在統(tǒng)計(jì)中,一般把說明現(xiàn)象某種特征的概念稱為變量。變量的

具體表現(xiàn)稱為變量值。如果一個(gè)變量是由品質(zhì)數(shù)據(jù)來記錄的稱為品質(zhì)變量,如

“性別”就是一個(gè)品質(zhì)變量。如果一個(gè)變量是由數(shù)量數(shù)據(jù)來記錄的稱為數(shù)量變

量或數(shù)字變量。數(shù)字變量根據(jù)其取值的不同,可以分為離散變量和連續(xù)變量。

離散變量其取值都是以整數(shù)位斷開,可以一一列舉,如“企業(yè)數(shù)”等。連續(xù)變

量其取值是連續(xù)不斷的,不能一一列舉,如“溫度”等。但多數(shù)情況下我們所

說的變量都是指數(shù)字變量。

第二章統(tǒng)計(jì)數(shù)據(jù)的搜集與整理

教學(xué)重點(diǎn)和難點(diǎn):數(shù)據(jù)的搜集方法;調(diào)查方案設(shè)計(jì);數(shù)據(jù)分組。

第一節(jié)數(shù)據(jù)的計(jì)量與類型

一獲募屏砍叨?

統(tǒng)計(jì)數(shù)據(jù)是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ),統(tǒng)計(jì)數(shù)據(jù)靠我們?nèi)ニ鸭拍艿玫?,但在?/p>

集數(shù)據(jù)之前,先要對現(xiàn)象進(jìn)行計(jì)量或測度,這就涉及到數(shù)據(jù)的計(jì)量尺度問題。按

照計(jì)量學(xué)的一般分類方法,對統(tǒng)計(jì)數(shù)據(jù)分為四種計(jì)量尺度或計(jì)量水準(zhǔn),即定類尺

度、定序尺度、定距尺度和定比尺度。

(-)定類尺度

定類尺度也稱類別尺度或列名尺度,是最粗略、計(jì)量層次最低的計(jì)量尺度。

這種計(jì)量尺度只能按照事物的某種屬性對其進(jìn)行平行的分類或分組。例如人口按

照性別分為男、女兩類等。分類就是將所觀察的個(gè)體(總體單位)分為不同的類

5

型。定類尺度只是測度了事物之間的類別差,對各類之間的其他差別卻沒有反映。

使用該尺度對事物所作的分類,各類別之間是平等的并列關(guān)系,無法區(qū)分優(yōu)劣或

大小,各類別之間的順序是可以改變的。對定類尺度的計(jì)量結(jié)果,通常是通過計(jì)

算出每一類別中各元素或個(gè)體出現(xiàn)的頻率或頻數(shù)來進(jìn)行分析。

在使用定類尺度對事物進(jìn)行分類時(shí),必須符合窮盡和互斥的要求。定類尺度

是對事物最基本的測度,是其他計(jì)量尺度的基礎(chǔ)。它具有=和#的數(shù)學(xué)特性。

(二)定序尺度

定序尺度又稱順序尺度,是對事物之間等級差或順序差別的一種測度。該尺

度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優(yōu)劣或順序。例

如,考試成績可以分為優(yōu)、良、中、及格、不及格等等。

定序尺度對事物的計(jì)量要比定類尺度精確一些,但它只測度了類別之間的順

序,而未測量出類別之間的準(zhǔn)確差值。因些該尺度具有>和<的數(shù)學(xué)特性,但不

能進(jìn)行加、減、乘、除等數(shù)學(xué)運(yùn)算。

(三)定距尺度

定距尺度也稱間隔尺度,它不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且

可以準(zhǔn)確地指出類別之間的差距是多少。定距尺度是對事物類別或次序之間間距

的測度。因此,定距尺度的計(jì)算結(jié)果表現(xiàn)為數(shù)值。如甲地區(qū)溫度是20

0

C,乙地

區(qū)的溫度是25

0

C,二者相差5

0

Co其結(jié)果可以進(jìn)行加、減運(yùn)算。

(四)定比尺度

定比尺度也稱為比率尺度,它除了具有上述三種計(jì)量尺度的全部特性以外,

還具有一個(gè)特性,那就是可以計(jì)算兩個(gè)測度值之間的比值。這就要求定比尺度中

必須有一個(gè)絕對固定的“零點(diǎn)”,這也是它與定距尺度的惟一差別。例如,一個(gè)

學(xué)生的數(shù)學(xué)成績?yōu)?分,是表示他的數(shù)學(xué)成績水平為0,并不表示他沒有考試成

績或沒有任何數(shù)學(xué)知識;一個(gè)地區(qū)的溫度為0度,表示一種溫度的水平,并不是

沒有溫度??梢?,定距尺度中的“0”是一個(gè)有意義的數(shù)值,定比尺度則不同,

它有一個(gè)絕對“零點(diǎn)”。在定比尺度中,“0”表示“沒有”或“不存在”,如某人

這個(gè)月的收入為“0”,表示這個(gè)人沒有收入。定比尺度可以進(jìn)行加、減、乘、除

運(yùn)算。

上述四種計(jì)量尺度對事物的測量層次由低級到高級,由粗略到精確逐步遞進(jìn)

6

的。高層次的計(jì)量尺度可以具有低層次計(jì)量尺度的全部特性,但不能反過來。下

表給出了上述四種計(jì)量尺度的測量層次和數(shù)學(xué)特性。

四種計(jì)量尺度的比較

計(jì)

學(xué)

數(shù)

<=7

4、J

4V

<><

4<NI

<)

一+

比值

(X、-r)

在統(tǒng)計(jì)分析中,一般要求測量的層次越高越好,因?yàn)楦邔哟蔚挠?jì)量尺度包

含更多的數(shù)學(xué)特性,所運(yùn)用的統(tǒng)計(jì)分析方法越多,分析時(shí)也就越方便,因此,應(yīng)

盡可能使用高層次的計(jì)量尺度。

數(shù)據(jù)的類型

從上述四種計(jì)量尺度的結(jié)果來看,可以將統(tǒng)計(jì)數(shù)據(jù)分為四種類型:

1.定類數(shù)據(jù):表現(xiàn)為類別,但不區(qū)分順序,是由定類尺度形成的。

2.定序數(shù)據(jù):表現(xiàn)為類別,但有順序,是由定序尺度計(jì)量形成的。

3.定距數(shù)據(jù):表現(xiàn)為數(shù)值,可以進(jìn)行加、減運(yùn)算,是由定距尺度計(jì)量形

成的。

4.定比數(shù)據(jù):表現(xiàn)為數(shù)值,可進(jìn)行加、減、乘、除運(yùn)算,是由定尺度形

成的。

前二類數(shù)據(jù)說明的是事物的品質(zhì)特征,不能用數(shù)值表示,其結(jié)果均表現(xiàn)

為類別,稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);后兩類數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征,能夠

用數(shù)值來表現(xiàn),因此稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。

7

區(qū)分測量的層次和數(shù)據(jù)的類型十分重要,因?yàn)閷Σ煌愋偷臄?shù)據(jù)將采用

不同的統(tǒng)計(jì)方法來處理。

三.統(tǒng)計(jì)數(shù)據(jù)的表現(xiàn)形式

時(shí)期數(shù)

絕對數(shù)(數(shù)量指標(biāo))

時(shí)點(diǎn)數(shù)

表現(xiàn)形式相對數(shù)比例(Proportion)

比率

(Ratio)

平均數(shù)(均值)

第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的搜集

我們站在統(tǒng)計(jì)數(shù)據(jù)使用者的角度看,統(tǒng)計(jì)數(shù)據(jù)主要來源于兩種渠道:一是

直接的調(diào)查和科學(xué)試驗(yàn),這是統(tǒng)計(jì)數(shù)據(jù)的直接來源,我們稱之為第一手資料或直

接的統(tǒng)計(jì)數(shù)據(jù);二是別人調(diào)查或試驗(yàn)的數(shù)據(jù),這是統(tǒng)計(jì)數(shù)據(jù)的間接來源,我們稱

之為第二手或間接的統(tǒng)計(jì)數(shù)據(jù)。

統(tǒng)計(jì)數(shù)據(jù)的直接來源

統(tǒng)計(jì)數(shù)據(jù)的直接來源主要有兩個(gè)渠道:一是專門組織的調(diào)查;專門調(diào)查是

取得社會經(jīng)濟(jì)數(shù)據(jù)的重要手段。二是科學(xué)試驗(yàn);科學(xué)試驗(yàn)是取得自然科學(xué)數(shù)據(jù)的

主要手段。

(-)統(tǒng)計(jì)調(diào)查方式

實(shí)際工作中常用的統(tǒng)計(jì)調(diào)查方式有:普查、重點(diǎn)調(diào)查、典型調(diào)查、抽樣調(diào)

查、統(tǒng)計(jì)報(bào)表等。

[普查

①概/普查是為某一特定目的而專門組織的一次性全面調(diào)查。我國五次人

口普查時(shí)間:1953年,1964年,1982年,1990年(7月1日零時(shí)),2000年

(11

月1日零時(shí))。

②特點(diǎn):

a.普查通常是一次性的或周期性的;

b.普查一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時(shí)間。目的是為了避免調(diào)

查數(shù)據(jù)的重復(fù)或遺漏。

8

c.為抽樣調(diào)查或其他調(diào)查提供基本依據(jù)。

d.普查的使用范圍比較窄。

2.抽樣調(diào)查

①概念:抽樣調(diào)查是從調(diào)查對象中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,

并根據(jù)調(diào)查結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查。

②特點(diǎn):i:經(jīng)濟(jì)性ii:時(shí)效性強(qiáng)iii:適應(yīng)面廣iv:

準(zhǔn)確性高

3.統(tǒng)計(jì)報(bào)表

統(tǒng)計(jì)報(bào)表是國家和地方政府部門統(tǒng)計(jì)數(shù)據(jù)的主要來源。

①概念:統(tǒng)計(jì)報(bào)表是按照國家有關(guān)法規(guī)的規(guī)定,自上而下地逐級提供基本統(tǒng)

計(jì)數(shù)據(jù)的一種調(diào)查方式。

②種類

i:按調(diào)查范圍不同分為全面報(bào)表和非全面報(bào)表。

全面報(bào)表要求調(diào)查對象的每一個(gè)單位都填報(bào);非全面報(bào)表要求調(diào)查對象中的

一部分單位填報(bào)。

ii:按報(bào)表內(nèi)容和實(shí)施范圍不同分為國家統(tǒng)計(jì)報(bào)表、部門統(tǒng)計(jì)報(bào)表和地方統(tǒng)

計(jì)報(bào)表。

iii:按報(bào)送周期長短分為日報(bào)、旬報(bào)、月報(bào)、季報(bào)、半年報(bào)、年報(bào)。

iv:按報(bào)送單位不同分為基層統(tǒng)計(jì)報(bào)表和綜合統(tǒng)計(jì)報(bào)表。

4.重點(diǎn)調(diào)查

①概念:是指只在調(diào)查對象中選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,借以了解總體

基本情況的一種非全面調(diào)查。重點(diǎn)單位是指在所要調(diào)查的數(shù)量特征上占有較大比

重的單位。

②特點(diǎn):i:重點(diǎn)單位的選擇具有客觀性。ii:重點(diǎn)調(diào)查的目的是為了

反映總體的基本情況。

5.典型調(diào)查

①概念:是根據(jù)調(diào)查目的和要求,在對研究對象進(jìn)行全面分析的基礎(chǔ)上,有

意識地選擇部分有代表性單位進(jìn)行調(diào)查,它是一種非全面調(diào)查。

②特點(diǎn):i:調(diào)查單位是根據(jù)調(diào)查目的有意識地選擇出來的少數(shù)具有代表性

的單位。

9

ii:典型調(diào)查是一種深入、細(xì)致的調(diào)查。

(-)數(shù)據(jù)的搜集方法

不論采取何種方式進(jìn)行調(diào)查,在取得統(tǒng)計(jì)數(shù)據(jù)時(shí),都有一些具體的數(shù)據(jù)搜

集方法,歸納起來有兩大類:

1.詢問調(diào)查:包括①訪問調(diào)查(派員調(diào)查):是調(diào)查者與被調(diào)查者通過面

對面交談從而得到所需資料的調(diào)查方法。②郵寄調(diào)查:是通過郵寄將調(diào)查表或

調(diào)查問卷送到被調(diào)查者手中,由被調(diào)查者填寫,然后寄回調(diào)查表的一種調(diào)查方法。

③電話調(diào)查:打電話,語言交流、搜集資料”④座談會:把被調(diào)查者集中起來,

讓他們對調(diào)查主題發(fā)表意見,獲取資料。⑤個(gè)別深度訪問:一次只訪問一名被

調(diào)查者,詳細(xì)了解被調(diào)查者的思想和行為動機(jī)。

2.觀察與實(shí)驗(yàn):包括①觀察法:調(diào)查人員邊觀察邊記錄以收集信息的方法。

②是在所設(shè)定的特殊實(shí)驗(yàn)場所,對調(diào)查對象進(jìn)行實(shí)驗(yàn)以取得資料的一種調(diào)查方

法。

二.統(tǒng)計(jì)數(shù)據(jù)的間接來源

第二手?jǐn)?shù)據(jù)主要是公開出版的或公開報(bào)道的數(shù)據(jù)。在我國,公開出版或報(bào)道

的社會經(jīng)濟(jì)數(shù)據(jù)主要來自國家和地方的統(tǒng)計(jì)部門以及各種報(bào)刊媒介。如公開出版

的《中國統(tǒng)計(jì)年鑒》,《中國市場統(tǒng)計(jì)年鑒》等,另外,廣泛分布在各種報(bào)刊、

志、圖書、廣播、電視傳媒中的各種數(shù)據(jù)資料也屬于第二手?jǐn)?shù)據(jù)。

第三節(jié)調(diào)查方案設(shè)計(jì)

在搜集直接統(tǒng)計(jì)數(shù)據(jù)之前,需要制定出一個(gè)周密、完整的調(diào)查方案,以指導(dǎo)

整個(gè)調(diào)查工作,一個(gè)完整的統(tǒng)計(jì)調(diào)查方案應(yīng)包括以下內(nèi)容:

確定調(diào)查目的(為什么要調(diào)查)

在調(diào)查方案中首先應(yīng)明確本次調(diào)查的目的,它要回答的是為什么調(diào)杳,要解

決什么樣的問題。只有這些問題明確之后,才能確定向誰調(diào)查,調(diào)查什么以及采

用什么方法進(jìn)行調(diào)查。

二.確定調(diào)查對象和調(diào)查單位(向誰調(diào)查)

調(diào)查對象和調(diào)查單位要解決的是向誰調(diào)查,由誰來提供所需資料的問題。調(diào)

查對象是根據(jù)調(diào)查目的確定的調(diào)查研究的總體或調(diào)查范圍,調(diào)查單位是構(gòu)成調(diào)查

對象的每一個(gè)單位,是調(diào)查項(xiàng)目和指標(biāo)的承擔(dān)者或載體。

10

三.設(shè)計(jì)調(diào)查項(xiàng)目和調(diào)查表(調(diào)查什么)

調(diào)查項(xiàng)目是調(diào)查的具體內(nèi)容,它要回答的是調(diào)查什么問題。調(diào)查項(xiàng)目可以是

調(diào)查單位的數(shù)量特征,也可以是調(diào)查單位的某種屬性或品質(zhì)特征。調(diào)查項(xiàng)目常以

表格的形式來表現(xiàn),稱為調(diào)查表。

四.方案設(shè)計(jì)中的其他內(nèi)容

另外,調(diào)查方案還應(yīng)明確調(diào)查所采用的方式和方法,調(diào)查時(shí)間及調(diào)查的組織

與實(shí)施工作等。調(diào)查時(shí)間包括調(diào)查數(shù)據(jù)的所屬時(shí)間(若為時(shí)點(diǎn)現(xiàn)象,要明確規(guī)定

資料的統(tǒng)一時(shí)點(diǎn),即標(biāo)準(zhǔn)時(shí)點(diǎn);若為時(shí)期現(xiàn)象,要明確規(guī)定現(xiàn)象的起止時(shí)間)和

調(diào)查的工作期限(指調(diào)查工作從開始到結(jié)束的時(shí)間長度,包括:調(diào)查人員的選擇、

組織的培訓(xùn);調(diào)查經(jīng)費(fèi)的來源和開支預(yù)算等,調(diào)查表格、問卷、調(diào)查員手冊的印

刷等)。

第四節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理

把統(tǒng)計(jì)數(shù)據(jù)搜集上來之后,接下去的工作應(yīng)對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行加工整理,使之

系統(tǒng)化、條理化、以符合分析的需要。數(shù)據(jù)整理的步驟如下:

一.數(shù)據(jù)的預(yù)處理

在對數(shù)據(jù)進(jìn)行分類或分組之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的審核、

篩選、排序等。

1.數(shù)據(jù)的審核與篩選

①數(shù)據(jù)的審核

對數(shù)據(jù)進(jìn)行審核,主要是為了保證數(shù)據(jù)的質(zhì)量,對于通過直接調(diào)查取得的原

始數(shù)據(jù),主要從完整性和準(zhǔn)確性兩個(gè)方面去審核。完整性審核主要是檢查應(yīng)調(diào)查

的單位或個(gè)體是否有遺漏,所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全等。準(zhǔn)確性審核

主要包括兩個(gè)方面:一是檢查數(shù)據(jù)資料是否真實(shí)地反映了客觀實(shí)際情況,內(nèi)容是

否符合實(shí)際;二是檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等。第二手資料,除審核

數(shù)據(jù)的完整性和準(zhǔn)確性外,還應(yīng)審核數(shù)據(jù)的適應(yīng)性和時(shí)效性。

②數(shù)據(jù)的篩選

數(shù)據(jù)的篩選包括兩方面的內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤

的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來,對不符合條件的數(shù)

據(jù)予以剔除。

11

2.數(shù)據(jù)的排序

排序是按一定順序?qū)?shù)據(jù)排列,以便研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特

征或趨勢。對于定類數(shù)據(jù),如果是字母型數(shù)據(jù),排序有升序與降序之分,習(xí)慣上

使用升序:如果是漢字型數(shù)據(jù),排序方式既可按漢字的首位拼音字母排列,也可

按筆畫排序。定距數(shù)據(jù)和定比數(shù)據(jù)的排序只有兩種:即遞增和遞減。

二.數(shù)據(jù)分組與頻數(shù)分布

(-)數(shù)據(jù)分組的概念

統(tǒng)計(jì)數(shù)據(jù)經(jīng)過預(yù)處理后,可進(jìn)一步做分類或分組整理。統(tǒng)計(jì)分組是統(tǒng)計(jì)數(shù)據(jù)

整理的一項(xiàng)重要工作。統(tǒng)計(jì)數(shù)據(jù)整理的中心任務(wù)就是分組和編制頻數(shù)分布表。

統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將統(tǒng)計(jì)總體按照一定的標(biāo)志區(qū)分為若干

組成部分的一種統(tǒng)計(jì)方法。通過分組,可以劃分現(xiàn)象的類型、說明現(xiàn)象的內(nèi)部結(jié)

構(gòu)、提示現(xiàn)象與現(xiàn)象之間的依存關(guān)系。

(二)統(tǒng)計(jì)分組方法

按分組方法不同,分組的方法有:

1.按品質(zhì)標(biāo)志分組

即按事物的品質(zhì)特征進(jìn)行分組。按品質(zhì)標(biāo)志分組,在確定其分組界限時(shí),有

時(shí)比較簡單,有時(shí)卻很復(fù)雜。

2.按數(shù)量標(biāo)志分組

按數(shù)量標(biāo)志分組,就是按事物的數(shù)量特鶻蟹腫楞0詞勘嚅痙腫棕喚?在于

確定各組的數(shù)量標(biāo)志的差異,而且要通過數(shù)量差異來反映各組的不同類型和

性質(zhì)。按數(shù)量標(biāo)志分組,涉及到以下幾個(gè)問題:

①組距和組數(shù)

數(shù)量標(biāo)志也即前面講的數(shù)字變量。數(shù)字變量根據(jù)其取值不同,可以分為離散

變量和連續(xù)變量。

離散變量變量值少,采用單

項(xiàng)式分組。

變量變量值多,

采用組距分組。

連續(xù)變量采用組距分組。

單項(xiàng)式分組:把一個(gè)變量值作為一組。組距分組:將全部變量值依次劃分為

幾個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組。組距宜取5或者10的倍數(shù),且第

12

一組的下限應(yīng)低于最小變量值,最后一組的上限應(yīng)高于最大變量值。

組距的大小與組數(shù)的多少是相互制約的,它們之間呈反比例關(guān)系。組距越大,

則可分的組就越少。確定組距與組數(shù),原則上應(yīng)該是通過分組能把總體單位的分

布特征顯示出來,即組與組之間應(yīng)該反映出現(xiàn)象的差異。

②等距分組與不等距分組

等距分組即變量值在各組保持相等的組距,就是說各變量值都限于相同的范

圍,在變量值比較均勻時(shí),采用等距分組。當(dāng)變量值變動很不均勻,就應(yīng)采用不

等距分組。

③組限與組中值

組限即為組距兩端的數(shù)值,分為上限和下限。上限是各組的最大變量值,下

限是各組的最小變量值。

對于離散變量和連續(xù)變量,組限的劃分是不同的。對于離散型變量,由于其

只能取整數(shù),相鄰組的上下限可以不重疊,對于連續(xù)變量,相鄰兩組的組限應(yīng)重

疊,即上一組的上限同時(shí)也是下一組的下限。用“上組限不在內(nèi)”原則解決不重

問題。

組中值是上下限之間的中點(diǎn)數(shù)值,其計(jì)算公式為:組中值=(上限+F限)

?2o用組中值來反映組距分組中各組數(shù)據(jù)的一般水平。實(shí)際工作中,對于開口

組的組中值,一般是用相鄰組的組距作為開口組的組距,因此,其組中值的計(jì)算

公式近似為:組中值=下限+鄰組組距/2(缺上限)或組中值=上限一鄰組組距/2

(缺下限)。用組中值來代表各組數(shù)據(jù)的一般水平,有一個(gè)假設(shè)條件:即各組數(shù)

據(jù)在本組內(nèi)呈均勻分布。

(三)頻數(shù)分布

1.頻數(shù)分布的概念和種類

①概念:頻數(shù)分布也叫次數(shù)分布或分布數(shù)列,即把全部數(shù)據(jù)按其分組標(biāo)志在

各組內(nèi)的分布狀況稱為頻數(shù)分布。分布在各組內(nèi)的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)或次數(shù),各

組頻數(shù)與全部頻數(shù)之和的比值稱為頻率或比重。將頻數(shù)分布用表格的形式表現(xiàn)出

來就是頻數(shù)分布表。

13

②種類

品質(zhì)數(shù)列(按品質(zhì)標(biāo)志分組所形成)

分布數(shù)列單項(xiàng)式變量

數(shù)列

變量數(shù)列

等距數(shù)列

距式變量數(shù)列

不等距數(shù)列

2.累積頻數(shù)和累積頻率

累積頻數(shù)分為向上累積和向下累積兩種:向上累積從變量值小的一方向變量

值大的一方累加頻數(shù);向下累積從變量值大的一方向變量值小的一方累加頻數(shù)。

向上累積各累積數(shù)的意義是上限以下的累積頻數(shù)和累積頻率;向下累積各累

積數(shù)的意義是各組下限以上的累積頻數(shù)或累積頻率。

(四)頻數(shù)分布表的編制

編制步驟如下:

1.對數(shù)據(jù)進(jìn)行排序

2.進(jìn)行分組

采用組距分組的步驟如下:

①確定組數(shù)

按斯特格斯提出的經(jīng)驗(yàn)公式確定組數(shù)K:K=l+bg

10

N/題

10

2N為數(shù)據(jù)的個(gè)

數(shù)。

②確定各組的組距

③根據(jù)分組整理成頻數(shù)分布表

三.次數(shù)分配的圖示和類型

(-)圖示法

通過頻數(shù)分布表,可以初步看出數(shù)據(jù)分布的一些特征和規(guī)律,但如果用圖形

來表示次數(shù)分布的結(jié)果,會更加形象和直觀。常用的顯示頻數(shù)分布特征的圖形有

直方圖、折線圖和曲線圖等。

1.直方圖

14

即用直方形的寬度和高度來表示頻數(shù)分布情況的圖形。繪制直方圖時(shí),橫軸

表示各組組限,縱軸表示頻數(shù)(一般標(biāo)在左方)和頻率(一般標(biāo)在右方),然后

按分布在各組的頻數(shù)及頻率確定各組在縱軸上的坐標(biāo),并依據(jù)各組組距的寬度與

頻數(shù)的高度繪成直方形。

學(xué)生按成績分

按成

績分組

學(xué)生

比重

(%)

60以下78.8

60——

70

2126.2

70——

80

2531.2

80——

90

1923.8

90——

100

810

計(jì)

80100

0

5

10

15

20

25

60以下70-------8090--------100

學(xué)生數(shù)

對于不等距數(shù)列,先要計(jì)算出各組的頻數(shù)密度,然后以組距為寬,以頻數(shù)密

度為高畫直方圖,其中頻數(shù)密度的計(jì)算公式為:頻數(shù)密度=頻數(shù)一組距。

2.折線圖

在直方圖的基礎(chǔ)上,將直方圖中的每個(gè)長方形的頂端中點(diǎn)用折線連點(diǎn)而成。

如果不繪制直方圖,可以用組中值與頻數(shù)求坐標(biāo)點(diǎn)連接而成。

15

3.曲線圖

當(dāng)變量值非常多,變量數(shù)列的組距無限增多時(shí),折線便近似地表現(xiàn)為一條平

滑的曲線,曲線圖的繪制方法與折線圖基本相同,只是連接各組頻數(shù)坐標(biāo)點(diǎn)的線

段應(yīng)當(dāng)是平滑曲線而不用折線。

(二)頻數(shù)分布的類型

常見的頻數(shù)分布曲線主要有正態(tài)分布、偏態(tài)分布、J型分布、V型分布等幾

種類型。???

第三章數(shù)據(jù)分布特征的描述

教學(xué)重點(diǎn)和難點(diǎn):均值的計(jì)算方法;方差和標(biāo)準(zhǔn)差的計(jì)算;離散系數(shù)的適用

場合。

第二節(jié)分布集中趨勢的測度

統(tǒng)計(jì)數(shù)據(jù)經(jīng)過整理與顯示后,我們對數(shù)據(jù)分布的類型和特點(diǎn)就有了一個(gè)大致

的了解。但這種了解只是表面上的,還缺少代表性的數(shù)量特征值準(zhǔn)確地描述出統(tǒng)

計(jì)數(shù)據(jù)的分布。要進(jìn)一步掌握數(shù)據(jù)分布的特征和規(guī)律,還需要找到反映數(shù)據(jù)分布

特征的各個(gè)代表值。對統(tǒng)計(jì)數(shù)據(jù)分布的特征,可以從以下三個(gè)方面進(jìn)行測度和描

述:一是分布的集中趨勢,反映各統(tǒng)計(jì)數(shù)據(jù)向其中心值靠攏或聚集的程度;二是

分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢;三是分布的偏態(tài)和峰度,反

映數(shù)據(jù)分布的形狀。

集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的傾向,測度集中趨勢也就是尋找

數(shù)據(jù)一般水平的代表值或中心值。集中趨勢的測度值主要有:均值、幾何平均數(shù)、

眾數(shù)、中位數(shù)。

一.均值(Mean)

均值也叫算術(shù)平均數(shù)(Arithmeticmean),是全部數(shù)據(jù)的算術(shù)平均,是集中

趨勢的最主要測度值,它主要適用于定距數(shù)據(jù)和定比數(shù)據(jù),但不適用于定類數(shù)據(jù)

和定序數(shù)據(jù)。根據(jù)所掌握數(shù)據(jù)的不同,均值有不同的計(jì)算形式和計(jì)算公式。

(-)簡單均值與加權(quán)均值

1.根據(jù)未經(jīng)分組整理的原始數(shù)據(jù)計(jì)算均值

設(shè)一組數(shù)據(jù)為X

1

,X

2

,X

3

,??X

n

,則均值

注:簡單均值數(shù)值大小只與變量值的大小有關(guān)。

16

計(jì)算公式如下:

n

X

n

XXX

X

n21

2.根據(jù)分組整理的數(shù)據(jù)計(jì)算均值

設(shè)原始數(shù)據(jù)被分成K組,各組的組中值為XI,X2,X3,??,XK,各組變量值為

Fl,F2,F3,??,FKo則均值為:計(jì)算公式如下:

Xf

fff

fXfXfX

X

n21

nn2211

注:①Fi:權(quán)數(shù)——起權(quán)衡輕重的作用。如果某一組的權(quán)數(shù)較大,則說明

該組的數(shù)據(jù)較多,那么該組數(shù)據(jù)的大小對均值的影響就越大,反之則越小。

②均值受各組變量值大小和各組權(quán)數(shù)大小的影響。

③單變量分組時(shí)為精確值,組距分組時(shí)為近似值。

(-)均值的另一種表現(xiàn)形式——調(diào)和平均數(shù)

調(diào)和平均數(shù)(Harmonicmean)也稱調(diào)和均值,是均值的另一種表現(xiàn)形式。

在實(shí)際工作中,由于所獲得的數(shù)據(jù)不同,有時(shí)不能直接采用均值的計(jì)算形式來計(jì)

算平均數(shù),這就需要使用調(diào)和平均數(shù)的形式進(jìn)行計(jì)算。調(diào)和平均數(shù)分為簡單調(diào)和

平均數(shù)和加權(quán)調(diào)和平均數(shù)。

簡單調(diào)和平均法是先計(jì)算總體單位標(biāo)志值倒數(shù)的簡單算術(shù)平均數(shù),然后求其

倒數(shù)。

X

1

n

x

1

x

1

X

1

n

H

n21

H:表示調(diào)和平均數(shù)

加權(quán)調(diào)和平均法是先計(jì)算總體單位標(biāo)志值倒數(shù)的加權(quán)算術(shù)平均數(shù),然后求其

到數(shù)。

x

m

m

x

m

x

m

x

m

mmm

H

n

n

2

2

1

1

n21

m表示權(quán)數(shù)。

17

調(diào)和平均數(shù)實(shí)際上是算術(shù)平均數(shù)的一種變形。二者在本質(zhì)上是一致的,唯一

的區(qū)別是計(jì)算時(shí)使用了不同的數(shù)據(jù)。

(三)一種特殊的均值:幾何平均數(shù)

幾何平均數(shù)(Geometricmean)也稱幾何均值,它是N個(gè)變量值乘積的N次

方根。社會經(jīng)濟(jì)統(tǒng)計(jì)中,幾何平均法適用于計(jì)算平均比率和平均速度。簡單幾何

平均數(shù)的計(jì)算公式為:

n21

xxxG

G表示幾何平均數(shù);x表示變量值;n表示變量值個(gè)數(shù)。

加權(quán)幾何平均數(shù)的計(jì)算公式為

n21n21

ffff

n

f

2

f

1

xxxG

應(yīng)用條件:①所掌握的變量值本身是比率的形式;②各比率的乘積等于總比

率。

幾何平均數(shù)是適用于特殊數(shù)據(jù)的一種平均數(shù),它主要用于計(jì)算比率或速度的

平均。

幾何平均數(shù)也可以看作是均值的一種變形,對幾何平均數(shù)的公式取對數(shù)得:

可以看出,幾何平均數(shù)的對數(shù)是各變量值對數(shù)的算術(shù)平均。

三.眾數(shù)

眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用M

0

表不。它主要

用于作為定序數(shù)據(jù)以及定距和定比數(shù)據(jù)集中趨勢的測度值。

1.當(dāng)數(shù)據(jù)未分組時(shí),出現(xiàn)次數(shù)最多的變量值既為眾數(shù)。

2.當(dāng)數(shù)據(jù)經(jīng)過分組整理后,眾數(shù)的計(jì)算公式為:下限公式:

dLM

21

1

o

上限公式:

dUM

21

2

o

18

Mo:表示次數(shù);L:表示眾數(shù)所在組的下限;U:表示眾數(shù)所在組的上限;

△1:表示眾數(shù)所在組次數(shù)與前一組次數(shù)之差;42:表示眾數(shù)所在組次數(shù)與

后一組次數(shù)之差;d:表示眾數(shù)所在組的組距。

三.中位數(shù)(Median)

中位數(shù)是一組數(shù)據(jù)按從小到大排序后,處于中間位置上的變量值,用Me表

示。中位數(shù)將全部數(shù)據(jù)等分成兩部分,每部分都包含50%的數(shù)據(jù),一部分?jǐn)?shù)據(jù)比

中位數(shù)大,另一部分則比中位數(shù)小。中位數(shù)是個(gè)位置代表值,它主要用于測度定

序數(shù)據(jù)的集中趨勢。

1.根據(jù)未分組數(shù)據(jù)計(jì)算中位數(shù)

先對數(shù)據(jù)進(jìn)行排序;然后確定中位數(shù)的位置。其公式為:

中位數(shù)位置=(N+1)/2,式中的N為數(shù)據(jù)的個(gè)數(shù)。最后確定中位數(shù)的具體

數(shù)值。

若N為奇數(shù),則中位數(shù)為;若N為偶數(shù),則中位數(shù)為

的平均數(shù)。

2.根據(jù)分組數(shù)據(jù)計(jì)算中位數(shù)

先根據(jù)公式N/2確定中位數(shù)的位置,并確定中位數(shù)所在組,然后用公式近似

確定中位數(shù)。

3.組距分組資料確定中位數(shù)。

組距資料確定中位數(shù)與單項(xiàng)式資料不同的是需要采用公式計(jì)算。

下限公式:

d

f

S

2

f

LM

m

1m

上限公式:

d

f

S

2

f

UM

m

1m

式中:L:表示中位數(shù)組的下限,U表示中位數(shù)組的上限,fm:表示中位數(shù)

組的次

數(shù),Sm-1表示中位數(shù)所在組以前各組的累計(jì)次數(shù),Sm+1表示中位數(shù)所

19

在組以后各組的累計(jì)次數(shù),Zf:表示總次數(shù),d:表示中位數(shù)所在組的組距。

計(jì)算中位數(shù)時(shí),假定中位數(shù)所在組的頻數(shù)在該組內(nèi)是均勻分布的,中位數(shù)是

一個(gè)位置平均數(shù),其數(shù)值的大小不受極大值和極小值的影響。

四.眾數(shù)、中位數(shù)和均值的關(guān)系

第二節(jié)分布離散程度的測度

集中趨勢反映的是各變量值向其中心值聚集的程度,這只是數(shù)據(jù)分布的一個(gè)

特征,數(shù)據(jù)的分散程度是數(shù)據(jù)分布的另一個(gè)重要特征。它所反映的是各變量值遠(yuǎn)

離其中心值的程度,集中數(shù)據(jù)對一組數(shù)據(jù)的代表程度,取決于該組數(shù)據(jù)的離散水

平。

數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差,離散

程度越小,其代表性就越好。

描述數(shù)據(jù)離散程度的測度值主要有極差、平均差、方差和標(biāo)準(zhǔn)差、離散系數(shù)

等。

極差(全距)

是一組數(shù)據(jù)的最大值與最小值之差,即R=max(Xi)—min(Xi)

對于組距分布數(shù)據(jù),極差也可以近似表示為:R=最高組上限值一最低組下

限值

極差計(jì)算簡單,易于理解,但它易受極端值的影響。

—.方差和標(biāo)準(zhǔn)差

方差(Variance)是各變量值與其均值離差平方的平均數(shù),是測定定距和定

比數(shù)據(jù)離散程度的最主要方法。根據(jù)總體數(shù)據(jù)和根據(jù)樣本數(shù)據(jù)計(jì)算的方差在數(shù)學(xué)

處理上略有不同。

1.總體方差和標(biāo)準(zhǔn)差

①未經(jīng)分組的原始數(shù)據(jù)

n

Ixxl

.D.A

②對于組距分組數(shù)據(jù)

fIxxI

.D.A

20

平均差系數(shù)就是平均差除以算術(shù)平均數(shù),它說明標(biāo)志值差異的相對程度,還

可以用來比較平均數(shù)不同的各個(gè)標(biāo)志變動度的大小。

計(jì)算公式:

x

.D.A

V

.D.A

優(yōu)點(diǎn):計(jì)算簡便,意義明確,能反映各標(biāo)志值的大小和程度。

缺點(diǎn):采用絕對值,不適于數(shù)理統(tǒng)計(jì)中的數(shù)字處理,使用受限制。

方差的平方即為標(biāo)準(zhǔn)差。與方差不同,標(biāo)準(zhǔn)差是計(jì)量單位的,計(jì)量單位與變

量值相同,其實(shí)際意義要比方差清楚。在對社會經(jīng)濟(jì)現(xiàn)象進(jìn)行分析時(shí),我們更多

地使用標(biāo)準(zhǔn)差。

2.樣本方差和標(biāo)準(zhǔn)差

①樣本方差:未分組數(shù)據(jù):

n

Ixxl

.D.A

組距分組數(shù)據(jù):

f

flxxl

.D.A

②樣本標(biāo)準(zhǔn)差:未分組數(shù)據(jù):

n

)xx(

2

組距分組數(shù)據(jù):

f

f)xx(

2

說明:i樣本方差與總體方差在計(jì)算上的區(qū)別是:總體方差是用數(shù)據(jù)個(gè)數(shù)或

總頻數(shù)去除離差平方,而樣本方差則是用樣本數(shù)據(jù)個(gè)數(shù)或總頻數(shù)減1去除離差平

方和。其中n-l稱為自由度。

ii當(dāng)n很大時(shí),樣本方差S

2

與總體方差6

2

的計(jì)算結(jié)果相差很小,這時(shí)樣本

方差也可以用總體方差的公式來計(jì)算。

三.離散系數(shù)

對于平均水平不同或計(jì)量單位不同的不同組別的變量值,不能用極差、平均

差、標(biāo)準(zhǔn)差等測度值比較其離散程度,必須消除變量值水平高低和計(jì)量單位不同

對離散程度測度值的影響,此時(shí)需計(jì)算離散系數(shù)。

離散系數(shù)通常是就標(biāo)準(zhǔn)差來計(jì)算的,因此也稱為標(biāo)準(zhǔn)差系數(shù),它是一組數(shù)據(jù)

的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測度數(shù)據(jù)離散程度的相對指標(biāo),標(biāo)準(zhǔn)差系數(shù)

是標(biāo)準(zhǔn)差除以算術(shù)平均數(shù),也叫離散系數(shù)。計(jì)算公式:

X

V

21

離散系數(shù)的作用主要是用于比較不同總體或樣本數(shù)據(jù)的離散程度。離散程度

大的,說明數(shù)據(jù)的離散程度大,離散系數(shù)小的,說明數(shù)據(jù)的離散程度小。

第三節(jié)分布偏態(tài)與峰度的測度

前面講的集中趨勢和離散程度是數(shù)據(jù)分布的兩個(gè)重要特征,但要全面了解數(shù)

據(jù)分布的特點(diǎn),還需要知道數(shù)據(jù)分布的形狀是否對稱,偏斜的程度以及分布的扁

平程度等。

一.偏態(tài)及其測度

偏態(tài)是對數(shù)據(jù)分布的偏斜方向和程度的測度。要測度偏斜的程度則需要計(jì)算

偏態(tài)系數(shù),其計(jì)算公式為:a

3=

式中:a

3

為偏態(tài)系數(shù);o

3

為標(biāo)準(zhǔn)差的三次方。

對偏態(tài)系數(shù)的分析:

1.當(dāng)分布對稱時(shí),離差三次方后正負(fù)離差可以相互抵消,因而a

3

的分子等

于零,則a

3

=0o

2.當(dāng)分布不對稱時(shí),則偏態(tài)系數(shù)a

3

為正值或負(fù)值。當(dāng)a

3

為正值時(shí),表示正

偏離差值較大;可以判斷為正偏或右偏,a

3

的數(shù)值越大,偏斜的程度就越大;當(dāng)

a

3

為負(fù)值時(shí),表示負(fù)離差數(shù)值較大,可以判斷為負(fù)偏或左偏,a

3

的數(shù)值越大,向

左偏斜的程度就越大。

二.峰度及其測度

峰度是集中趨勢高峰的形狀,它是與正態(tài)分布相比較而言的。若分布的形狀

比正態(tài)更瘦更高,則稱為尖峰分布,若比正態(tài)分布更矮更胖,則稱為平峰分布。

峰度系數(shù)是離差四次方和平均數(shù)再除以標(biāo)準(zhǔn)差的四次方,其計(jì)算公式為:

式中:a

4

為峰度系數(shù)

大家知道,正態(tài)分布的峰度系數(shù)為3,當(dāng)a

4

>3時(shí)為尖峰分布,當(dāng)a

4

<3時(shí)

為平峰分布。

第四節(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論