管理統(tǒng)計(jì)學(xué)全書(shū)課件整套電子教案_第1頁(yè)
管理統(tǒng)計(jì)學(xué)全書(shū)課件整套電子教案_第2頁(yè)
管理統(tǒng)計(jì)學(xué)全書(shū)課件整套電子教案_第3頁(yè)
管理統(tǒng)計(jì)學(xué)全書(shū)課件整套電子教案_第4頁(yè)
管理統(tǒng)計(jì)學(xué)全書(shū)課件整套電子教案_第5頁(yè)
已閱讀5頁(yè),還剩1010頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章緒論

第一節(jié).管理現(xiàn)實(shí)中的統(tǒng)計(jì)應(yīng)用

第二節(jié).管理統(tǒng)計(jì)學(xué)的含義、特點(diǎn)和內(nèi)容

管理現(xiàn)實(shí)中的統(tǒng)計(jì)應(yīng)用

管理統(tǒng)計(jì)學(xué)在人口管理中的應(yīng)用

管理統(tǒng)計(jì)學(xué)在市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用

管理統(tǒng)計(jì)學(xué)在企業(yè)管理中的應(yīng)用

管理統(tǒng)計(jì)學(xué)在投資分析和風(fēng)險(xiǎn)決策中的應(yīng)用

1.投資分析

2.風(fēng)險(xiǎn)管理

3.期貨交易

管理統(tǒng)計(jì)學(xué)的含義、特點(diǎn)和內(nèi)容

管理統(tǒng)計(jì)學(xué)的含義:它是一門(mén)以經(jīng)濟(jì)與管理理論為基礎(chǔ),采用描述和推斷的方法來(lái)對(duì)社會(huì)經(jīng)濟(jì)和管理現(xiàn)象中研究對(duì)象的數(shù)量特征、數(shù)量關(guān)系、發(fā)展變化趨勢(shì)及規(guī)律進(jìn)行研究,最終解決管理和經(jīng)濟(jì)問(wèn)題的學(xué)科。它是一門(mén)應(yīng)用性的方法論科學(xué),以數(shù)理統(tǒng)計(jì)學(xué)的理論和方法為基礎(chǔ),不斷吸收信息論、控制論、系統(tǒng)論和決策論等方面的研究成果,使統(tǒng)計(jì)職能從反映和監(jiān)督拓展到推斷、預(yù)測(cè)和決策的學(xué)科。

管理統(tǒng)計(jì)學(xué)的特點(diǎn):描述統(tǒng)計(jì):通過(guò)大量數(shù)據(jù)資料的搜集、整理和分析,描述出總體數(shù)據(jù)的分布特征,進(jìn)而達(dá)到對(duì)總體內(nèi)在的數(shù)量規(guī)律性的認(rèn)識(shí)。推斷統(tǒng)計(jì):根據(jù)實(shí)際工作中所搜集到的統(tǒng)計(jì)資料絕大部分都是樣本資料這一特點(diǎn),利用這些樣本資料所提供的信息,進(jìn)一步對(duì)總體的數(shù)量規(guī)律性做出科學(xué)的推論。管理統(tǒng)計(jì)學(xué):將描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)的基本方法有機(jī)地結(jié)合在一起,形成在社會(huì)經(jīng)濟(jì)管理中常用的統(tǒng)計(jì)方法,并用以解決實(shí)際問(wèn)題的一門(mén)學(xué)問(wèn)。

管理統(tǒng)計(jì)學(xué)的內(nèi)容:以社會(huì)經(jīng)濟(jì)現(xiàn)象靜態(tài)信息為依據(jù),應(yīng)用統(tǒng)計(jì)分組和變量數(shù)列,采取絕對(duì)數(shù)、相對(duì)數(shù)、平均數(shù)等具有離散趨勢(shì)的指標(biāo),對(duì)現(xiàn)象總體的頻數(shù)分布、極差、絕對(duì)總量、相對(duì)程度以及集中離散趨勢(shì)等進(jìn)行描述。根據(jù)社會(huì)經(jīng)濟(jì)現(xiàn)象動(dòng)態(tài)統(tǒng)計(jì)信息,采用動(dòng)態(tài)比較、動(dòng)態(tài)平均、長(zhǎng)期趨勢(shì)、季節(jié)波動(dòng)等,對(duì)現(xiàn)象總體的發(fā)展變化情況、變動(dòng)趨勢(shì)及變化成分進(jìn)行統(tǒng)計(jì)描述和推斷。對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象中大量隨機(jī)變量間的交互統(tǒng)計(jì)信息,采用相關(guān)回歸分析,刻畫(huà)現(xiàn)象變量間的相關(guān)程度和數(shù)學(xué)表達(dá)式,建立回歸方程進(jìn)行統(tǒng)計(jì)預(yù)測(cè);或采用投入產(chǎn)出分析,揭示部門(mén)間的數(shù)量聯(lián)系,綜合反映其運(yùn)行狀態(tài)。根據(jù)實(shí)際現(xiàn)象變量的概率分布、大數(shù)定律和中心極限定律,運(yùn)用抽樣推斷原理,按照一定的方式用樣本統(tǒng)計(jì)量去推算統(tǒng)計(jì)總體參數(shù),并進(jìn)行假設(shè)檢驗(yàn)、方差分析和非參數(shù)估計(jì)等。根據(jù)現(xiàn)象過(guò)去和現(xiàn)在的統(tǒng)計(jì)信息,對(duì)未來(lái)數(shù)量特征,運(yùn)用平均數(shù)模型、長(zhǎng)期趨勢(shì)模型、季節(jié)波動(dòng)模型、回歸模型及時(shí)間序列分析等,借助計(jì)算機(jī)進(jìn)行統(tǒng)計(jì)預(yù)測(cè),為統(tǒng)計(jì)決策和控制提供數(shù)值依據(jù)。根據(jù)社會(huì)經(jīng)濟(jì)數(shù)量的目標(biāo)函數(shù)、約束條件、自然狀態(tài)及其概率,建立數(shù)學(xué)模型,運(yùn)用優(yōu)化思想、風(fēng)險(xiǎn)決策技術(shù)及貝葉斯決策原理對(duì)企業(yè)實(shí)施有效決策,為合理的經(jīng)濟(jì)管理核算服務(wù)。結(jié)束第二章統(tǒng)計(jì)數(shù)據(jù)的搜集與整理第一節(jié).數(shù)據(jù)的計(jì)量與類(lèi)型第二節(jié).統(tǒng)計(jì)數(shù)據(jù)的搜集與可靠性分析

第三節(jié).抽樣調(diào)查中的基本概念

第四節(jié).抽樣方法介紹

學(xué)習(xí)目的理解數(shù)據(jù)類(lèi)型掌握抽樣中用到的基本概念的含義掌握幾種抽樣方法的抽樣過(guò)程、要求、特點(diǎn)案例與背景某化妝品公司對(duì)其銷(xiāo)售情況做統(tǒng)計(jì),以制定下一季度的實(shí)施計(jì)劃。銷(xiāo)售情況包括銷(xiāo)售代表和門(mén)市的月平均銷(xiāo)售量及他們所占比率。500名銷(xiāo)售代表和20家門(mén)市構(gòu)成此次統(tǒng)計(jì)的總體,公司參照門(mén)市的營(yíng)業(yè)額來(lái)完成調(diào)查。假設(shè),我們無(wú)法獲取全部銷(xiāo)售代表的信息,我們就考慮選取50名銷(xiāo)售代表組成一個(gè)樣本,顯然,這樣做比總體統(tǒng)計(jì)要節(jié)約時(shí)間和成本。本章將學(xué)習(xí)數(shù)據(jù)的計(jì)量與類(lèi)型、數(shù)據(jù)的搜集、抽樣方法和抽樣分布的幾種類(lèi)型,并簡(jiǎn)單介紹其應(yīng)用范圍。第一節(jié)數(shù)據(jù)的計(jì)量與類(lèi)型1.1 數(shù)據(jù)的計(jì)量尺度

變量:對(duì)象(或單位)的特征。例如,我們想研究對(duì)象的性別、身高或他所持有的定期大額存單數(shù)量。一般來(lái)說(shuō),變量分為定性變量和定量變量。

定性變量類(lèi)型離散定量連續(xù)定性變量與定量變量定性變量:定性變量不一定是數(shù)值型變量,但卻可以歸到數(shù)值型變量當(dāng)中。定性變量的數(shù)值沒(méi)有數(shù)學(xué)意義。定性變量得到的觀(guān)察值常常稱(chēng)為“類(lèi)型數(shù)據(jù)”。一般而言,定性變量包括計(jì)算有多少對(duì)象或者描述有多少對(duì)象(用百分比表示)落在某一特定的區(qū)域。定量變量:定量變量表現(xiàn)為數(shù)值型變量。這些數(shù)值有數(shù)學(xué)意義。定量變量分為兩類(lèi):即離散變量和連續(xù)變量。離散變量與連續(xù)變量離散變量:如果得到的一組可能結(jié)果是有限或可數(shù)的,那么我們稱(chēng)這種定量變量為離散變量。也就是說(shuō),離散變量表現(xiàn)為某些數(shù)值,各個(gè)可能的數(shù)值之間存在間隙。連續(xù)變量:如果得到的一組可能結(jié)果是區(qū)間集合內(nèi)的任意數(shù)值,那么我們稱(chēng)這種定量變量為連續(xù)變量。也就是說(shuō),數(shù)值可以是區(qū)間內(nèi)的任意點(diǎn)。【例2-1】判斷下列變量的類(lèi)型郵局信件的重量小轎車(chē)的牌子鐳射唱片總的播放時(shí)間鐳射唱片所含的歌曲數(shù)量中午的溫度某個(gè)季節(jié)的降雨量一個(gè)人的宗教信仰繩子長(zhǎng)度某個(gè)班不同學(xué)生的生日日期上個(gè)季節(jié)某大學(xué)患感冒的大學(xué)生人數(shù)連續(xù)定量變量定性變量連續(xù)定量變量離散定量變量連續(xù)定量變量連續(xù)定量變量定性變量連續(xù)定量變量離散定量變量離散定量變量1.2統(tǒng)計(jì)數(shù)據(jù)的類(lèi)型定性變量可以采用“名義尺度”或“順序尺度”來(lái)測(cè)量名義尺度:數(shù)值屬于不同的類(lèi)型。這些數(shù)值沒(méi)有任何數(shù)學(xué)意義或者排列順序沒(méi)有任何意義。也就是說(shuō),數(shù)值是任意性的。例如,性別、宗教和種族就屬于這一類(lèi)。順序尺度:當(dāng)我們把數(shù)值歸為不同類(lèi)型時(shí),排列順序(升序或降序)有意義。也就是說(shuō),這些數(shù)值暗示了類(lèi)型的級(jí)別、偏好和順序。注意,由于測(cè)量值沒(méi)有量綱,因此數(shù)值之間的差值并不代表兩個(gè)對(duì)象之間的差距。例如,對(duì)餐館提供的服務(wù)進(jìn)行評(píng)級(jí)、對(duì)軟飲料偏好程度進(jìn)行評(píng)定就屬于這一類(lèi)。

定量變量可以采用“比例尺度”或“間隔尺度”來(lái)測(cè)量間隔尺度:由于有測(cè)量單位,因此我們可以用數(shù)值之間的差值來(lái)描述兩個(gè)對(duì)象之間的差距。但是,數(shù)值之間的比例沒(méi)有任何意義,“零”這個(gè)數(shù)值沒(méi)有內(nèi)在的含義??梢宰骷臃āp法計(jì)算,但不可以作乘法計(jì)算。例如,溫度就屬于這一類(lèi)。我們不能說(shuō)10攝氏度是5攝氏度的2倍。比例尺度:由于也有測(cè)量單位,因此我們可以用數(shù)值之間的差值來(lái)描述兩個(gè)對(duì)象之間的差距。數(shù)值之間的比例有意義,而且“零”這個(gè)數(shù)值有內(nèi)在的含義不僅可以作加減運(yùn)算,還可以作乘除運(yùn)算。例如,身高、重量和花費(fèi)的時(shí)間就屬于這一類(lèi)?!纠?-2】美國(guó)消費(fèi)者是否習(xí)慣通過(guò)互聯(lián)網(wǎng)利用信用卡進(jìn)行購(gòu)物?假設(shè)一家著名的機(jī)構(gòu)表示一旦突破了80%這個(gè)數(shù)字關(guān)卡,人們?cè)陬^腦中就會(huì)牢固樹(shù)立起通過(guò)互聯(lián)網(wǎng)利用信用卡進(jìn)行購(gòu)物的觀(guān)念。Gallop公司近期所做的一項(xiàng)民意調(diào)查表明:在被調(diào)查的302位購(gòu)物者當(dāng)中,有267人是通過(guò)互聯(lián)網(wǎng)利用信用卡進(jìn)行支付的。根據(jù)Gallop公司的調(diào)查結(jié)果,我們很想證實(shí)是否有足夠的證據(jù)讓我們得出以下結(jié)論:80%以上的消費(fèi)者愿意通過(guò)互聯(lián)網(wǎng)利用信用卡進(jìn)行購(gòu)物。

1.我們關(guān)心什么變量?變量的性質(zhì)是什么?

2.測(cè)量指標(biāo)是什么?【例2-3】在下列事項(xiàng)中采用什么測(cè)量指標(biāo)

能夠最好地描述相關(guān)信息?A.一家移動(dòng)電話(huà)公司最近宣布它將從東南亞運(yùn)營(yíng)機(jī)構(gòu)裁減80名職員。B.天氣預(yù)報(bào)說(shuō),昨天下午1點(diǎn)53分觀(guān)察到的溫度值突破了新加坡的歷史記錄。C.一家大公司的人力資源管理部門(mén)想要調(diào)查員工是否對(duì)在職培訓(xùn)感到滿(mǎn)意。D.一家市場(chǎng)研究機(jī)構(gòu)想要調(diào)查行人是否注意到新加坡的大片島嶼安裝了新的交通信號(hào)燈系統(tǒng)(LED)。

A.比例尺度

B.間隔尺度

C.順序尺度

D.名義尺度

【例2-4】考察以下變量,這些變量代表了新加坡390所學(xué)校的情況:該地區(qū)的學(xué)生數(shù)量、學(xué)校名稱(chēng)、每名學(xué)生花費(fèi)的金額、教師的平均工資水平、學(xué)生的智商。

1.哪些變量屬于定性變量?哪些變量屬于定量變量?

2.確定每種變量的測(cè)量指標(biāo)。

(a) 定性變量

學(xué)校名稱(chēng)定量變量

該地區(qū)的學(xué)生數(shù)量每名學(xué)生花費(fèi)的金額教師的平均工資水平學(xué)生的智商

(b)該地區(qū)的學(xué)生數(shù)量

比例尺度 學(xué)校名稱(chēng)

名義尺度 每名學(xué)生花費(fèi)的金額

比例尺度 教師的平均工資水平

比例尺度 學(xué)生的智商

間隔尺度1.3絕對(duì)數(shù)與相對(duì)數(shù)絕對(duì)數(shù):

反映客觀(guān)現(xiàn)象總體在一定時(shí)間、地點(diǎn)條件下的總規(guī)模、總水平的綜合指標(biāo),表現(xiàn)為事物的絕對(duì)水平的描述。如:一定總體范圍內(nèi)的糧食總產(chǎn)量、農(nóng)業(yè)總產(chǎn)值、國(guó)營(yíng)企業(yè)數(shù)等。相對(duì)數(shù):反映兩個(gè)有聯(lián)系的指標(biāo)的比值,它可以從數(shù)量上反映兩個(gè)相互聯(lián)系的現(xiàn)象之間的對(duì)比關(guān)系和聯(lián)系程度。相對(duì)數(shù)通常用百分比、千分比或萬(wàn)分比等來(lái)表示。如:每千只燈泡的次品率、每百名疾病患者的死亡率等。計(jì)算相對(duì)數(shù)的基本公式為:相對(duì)數(shù)的種類(lèi)很多,根據(jù)其表現(xiàn)形式可分為兩類(lèi):一類(lèi)是有名數(shù),即凡是由兩個(gè)性質(zhì)不同而又有聯(lián)系的絕對(duì)數(shù)或平均數(shù)指標(biāo)對(duì)比計(jì)算所得的相對(duì)數(shù),一般都是有名數(shù),而且多用復(fù)合計(jì)量單位,如人口密度、人均占有土地和人均國(guó)內(nèi)生產(chǎn)總值等。另一類(lèi)是無(wú)名數(shù),無(wú)名數(shù)可以根據(jù)不同的情況分別采用倍數(shù)、成數(shù)、系數(shù)、百分?jǐn)?shù)、千分?jǐn)?shù)等來(lái)表示,如:人口出生率、死亡率等。相對(duì)數(shù)根據(jù)相互對(duì)比的指標(biāo)性質(zhì)和所能發(fā)揮的作用不同,又可分為動(dòng)態(tài)相對(duì)數(shù)、結(jié)構(gòu)相對(duì)數(shù)、比較相對(duì)數(shù)、強(qiáng)度相對(duì)數(shù)、計(jì)劃完成程度相對(duì)數(shù)等五種?!纠?-5】考察某時(shí)期兩個(gè)部隊(duì)患病的情況:A部隊(duì)有534人,其中患病人數(shù)為17人;B部隊(duì)有313人,其中患病人數(shù)為10人。我們能否得到A部隊(duì)的患病率較高的結(jié)論。從絕對(duì)數(shù)的概念來(lái)看,A部隊(duì)患病人數(shù)比B部隊(duì)高7人。從相對(duì)數(shù)來(lái)看,

A部隊(duì)的患病率為:

B部隊(duì)的患病率為:因此,兩部隊(duì)的患病率是一樣的。第二節(jié)統(tǒng)計(jì)數(shù)據(jù)的搜集與可靠性分析2.1總體與樣本總體和個(gè)體對(duì)我們研究的對(duì)象來(lái)說(shuō),研究對(duì)象的全部元素組成的集合,稱(chēng)為總體組成總體的每一個(gè)元素成為個(gè)體,個(gè)體又稱(chēng)為總體單位。作為統(tǒng)計(jì)的總體和個(gè)體,必須具備下面4個(gè)條件:①客觀(guān)性②大量性③同質(zhì)性④差異性統(tǒng)計(jì)總體按其包含的單位數(shù)分,可分成:有限總體和無(wú)限總體兩類(lèi)。統(tǒng)計(jì)總體按其個(gè)體的時(shí)空性分,可分成:空間總體和時(shí)間總體兩類(lèi)??傮w和個(gè)體的概念不是固定不變的,隨著研究目的的不同,它們二者是會(huì)轉(zhuǎn)換的。

樣本與抽樣樣本:從總體中隨機(jī)抽出一部分個(gè)體進(jìn)行觀(guān)察所組成的稱(chēng)為樣本。簡(jiǎn)單隨機(jī)樣本:若被抽出的每一個(gè)個(gè)體之間相互獨(dú)立,與總體有相同的分布,每個(gè)個(gè)體被抽取的幾率是一樣的(隨機(jī)性),則這樣的樣本叫做簡(jiǎn)單隨機(jī)樣本。抽樣:而從總體挑選一部分個(gè)體的過(guò)程叫做抽樣。

變異、變量和變量值變異:某一標(biāo)志具體表現(xiàn)在各總體單位的差別或差異稱(chēng)之為變異。包括品質(zhì)標(biāo)志的差異和數(shù)量標(biāo)志的差異。變量:即可變的數(shù)量標(biāo)志。變量按變量變動(dòng)是否連續(xù),分為連續(xù)型變量與離散型變量。連續(xù)型變量是連續(xù)不斷的,相鄰兩個(gè)變量值之間可作無(wú)限分割;離散型變量值不是連續(xù)不斷的,相鄰兩個(gè)變量值之間不能無(wú)限分割。變量值:亦稱(chēng)標(biāo)志值,是變量的具體數(shù)值表現(xiàn)。

參數(shù)和統(tǒng)計(jì)量參數(shù)研究者想要了解的總體的某種特征值所關(guān)心的參數(shù)主要有總體均值(

)、標(biāo)準(zhǔn)差(

)、總體比例(

)等總體參數(shù)通常用希臘字母表示統(tǒng)計(jì)量根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一個(gè)量所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(

x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等樣本統(tǒng)計(jì)量通常用小寫(xiě)英文字母來(lái)表示2.2統(tǒng)計(jì)調(diào)查方式統(tǒng)計(jì)調(diào)查是取得社會(huì)經(jīng)濟(jì)數(shù)據(jù)的主要途徑,也是直接獲得第一手統(tǒng)計(jì)數(shù)據(jù)的重要手段。主要的統(tǒng)計(jì)調(diào)查方式有:普查、抽樣調(diào)查和統(tǒng)計(jì)報(bào)表三種。另外,除了上述三種調(diào)查方式外,實(shí)際工作中還常用到重點(diǎn)調(diào)查和典型調(diào)查,它們屬于非全面調(diào)查。2.3數(shù)據(jù)的搜集方法

統(tǒng)計(jì)數(shù)據(jù)的直接來(lái)源

無(wú)論采取何種方式進(jìn)行調(diào)查,在取到需要的統(tǒng)計(jì)數(shù)據(jù)時(shí),都有一些具體的數(shù)據(jù)搜集方法。調(diào)查方法可分成:詢(xún)問(wèn)法、觀(guān)察法和實(shí)驗(yàn)法三種。除了以上三種主要的調(diào)查方法外,還有計(jì)算機(jī)輔助調(diào)查、座談會(huì)、個(gè)別深度調(diào)查等。統(tǒng)計(jì)數(shù)據(jù)的間接來(lái)源

第二手?jǐn)?shù)據(jù)主要來(lái)源是公開(kāi)出版或報(bào)道的數(shù)據(jù),當(dāng)然有些是未公開(kāi)的。在我國(guó),公開(kāi)出版或報(bào)道的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)主要來(lái)源是國(guó)家和地方的統(tǒng)計(jì)部門(mén)以及各種學(xué)報(bào)。除了上面獲得統(tǒng)計(jì)數(shù)據(jù)的方式外,還可以從各種報(bào)刊、雜志、圖書(shū)、電視傳播中獲得,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,我們也可以從因特網(wǎng)中獲得統(tǒng)計(jì)數(shù)據(jù)。2.4調(diào)查方案的設(shè)計(jì)

1.確定調(diào)查目的2.確定調(diào)查對(duì)象和調(diào)查單位3.設(shè)計(jì)調(diào)查項(xiàng)目和調(diào)查表4.確定調(diào)查時(shí)間5.調(diào)查的組織實(shí)施2.5資料的質(zhì)量分析和可靠性分析

統(tǒng)計(jì)數(shù)據(jù)的誤差在現(xiàn)實(shí)生活中,誤差的產(chǎn)生是不可避免的,統(tǒng)計(jì)數(shù)據(jù)的誤差通常是統(tǒng)計(jì)數(shù)據(jù)與客觀(guān)世界間的差距,誤差的來(lái)源主要有主觀(guān)性誤差和客觀(guān)性誤差兩類(lèi)。主觀(guān)性誤差是由于調(diào)查者或被調(diào)查者在調(diào)查的過(guò)程中主觀(guān)人為因素造成的。客觀(guān)性誤差主要是統(tǒng)計(jì)推斷和預(yù)測(cè)所產(chǎn)生的隨機(jī)誤差。隨機(jī)誤差:由于樣本的隨機(jī)性而產(chǎn)生的樣本對(duì)總體代表性的誤差叫做抽樣誤差,也稱(chēng)為隨機(jī)誤差。統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量分析

精度:保證抽樣誤差或隨機(jī)誤差盡量小準(zhǔn)確性:人為因素產(chǎn)生的誤差或偏差足夠小。關(guān)聯(lián)性:滿(mǎn)足相關(guān)人員決策、管理和研究的需要。及時(shí)性:在最短時(shí)間內(nèi)取得并公開(kāi)數(shù)據(jù)。一致性:保持時(shí)間序列可比性。經(jīng)濟(jì)性:在滿(mǎn)足上面指標(biāo)前提下,以最小費(fèi)用式取得數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)的可靠性分析

首先要明確統(tǒng)計(jì)調(diào)查的目的,我們選取某個(gè)事件作為調(diào)查對(duì)象必須符合調(diào)查目的;其次,在取得統(tǒng)計(jì)數(shù)據(jù)的過(guò)程中,不可避免地要經(jīng)歷抽樣的過(guò)程,統(tǒng)計(jì)數(shù)據(jù)的可靠性主要依賴(lài)于抽樣的過(guò)程是否科學(xué)。在抽樣的過(guò)程中應(yīng)注意以下4個(gè)方面:隨機(jī)性:樣本抽取的過(guò)程一定是隨機(jī)的。換句話(huà)說(shuō),每個(gè)個(gè)體被抽到的幾率是一樣的,不能因?yàn)槿藶橐蛩仄茐倪@種隨機(jī)性。一致性:樣本結(jié)構(gòu)和總體結(jié)構(gòu)應(yīng)該保持一致。獨(dú)立性:樣本中每個(gè)個(gè)體之間應(yīng)該是獨(dú)立的。足量性:樣本容量一定要足量。第三節(jié)抽樣調(diào)查中的基本概念3.1概率抽樣與非概率抽樣概率抽樣也稱(chēng)隨機(jī)抽樣。概率抽樣:就是使總體中的每一個(gè)單位都有一個(gè)已知的、不為零的概率進(jìn)入樣本的抽樣方法。非概率抽樣:是指抽樣時(shí)不遵循隨機(jī)原則,而是按照研究人員的主觀(guān)經(jīng)驗(yàn)或其它條件來(lái)抽取樣本的一種抽樣方法,也就是說(shuō)在抽樣時(shí),總體單元的入樣概率事先未知,入樣與否與研究人員的經(jīng)驗(yàn)和主觀(guān)意志有很大關(guān)系。兩者的不同:是否遵循隨機(jī)原則非概率抽樣一般不能用數(shù)理統(tǒng)計(jì)方法進(jìn)行推斷。3.2抽樣誤差和處理

抽樣誤差:由于個(gè)體存在差異,導(dǎo)致每個(gè)樣本的樣本統(tǒng)計(jì)量的值與總體參數(shù)之間存在的差異。影響抽樣誤差的因素:總體各單位標(biāo)志值的差異程度;樣本的單位數(shù);抽樣的方法;抽樣調(diào)查的組織形式。盡管抽樣誤差是無(wú)法避免的,但它卻是可以控制的。選擇適當(dāng)?shù)某闃臃椒ɑ蛘叱闃釉O(shè)計(jì)是控制這種誤差的一個(gè)重要方法。第四節(jié)抽樣方法介紹樣本不能準(zhǔn)確代表總體,在研究設(shè)計(jì)中會(huì)出現(xiàn)偏差:偏差:如果抽樣方法得到的結(jié)果與總體的真實(shí)情況存在系統(tǒng)性差距,那么我們說(shuō)這種抽樣方法存在偏差選擇性偏差:系統(tǒng)性趨勢(shì)排除或包括某一類(lèi)單位無(wú)反應(yīng)偏差:樣本所選擇的單位不產(chǎn)生反應(yīng),而且與應(yīng)答者相比,它們具有非常不同的特性反應(yīng)偏差:調(diào)查者的提問(wèn)時(shí)間和提問(wèn)方式會(huì)對(duì)被調(diào)查單位做出的反應(yīng)產(chǎn)生影響【例2-6】:電視節(jié)目就槍支控制問(wèn)題進(jìn)行了一項(xiàng)民意調(diào)查。電視觀(guān)眾被邀請(qǐng)就這一問(wèn)題發(fā)表自己的意見(jiàn)。你認(rèn)為民意調(diào)查結(jié)果值得信賴(lài)嗎?電視節(jié)目調(diào)查一般會(huì)產(chǎn)生偏差。因?yàn)檫@種調(diào)查是依據(jù)自愿抽樣方法進(jìn)行的,即只有那些觀(guān)看電視節(jié)目并對(duì)這一問(wèn)題有強(qiáng)烈意見(jiàn)的人才有可能接受調(diào)查。因此,調(diào)查結(jié)果存在偏差,不能真正加以信賴(lài)。【例2-7】:電話(huà)調(diào)查:如果隨機(jī)從電話(huà)本上選取電話(huà)及其號(hào)碼進(jìn)行某項(xiàng)調(diào)查,請(qǐng)問(wèn)是否會(huì)產(chǎn)生偏差?由于只有那些將電話(huà)及其號(hào)碼印在電話(huà)本上的人才有機(jī)會(huì)被選入到樣本中,因此會(huì)出現(xiàn)選擇性偏差。【例2-8】:郵件調(diào)查在大部分郵件調(diào)查中,較低和較高的社會(huì)階層一般不愿意對(duì)調(diào)查做出回答,這表面調(diào)查結(jié)果過(guò)于代表中層階級(jí)的觀(guān)點(diǎn)。這時(shí)會(huì)產(chǎn)生無(wú)反應(yīng)偏差?!纠?-9】:一名心理學(xué)家想要研究夫婦之間的分居問(wèn)題。此時(shí)你會(huì)遇到這樣一個(gè)問(wèn)題,“心理學(xué)家發(fā)現(xiàn)分居會(huì)削弱夫婦之間的感情,正如一句俗語(yǔ)所說(shuō),眼不見(jiàn),心不想。你能夠想象為什么會(huì)那樣嗎?”受訪(fǎng)者對(duì)結(jié)果并不感到奇怪。這名心理學(xué)家在不同的時(shí)候?qū)α硪唤M受訪(fǎng)者又進(jìn)行了同樣的調(diào)查,“心理學(xué)家發(fā)現(xiàn)分居會(huì)增強(qiáng)夫婦之間的感情。正如一句俗語(yǔ)所說(shuō),分離使愛(ài)心更濃。你能夠想象為什么會(huì)那樣嗎?”受訪(fǎng)者對(duì)結(jié)果并不感到奇怪。由于敘述中選用了不同的詞匯,因此調(diào)查結(jié)果出現(xiàn)了反應(yīng)偏差。4.1隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣(純隨機(jī)抽樣)對(duì)總體單位不進(jìn)行任何分組排列,僅按隨機(jī)原則直接從總體中抽取樣本,以使總體中的每一個(gè)單位均有同等的被抽取的機(jī)會(huì)。一種基本的等概率抽樣方法,其他概率抽樣都可以看成是由它派生出來(lái)的。具體做法:直接抽選法抽簽法隨機(jī)數(shù)碼表法主要用于以下情況:對(duì)調(diào)查對(duì)象的情況很少了解;總體單位的排列沒(méi)有秩序;抽到的單位比較分散時(shí)也不影響調(diào)查工作。4.2分層抽樣(類(lèi)型抽樣)在分層隨機(jī)抽樣中,首先將總體分成若干層,然后從每一層中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本。每一層抽取的觀(guān)察值數(shù)量不僅能夠代表樣本的百分比,而且能夠代表總體的百分比。同一層的觀(guān)察值應(yīng)當(dāng)有相同的特征。不同層的觀(guān)察值會(huì)表現(xiàn)出不同的特征。具體步驟如下:第一,按照某一種或幾種特征對(duì)總體進(jìn)行分層。第二,確定在各層中抽取樣本單位的數(shù)量??刹扇〉缺壤筒坏缺壤槿煞N不同的方法。

各層(組)的抽樣單位數(shù)的確定類(lèi)型比例抽樣方法不考慮各組標(biāo)志差異程度,而是根據(jù)統(tǒng)一的比例來(lái)確定各組抽取的單位數(shù)。類(lèi)型適宜抽樣方法根據(jù)抽樣誤差大小與標(biāo)志差異程度、抽樣單位數(shù)等的關(guān)系來(lái)確定。差異大的組多抽,差異小的組少抽。分層抽樣抽樣的主要優(yōu)點(diǎn)有:提高從樣本推斷總體的精確性。分層抽樣特別適用于既要對(duì)總體參數(shù)進(jìn)行推斷,也要對(duì)各子總體(層)的參數(shù)進(jìn)行推斷的情形,例如一項(xiàng)全國(guó)性抽樣調(diào)查,若以省為層,那么調(diào)查以后即可進(jìn)行全國(guó)性的統(tǒng)計(jì),也可獲得各省的統(tǒng)計(jì)數(shù)據(jù)。分層抽樣實(shí)施起來(lái)靈活方便,而且便于組織。由于抽樣是在各層獨(dú)立進(jìn)行的,因此它允許根據(jù)不同層的情況采用不同的抽樣方法。分層抽樣要求:盡量使層(組)的分布與總體中個(gè)體的分布相似即要求層內(nèi)(組內(nèi))方差盡量小,而層間(組間)方差盡量大。分層抽樣的主要局限性:調(diào)查者必須對(duì)總體情況有較多的了解,否則無(wú)法進(jìn)行恰當(dāng)?shù)姆謱印?.3等距抽樣等距抽樣,又稱(chēng)系統(tǒng)抽樣或機(jī)械抽樣。是對(duì)研究的總體按一定的順序排列,每隔一定的間隔抽取一個(gè)或若干個(gè)單位,并把這些抽取的單位組成樣本進(jìn)行觀(guān)察的一種抽樣方法。kiki+ki+2ki+(n-1)kik等距抽樣示意圖雖然等距抽樣在概念方面與簡(jiǎn)單隨機(jī)抽樣很相似,但這種方法在實(shí)踐中更加容易實(shí)施。這種方法是以相等間隔從總體中抽取觀(guān)察值。等距抽樣的主要優(yōu)點(diǎn):易于實(shí)施,工作量少樣本在總體中的分布比較均勻,故而抽樣誤差小于或至多等于簡(jiǎn)單隨機(jī)抽樣,即較其精確。等距抽樣的弱點(diǎn):容易造成系統(tǒng)性誤差等距抽樣是以總體單位的無(wú)規(guī)律排列為前提的,其存在的一個(gè)潛在問(wèn)題是周期性,當(dāng)總體呈現(xiàn)周期性變化時(shí)會(huì)出現(xiàn)這種現(xiàn)象,而且周期長(zhǎng)度與我們采用系統(tǒng)抽樣觀(guān)察到的結(jié)果一樣。雖然周期性并不常見(jiàn),但在進(jìn)行等距抽樣時(shí)應(yīng)當(dāng)考慮到這個(gè)問(wèn)題。

等距抽樣的分類(lèi)按排隊(duì)所依據(jù)的標(biāo)志不同,分為:無(wú)關(guān)標(biāo)志排隊(duì):排隊(duì)的標(biāo)志與調(diào)查的內(nèi)容無(wú)關(guān)。有關(guān)標(biāo)志排隊(duì):排隊(duì)的標(biāo)志與調(diào)查內(nèi)容有關(guān)。按樣本單位抽選的方法不同,可分為:隨機(jī)起點(diǎn)等距抽樣無(wú)關(guān)標(biāo)志排隊(duì)可用。有關(guān)標(biāo)志排隊(duì)會(huì)產(chǎn)生系統(tǒng)性誤差。

半距起點(diǎn)等距抽樣有關(guān)標(biāo)志排隊(duì)和無(wú)關(guān)標(biāo)志排隊(duì)都可用隨機(jī)性不明顯;只能抽取一個(gè)樣本,不能進(jìn)行樣本輪換,抽樣的利用率低。

對(duì)稱(chēng)等距抽樣避免了半距抽樣的局限性,優(yōu)點(diǎn)更加明顯。4.4整群抽樣整群抽樣又稱(chēng)聚類(lèi)抽樣把總體分成若干個(gè)組(或群)。每一組就好像是總體的縮影。然后從這些群中抽取若干群作為一個(gè)簡(jiǎn)單隨機(jī)樣本,或者對(duì)被抽中群的所有個(gè)體進(jìn)行全面調(diào)查。主要優(yōu)點(diǎn):易于取得抽樣框,便于組織,可以節(jié)省人力、物力和財(cái)力。最大缺點(diǎn):樣本分布不均勻,樣本的代表性差。它與其他抽樣方法相比,在樣本容量相同時(shí),其抽樣誤差較大。要求:要使整群抽樣的誤差小成為可能的話(huà),在劃分群時(shí),應(yīng)使群內(nèi)方差盡可能大,而使群間方差盡可能小。案例分析:1936年美國(guó)總統(tǒng)大選,由民主黨人羅斯福對(duì)陣共和黨人蘭登。美國(guó)一著名雜志社作了一項(xiàng)民意調(diào)查,該雜志根據(jù)電話(huà)號(hào)碼簿、俱樂(lè)部名冊(cè)、駕駛證等隨機(jī)調(diào)查了大量的民眾。據(jù)其結(jié)果,該雜志預(yù)言蘭登將以壓倒性?xún)?yōu)勢(shì)獲勝,但大選結(jié)果卻截然相反。試從抽樣的角度詮釋預(yù)測(cè)失敗的原因。究其原因,在于該雜志是從電話(huà)號(hào)碼簿、俱樂(lè)部名冊(cè)、駕駛證等去選擇被調(diào)查對(duì)象的,這類(lèi)人多屬于富有階層,傾向共和黨者居多,這違反了隨機(jī)抽樣的原則,屬于便利抽樣。因此,這類(lèi)教訓(xùn)應(yīng)在抽樣調(diào)查中汲取。結(jié)束第三章統(tǒng)計(jì)數(shù)據(jù)的概括性描述第三章統(tǒng)計(jì)數(shù)據(jù)的概括性描述第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理與展示第二節(jié)數(shù)據(jù)集位置的測(cè)度第三節(jié)數(shù)據(jù)集離散程度的測(cè)度第四節(jié)數(shù)據(jù)集的峰度與偏度學(xué)習(xí)目標(biāo)了解數(shù)據(jù)預(yù)處理的內(nèi)容和目的掌握分配數(shù)列的整理與顯示方法掌握數(shù)據(jù)集的位置測(cè)度的變量與方法掌握數(shù)據(jù)集的離散程度測(cè)度的變量與方法掌握數(shù)據(jù)集的分布形態(tài)測(cè)度的變量與方法用SPSS作頻數(shù)分布表和形圖案例與背景統(tǒng)計(jì)數(shù)據(jù)首先需要經(jīng)過(guò)預(yù)處理和整理,以便人們對(duì)數(shù)據(jù)分布的類(lèi)型和特點(diǎn)有了一個(gè)大概的了解。但這種了解并不能幫助我們準(zhǔn)確地描述出統(tǒng)計(jì)數(shù)據(jù)的分布,還需要更深入的分析,找到能反映數(shù)據(jù)分布特征的各個(gè)代表值。對(duì)統(tǒng)計(jì)數(shù)據(jù)分布的特征和規(guī)律,可以從本章所介紹的三個(gè)方面進(jìn)行測(cè)度和描述:一是數(shù)據(jù)集位置的測(cè)度,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二是數(shù)據(jù)集離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢(shì);三是數(shù)據(jù)集的峰度與偏度,反映數(shù)據(jù)分布的形狀。這三個(gè)方面從不同側(cè)面反映了數(shù)據(jù)分布特征。本章將重點(diǎn)介紹這些代表值的計(jì)算方法、特點(diǎn)及其應(yīng)用。第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理與展示3.1.1數(shù)據(jù)的預(yù)處理3.1.2頻數(shù)分布表的編制與圖示3.1.1數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征數(shù)據(jù)審核—原始數(shù)據(jù)

(rawdata)

審核的內(nèi)容完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫(xiě)齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實(shí)反映客觀(guān)實(shí)際情況,內(nèi)容是否符合實(shí)際檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等數(shù)據(jù)的審核—原始數(shù)據(jù)

(rawdata)

審核數(shù)據(jù)準(zhǔn)確性的方法邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項(xiàng)目或數(shù)字之間有無(wú)相互矛盾的現(xiàn)象主要用于對(duì)分類(lèi)和順序據(jù)的審核計(jì)算檢查檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無(wú)錯(cuò)誤主要用于對(duì)數(shù)值型數(shù)據(jù)的審核數(shù)據(jù)的審核—二手?jǐn)?shù)據(jù)

(secondhanddata)適用性審核弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時(shí)效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)是否必要做進(jìn)一步的加工整理數(shù)據(jù)篩選

(datafilter)當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來(lái),而不符合特定條件的數(shù)據(jù)予以剔數(shù)據(jù)篩選

(datafilter)用SPSS進(jìn)行數(shù)據(jù)篩選

8名學(xué)生的考試成績(jī)數(shù)據(jù)

數(shù)據(jù)排序

(datarank)按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線(xiàn)索排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類(lèi)或分組等提供依據(jù)在某些場(chǎng)合,排序本身就是分析的目的之一排序可借助于計(jì)算機(jī)完成數(shù)據(jù)排序

(方法)分類(lèi)數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫(huà)排序,其中也有筆畫(huà)多少的升序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)3.1.2頻數(shù)分布表的編制與圖示頻數(shù)與頻數(shù)分布統(tǒng)計(jì)分組品質(zhì)數(shù)列的整理和顯示變量數(shù)列的整理和顯示頻數(shù)分布的類(lèi)型1.頻數(shù)與頻數(shù)分布頻數(shù)分布數(shù)列的概念在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體的所有單位按組歸類(lèi)整理,并按一定順序排列,形成總體中各個(gè)單位在各組簡(jiǎn)的分布,又稱(chēng)次數(shù)分配或分布數(shù)列。頻數(shù)(frequency)

:又叫次數(shù),落在各類(lèi)別中的數(shù)據(jù)(單位)個(gè)數(shù),記作Fi。

頻率(ratio)

:又叫比率,各組次數(shù)(頻數(shù))與總次數(shù)(頻數(shù))之比。頻率分布的性質(zhì):=££???===110111NiNiiiNiiiFFFF分配數(shù)列的種類(lèi)品質(zhì)分配數(shù)列(屬性分布數(shù)列):按品質(zhì)標(biāo)志分組形成的分配數(shù)列。變量分配數(shù)列(變量分布數(shù)列):按數(shù)量標(biāo)志分組形成的分配數(shù)列。單項(xiàng)數(shù)列:總體按單項(xiàng)式分組而形成的變量數(shù)列,每個(gè)變量值是一個(gè)組,順序排列。組距數(shù)列:總體按組距式分組而形成的變量數(shù)列,每個(gè)組是由若干個(gè)變量值形成的區(qū)間表示。分配數(shù)列品質(zhì)數(shù)列變量數(shù)列單項(xiàng)數(shù)列組距數(shù)列2.統(tǒng)計(jì)分組統(tǒng)計(jì)分組—概念:是根據(jù)統(tǒng)計(jì)研究的目的,選擇某一主要標(biāo)志,將總體單位劃分為若干類(lèi)型或組別,使組內(nèi)具有同質(zhì)性,組間具有差異性。統(tǒng)計(jì)分組—作用劃分現(xiàn)象的類(lèi)型揭示現(xiàn)象內(nèi)部結(jié)構(gòu)分析現(xiàn)象之間的依存關(guān)系統(tǒng)計(jì)分組—分組標(biāo)志的選擇統(tǒng)計(jì)分組的關(guān)鍵問(wèn)題:如何選擇分組標(biāo)志和確定各組的界限。根據(jù)統(tǒng)計(jì)研究的目的來(lái)選擇在滿(mǎn)足研究目的的前提下,應(yīng)選擇本質(zhì)的、主要的,而不是非本質(zhì)的、次要的標(biāo)志。考慮具體的歷史和經(jīng)濟(jì)條件。簡(jiǎn)單分組、復(fù)合分組和分組體系根據(jù)采用的分組標(biāo)志的多少,可以分為:簡(jiǎn)單分組復(fù)合分組簡(jiǎn)單分組又稱(chēng)單一分組,是對(duì)被研究現(xiàn)象總體只按一個(gè)標(biāo)志進(jìn)行的分組。特點(diǎn):只能反映現(xiàn)象在某一標(biāo)志特征方面的差異情況。不能反映現(xiàn)象在其他標(biāo)志特征方面的差異,說(shuō)明問(wèn)題比較簡(jiǎn)單明了。簡(jiǎn)單分組按性別分組男女按年齡分組0~6歲組7~17歲組18~59歲組60歲以上組復(fù)合分組對(duì)同一總體選擇兩個(gè)或兩個(gè)以上標(biāo)志層疊起來(lái)進(jìn)行的分組。特點(diǎn):可以從幾個(gè)不同角度了解總體內(nèi)部的差別和關(guān)系,比簡(jiǎn)單分組能更全面、更深入地研究問(wèn)題;分組的組數(shù)隨著分組標(biāo)志的增加而成倍地增加。因而在采用復(fù)合分組時(shí),選擇分組標(biāo)志的數(shù)量要適量,并且要考慮倒只有在總體包括的單位數(shù)較多的情況下,才宜于采用復(fù)合分組。理科學(xué)生組高等學(xué)校學(xué)生總體男學(xué)生組女學(xué)生組男學(xué)生組女學(xué)生組本科學(xué)生組專(zhuān)科學(xué)生組男學(xué)生組女學(xué)生組男學(xué)生組女學(xué)生組文科學(xué)生組本科學(xué)生組專(zhuān)科學(xué)生組復(fù)合分組分組體系為了從不同側(cè)面反映總體的特征,運(yùn)用幾個(gè)標(biāo)志對(duì)總體進(jìn)行分組,形成的一個(gè)完整的體系。分組體系有兩種不同的形式:平行分組體系:同一個(gè)總體的幾個(gè)簡(jiǎn)單分組按某一規(guī)定排列起來(lái)就構(gòu)成一個(gè)平行分組體系。復(fù)合分組體系:由復(fù)合分組形成的分組系列。3.品質(zhì)分布數(shù)列的整理與顯示分類(lèi)數(shù)據(jù)的整理順序數(shù)據(jù)的整理品質(zhì)分布數(shù)列的整理列出各類(lèi)別計(jì)算各類(lèi)別的頻數(shù)制作頻數(shù)分布表用圖形顯示數(shù)據(jù)分類(lèi)頻數(shù)比例百分比比率ABCDE分類(lèi)數(shù)據(jù)整理—頻數(shù)分布表

(例題分析)【例3.1】一家市場(chǎng)調(diào)查公司為研究不同品牌飲料的市場(chǎng)占有率,對(duì)隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對(duì)50名顧客購(gòu)買(mǎi)飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購(gòu)買(mǎi)某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數(shù)據(jù)用SPSS制作頻數(shù)分布表分類(lèi)數(shù)據(jù)的圖示—條形圖

(barChart)用寬度相同的條形的高度或長(zhǎng)短來(lái)表示各類(lèi)別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類(lèi)數(shù)據(jù)的頻數(shù)分布繪制時(shí),各類(lèi)別可以放在縱軸,稱(chēng)為條形圖,也可以放在橫軸,稱(chēng)為柱形圖分類(lèi)數(shù)據(jù)的圖示—條形圖

(例題分析)分類(lèi)數(shù)據(jù)的圖示—餅圖

(pieChart)也稱(chēng)圓形圖,是用圓形及園內(nèi)扇形的面積來(lái)表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的分類(lèi)數(shù)據(jù)的圖示—餅圖

(例題分析)順序數(shù)據(jù)的整理累積頻數(shù)(cumulativefrequencies):各類(lèi)別頻數(shù)的逐級(jí)累加累積頻率(cumulativepercentages):各類(lèi)別頻率(百分比)的逐級(jí)累加順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)【例3.2】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶(hù),其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿(mǎn)意?1.非常不滿(mǎn)意;2.不滿(mǎn)意;3.一般;4.滿(mǎn)意;5.非常滿(mǎn)意。甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶(hù)數(shù)(戶(hù))百分比(%)累計(jì)戶(hù)數(shù)(戶(hù))百分比(%)

非常不滿(mǎn)意

不滿(mǎn)意

一般

滿(mǎn)意

非常滿(mǎn)意24108934530836311510241322252703008.044.075.090.0100.0合計(jì)300100.0——順序數(shù)據(jù)的頻數(shù)分布表

(例題分析)乙城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別乙城市戶(hù)數(shù)(戶(hù))百分比(%)累計(jì)戶(hù)數(shù)(戶(hù))百分比(%)

非常不滿(mǎn)意

不滿(mǎn)意

一般

滿(mǎn)意

非常滿(mǎn)意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.0合計(jì)300100.0——順序數(shù)據(jù)的圖示—累計(jì)頻數(shù)分布圖

(例題分析)甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布環(huán)形圖

(annularchart)環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類(lèi)似,但又有區(qū)別圓形圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究環(huán)形圖主要用于展示分類(lèi)和順序數(shù)據(jù)環(huán)形圖

(例題分析)8%36%31%15%7%33%26%21%13%10%

非常不滿(mǎn)意

不滿(mǎn)意

一般

滿(mǎn)意

非常滿(mǎn)意

甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià)4.變量數(shù)列的整理與顯示

數(shù)據(jù)分組累計(jì)頻數(shù)分布數(shù)值型數(shù)據(jù)的圖示數(shù)據(jù)分組分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點(diǎn))將一個(gè)變量值作為一組適合于離散變量適合于變量值較少的情況組距分組

(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組等距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按Sturges

提出的經(jīng)驗(yàn)公式來(lái)確定組數(shù)K確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表確定全距(極差):全部變量的最大之與最小值的距離頻數(shù)分布表的編制

(例題分析)【例3.3】某電腦公司2002年前四個(gè)月各天的銷(xiāo)售量數(shù)據(jù)(單位:臺(tái))。試對(duì)數(shù)據(jù)進(jìn)行分組。

頻數(shù)分布表的編制

(步驟)確定組數(shù):根據(jù)Sturges提出的經(jīng)驗(yàn)公式得組數(shù)K為:確定各組的組距:組距=(237-141)÷10=9.6

10用SPSS制作頻數(shù)分布表

組距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對(duì)頻數(shù)來(lái)觀(guān)察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度反映頻數(shù)分布的實(shí)際狀況異距分組

(幾個(gè)概念)標(biāo)準(zhǔn)組距:數(shù)列中能被各組組距整除的最大組距。常用數(shù)列中的最小組距作為標(biāo)準(zhǔn)組距。異距分組

(例題分析)某廠(chǎng)工人年齡分布情況工人按年齡分組組距人數(shù)(人)標(biāo)準(zhǔn)組距人數(shù)次數(shù)密度15~2020~2525~3030~3535~4545~5055551051728407065101728407032.5103.45.68146.52合計(jì)-230——異距分組

(例題分析)異距分組

(例題分析)組限和組中值組限(classlimit)

:各組的上限界限值組下限(lowlimit)

:一個(gè)組的最小值組上限(upperlimit)

:一個(gè)組的最大值閉口組:上限和下限都齊全的組開(kāi)口組:上限或下限有一個(gè)沒(méi)有的組組限的確定組限確定有一個(gè)基本原則:即按這樣的組限分組后,標(biāo)志值在各組的變動(dòng)能反映事物的質(zhì)的變化。常用的組限表示方法:按連續(xù)變量分組,由于相鄰兩組的上限和下限常時(shí)同一數(shù)值,每組的界限會(huì)重疊,為避免計(jì)算各組次數(shù)時(shí)出現(xiàn)混亂,一般的原則是“上組限不在內(nèi),或下組限不在內(nèi)”。按離散變量分組,則相鄰的上限和現(xiàn)象通常是以?xún)蓚€(gè)確定的不同整數(shù)值來(lái)表示,故相鄰兩組的上下限可以不重合。等距分組表

(上下組限重疊)等距分組表

(上下組限間斷)等距分組表

(使用開(kāi)口組)組中值(classmidpoint)

組中值(classmidpoint)

:下限與上限之間的中點(diǎn)值。下限值+上限值2組中值=累計(jì)頻數(shù)分布累計(jì)頻數(shù)分布在頻數(shù)分布的基礎(chǔ)上將各組頻數(shù)逐一累計(jì),稱(chēng)為頻數(shù)分布累計(jì)。向上累計(jì):從變量值最低組開(kāi)始向變量值高的組累計(jì),表明小與該組上限的頻數(shù)(頻率)一共有多少;向下累計(jì):從變量值最高組開(kāi)始向變量值低的組累計(jì),表明大與該組下限的頻數(shù)(頻率)一共有多少。特點(diǎn):同一數(shù)值的向上累計(jì)和向下累計(jì)次數(shù)之和等于總體總次數(shù)。累計(jì)頻數(shù)分布圖:以變量值為橫坐標(biāo),累計(jì)頻數(shù)和頻率為縱坐標(biāo)。累計(jì)頻數(shù)分布

(例題分析)141159166172177182188196203214143160167173177183189196203215144160168173178184189196205218149161168174178185189196206223150161168174178186190196207225152162170174179186190197208226153163171175179187191197209228153163171175179187192198210233154164172175180187194198210233155165172175180187194200211234156165172176181188195201211234158165172176182188195202213237某電腦公司2002年前4個(gè)月的銷(xiāo)售量累計(jì)頻數(shù)分布

(例題分析)按銷(xiāo)售量分組(臺(tái))頻數(shù)(天)頻率(%)向上累積頻率(%)向下累積頻率(%)150以下43.333.33100.00150~16097.5010.8396.67160~1701613.3324.1789.17170~1802722.5046.6775.83180~1902016.6763.3355.33190~2001714.1777.5036.67200~210108.3385.8322.50210~22086.6792.5014.17220~23043.3395.837.50230以上54.17100.004.17合計(jì)120100100.00100.00累計(jì)頻數(shù)分布

(例題分析)變量分布數(shù)列的圖示

分組數(shù)據(jù)—直方圖和折線(xiàn)圖分組數(shù)據(jù)—直方圖

(histogram)用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1分組數(shù)據(jù)的圖示

(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷(xiāo)售量分布的直方圖190200180160170頻數(shù)(天)25201510530220230240分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類(lèi)別頻數(shù)的多少,其寬度(表示類(lèi)別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開(kāi)排列條形圖主要用于展示分類(lèi)數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)分組數(shù)據(jù)—折線(xiàn)圖

(frequencypolygon)折線(xiàn)圖也稱(chēng)頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線(xiàn)連接起來(lái),再把原來(lái)的直方圖抹掉折線(xiàn)圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線(xiàn)圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示

(折線(xiàn)圖的繪制)折線(xiàn)圖與直方圖下的面積相等!140150210某電腦公司銷(xiāo)售量分布的折線(xiàn)圖190200180160170220230240頻數(shù)(天)25201510530數(shù)值型數(shù)據(jù)的圖示未分組數(shù)據(jù)—莖葉圖和箱線(xiàn)圖未分組數(shù)據(jù)—莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉樹(shù)葉上只保留一位數(shù)字對(duì)于n(20

n

300)個(gè)數(shù)據(jù),莖葉圖最大行數(shù)不超過(guò)

L=[10×lg(n)]莖葉圖類(lèi)似于橫置的直方圖,但又有區(qū)別直方圖可觀(guān)察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)—莖葉圖

(例題分析)未分組數(shù)據(jù)—莖葉圖

(擴(kuò)展的莖葉圖)未分組數(shù)據(jù)—箱線(xiàn)圖

(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布箱線(xiàn)圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線(xiàn)段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me

和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分(位)數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接未分組數(shù)據(jù)—單批數(shù)據(jù)箱線(xiàn)圖

(箱線(xiàn)圖的構(gòu)成)中位數(shù)4681012QUQLX最大值X最小值簡(jiǎn)單箱線(xiàn)圖未分組數(shù)據(jù)—單批數(shù)據(jù)箱線(xiàn)圖

(例題分析)最小值141最大值237中位數(shù)182下四分位數(shù)170.25上四分位數(shù)197140150160170180190200210220230240某電腦公司銷(xiāo)售量數(shù)據(jù)的箱線(xiàn)圖分布的形狀與箱線(xiàn)圖

對(duì)稱(chēng)分布QL中位數(shù)

QU左偏分布QL中位數(shù)

QU右偏分布QL

中位數(shù)

QU不同分布的箱線(xiàn)圖未分組數(shù)據(jù)—多批數(shù)據(jù)箱線(xiàn)圖

(例題分析)【例3.4】

從某大學(xué)經(jīng)濟(jì)管理專(zhuān)業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對(duì)8門(mén)主要課程的考試成績(jī)進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績(jī)的批比較箱線(xiàn)圖,并分析各科考試成績(jī)的分布特征11名學(xué)生各科的考試成績(jī)數(shù)據(jù)課程名稱(chēng)學(xué)生編號(hào)1234567891011英語(yǔ)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場(chǎng)營(yíng)銷(xiāo)學(xué)財(cái)務(wù)管理基礎(chǔ)會(huì)計(jì)學(xué)統(tǒng)計(jì)學(xué)計(jì)算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)—多批數(shù)據(jù)箱線(xiàn)圖

(例題分析)8門(mén)課程考試成績(jī)的箱線(xiàn)圖11名學(xué)生8門(mén)課程考試成績(jī)的箱線(xiàn)圖Min-Max25%-75%Medianvalue455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)—多批數(shù)據(jù)箱線(xiàn)圖

(例題分析)數(shù)值型數(shù)據(jù)的圖示時(shí)間序列數(shù)據(jù)—線(xiàn)圖時(shí)間序列數(shù)據(jù)—線(xiàn)圖

(lineplot)

繪制線(xiàn)圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長(zhǎng)寬比例要適當(dāng),其長(zhǎng)寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開(kāi)始,以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí),可以采取折斷的符號(hào)將縱軸折斷時(shí)間序列數(shù)據(jù)—線(xiàn)圖

(例題分析)【例3.5】已知1991~2000年我國(guó)城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線(xiàn)圖1991~2000年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6784.0921.61221.01577.71926.12091.12162.02210.32254.4時(shí)間序列數(shù)據(jù)—線(xiàn)圖

(例題分析)數(shù)值型數(shù)據(jù)的圖示多變量數(shù)據(jù)—雷達(dá)圖多變量數(shù)據(jù)—雷達(dá)圖

(radarchart)顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用假定各變量的取值具有相同的正負(fù)號(hào),總的絕對(duì)值與圖形所圍成的區(qū)域成正比可用于研究多個(gè)樣本之間的相似程度多變量數(shù)據(jù)—雷達(dá)圖

(雷達(dá)圖的制作)

設(shè)有n組樣本S1,S2,…Sn,每個(gè)樣本測(cè)得P個(gè)變量X1,X2,Xp,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是

先做一個(gè)圓,然后將圓P等分,得到P個(gè)點(diǎn),令這P個(gè)點(diǎn)分別對(duì)應(yīng)P個(gè)變量,在將這P個(gè)點(diǎn)與圓心連線(xiàn),得到P個(gè)幅射狀的半徑,這P個(gè)半徑分別作為P個(gè)變量的坐標(biāo)軸,每個(gè)變量值的大小由半徑上的點(diǎn)到圓心的距離表示再將同一樣本的值在P個(gè)坐標(biāo)上的點(diǎn)連線(xiàn)。這樣,n個(gè)樣本形成的n個(gè)多邊形就是一個(gè)雷達(dá)圖多變量數(shù)據(jù)—雷達(dá)圖

(例題分析)【例3.6】2000年我國(guó)城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖。2000年城鄉(xiāng)居民家庭平均每人生活消費(fèi)支出構(gòu)成(%)項(xiàng)目城鎮(zhèn)居民農(nóng)村居民

食品衣著家庭設(shè)備用品及服務(wù)醫(yī)療保健交通通訊娛樂(lè)教育文化服務(wù)居住雜項(xiàng)商品與服務(wù)39.1810.018.796.367.9012.5610.015.1749.305.754.525.245.5811.1815.473.14多變量數(shù)據(jù)—雷達(dá)圖

(例題分析)數(shù)據(jù)類(lèi)型及圖示

(小結(jié))頻數(shù)分布的類(lèi)型頻數(shù)分布的類(lèi)型對(duì)稱(chēng)分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見(jiàn)的頻數(shù)分布本節(jié)小結(jié)數(shù)據(jù)預(yù)處理的內(nèi)容和目的品質(zhì)分布數(shù)列的整理與顯示方法變量分布數(shù)列的整理與顯示方法用SPSS作頻數(shù)分布表和圖形結(jié)束第二節(jié)數(shù)據(jù)集位置的測(cè)度一、平均指標(biāo)的概念和作用二、算術(shù)平均數(shù)三、調(diào)和平均數(shù)四、幾何平均數(shù)五、眾數(shù)六、中位數(shù)和分位數(shù)七、各種平均數(shù)之間的相互關(guān)系八、正確應(yīng)用平均指標(biāo)的原則一、平均指標(biāo)的概念和作用一、平均指標(biāo)的概念和作用平均指標(biāo)的作用:可用于同類(lèi)現(xiàn)象在不同空間條件下的對(duì)比可用于同一總體指標(biāo)在不同時(shí)間的對(duì)比可作為論斷事物的一種數(shù)量標(biāo)準(zhǔn)或參考可用于分析現(xiàn)象之間的依存關(guān)系和進(jìn)行數(shù)量上的估算。二、算術(shù)平均數(shù)二、算術(shù)平均數(shù)算術(shù)平均數(shù)的基本公式算術(shù)平均數(shù)

(計(jì)算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN簡(jiǎn)單算術(shù)平均數(shù)的計(jì)算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK相應(yīng)的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權(quán)算術(shù)平均數(shù)的計(jì)算公式為簡(jiǎn)單算術(shù)平均數(shù)

(算例)原始數(shù)據(jù): 10 5 9 13 6 8加權(quán)算術(shù)平均數(shù)

(算例)某車(chē)間50名工人日加工零件均值計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計(jì)—506160.0【例3.7】根據(jù)下表數(shù)據(jù),計(jì)算50名工人日加工零件數(shù)的均值加權(quán)算術(shù)平均數(shù)

(權(quán)數(shù)對(duì)均值的影響)

甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下

甲組:考試成績(jī)(X): 020100

人數(shù)分布(F):118

乙組:考試成績(jī)(X): 020100

人數(shù)分布(F):811X甲0×1+20×1+100×8n

10i=1

Xi

82(分)X乙0×8+20×1+100×1n

10i=1

Xi

12(分)算術(shù)平均數(shù)

(數(shù)學(xué)性質(zhì))

2.如果每個(gè)變量值都加或減任意數(shù)值A(chǔ),則,平均數(shù)也要增多或減少這個(gè)數(shù)A。

1.算術(shù)平均數(shù)與總體單位數(shù)的乘積等于總體各單位標(biāo)志值的總和。算術(shù)平均數(shù)

(數(shù)學(xué)性質(zhì))3.如果每個(gè)變量值都乘以或除以任意數(shù)值A(chǔ),則平均數(shù)也要乘以或除以這個(gè)數(shù)A。

5.各變量值與均值的離差平方和最小4.各變量值與均值的離差之和等于零。算術(shù)平均數(shù)的簡(jiǎn)捷計(jì)算法Xo為假定平均數(shù),取靠近數(shù)列中間那一組的組中值;d為組距,一般情況下,d?。╔-Xo)差數(shù)的最大公約數(shù)算術(shù)平均數(shù)的簡(jiǎn)捷計(jì)算法

(算例)某企業(yè)工人日產(chǎn)量的算術(shù)平均數(shù)簡(jiǎn)捷計(jì)算法按日產(chǎn)量分組(千克)工人人數(shù)

fi組中值

Xi60以下60~7070~8080~9090~100100~110110以上10195036271485565758595105115-3-2-10123-30-38-500272824合計(jì)164---39【例3.8】算術(shù)平均數(shù)的簡(jiǎn)捷計(jì)算法

(算例)工人平均日產(chǎn)量:算術(shù)平均數(shù)的不足算術(shù)平均數(shù)易受極端變量值的影響,使得平均數(shù)代表性變小;而且受極大值的影響大于受極小值的影響。當(dāng)組距數(shù)列為開(kāi)口組時(shí),由于組中值不易確定,使平均數(shù)的代表性部很可靠。三、調(diào)和平均數(shù)調(diào)和平均數(shù)

(概念)調(diào)和平均數(shù)又稱(chēng)為“倒數(shù)平均數(shù)”,它是各個(gè)變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。計(jì)算公式為調(diào)和平均數(shù)

(概念)調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形,兩者的計(jì)算結(jié)果是相同的,僅計(jì)算的過(guò)程不同調(diào)和平均數(shù)

(算例:由平均數(shù)計(jì)算)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱(chēng)批發(fā)價(jià)格(元)

Xi成交額(元)m=XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合計(jì)—3690048000【例3.9】某蔬菜批發(fā)市場(chǎng)三種蔬菜的日成交數(shù)據(jù)如下表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格調(diào)和平均數(shù)

(算例:由相對(duì)數(shù)計(jì)算)某公司各企業(yè)計(jì)劃完成程度情況工廠(chǎng)計(jì)劃完成程度(%)

Xi計(jì)劃產(chǎn)值(萬(wàn)元)fi實(shí)際產(chǎn)值(萬(wàn)元)m=Xifi甲乙丙9510511512001280020001140134402300合計(jì)—1600016880【例3.10】某工業(yè)公司有三個(gè)工廠(chǎng),已知其計(jì)劃完成程度(%)及計(jì)劃產(chǎn)值資料如下表,計(jì)算平均計(jì)劃完成程度。調(diào)和平均數(shù)特點(diǎn):數(shù)列中各標(biāo)志值不能為零;受極端值影響,并且受極小值的影響大于受極大值的影響,但比算術(shù)平均數(shù)受極端值的影響要小。四、幾何平均數(shù)幾何平均數(shù)

(概念要點(diǎn))

幾何平均數(shù)又稱(chēng)“對(duì)數(shù)平均數(shù)”,它是若干項(xiàng)變量值連乘積開(kāi)其項(xiàng)數(shù)次方的算術(shù)根。當(dāng)各項(xiàng)變量值的連乘積等于總比率或總速度時(shí),適宜用幾何平均數(shù)計(jì)算平均比率或平均速度。幾何平均數(shù)

(簡(jiǎn)單幾何平均數(shù))其計(jì)算公式為可以用對(duì)數(shù)形式表示為幾何平均數(shù)

(簡(jiǎn)單幾何平均數(shù)算例)某工業(yè)產(chǎn)品產(chǎn)量平均發(fā)展速度計(jì)算表年份產(chǎn)品產(chǎn)量(億噸)逐年發(fā)展速度(X)(各年產(chǎn)量為前一年的%)逐年發(fā)展速度的對(duì)數(shù)(lgX)1993199419951996199719989.8010.5410.8010.8711.1611.41-107.6102.5100.6102.7102.2-2.03192.01072.00252.01152.0094合計(jì)—-10.0660【例3.11】我國(guó)某工業(yè)產(chǎn)品1994~1998年期間產(chǎn)量資料如下表,計(jì)算產(chǎn)品平均發(fā)展速度。幾何平均數(shù)

(簡(jiǎn)單幾何平均數(shù)算例)平均發(fā)展速度:用對(duì)數(shù)計(jì)算幾何平均數(shù)

(加權(quán)幾何平均數(shù))其計(jì)算公式為可以用對(duì)數(shù)形式表示為幾何平均數(shù)

(算例)【例3.12】投資銀行43年的利率分配為:1年為3%,4年為5%,8年為8%,10年為10%20年為15%。計(jì)算平均年利率。某投資銀行平均年利率計(jì)算表年利率發(fā)展速度(%)X年份f年利率發(fā)展速度的對(duì)數(shù)(lgX)flgX

10310510811011514810202.01282.02122.03342.04142.06072.01288.084816.267220.414041.214合計(jì)43-87.9929幾何平均數(shù)

(算例)45年的平均年利率為11.2617%幾何平均數(shù)

(特點(diǎn))數(shù)列中標(biāo)志值不能為零或負(fù);受極端值影響較算術(shù)平均數(shù)和調(diào)和平均數(shù)要小,較穩(wěn)??;適用于反映特定現(xiàn)象的平均水平,即現(xiàn)象的總體標(biāo)志值不是各單位標(biāo)志值的總和,而是各單位標(biāo)志值的連乘積。五、眾數(shù)眾數(shù)

(概念要點(diǎn))集中趨勢(shì)的測(cè)度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)總體的單位數(shù)較多,且分配集中,不呈均勻分布,總數(shù)才有意義眾數(shù)

(眾數(shù)的不唯一性)無(wú)眾數(shù)

原始數(shù)據(jù):10591268一個(gè)眾數(shù)

原始數(shù)據(jù):65

9855多于一個(gè)眾數(shù)

原始數(shù)據(jù):252828

364242品質(zhì)數(shù)列或單項(xiàng)數(shù)列的眾數(shù)

(算例)某城市居民關(guān)注廣告類(lèi)型的頻數(shù)分布

廣告類(lèi)型人數(shù)(人)比例頻率(%)

商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計(jì)2001100【例3.13】計(jì)算眾數(shù)解:這里的變量為“廣告類(lèi)型”,這是個(gè)定類(lèi)變量,不同類(lèi)型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類(lèi)別,即

Mo=商品廣告品質(zhì)數(shù)列或單項(xiàng)數(shù)列的眾數(shù)

(算例)【例3.14】解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類(lèi)別”。甲城市中對(duì)住房表示不滿(mǎn)意的戶(hù)數(shù)最多,為108戶(hù),因此眾數(shù)為“不滿(mǎn)意”這一類(lèi)別,即

Mo=不滿(mǎn)意甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶(hù)數(shù)(戶(hù))百分比(%)

非常不滿(mǎn)意

不滿(mǎn)意

一般

滿(mǎn)意

非常滿(mǎn)意24108934530836311510合計(jì)300100.0組距數(shù)列的眾數(shù)

(要點(diǎn)及計(jì)算公式)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)2.

公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布3.相鄰兩組的頻數(shù)相等時(shí),眾數(shù)組的組中值即為眾數(shù)Mo組距數(shù)列的眾數(shù)

(要點(diǎn)及計(jì)算公式)4.相鄰兩組的頻數(shù)不相等時(shí),眾數(shù)采用下列近似公式計(jì)算組距數(shù)列的眾數(shù)

(算例)某車(chē)間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計(jì)50—【例3.15】眾數(shù)的特點(diǎn)是位置平均數(shù),只考慮總體分布中最頻繁出現(xiàn)的變量值,不受極端值和開(kāi)口組的影響,增強(qiáng)了其代表性;當(dāng)分布數(shù)列中無(wú)明顯的集中趨勢(shì)而呈均勻分布時(shí),無(wú)眾數(shù);當(dāng)變量數(shù)列不等距分組時(shí),眾數(shù)不易確定。六、中位數(shù)和分位數(shù)中位數(shù)

(概念要點(diǎn))集中趨勢(shì)的測(cè)度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響各變量值與中位數(shù)的離差絕對(duì)值之和最小,即未分組數(shù)據(jù)的中位數(shù)

(計(jì)算公式)未分組數(shù)據(jù):未分組數(shù)據(jù)的中位數(shù)

(5個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù): 2422212620排序: 2021222426位置: 123

45中位數(shù)

22

未分組數(shù)據(jù)的中位數(shù)

(6個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):105 91268排序: 56891012位置: 123

4

56位置

N+126+123.5中位數(shù)

8+928.5

品質(zhì)數(shù)列或單項(xiàng)數(shù)列的中位數(shù)

(計(jì)算方法)1.位置公式:2.計(jì)算各組的累計(jì)頻數(shù)3.根據(jù)中位數(shù)的位置找出中位數(shù)單項(xiàng)數(shù)列的中位數(shù)

(算例)某廠(chǎng)工人日產(chǎn)零件中位數(shù)計(jì)算

按日產(chǎn)零件分組(件)工人數(shù)(人)向上累計(jì)頻數(shù)向下累計(jì)頻數(shù)26313234364131014271883132754728080775753268合計(jì)80--【例3.16】從向上累計(jì)和向下累計(jì)中可以找到累計(jì)頻數(shù)有40的那一組的標(biāo)志值為34,即Me=34件品質(zhì)數(shù)列的中位數(shù)

(算例)【例3.17】解:中位數(shù)的位置為:

300/2=150從累計(jì)頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此

Me=一般甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類(lèi)別甲城市戶(hù)數(shù)(戶(hù))累計(jì)頻數(shù)

非常不滿(mǎn)意

不滿(mǎn)意

一般

滿(mǎn)意

非常滿(mǎn)意2410893453024132225270300合計(jì)300—組距數(shù)列的中位數(shù)

(要點(diǎn)及計(jì)算公式)根據(jù)位置公式確定中位數(shù)所在的組假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布采用下列近似公式計(jì)算:Sm-1

中位數(shù)所在組以前各組的累計(jì)次數(shù)(向上累計(jì));Sm+1

中位數(shù)所在組以后各組的累計(jì)次數(shù)(向下累計(jì))。組距數(shù)列的中位數(shù)

(計(jì)算公式幾何證明)某班統(tǒng)計(jì)學(xué)學(xué)習(xí)成績(jī)成績(jī)(Xi)人數(shù)(Fi)向上累積頻數(shù)向下累計(jì)頻數(shù)60以下60~7070~8080~9090~100371093310202932322922123【例3.18】某班統(tǒng)計(jì)學(xué)成績(jī)?nèi)缦卤?,?jì)算中位數(shù)中位數(shù)組為70~80分組距數(shù)列的中位數(shù)

(計(jì)算公式幾何證明)組距數(shù)列的中位數(shù)

(算例)某車(chē)間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)向上累積頻數(shù)向下累計(jì)頻數(shù)105~110110~115115~120120~125125~130130~135135~1403581410643816304046505047423420104合計(jì)50—【例3.19】計(jì)算50名工人日加工零件數(shù)的中位數(shù)四分位數(shù)

(概念要點(diǎn))1. 集中趨勢(shì)的測(cè)度值之一2. 排序后處于25%和75%位置上的值3.不受極端值的影響Q1QMQ325%25%25%25%四分位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(Q1)位置=N+14上四分位數(shù)(Q3)位置=3(N+1)4下四分位數(shù)(Q1)位置=N4上四分位數(shù)(Q3)位置=3N4未分組數(shù)據(jù)的四分位數(shù)

(7個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 3032 282526排序:2123

2526283032位置:1 23 4567N+1Q1=237+1Q1位置=4=4=2Q3位置=3(N+1)43(7+1)4==6Q3

=30

未分組數(shù)據(jù)的四分位數(shù)

(6個(gè)數(shù)據(jù)的算例)原始數(shù)據(jù):2321 30 282526排序:212325262830位置:1 2 3 4 56Q1=21+0.75(23-21)=22.5Q1位置=N+

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論