統(tǒng)計學教學課件(完整版)_第1頁
統(tǒng)計學教學課件(完整版)_第2頁
統(tǒng)計學教學課件(完整版)_第3頁
統(tǒng)計學教學課件(完整版)_第4頁
統(tǒng)計學教學課件(完整版)_第5頁
已閱讀5頁,還剩359頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1.教材:胡寶珠主編.統(tǒng)計學.北京:中國發(fā)展出版社.2011.2.課程特點:邏輯性強,注重運用,強調理解,運用高數(shù)和概率論相關基礎知識。3.課程重點難點:用星號(*)標注。4.考核方法暫定。第一講緒論第二講統(tǒng)計數(shù)據(jù)的搜集、整理與顯示第三講統(tǒng)計分析的綜合指標第四講抽樣與抽樣分布第五講參數(shù)估計第六講假設檢驗第七講方差分析第八講相關與回歸分析

本講目的和要求1.形成對統(tǒng)計學的基本認識;2.理解統(tǒng)計學的研究對象;3.了解統(tǒng)計學的發(fā)展過程;4.掌握統(tǒng)計學的基本概念;5.了解統(tǒng)計學的研究方法。本講重點難點1.統(tǒng)計學的研究對象;2.統(tǒng)計學的基本概念。1統(tǒng)計學的研究對象和性質1.1統(tǒng)計的含義

一般而言,統(tǒng)計包含統(tǒng)計工作、統(tǒng)計資料和統(tǒng)計學三種含義。

統(tǒng)計工作是指利用科學的方法,對經(jīng)濟、社會以及自然現(xiàn)象總體數(shù)量方面的資料進行搜集、整理和分析的過程。

統(tǒng)計資料是指統(tǒng)計部門或單位進行工作時所搜集、整理、編制的各種統(tǒng)計數(shù)據(jù)資料的總稱,它包括原始的調查以及經(jīng)過整理、分析而形成的系統(tǒng)的統(tǒng)計資料。

統(tǒng)計學是研究如何搜集、整理、顯示和分析統(tǒng)計數(shù)據(jù),反映客觀現(xiàn)象總體數(shù)量特征和數(shù)量規(guī)律的方法論科學。1.2統(tǒng)計學的研究對象(*)統(tǒng)計是從量的方面對客觀現(xiàn)象進行觀察和研究。統(tǒng)計研究客觀事物數(shù)量方面的目的在于,通過對事物量的方面的觀察及其變化規(guī)律的研究,逐步把握事物質的方面。在客觀現(xiàn)象量的方面的研究內容包括數(shù)量特征、現(xiàn)象之間的數(shù)量聯(lián)系、現(xiàn)象數(shù)量的變化規(guī)律、現(xiàn)象質與量互變的數(shù)量界限。因此,統(tǒng)計學的研究對象是客觀現(xiàn)象總體的數(shù)量特征、數(shù)量關系和數(shù)量界限。統(tǒng)計學的研究對象主要有以下特點:(1)數(shù)量性客觀現(xiàn)象的數(shù)量包括以下三方面:數(shù)量特征、客觀現(xiàn)象之間的數(shù)量關系、質變的數(shù)量界限。(2)總體性總體性是指統(tǒng)計學的研究對象是客觀現(xiàn)象總體的數(shù)量方面,而不是個體的數(shù)量方面。統(tǒng)計研究雖然是從調查登記個別單位的具體數(shù)量特征開始,但目的卻在于認識現(xiàn)象總體的數(shù)量特征。(3)具體性具體性是指統(tǒng)計學所研究的數(shù)量都是客觀現(xiàn)象在具體的時間、地點、條件下的數(shù)量表現(xiàn),而不是抽象的數(shù)量,它總是與實物的質緊密聯(lián)系。(4)變異性統(tǒng)計學研究的是同類現(xiàn)象總體的數(shù)量特征,前提是總體各單位的特征表現(xiàn)存在著差異,否則就沒有研究的必要。引起差異的原因分為固定原因和非固定原因,非固定原因具有隨機性,統(tǒng)計上把總體各單位由于隨機因素引起的標志表現(xiàn)的差異稱為變異,變異才需要用統(tǒng)計方法進行研究。1.3統(tǒng)計學的性質統(tǒng)計學是一門認識方法論科學,而不是實質性科學。

2統(tǒng)計學的產生和發(fā)展從統(tǒng)計學的產生和發(fā)展來看,大致可以分為三個階段:古典統(tǒng)計學、近代統(tǒng)計學和現(xiàn)代統(tǒng)計學。2.1古典統(tǒng)計學(17世紀中葉到18世紀中葉)(1)國勢學派主要運用簡單的文字記述來論述和反映各國國情,沒有運用比較、因果等分析方法,但卻開始使用“statisticum”(統(tǒng)計學)一詞。(2)政治算術學派代表人物威廉·配第在《政治算數(shù)》一書中,運用數(shù)字、重量和尺度等統(tǒng)計方式對當時的英國、荷蘭、法國之間的“國富和力量”進行數(shù)量上的計算和比較。以配第為代表的政治算數(shù)學派以數(shù)量分析為特征,并且研究客觀現(xiàn)象之間的數(shù)量關系,算是統(tǒng)計學的正統(tǒng)起源。2.2近代統(tǒng)計學(18世紀末到19世紀末)(1)數(shù)理統(tǒng)計學派將概率論引入統(tǒng)計學,使統(tǒng)計學發(fā)生了質的變化,從而使統(tǒng)計學從古典統(tǒng)計學發(fā)展為近代統(tǒng)計學。代表人物拉普拉斯、凱特勒。(2)社會統(tǒng)計學派將統(tǒng)計學派運用于社會現(xiàn)象研究之中,代表人物恩格爾和梅爾。恩格爾曾將統(tǒng)計過程分為統(tǒng)計調查、整理和分析三個階段,并通過調查英、德、法和比利時等國的工人家庭,撰寫了《比利時工人家庭的生活費》一書,提出著名的恩格爾定律。2.3現(xiàn)代統(tǒng)計學(20世紀初到現(xiàn)在)(1)歐美數(shù)理統(tǒng)計學推斷統(tǒng)計成為主流統(tǒng)計學,大量的推斷統(tǒng)計理論產生,如戈賽特的小樣本t統(tǒng)計量理論,費雪的F統(tǒng)計量、極大似然估計、實驗設計和方差分析,高爾頓的相關與回歸理論,皮爾遜的卡方統(tǒng)計量及其極限分布等。因從歐美發(fā)展起來,故稱為歐美數(shù)理統(tǒng)計學。(2)社會經(jīng)濟統(tǒng)計學源起蘇聯(lián),受社會統(tǒng)計學派的影響而產生,認為數(shù)理統(tǒng)計學是數(shù)學,強調統(tǒng)計學的階級性方面。3統(tǒng)計學的分科3.1描述統(tǒng)計學與推斷統(tǒng)計學(1)描述統(tǒng)計學其內容包括統(tǒng)計數(shù)據(jù)的搜集方法、加工處理方法、顯示方法、數(shù)據(jù)分布特征的概括和分析方法等,分為集中趨勢分析、離散程度分析和相關分析三大部分。(2)推斷統(tǒng)計學推斷統(tǒng)計學是在概率論的基礎上研究如何根據(jù)隨機樣本的數(shù)量特征來推斷總體未知的數(shù)量特征,并作出具有一定可靠程度的估計或檢驗,主要包括參數(shù)估計和假設檢驗兩種類型。(3)描述統(tǒng)計學與推斷統(tǒng)計學的關系描述統(tǒng)計學和推斷統(tǒng)計學是使用統(tǒng)計方法探索客觀事物數(shù)量規(guī)律性的不同過程。在進行統(tǒng)計研究的過程中,如果搜集到的是總體數(shù)據(jù)(如普查數(shù)據(jù)),那么運用描述統(tǒng)計學就可以達到認識總體數(shù)量規(guī)律性的目的;如果獲得的只是總體的一部分數(shù)據(jù)(即樣本數(shù)據(jù)),那么要找到總體的數(shù)量規(guī)律性,就要根據(jù)樣本信息,運用分布理論大數(shù)定律和中心極限定理等概率論的理論,對總體進行科學的推斷。描述統(tǒng)計是整個統(tǒng)計學的基礎,推斷統(tǒng)計則是現(xiàn)代統(tǒng)計學的主要內容。從描述統(tǒng)計學到推斷統(tǒng)計學,既反映了統(tǒng)計學發(fā)展的巨大成就,也是統(tǒng)計學發(fā)展成熟的重要標志。3.2理論統(tǒng)計學和應用統(tǒng)計學理論統(tǒng)計學主要是進行統(tǒng)計學的數(shù)學原理和統(tǒng)計公式的推導和證明,應用統(tǒng)計學探討如何從所研究的領域或專門問題出發(fā),依據(jù)探討對象的性質而采用適當?shù)慕y(tǒng)計學原理去解決問題。理論統(tǒng)計學是以方法為中心建立統(tǒng)計方法體系,而應用統(tǒng)計學則是以問題為中心運用統(tǒng)計方法分析和解決問題。4統(tǒng)計學的基本概念(*)4.1統(tǒng)計總體和總體單位統(tǒng)計總體簡稱總體,是統(tǒng)計所要研究的客觀事物或現(xiàn)象的全體,即由客觀存在的,具有某種共同特征的許多個別事物構成的整體。形成統(tǒng)計總體的個別事物叫做總體單位,簡稱單位或個體。統(tǒng)計總體的特點有:(1)大量性大量性是指總體應該由足夠數(shù)量的同質單位構成,而不能只有個別或少量單位。這是因為個別單位的現(xiàn)象具有很大偶然性,大量現(xiàn)象的總體則相對穩(wěn)定,表現(xiàn)出共同的傾向,這樣才能發(fā)現(xiàn)總體的數(shù)量規(guī)律。根據(jù)數(shù)量是否有限,總體分為有限總體和無限總體兩種。(2)同質性同質性是指構成總體的所有單位,必須具有某種共同屬性。(3)相對性總體和總體單位的概念是相對的,隨著研究目的的不同而相互轉化。同一研究對象,在這種情況下是總體,在另外一種情況下則可能變成個體。(4)差異性差異性是指構成總體的各個單位,除了在某方面同質外,在其他某些方面必須存在差異。4.2樣本和樣本單位樣本是從總體中抽取出來的,作為代表這一總體的部分單位組成的集合體。構成樣本的每個個體成為樣本單位。樣本必須具有以下4個方面的特征:(1)必須取自全體及內部;(2)取值是可變的;(3)必須具有代表性;(4)必須具有客觀性。4.3標志和標志表現(xiàn)標志,是指總體各單位共同具有的屬性或特征,它是說明個體屬性或特征的具體名稱。只有總體每個個體都具有的屬性或特征才被作為統(tǒng)計總體的標志。標志按其性質不同,可以分為品質標志和數(shù)量標志。前者表明個體屬性方面的特征,只能用文字、語言來描述,如性別,不能用數(shù)量表示,后者表明個體數(shù)量特征,可以用數(shù)量表示,如年齡。按照標志表現(xiàn)是否相同,可以分為不變標志和可變標志。布標標志是總體同質性的基礎,一個總體至少要有一個不變標志,當然,一個總體同時必須具有至少一個可變標志。4.4統(tǒng)計指標統(tǒng)計指標,也叫指標,是反映統(tǒng)計總體數(shù)量特征的概念(名稱)和數(shù)值,由各個個體的標志差異匯總綜合而成。一個完整的統(tǒng)計指標由指標名稱和指標數(shù)值兩項基本要素構成。標志反映的是個體屬性和特征,指標反映的是總體的數(shù)量特征。按反映內容的不同,統(tǒng)計指標按其反映的總體內容不同可以分為數(shù)量指標和質量指標。前者反映研究總體的規(guī)模和水平,又稱為絕對指標或總量指標,后者反映總體質方面的特征,一般用相對數(shù)或平均數(shù)表示。4.5指標體系統(tǒng)計指標體系是由一系列相互聯(lián)系的統(tǒng)計指標所組成的具有特定功能的有機整體,用來反映負責現(xiàn)象的數(shù)量特征及其相互關系。4.6參數(shù)和統(tǒng)計量參數(shù)是用來描述總體特征的概括性數(shù)字度量。統(tǒng)計量是用來描述樣本特征的概括性數(shù)字度量。4.7變量和變量值變量是可以取不同數(shù)值的量。如,商品的銷售額、人的受教育程度、產品的質量等級等。變量的具體取值叫變量值,包括標志值和指標數(shù)值。按照取值是否連續(xù),可將變量分為離散型變量和連續(xù)型變量。按照所有因素的影響不同,還可以分為確定性變量和隨機性變量。5統(tǒng)計學的研究方法5.1實驗設計5.2大量觀察法5.3統(tǒng)計分組法5.4綜合指標法5.5統(tǒng)計模型法5.6統(tǒng)計推斷法本章小結1.理解統(tǒng)計學研究對象的特點;2.掌握統(tǒng)計學的基本概念。思考與練習

本講目的和要求1.掌握統(tǒng)計數(shù)據(jù)的分類2.了解統(tǒng)計調查的過程3.掌握專門調查的幾種形式及其適用情況本講重點難點1.統(tǒng)計數(shù)據(jù)的分類2.統(tǒng)計調查幾種形式的適用情況1統(tǒng)計數(shù)據(jù)的計量尺度和分類1.1統(tǒng)計數(shù)據(jù)的計量尺度對數(shù)據(jù)的屬性、特征進行分類、標示和計算,稱為統(tǒng)計計量或統(tǒng)計量度。統(tǒng)計計量可以分為四個層次或四種計量尺度。(1)

定類尺度定類尺度是按照客觀現(xiàn)象的某種屬性對其進行分類或分組,各類各組之間的關系是并列、平等而相互排斥的。定類尺度是最粗略、計量層次最低的計量尺度,數(shù)字只作為現(xiàn)象總體中不同類別或不同組別的代碼,不反映各類的優(yōu)劣、量的大小或順序,不可區(qū)分大小或進行任何數(shù)據(jù)運算。(2)定序尺度定序尺度是對各類客觀現(xiàn)象之間的等級差或順序差的一種測度。定序尺度不僅可以將對象分為不同的類別,而且可以反映各類的優(yōu)劣、量的大小和順序。定序尺度只是測度了類別之間的順序,而未測量出類別之間的精確差值,其計量結果只能比較大小,不能進行加減乘除的數(shù)學運算。(3)定距尺度定距尺度也稱間隔尺度,是對事物類別或次序之間間距的計量,通常使用自然或度量單位作為計量尺度,其計量結果可以進行加減計算,卻不能進行乘除運算,因為在等級序列中沒有固定的、有確定意義的絕對“零”位。(4)定比尺度定比尺度是在定距尺度的基礎上,確定可以作為比較的基數(shù),將兩種相關的數(shù)加以對比,從而形成新的相對數(shù),用以反映現(xiàn)象的構成、比重、速度、密度等數(shù)量關系的計量尺度,由于它是在比較基礎上形成的尺度,所以能夠顯示更加深刻的意義。如人均國內生產總值、人口密度等。上述四種計量尺度是從低級到高級、從粗略到精確逐步遞進的,高層次的計量尺度具有低層次計量尺度的全部特征,但反之卻不是這樣?!纠}·單選題】按低級到高級、粗略到精確順序排列的數(shù)據(jù)計量尺度是()。A.定比尺度、定距尺度、定類尺度、定序尺度B.定序尺度、定比尺度、定類尺度、定距尺度C.定類尺度、定序尺度、定距尺度、定比尺度D.定類尺度、定距尺度、定序尺度、定比尺度【答案】C【解析】本題考查統(tǒng)計數(shù)據(jù)的計量尺度。按低級到高級、粗略到精確順序排列的數(shù)據(jù)計量尺度是:定類尺度、定序尺度、定距尺度、定比尺度。1.2統(tǒng)計數(shù)據(jù)的分類根據(jù)統(tǒng)計計量尺度的不同,統(tǒng)計數(shù)據(jù)可以分為以下四種類型:定類數(shù)據(jù)——表現(xiàn)為類別,但不區(qū)分順序,由定類尺度計量所形成;定序數(shù)據(jù)——表現(xiàn)為類別,但區(qū)分順序,由定序計量所形成;定距數(shù)據(jù)——表現(xiàn)為數(shù)值,可做加減運算,由定距尺度計量所形成。定比數(shù)據(jù)——表現(xiàn)為數(shù)值,可做加減乘除運算,由定比尺度計量形成。前兩類數(shù)據(jù)也成為定序數(shù)據(jù)或品質數(shù)據(jù),說明的是事物的品質特征,不能用數(shù)值表示,其結果均表現(xiàn)為類別;后兩類數(shù)據(jù)也成為定量數(shù)據(jù)或數(shù)值型數(shù)據(jù),說明的是現(xiàn)象的數(shù)量特征,能夠用數(shù)值來表示。對不同類型數(shù)據(jù),適用的統(tǒng)計處理和分析方法不同,適用于低層次測量數(shù)據(jù)的統(tǒng)計方法,也適用于較高層次的測量數(shù)據(jù),因為后者具有前者的數(shù)學特性。適用于高層次測量數(shù)據(jù)的統(tǒng)計方法,不一定適用于低層次的測量數(shù)據(jù),因為低層次數(shù)據(jù)不具有高層次測量數(shù)據(jù)的數(shù)學特性。2統(tǒng)計調查2.1統(tǒng)計調查的概念

統(tǒng)計調查就是根據(jù)統(tǒng)計研究的目的和要求,采取科學的調查方法,有目的、有計劃、有組織地從客觀實際中搜集資料的過程。2.2統(tǒng)計調查方案的設計(1)確定調查目的(2)確定調查對象和調查單位(總體和個體)(3)確定調查項目和調查表調查項目就是調查總所要登記的調查單位的特征,這些特征在統(tǒng)計上又稱為標志。(4)確定調查時間和調查期限調查時間是指調查資料所屬的時間(時期或時點),如第六次人口普查的時點是2010年11月1日零時。調查期限是指調查工作從開始到結束的時間,包括搜集資料和報送資料的整個工作所需要的時間。2.3統(tǒng)計報表統(tǒng)計調查按其組織形式不同,可以分為統(tǒng)計報表和專門調查。統(tǒng)計報表是一種以全面調查為主的調查方式,是按照國家統(tǒng)一規(guī)定的表格形式、統(tǒng)一規(guī)定的報送程序和報送時間,由填報單位自下而上逐級提供統(tǒng)計資料的一種統(tǒng)計調查方式。(1)分類按照性質和要求的不同,統(tǒng)計報表可以分為以下幾類:①按報表內容和實施范圍不同,分為國家、部門和地方統(tǒng)計報表。②按報送周期長短的不同,統(tǒng)計報表可分為日報、旬報、月報、季報、半年報和年報。③按填報單位不同,分為基層統(tǒng)計報表和綜合統(tǒng)計報表。(2)優(yōu)點①來源可靠它是根據(jù)國民經(jīng)濟和社會發(fā)展宏觀管理的需要而周密設計的統(tǒng)計信息系統(tǒng),從基層單位日常業(yè)務的原始記錄和臺賬(即原始記錄分門別類的系統(tǒng)積累和總結)到包含一系列登記項目和指標,都可以力求規(guī)范和完善,使調查資料具有可靠的基礎,保證資料的統(tǒng)一性,便于在全國范圍內匯總、綜合。②回收率高它是依靠行政手段執(zhí)行的報表制度,要求嚴格按照規(guī)定的時間和程序上報,因此,具有100%的回收率;而且填報的項目和指標具有相對的穩(wěn)定性,可以完整地積累形成時間序列資料,便于進行歷史對比和社會經(jīng)濟發(fā)展變化規(guī)律的系統(tǒng)分析。③方式靈活它既可以越級匯總,也可以層層上報、逐級匯總,以便滿足各級管理部門對主管系統(tǒng)和區(qū)域統(tǒng)計資料的需要。(3)缺點費時費力;受干擾多;缺乏靈活性。(4)適用情況和要求a.對國民經(jīng)濟和社會發(fā)展進行計劃管理和宏觀調控時;b.要求各基層單位有很完善的記錄,也要求有專業(yè)化的統(tǒng)計隊伍。2.4專門調查專門調查:是為了某一特定目的而專門組織的統(tǒng)計調查。根據(jù)專門調查的組織形式不同,專門調查具體包括:普查、抽樣調查、重點調查、典型調查等。(1)普查普查是專門組織的一次性的全面調查,用來調查屬于一定時點或時期內的社會經(jīng)濟現(xiàn)象的總量。普查可以取得被調查事物總體的全面情況。通過普查,從宏觀上看,可以摸清一個國家的國情和國力,了解一個國家的人力資源的現(xiàn)狀和利用情況。從微觀上看,普查也可以用于某些小范圍的市場調查。例如,對市場上某種產品的供應,銷售及庫存的全面調查。①組織方式普查的組織方式一般有兩種:a.建立專門的普查機構,配備大量的普查人員,對調查單位進行直接的登記,如人口普查等。b.是利用調查單位的原始記錄和核算資料,頒發(fā)調查表,由登記單位填報,如物資庫存普查等。②特點a.普查通常是一次性的或周期性的b.規(guī)定統(tǒng)一的標準時點c.規(guī)定統(tǒng)一的普查期限d.規(guī)定普查的項目和指標e.普查的數(shù)據(jù)一般比較準確,規(guī)范化程度也較高,因此它可以為抽樣調查或其他調查提供基本依據(jù)。f.普查的使用范圍比較窄,只能調查一些最基本及特定的現(xiàn)象。(2)重點調查重點調查是一種非全面調查,它是在全部單位中選擇一部分重點單位進行調查,以取得統(tǒng)計數(shù)據(jù)的一種非全面調查方法。重點單位,是指在總體中具有舉足輕重的單位,這些單位雖然數(shù)目不多,但就調查的標志值來說,它們在總體中卻占了絕大部分比重。通過對這些單位的調查,能夠反映出整個研究對象的基本情況。①優(yōu)點調查單位少,可以調查較多的指標。②適用情況當調查任務只要求掌握總體的基本情況,而且總體中確實存在重點單位③關鍵問題確定重點單位,要根據(jù)調查任務而定。應選擇管理健全、統(tǒng)計基礎工作較好的單位,以便統(tǒng)計調查的實施。(3)典型調查典型調查也是一種非全面調查,它是根據(jù)調查研究的目的和要求,在對總體進行全面分析的基礎上,有意識地選擇其中有代表性的典型單位進行深入細致的調查,借以認識事物的本質特征、因果關系和發(fā)展變化趨勢。

典型單位,是指那些最充分、最集中地體現(xiàn)總體某方面共性的單位。①優(yōu)點有利于研究尚未充分發(fā)展、處于萌芽狀態(tài)的新生事物或某種傾向性的社會問題;能夠分析事物的不同類型,研究它們之間的差別和相互關系。②適用情況總體內部差別不大,或分類后各類型內部差別不大。③關鍵問題確定典型單位,選典的方法有:解剖麻雀、劃類選典、抓兩頭。(4)抽樣調查抽樣調查是實際中應用最廣泛的一種調查方法,是按照科學的方法從總體中抽取部分單位組成樣本,對樣本指標進行測定,并據(jù)此對總體的數(shù)量特征進行估計和判斷,是一種非全面調查。①特點a.與全面調查相比,省時省力,靈活。b.有些情況下,抽樣調查的結果比全面調查要準確。c.抽樣時要盡量遵循隨機原則。d.抽樣調查會產生抽樣誤差,抽樣誤差可以計算,且能夠加以控制。②適用范圍a.不能進行全面調查的事物。有些事物在測量或試驗時有破壞性,不可能進行全面調查。如電視的抗震能力試驗,燈泡的耐用時間試驗等。b.有些總體從理論上講可以進行全面調查,但實際上不能進行全面調查的事物。如了解某個森林有多少棵樹,職工家庭生活狀況如何等。c.抽樣調查方法可以用于工業(yè)生產過程中的質量控制。d.利用抽樣推斷的方法,可以對于某種總體的假設進行檢驗,來判斷這種假設的真?zhèn)?,以決定取舍。2.5統(tǒng)計調查體系統(tǒng)計調查體系是指若干相互聯(lián)系的統(tǒng)計調查方法所構成的整體。1統(tǒng)計數(shù)據(jù)的內容1.1統(tǒng)計數(shù)據(jù)整理的概念及意義1.2統(tǒng)計數(shù)據(jù)整理的內容1.3統(tǒng)計數(shù)據(jù)整理的程序(1)調查資料的審核(2)調查資料的分組(3)調查資料的匯總(4)編制統(tǒng)計表和繪制統(tǒng)計圖(5)統(tǒng)計資料的積累、保管和公布1.4統(tǒng)計數(shù)據(jù)的預處理

(1)統(tǒng)計數(shù)據(jù)的審核①審核資料的完整性②審核資料的準確性:邏輯檢查、計算檢查

③歷史資料的審核:可靠程度、指標含義、所屬時間與空間范圍、計算方法和分組條件與規(guī)定的要求是否一致。(2)數(shù)據(jù)審核后的訂正①對于可以確定的一般錯誤,應及時代為更正,并向有關單位核對。②對于可疑的數(shù)據(jù)或無法代為更正的錯誤,應通知原報單位核對數(shù)據(jù)。③如果發(fā)現(xiàn)的差錯在其他單位也可能發(fā)生時,除通知原報單位更正外,還要將差錯情況通報尚未報送資料的單位,以免發(fā)生類似錯誤。④對于嚴重的錯誤,應發(fā)還重新填報,并查明發(fā)生錯誤的原因,若屬于違法行為,則應嚴肅處理。(3)數(shù)據(jù)的排序2統(tǒng)計分組2.1統(tǒng)計分組的概念根據(jù)客觀現(xiàn)象的特點和統(tǒng)計研究的目的和任務,按照一定的標志把總體劃分為若干不同性質的組或類型,稱為統(tǒng)計分組。2.2統(tǒng)計分組的原則(1)

科學性原則統(tǒng)計分組一定要從統(tǒng)計研究的目的出發(fā),使組與組之間在某一方面具有顯著的差異,而組內各單位在該方面具有同質性。關鍵是正確選擇分組標志和正確劃分分組界限。(2)窮盡性原則該原則是指任何一個總體單位或任何一個原始數(shù)據(jù)都能歸屬于某一個組,也就是不能遺漏參與分組的總體中所有的單位。(3)互斥性原則該原則是指在特定的分組標志下,任何一個總體單位或任何一個原始數(shù)據(jù),在一種統(tǒng)計分組中只能歸屬于某一個組,而不能歸屬于兩個或兩個以上的組。2.3統(tǒng)計分組的種類

(1)按照分組標志的多少,可以分為簡單分組體系和復雜分組體系兩種。①平行分組體系對同一總體選擇兩個或兩個以上的標志分別進行簡單分組,就形成平行分組體系。例如對人口按年齡、性別、文化程度等標志分別進行簡單分組,可得到一個平行的分組體系,如圖1所示。平行分組體系的特點是:每一個分組只能反映各總體單位在一個標志上的差異,而不反映其他標志的差異,在其他標志上的差異仍然存在。②復合分組體系對同一總體同時選擇兩個或兩個以上標志層疊起來進行分組形成復合分組體系。例如,為了了解我國高等學校在校學生的基本狀況,可同時選擇學科、學歷、性別等三個標志進行復合分組,得到的復合分組體系如圖2所示。建立復合分組體系,應根據(jù)統(tǒng)計分析的要求,在選擇分組標志的同時,確定它們的主次順序。首先要按照主要標志對總體單位進行第一次分組,然后按次要的標志在第一次分組的基礎上進行第二次分組,依次按所有標志分組至最后一層為止。(2)按分組標志的性質,分為品質分組和數(shù)量分組。①品質分組是按品質標志進行的分組,即按事物的某種屬性分組。如企業(yè)按照經(jīng)濟類型、行業(yè)分組;人口按照性別、民族分組;大學生按專業(yè)分組等。②數(shù)量分組是按數(shù)量標志進行的分組。如企業(yè)按生產能力、勞動生產率分組;人口按年齡、身高分組等。2.4統(tǒng)計分組的方法(1)分組標志的選擇①要符合統(tǒng)計研究的目的和任務要求②必須選擇最重要的標志作為分組依據(jù)③要考慮到客觀現(xiàn)象所處的具體歷史條件(2)統(tǒng)計分組方法①按品質標志分組簡單的品質標志分組(如血型)、復雜的品質標志分組(如工業(yè)產品分類目錄)②按數(shù)量標志分組2.5數(shù)量標志分下的相關概念(1)單項式分組與組距式分組①單項式分組單項式分組是指每組只包含一個變量值的分組。比如,將工人按照日產量分組,如下表所示。單項式分組一般適用于那些變量值不多、變動范圍較小的離散型變量。表3-1企業(yè)工人日產量完成情況表下列分組中屬于按數(shù)量標志分組的是()。A.企業(yè)按所有制分組B.企業(yè)按產值分組C.企業(yè)按工人數(shù)分組D.按計劃完成程度分組E.企業(yè)按隸屬關系分組按日產量分組(件)工人數(shù)(人)比例(%)352010.00362512.50473015.00583517.50694020.00705025.00合計200100.00【正確答案】BCD【答案解析】按數(shù)量標志分組是指選擇反映現(xiàn)象數(shù)量特征的數(shù)量標志作為分組標志。BCD屬于按數(shù)量標志分組。②組距式分組組距式分組是將變量依次劃分為幾個區(qū)間,各個變量值則按其大小確定所應歸并的區(qū)間,各區(qū)間內的所有變量值作為一組,其性質相同,組與組之間性質相異。組距式分組適用于連續(xù)型變量或者變動范圍較大的離散型變量。

表3-2人均居住面積表人均居住面積(平方米)人數(shù)(人)比例(%)40以上202020-40202010-20404010以下2020合計100100(2)開口式分組與閉口式分組開口式分組的組距和組限無法直接計算,統(tǒng)計上一般按最鄰近組推算,將相鄰組的組距作為本組的組距。(3)間斷組距式分組和連續(xù)組距式分組間斷組距式分組是指組限不相連(或不重疊)的分組。連續(xù)組距式分組是指組限相連的分組,即以同一數(shù)值作為相鄰兩組的共同界限的分組。適用情況:如果變量值只是在整數(shù)之間變動,例如職工人數(shù),則可采用間斷組距式分組,也可采用連續(xù)組距式分組;如果變量值在一定范圍內表現(xiàn)為既可以是整數(shù)也可以是小數(shù)的連續(xù)型變量,只能采用連續(xù)組距式分組?!吧暇€不在內”原則:出于統(tǒng)計分組的窮盡性和互斥性原則,統(tǒng)計上規(guī)定凡是總體某一個單位的變量值是相鄰兩組的界限值時,這一變量值應歸入作為下限值的那一組內。(4)等距分組與異距分組等距分組是指標志值在各組中保持相等組距的分組,凡是在標志值變動比較均勻的情況下,都可采用等距分組。如工人的年齡、工齡、工資的分組。異距分組是指各組組距并不完全相等的分組,其適用情況有以下幾種:①標志值分布不是很均勻的場合。②標志值相等的量具有不同意義的場合。③標志值按一定比例發(fā)展變化的場合。(5)組距、組數(shù)與組中值的計算①組距組距是指各組最大標志值和最小標志值之差。根據(jù)上限不在內原則,在連續(xù)組距式分組中,組距的計算公式應為:組距=本組上限-本組下限在間斷組距式分組中,組距的計算公式應為:組距=本組上限-本組下限+1或=本組上限-前組上限或=本組下限-前組下限②組數(shù)組數(shù)的多少直接取決于兩個因素,一是總體的全距,另一個是組距。全距是全體中最大的標志值與最小的標志值之差。在等距分組的條件下,組數(shù)等于全距除以組距。③組中值組中值:各組中點位置所對應的變量值。其計算公式為:組中值=(本組上限+本組下限)/2【閉口組】組中值=本組上限-本組組距/2【下開口組】組中值=本組下限+本組組距/2【上開口組】其中:開口組的組距是以相鄰組的組距作為本組組距當各組標志值均勻分布時,用組中值來代表各組標志值的水平,其代表性就好,反之,代表性就差。以人均居住面積表為例,因相鄰組的組距是20,人均居住面積在40平米以上的組的組距也就為20,其組中值為50。3統(tǒng)計數(shù)據(jù)的整理與顯示對定性數(shù)據(jù)主要是分類整理,對定量數(shù)據(jù)主要是分組整理。3.1定類數(shù)據(jù)的整理與顯示(1)定類數(shù)據(jù)的整理——頻數(shù)與頻數(shù)分布頻數(shù)是落在某一特定類別或組中的數(shù)據(jù)個數(shù)。把各個類別及落在其中的相應頻數(shù)全部列出,并用表格形式表現(xiàn)出來,稱為頻數(shù)分布。表3-3不同品牌電腦的銷售數(shù)量(2)定類數(shù)據(jù)的顯示①條形圖和柱形圖當類別在縱軸,為條形圖;當類別在橫軸,為柱形圖。②帕累托圖帕累托圖按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制柱形圖。③圓形圖又稱餅形圖,主要用于表示總體中各組成部分所占的比例,對研究結構性問題十分有用。電腦品牌頻數(shù)比例百分比(%)聯(lián)想150.3030IBM110.2222戴爾90.1818惠普60.1212三星90.1818合計501100電腦品牌第一季度第二季度聯(lián)想250352IBM263189戴爾356278惠普410456表3-4不同電腦品牌的季度銷售量3.2定序數(shù)據(jù)的整理與顯示定序數(shù)據(jù)是只能歸于某一有序類的非數(shù)字型數(shù)據(jù)。對于定序數(shù)據(jù),除了可使用定類數(shù)據(jù)的整理和顯示技術外,還可以計算累計頻數(shù)和累積頻率。(1)定序數(shù)據(jù)的整理——累計頻數(shù)和累計概率累計頻數(shù)是將各有序類別或組的頻數(shù)逐級累加起來得到的頻數(shù),頻數(shù)的兩種累計方法:一是從類別順序的開始一方向類別順序的最后一方累加頻數(shù),稱為向上累計;二是從類別順序的最后一方向類別順序的開始一方累加頻數(shù),稱為向下累計?!纠?.1】在一項有關住房問題的研究中,調查人員在甲乙兩個城市各抽樣調查300戶家庭,其中一個問題是:“您對您家庭目前的住房狀況是否滿意?”備選答案有:(1)非常不滿意;(2)不滿意;(3)一般;(4)滿意;(5)非常滿意。調查結果如表3-5和表3-6所示。回答類別甲城市戶數(shù)(戶)百分比(%)向上累計向下累計戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)非常不滿意248248300100不滿意108361324427692一般93312257516856滿意4515270907525非常滿意30103001003010合計300100————————表3-5甲城市家庭對住房狀況評價的頻數(shù)分布回答類別乙城市戶數(shù)(戶)百分比(%)向上累計向下累計戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)非常不滿意217217300100不滿意99331204027993一般78261986618060滿意64212628710234非常滿意38133001003813合計300100————————表3-6乙城市家庭對住房狀況評價的頻數(shù)分布(2)定類數(shù)據(jù)的顯示①累計頻數(shù)分布圖根據(jù)累計頻數(shù)或累計頻率,可以繪制累計頻數(shù)分布或頻率圖。如根據(jù)表3-5甲城市家庭對住房狀況評價的頻數(shù)分布數(shù)據(jù)繪制的累計頻數(shù)如圖3-8和圖3-9所示。圖3-8向上累計②環(huán)形圖環(huán)形圖可以顯示多個總體各部分所占的相應比例,從而有利于進行比較研究。根據(jù)表3-5和表3-6的數(shù)據(jù)繪制兩個城市家庭對住房狀況評價的環(huán)形圖,如圖3-10所示。3.3數(shù)值型數(shù)據(jù)的整理與顯示(1)數(shù)值型數(shù)據(jù)的整理——累計頻數(shù)和累積頻率某組向上累計頻數(shù)表明該組上限以下的各組單位數(shù)之和,某組向上累計頻率表明該組上限以下的各組單位數(shù)之和占總體單位數(shù)的比重。某組向下累計頻數(shù)表明該組下限以上的各組單位數(shù)之和,某組向下累計頻數(shù)表明該組下限以上的各組單位數(shù)之和占總體單位數(shù)的比重。現(xiàn)在以表3-7中50戶居民某月購買消費品支出額的資料為例,分別進行向上和向下累計,其結果如表中所示。居民月消費支出額分組向上累計向下累計頻數(shù)累計頻數(shù)頻率(%)累計頻率(%)頻數(shù)累計頻數(shù)頻率(%)累計頻率(%)800-90055101055010100900-1000162121452901000-1100814162884416881100-120011252250113622721200-130011362272112522501300-1400743148571414281400-1500447894478141500-160024949823461600-170015021001122合計50——100——50——100——表3-7某市50戶居民某月消費品支出累計表累計頻數(shù)(頻率)分布有如下兩個特點:①第一組的累積頻數(shù)(頻率)等于第一組本身的頻數(shù)(頻率);②最后一組累計頻數(shù)等于總體單位數(shù),最后一組的累計頻率等于1。(2)數(shù)值型數(shù)據(jù)的顯示①直方圖學生體重(kg)學生人數(shù)(人)39.5-44.5344.5-49.5849.5-54.51354.5-59.5959.5-64.5564.5-69.52合格人數(shù)40表3-8某班學生體重分布表②折線圖和曲線圖折線圖是在直方圖的基礎上,把直方圖頂部的中點用直線連接而成,也可以用組中值與頻數(shù)求坐標連接而成。根據(jù)曲線形狀的特點,概括起來有三種類型:鐘形分布,U型分布,J型分布。a.鐘形分布“兩頭小,中間大”,包括正態(tài)分布和偏態(tài)分布兩種,正態(tài)分布是以變量標志值中心為對稱軸,左右兩側對稱,兩側變量值分布的次數(shù)隨著與中間變量值距離的增大而漸次減少,偏態(tài)分布按照不同方向的偏態(tài),分為負偏態(tài)(左偏態(tài))分布和正偏態(tài)(右偏態(tài))分布,如圖3-12。圖3-12鐘形分布圖b.U型分布“兩頭大,中間小”,與鐘型分布相反,靠近中間的變量值分布次數(shù)少,靠近兩端的變量值分布次數(shù)多。c.J型分布兩種類型,包括J型分布和反J型分布。U型曲線反J型曲線③描述時間序列的線圖線圖是在平面坐標上用折線表現(xiàn)數(shù)量變化特征和規(guī)律的統(tǒng)計圖。線圖主要用于顯示時間序列數(shù)據(jù),以反映事物發(fā)展變化的規(guī)律和趨勢。年份城鎮(zhèn)居民(元)農村居民(元)199117007081992202678419932577921199434961221199542831577199648381926199751602091199854252162表3-91991-1998我國城鄉(xiāng)居民家庭的人均年收入圖3-131991-1998我國城鄉(xiāng)居民家庭的人均年收入④多變量數(shù)據(jù)的圖示a.散點圖散點圖是用二維坐標展示兩個變量之間關系的一種圖形,它是用坐標橫軸代表變量x,縱坐標代表變量y,每組數(shù)據(jù)(x,y)在坐標系中用一個點表示,n組數(shù)據(jù)在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數(shù)據(jù)圖稱為散點圖。降雨量溫度(℃)降雨量(mm)產量(kg/h㎡)62522508403450105046001362570014957400161105900表3-10糧食產量與降雨量和溫度的數(shù)據(jù)圖3-14糧食產量與降雨量的散點圖b.氣泡圖展示三個變量之間的關系年份溫度降雨量產量2001年62522502002年84034502003年105046002004年136257002005年149574002006年161105900c.雷達圖顯示多個變量項目甲市乙市食品36.244衣著1210家庭設備用品及服務9.58醫(yī)療保健75交通通訊97娛樂教育文化服務15.312.4居住1113.62008年甲乙兩城市家庭人均消費支出構成第四節(jié)統(tǒng)計圖與統(tǒng)計表1統(tǒng)計圖形的設計要求真實客觀同時顯示數(shù)據(jù)比較;目的明確;化繁為簡;以點帶面;多維反映2統(tǒng)計表的設計(1)統(tǒng)計表的定義與結構(2)統(tǒng)計表的分類(3)統(tǒng)計表的設計簡單表簡單分組表復合分組表未經(jīng)任何分組,按順序排列只按一個標志進行分組按兩個及以上標志分組分組情況用途調查表匯總表分析表思考與練習教材49頁4、11、12第四章統(tǒng)計數(shù)據(jù)的綜合指標

本講目的和要求1.了解統(tǒng)計分析的總量指標、相對指標;2.掌握統(tǒng)計分析的平均指標的計算;3.理解和掌握數(shù)據(jù)分布的離散程度指標;4.理解數(shù)據(jù)分布的偏度和峰度指標;本講重點難點1.平均指標;2.離散程度指標。第一節(jié)總量指標1總量指標的概念?總量指標又稱絕對指標或絕對數(shù),反映被研究對象在一定時期或時點、地點和條件下所達到的總規(guī)模、總水平或工作總量的綜合指標。2總量指標的特點指標數(shù)值大小受總體范圍的制約。3總量指標的作用?認識客觀現(xiàn)象的起點;?是實行宏觀經(jīng)濟調控和經(jīng)濟經(jīng)營管理的基本指標;?是計算其他統(tǒng)計指標的基礎。4總量指標的種類指標采取的計量單位指標反映內容總體標志總量總體單位總量指標反映時間狀況時期指標時點指標價值指標實物指標總量指標分類勞動量指標5注意問題明確規(guī)定每項指標的含義和范圍;注意客觀現(xiàn)象的同質性;合理確定計量單位第二節(jié)相對指標1相對指標的概念?用兩個有聯(lián)系的指標數(shù)值進行對比的比值來反映客觀現(xiàn)象的發(fā)展速度、結構、強度、普遍程度或比例關系的綜合指標。2相對指標的作用?反映現(xiàn)象之間的聯(lián)系程度、發(fā)展程度及經(jīng)濟效益等。?便于比較和分析事物。3相對指標的種類及其計算方法計劃完成程度相對指標:水平法、累計法;結構相對指標:總體某部分或某組數(shù)值/總體全部數(shù)值;比例相對指標:總體中某一部分數(shù)值/總體中另一部分的數(shù)值;比較相對指標:同一時間某一空間的某項指標數(shù)值/該時間另一空間的同項指標數(shù)值;強度相對指標:某一總量指標數(shù)值/另一個有聯(lián)系而性質不同的總量指標數(shù)值;動態(tài)相對指標:某一現(xiàn)象報告期數(shù)值/同一現(xiàn)象基期數(shù)值。4應用和計算相對指標應注意的問題指標之間的可比性;基數(shù)選擇的恰當性;相對指標和總量指標相結合;要將各種相對指標綜合起來分析。第三節(jié)平均指標1平均指標的概念及其表現(xiàn)形式?平均指標反映同類現(xiàn)象在一定時間、地點、條件下所達到的一般水平。?平均指標的表現(xiàn)形式:數(shù)值平均數(shù)(算術/調和/幾何平均數(shù))、位置平均數(shù)(眾數(shù)/中位數(shù)/四分位數(shù))2數(shù)值平均數(shù)(概念要點)?集中趨勢的測度值之一?最常用的測度值?一組數(shù)據(jù)的均衡點所在?易受極端值的影響?用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)(1)算術平均數(shù)?算術平均數(shù)是總體單位某一數(shù)量標志值之和除以總體單位總量(即總體單位數(shù))。其計算公式為:例如,某企業(yè)2006年12月職工平均人數(shù)為500人,其工資總額為1000000元,則該企業(yè)職工月平均工資為2000元。算術平均數(shù)可分為簡單算術平均數(shù)和加權算術平均數(shù)。簡單算術平均數(shù):若總體資料未進行分組,則先計算總體標志總量,再用總體單位數(shù)去除,計算的結果為簡單算術平均數(shù)。其計算公式為:加權算術平均數(shù):若總體資料已經(jīng)分組,編成分配數(shù)列,這時將各組標志值乘以相應的次數(shù),然后加總求和,再除以總次數(shù)(總體單位數(shù)),所得結果為加權算術平均數(shù)。其計算公式為:式中,表示加權算術平均數(shù);x表示各組標志值;f表示各組標志值出現(xiàn)的次數(shù)(也稱為權數(shù));∑xf表示總體標志總量;∑f表示總體單位數(shù)。若分組資料為單項數(shù)列,則可直接按公式計算加權算術平均數(shù);若分組資料是組距數(shù)列,則先計算組中值,用組中值代替各組標志值的一般水平,再計算加權算術平均數(shù)。加權算術平均數(shù)

(算例)表4-1某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計—506160.0【例】根據(jù)表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的均值(2)調和平均數(shù)調和平均數(shù)是總體各單位標志值倒數(shù)的算術平均數(shù)的倒數(shù),也稱倒數(shù)平均數(shù)。調和平均數(shù)按其計算方法不同,可分為簡單調和平均數(shù)和加權調和平均數(shù)。

簡單調和平均數(shù)

加權調和平均數(shù)

m表示調和平均數(shù)的權數(shù)。?調和平均數(shù)的特點:調和平均數(shù)也容易受極端數(shù)值的影響,而且受極小值的影響大于受極大值的影響。調和平均數(shù)的應用范圍較小,當變量值中有一項為0時,無法計算調和平均數(shù)。?調和平均數(shù)的運用:在社會經(jīng)濟領域中,調和平均數(shù)經(jīng)常作為算術平均數(shù)的變形使用。主要適用于質量指標求平均。如果知道該質量指標的分子資料,則用加權調和平均數(shù)公式計算該指標的平均數(shù);如果知道該質量指標的分母資料,則用加權算術平均數(shù)公式計算該指標的平均數(shù)。

【例】已知某商品在三個集市貿易市場上的平均價格及銷售量資料如下,求該商品在市場上的總平均價格(提示:總平均價格=銷售總額÷總銷售量,已知分子銷售總額,應用加權調和平均數(shù))解:市場平均價格(元/千克)銷售額(元)甲2.0060000乙2.5050000丙2.4060000合計-----170000

【例】已知某商品在三個集市貿易市場上的平均價格及銷售量資料如下,求該商品在市場上的總平均價格(提示:總平均價格=銷售總額÷總銷售量,已知分子銷售總額,應用加權調和平均數(shù))解:市場平均價格(元/千克)銷售額(元)甲2.0060000乙2.5050000丙2.4060000合計-----170000(3)幾何平均數(shù)幾何平均數(shù)是n個比率乘積的n次方根,即把若干個變量連乘,得其乘積再開n次方根。社會經(jīng)濟統(tǒng)計中,幾何平均數(shù)適用于計算平均比率和平均速度。幾何平均數(shù)按計算方法不同分為簡單幾何平均數(shù)和加權幾何平均數(shù)。簡單幾何平均數(shù)式中,表示幾何平均數(shù);x表示變量值;n表示變量值個數(shù);∏為連乘符號加權幾何平均數(shù)

社會經(jīng)濟現(xiàn)象用幾何平均法計算平均數(shù)應滿足兩個條件:?若干個比率或速度的乘積等于總比率或總速度。?相乘的各比率或速度不得為負值?!纠恳晃煌顿Y者持有一種股票,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計算該投資者在這四年內的平均收益率。平均收益率=103.84%-1=3.84%2位置平均數(shù)

(1)眾數(shù)?集中趨勢的測度值之一?出現(xiàn)次數(shù)最多的變量值?不受極端值的影響?可能沒有眾數(shù)或有幾個眾數(shù)?主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)表3-1某城市居民關注廣告類型的頻數(shù)分布廣告類型人數(shù)(人)比例頻率(%)

商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100【例】根據(jù)表3-1中的數(shù)據(jù),計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調查的200人當中,關注商品廣告的人數(shù)最多,為112人,占總被調查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告定類數(shù)據(jù)的眾數(shù)定序數(shù)據(jù)的眾數(shù)【例】根據(jù)表3-2中的數(shù)據(jù),計算眾數(shù)。解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)非常不滿意不滿意一般滿意非常滿意24108934530836311510合計300100.0數(shù)值型分組數(shù)據(jù)的眾數(shù)?眾數(shù)的值與相鄰兩組頻數(shù)的分布有關?該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內均勻分布?相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo?相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】根據(jù)表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的眾數(shù)(2)中位數(shù)?集中趨勢的測度值之一?排序后處于中間位置上的值Me50%50%?不受極端值的影響?主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)?各變量值與中位數(shù)的離差絕對值之和最小,即未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù)的中位數(shù)

(計算公式)定序數(shù)據(jù)的中位數(shù)【例】根據(jù)第三章表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的中位數(shù)解:中位數(shù)的位置為:

300/2=150從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此

Me=一般表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意不滿意一般滿意非常滿意2410893453024132225270300合計300—數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(5個數(shù)據(jù)的算例)原始數(shù)據(jù):

2422212620排序: 2021222426位置: 123 45原始數(shù)據(jù):

105 91268排序: 56891012位置:

123

4

56數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(6個數(shù)據(jù)的算例)位置N+126+123.5中位數(shù)8+928.5?根據(jù)位置公式確定中位數(shù)所在的組?采用下列近似公式計算?該公式假定中位數(shù)組的頻數(shù)在該組內均勻分布數(shù)值型分組數(shù)據(jù)的中位數(shù)

(要點及計算公式)表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—數(shù)值型分組數(shù)據(jù)的中位數(shù)

(算例)【例】根據(jù)表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的中位數(shù)(3)四分位數(shù)(概念要點)?集中趨勢的測度值之一?

排序后處于25%和75%位置上的值?不受極端值的影響?主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4四分位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4定序數(shù)據(jù)的四分位數(shù)

(算例)【例】根據(jù)表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為:

QL位置=(300)/4=75

上四分位數(shù)(QL)的位置為:

QU位置=(3×300)/4=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此

QL

=不滿意

QU

=一般表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意不滿意一般滿意非常滿意2410893453024132225270300合計300—數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計算公式)上四分位數(shù)

下四分位數(shù):

數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表3-5某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】根據(jù)表3-5中的數(shù)據(jù),計算50名工人日加工零件數(shù)的四分位數(shù)(4)眾數(shù)、中位數(shù)和數(shù)值平均數(shù)的比較平均指數(shù)及其所適用的數(shù)據(jù)類型表4-4平均指數(shù)及其所適用的數(shù)據(jù)類型數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)定比數(shù)據(jù)適用的指標類型※眾數(shù)※中位數(shù)數(shù)值平均數(shù)數(shù)值平均數(shù)—四分位數(shù)眾數(shù)調和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)

中位數(shù)———四分位數(shù)———眾數(shù)第四節(jié)離散程度的測度?定類數(shù)據(jù):異眾比率(不要求)?定序數(shù)據(jù):四分位差?定距和定比數(shù)據(jù):極差、平均差、方差及標準差?相對離散程度:離散系數(shù)離中趨勢數(shù)據(jù)分布的另一個重要特征離中趨勢的各測度值是對數(shù)據(jù)離散程度所作的描述反映各變量值遠離其中心值的程度,因此也稱為離中趨勢從另一個側面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值定序數(shù)據(jù):四分位差

(概念要點)1. 離散程度的測度值之一2. 也稱為內距或四分間距3. 上四分位數(shù)與下四分位數(shù)之差

QD=QU-QL4. 反映了中間50%數(shù)據(jù)的離散程度5.不受極端值的影響6.用于衡量中位數(shù)的代表性【例】根據(jù)表3-2中的數(shù)據(jù),計算甲城市家庭對住房滿意狀況評價的四分位差解:設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知QL=不滿意=2

QU=一般=3四分位差:

QD=QU-

QL

=3–2

=1四分位差

(定序數(shù)據(jù)的算例)表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意不滿意一般滿意非常滿意2410893453024132225270300合計300—極差(或全距)

(概念要點及計算公式)1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)R=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R

最高組上限-最低組下限5.計算公式為例.兩組工人的工資數(shù)據(jù)(單位;元)如下:甲:900100011001200128014802000乙:1200125014001500156017001750

工資的全距,甲組為1100元,乙組為550元,說明甲組工人工資水平差別比乙組工人工資水平差別大。

1991-2004年上證指數(shù)的全距極差(全距)的優(yōu)缺點優(yōu)點:計算簡單。缺點:但提供的信息不全面。不能全面反映標志值的離散程度。如果極端數(shù)值相差較大,而中間數(shù)值分布比較均勻時,全距便不能確切反映其離散程度。平均差

(概念要點及計算公式)1.離散程度的測度值之一2.各變量值與其均值離差絕對值的平均數(shù)3.能全面反映一組數(shù)據(jù)的離散程度4.數(shù)學性質較差,實際中應用較少5.計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差

(計算過程及結果)表4-5某車間50名工人日加工零件標準差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合計—50—312【例】根據(jù)表3-5中的數(shù)據(jù),計算工人日加工零件數(shù)的平均差方差和標準差1.離散程度的測度值之一2.最常用的測度值3.反映了數(shù)據(jù)的分布4.反映了各變量值與均值的平均差異5.根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4681012X=8.3總體方差和標準差

(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式總體標準差

(計算過程及結果)表4-6某車間50名工人日加工零件標準差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計—50—3100.5【例】根據(jù)表3-5中的數(shù)據(jù),計算工人日加工零件數(shù)的標準差樣本方差和標準差

(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差

自由度(degreeoffreedom)1.一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)2.當樣本數(shù)據(jù)的個數(shù)為n時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值3.例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當x=5確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值4.樣本方差用自由度去除,其原因可從多方面來解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量樣本方差

(算例)原始數(shù)據(jù):

10 591368樣本標準差樣本標準差原始數(shù)據(jù):

10591368方差

(簡化計算公式)樣本方差總體方差方差

(數(shù)學性質)各變量值對均值的方差小于對任意值的方差設X0為不等于X的任意數(shù),D2為對X0的方差,則在比較兩個數(shù)列的平均數(shù)代表性大小時,如果它們的平均水平不同或計量單位不同,就不能用前述的標志變異指標直接比較它們的差異程度,而應該用標志變異指標的相對指標即離散系數(shù)進行比較。1.平均差系數(shù)2.標準差系數(shù)離散系數(shù)?標準差與其相應的均值之比?消除了數(shù)據(jù)水平高低和計量單位的影響?測度了數(shù)據(jù)的相對離散程度?用于對不同組別數(shù)據(jù)離散程度的比較離散系數(shù)(特點)離散系數(shù)表4-7某管理局所屬8家企業(yè)的產品銷售數(shù)據(jù)企業(yè)編號產品銷售額(萬元)X1銷售利潤(萬元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產品銷售數(shù)據(jù)如表4.7。試比較產品銷售額與銷售利潤的離散程度離散系數(shù)X1=536.25(萬元)S1=309.19(萬元)V1=536.25309.19=0.577S2=23.09(萬元)V2=32.521523.09=0.710X2=32.5215(萬元)結論:

計算結果表明,V1<V2,說明產品銷售額的離散程度小于銷售利潤的離散程度數(shù)據(jù)類型與離散程度測度值表4-8數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型定類數(shù)據(jù)定序數(shù)據(jù)定距數(shù)據(jù)或定比數(shù)據(jù)適用的測度值※四分位差※方差或標準差※離散系數(shù)(比較時用)——

平均差——

極差——

四分位差——

第三節(jié)偏態(tài)與峰度的測度1偏態(tài)及其測度2峰度及其測度偏態(tài)與峰度分布的形狀扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布與標準正態(tài)分布比較!1偏態(tài)(概念要點)?

數(shù)據(jù)分布偏斜程度的測度?偏態(tài)系數(shù)=0為對稱分布?

偏態(tài)系數(shù)>0為右偏分布?

偏態(tài)系數(shù)<0為左偏分布?

計算公式為偏態(tài)【例】已知1997年我國農村居民家庭按純收入分組的有關數(shù)據(jù)如表4.9。試計算偏態(tài)系數(shù)表4-101997年農村居民家庭純收入數(shù)據(jù)按純收入分組(元)戶數(shù)比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94農村居民家庭村收入數(shù)據(jù)的直方圖偏態(tài)與峰度

(從直方圖上觀察)按純收入分組(元)20002500300035001000500←4000戶數(shù)比重(%)2520151051500→20002500300035001000500←4000戶數(shù)比重(%)2520151051500→結論:1.為右偏分布

2.峰度適中5000450020002500300035001000500←4000戶數(shù)比重(%)2520151051500→偏態(tài)系數(shù)表4-10農村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計算表按純收入分組(百元)組中值Xi戶數(shù)比重(%)Fi(Xi-X)Fi3(Xi-X)Fi45以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合計—1001689.2572521.25偏態(tài)系數(shù)根據(jù)上表數(shù)據(jù)計算得將計算結果代入公式得結論:偏態(tài)系數(shù)為正值,而且數(shù)值較大,說明農村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入較高的家庭則占少數(shù),而且偏斜的程度較大2峰度?

數(shù)據(jù)分布扁平程度的測度?

峰度系數(shù)=3扁平程度適中?偏態(tài)系數(shù)<3為扁平分布?偏態(tài)系數(shù)>3為尖峰分布?計算公式為峰度代入公式得

【例】根據(jù)表4-10中的計算結果,計算農村居民家庭純收入分布的峰度系數(shù)

結論:由于=3.4>3,說明我國農村居民家庭純收入的分布為尖峰分布,說明低收入家庭占有較大的比重思考與練習教材86-87頁9-12、14-16、23、25-27

本講目的和要求1.了解理解抽樣的基本概念;2.掌握掌握基本的抽樣方法;3.了解常用的抽樣分布;4.理解大數(shù)定律與中心極限定理;本講重點難點1.大數(shù)定律;2.中心極限定理。第5講抽樣與抽樣分布

第一節(jié)統(tǒng)計量統(tǒng)計量?是指不含任何參數(shù)的樣本函數(shù);?是用來描述樣本的數(shù)量特征的隨機變量;?統(tǒng)計量通常是可以由樣本數(shù)據(jù)計算出來的。

常用的總體參數(shù)總體均值總體方差總體比例

常用的樣本統(tǒng)計量(一)樣本均值樣本方差樣本比例

常用的樣本統(tǒng)計量(二)Z統(tǒng)計量t統(tǒng)計量χ2統(tǒng)計量第二節(jié)大數(shù)定律與中心極限定理1切比雪夫不等式

切比雪夫(1821~1894)

莫斯科大學門前廣場上的雕像或等價地有

定理5.1若r.v.X的期望和方差都存在,則對任意的

有證:設X是連續(xù)型r.v.,其概率密度為

記則關于切比雪夫不等式結果的幾點說明在上述證明中,如果把概率密度換成分布列,把積分號換成求和號,即得離散型情形的證明.?期望和方差存在是利用切比雪夫不等式的前提,否則可能導出錯誤的結果.的最大下界估計.界和

?切比雪夫不等式在概率估計方面起重要的最小上作用.給出了概率

設r.v.X的方差為2,利用切比雪夫不等式給出概率的上界估計.于是,由切比雪夫不等式得

解若記

的下界估計.

設r.v.X和Y的數(shù)學期望都是2,方差分別為1和4,而相關系數(shù)為0.5,利用切比雪夫不等式給出概率

設電站供電網(wǎng)有10000盞電燈,夜晚每一盞燈開燈概率都是0.6,而假定各盞燈開、關彼此獨立,估計夜晚同時開著的燈數(shù)在5800至6200之間的概率.解X表示同時開著的燈數(shù),則于是,由切比雪夫不等式得

定理5.2(切比雪夫大數(shù)定律)(教材p92)設相互獨立,且令P定理5.3(辛欽大數(shù)定律

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論