統(tǒng)計學筆記(精修版)_第1頁
統(tǒng)計學筆記(精修版)_第2頁
統(tǒng)計學筆記(精修版)_第3頁
統(tǒng)計學筆記(精修版)_第4頁
統(tǒng)計學筆記(精修版)_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

緒論第一節(jié)統(tǒng)計學的含義和作用一、什么是統(tǒng)計學統(tǒng)計學的含義統(tǒng)計學是有效收集、處理、分析和解釋數(shù)據(jù),發(fā)現(xiàn)規(guī)律,以便更好決策的一門方法論學科。? 2.分析數(shù)據(jù)的方法有描述統(tǒng)計、推斷統(tǒng)計。⑴描述統(tǒng)計描述統(tǒng)計是將所收集的數(shù)據(jù)處理后,用數(shù)值、表格或圖形形式表現(xiàn)的有用信息。描述統(tǒng)計是基礎,它為推斷統(tǒng)計、統(tǒng)計咨詢、統(tǒng)計決策提供必要⑵推斷統(tǒng)計就是根據(jù)樣本數(shù)據(jù)特征去估計或檢驗總體的數(shù)據(jù)特征.二、 統(tǒng)計學的作用和重要性統(tǒng)計學的作用人們用數(shù)據(jù)發(fā)現(xiàn)的規(guī)律做出更好的決策。要發(fā)現(xiàn)規(guī)律.對統(tǒng)計數(shù)據(jù)通常有要求:客觀性、適用性、準確性和及時性。三、 統(tǒng)計學是如何解決實際問題的?統(tǒng)計學解決實際問題的基本思路是:提出與統(tǒng)計有關的實際問題;建立有效的指標體系;收集數(shù)據(jù);選用或創(chuàng)造有效的統(tǒng)計方法處理、顯示所收集數(shù)據(jù)的特征;根據(jù)所收集數(shù)據(jù)的特征、結合定性、定量知識作出總體特征的合理推斷;根據(jù)推斷給出更好決策的建議;不解決問題時,重復第②一⑥步。第二節(jié)統(tǒng)計學的基本概念一、總體、單位和樣本1。 總體統(tǒng)計總體是根據(jù)一定目的確定的,由客觀存在的、具有某種同質性的許多個別事物構成的整體。⑴同質性是確定統(tǒng)計總體的基本標準,它是根據(jù)統(tǒng)計的研究目的而定的。研究目的不同,所確定的總體也不同,其同質性的意義也隨之變化。⑵統(tǒng)計總體還應具備大量性,即統(tǒng)計總體應應該由足夠數(shù)量的同質性單位構成。2。 總體單位(簡稱單位)是組成總體的各個個體。如典型案例1中英軍的每架戰(zhàn)機;事例4中的每個居民。由總體的部分單位組成的集合稱為樣本(又稱子樣)。構成樣本的單位稱為樣品,樣本中樣品的數(shù)目稱為樣本容量。統(tǒng)計學解決問題的目的是認識總體的數(shù)據(jù)特征.但是,當調(diào)查是破壞性的,或者出于成本、時間等因素考慮時,不必要或不可能對構成總體的所有單位都進行調(diào)查。二、標志、指標(參數(shù))和統(tǒng)計量1。標志:(1)總體單位普遍具有的屬性或特征稱為標志。(2)標志按其表現(xiàn)分為品質標志和數(shù)量標志兩種。?①品質標志表明單位屬性方面的特征,品質標志的表現(xiàn)只能用非數(shù)值來描述.(如:典型案例1中英軍戰(zhàn)機的類型,事例4中每個居民的性別。)?②數(shù)量標志表明單位數(shù)量方面的特征,其表現(xiàn)用數(shù)值來描述(如:典型案例1中英軍戰(zhàn)機的彈孔位置,事例4中每個居民的收入.)2。 參數(shù)(標志)(1)統(tǒng)計總體具有的數(shù)量特征的概念和數(shù)值稱為統(tǒng)計指標也稱為參數(shù)。⑵統(tǒng)計指標由兩項基本要素構成,即指標的概念和指標的取值。(指標的概念是對所研究現(xiàn)象本質的抽象概括,也是對總體數(shù)量特征的質的規(guī)定性。)(例如事例4中居民人口數(shù)100萬人,總收入31.4億元。)⑶統(tǒng)計指標按表示形式可以分為數(shù)量指標和質量指標。凡是反映現(xiàn)象總規(guī)模、總水平的統(tǒng)計指標稱為數(shù)量指標,用絕對數(shù)來表示。例如事例4中居民總數(shù)100萬人、總收入31.4億元等,凡是反映現(xiàn)象相對水平和工作質量的統(tǒng)計指標稱為質量指標,用相對數(shù)或平均數(shù)來表示例如企業(yè)職工平均工資5000元、工人出勤率93%等.質量指標是總量指標的派生指標,以反映現(xiàn)象之間的內(nèi)在聯(lián)系和對比關系.⑷單個指標不能反映總體的全貌,這便需要設立指標體系。統(tǒng)計指標體系是由一系列相互聯(lián)系的統(tǒng)計指標組成的有機整體,用以反映所研究現(xiàn)象各方面相互依存相互制約的關系。3。 統(tǒng)計量1統(tǒng)計量是樣本觀測量的一個已知函數(shù),用來說明樣本的特征。是樣本觀測量的一個已知函數(shù),用來說明樣本的特征。⑵抽取的樣本不同,統(tǒng)計量的觀測值也就不同。如樣本平均數(shù)、樣本方差、樣本比例是統(tǒng)計量,抽取樣本后,人們通常用與總體參數(shù)對應的統(tǒng)計量觀測值,作為總體參數(shù)的估計.(如某汽車制造企業(yè)從生產(chǎn)的一批轎車中抽取了16輛轎車,用這些轎車的平均行駛里程值、合格率值分別作為該批轎車平均行駛里程、合格率的估計。)三、數(shù)據(jù)?(一)變量與變量值即說明現(xiàn)象的某一事實或數(shù)量的特征稱為變量,將上述標志、指標和統(tǒng)計量的名稱進行歸納就是變量。變量的具體表現(xiàn)是變量值,數(shù)據(jù)就是變量及其表現(xiàn),也可稱為反映客觀事物的事實或數(shù)量依據(jù)。如:收入是一個變量,收入的表現(xiàn)是變量值。將在特定研究過程中收集的所有數(shù)據(jù)集合在一起,稱為數(shù)據(jù)集。根據(jù)變量值的確定與否,變量分為確定性變量(受確定性因素影響,因素是明確的,可解釋,可控制的)與隨機變量(受許多不確定因素影響,如員工的起床時間).(二)數(shù)據(jù)的計量尺度收集數(shù)據(jù)時需要用到以下四種由低到高的計量尺度:定類尺度、定序尺度、定距尺度和定比尺度,計量尺度的不同決定了不同的數(shù)據(jù)分析與處理方法。1。 定類尺度是說明客觀現(xiàn)象無序類別的計量。定類尺度的主要數(shù)學特征是“="或“工”?如居民的性別是男、女計量,戰(zhàn)機的類型是戰(zhàn)斗機、轟炸機、偵察機等計量,這一場合的所使用的數(shù)值只作為無序分類的代碼。定序尺度是說明客觀現(xiàn)象有序類別的非數(shù)值計量。定序尺度的主要數(shù)學特征是“<"或“>".例如,對居民的滿意度計量可以分為非常滿意、滿意、一般、不滿意、非常不滿意五類。這一場合的所使用的數(shù)值只作為有序分類的代碼。定距尺度是說明客觀現(xiàn)象數(shù)值間距有意義的計量。其用確切的數(shù)值反映現(xiàn)象之間在量方面的差異,定距尺度的主要數(shù)學特征是“+"“-"。如總量指標是定距尺度計量的。(0不代表不存在)4?定比尺度是說明客觀現(xiàn)象兩個數(shù)值比有意義的計量。定比尺度的主要數(shù)學特征是“x”“/”如質量指標中的相對數(shù)、平均數(shù)是定比尺度計量的(0代表不存在)5數(shù)據(jù)分類⑴定類尺度,定序尺度的數(shù)據(jù)統(tǒng)稱為定性數(shù)據(jù)。定性變量是指帶有定性數(shù)據(jù)的變量。⑵定距尺度,定比尺度的數(shù)據(jù)統(tǒng)稱為為定量數(shù)據(jù)。定量變量是指帶有定量數(shù)據(jù)的變量。根據(jù)定量變量值連續(xù)出現(xiàn)與否,定量變量分為連續(xù)性變量與離散型變量連續(xù)型變量是指變量在某一區(qū)域內(nèi)的取值是連續(xù)不斷的,無法一一列舉。如:軍機的彈孔位置,產(chǎn)品的壽命等。離散型變量是指變量的取值是間斷的,可以一一列舉?例如,產(chǎn)品數(shù)等。(三)數(shù)據(jù)的類型根據(jù)對客觀現(xiàn)象觀察的角度不同,統(tǒng)計數(shù)據(jù)可分為:橫截面數(shù)據(jù)、時間序列數(shù)據(jù)和面板數(shù)據(jù).1。 橫截面數(shù)據(jù)又稱為靜態(tài)數(shù)據(jù),它是指在同一時間對同一總體內(nèi)不同單位進行觀察而獲得的數(shù)據(jù)?例如,2014年全國各省、市、自治區(qū)的居民收入總值就屬于橫截面數(shù)據(jù)。2。 時間序列數(shù)據(jù)又稱為動態(tài)數(shù)據(jù),它是指在某一段時期內(nèi)按時間順序對同一總體進行觀察而獲得的數(shù)據(jù)。例如,“十二五”期間我國按年份順序的居民收入總值就屬于時間序列數(shù)據(jù)3?面板數(shù)據(jù)則是同時在時間和截面空間上取得的二維數(shù)據(jù)。例如2005—2014年30個企業(yè)的總產(chǎn)值數(shù)據(jù)。面板數(shù)據(jù)則由30個企業(yè)10年的數(shù)據(jù)組成,共有300個觀測值?從某一年份看,它是由30個企業(yè)總產(chǎn)值數(shù)第二章收集數(shù)據(jù)第一節(jié)統(tǒng)計調(diào)查方案設計調(diào)查方案設計是指導整個調(diào)查過程的綱領性文件,其主要內(nèi)容主要包括以下幾個方面:一、 確定調(diào)查目的調(diào)查要達到的具體目標回答“為什么調(diào)查?”調(diào)查之前必須明確二、 確定調(diào)查對象和調(diào)查單位調(diào)查對象:調(diào)查研究的總體或調(diào)查范圍調(diào)查單位:需要對之進行調(diào)查的單位??梢允钦{(diào)查對象的全部單位(全面調(diào)查)也可以是調(diào)查對象中的一部分單位(非全面調(diào)查)回答“向誰調(diào)查?三、選擇合適的調(diào)查方式、調(diào)查方法調(diào)查方式是指調(diào)查的組織方式,主要有:普查、抽樣調(diào)查、典型調(diào)查、重點調(diào)查和統(tǒng)計報表制度調(diào)查方法是指收集統(tǒng)計資料的方法,主要有:問卷法、訪談法、觀察法和實驗法四、設計調(diào)查項目和調(diào)查表調(diào)查項目:調(diào)查的具體內(nèi)容2。 調(diào)查表:表現(xiàn)調(diào)查項目的表格或問卷。有單一表和一覽表兩種形式。3。 回答“調(diào)查什么?”五、確定調(diào)查時間統(tǒng)計調(diào)查時間包括兩種涵義:調(diào)查時間和調(diào)查期限1.調(diào)查時間:調(diào)查資料的所屬時間(時期或時點)。調(diào)查期限:進行調(diào)查工作的時間,包括搜集資料和報送資料的整個工作所需要的時間六、調(diào)查報告的撰寫調(diào)查報告的撰寫包括:調(diào)查過程的描述、依據(jù)調(diào)查數(shù)據(jù)所做的決策、對調(diào)查結果的評價【在調(diào)查方案中,應給出:提交調(diào)查報告的具體時間,并對調(diào)查的精度、費用等提出具體要求】七、制訂調(diào)查工作的組織實施計劃第二節(jié)數(shù)據(jù)收集來源一、數(shù)據(jù)收集的來源1。原始數(shù)據(jù):必須要求調(diào)研者親自收集2。二手數(shù)據(jù):調(diào)研者需要識別和評估二手數(shù)據(jù)的有效性二、二手數(shù)據(jù)的收集二手數(shù)據(jù)的來源⑴內(nèi)部二手數(shù)據(jù)⑵外部二手數(shù)據(jù)2.二手數(shù)據(jù)收集的特點優(yōu)點:快捷、成本低、易獲取缺點:相關性差、時效性差、可靠性低四、二手數(shù)據(jù)收集的注意事項二手數(shù)據(jù)的評估主要包括:研究目的的評估——調(diào)研的目的是什么二手數(shù)據(jù)來源評估——誰收集了這些資料研究內(nèi)容評估——收集了一些什么樣的資料調(diào)查方式、方法評估——這些資料如何獲得的二手數(shù)據(jù)相關性評估——這些資料與其他資料的一致程度如何二手數(shù)據(jù)時效性評估--這些資料是何時收集的第三節(jié)原始數(shù)據(jù)的收集一、數(shù)據(jù)收集的分類1.按數(shù)據(jù)收集的組織方式不同,分為統(tǒng)計報表和專門調(diào)查統(tǒng)計報表:按照國家有關法規(guī)的規(guī)定,自上而下地統(tǒng)一布置、自下而上地逐級填報的一種調(diào)查組織方式。專門調(diào)查:為了某一特定目的或專門問題而專門組織的調(diào)查按數(shù)據(jù)收集對象包括范圍的大小不同,分為全面調(diào)查和非全面調(diào)查全面調(diào)查:對構成調(diào)查對象中的所有黨委進行一一不漏的調(diào)查非全面調(diào)查:是在統(tǒng)計調(diào)查過程中,僅對調(diào)查中的一部分單位進行調(diào)查。包括:抽樣調(diào)查、重點調(diào)查、典型調(diào)查和非全面統(tǒng)計報表按數(shù)據(jù)收集的登記時間是否連續(xù),分為經(jīng)常性調(diào)查和一次性調(diào)查經(jīng)常性調(diào)查:又稱連續(xù)性調(diào)查,它是為了觀察社會經(jīng)濟現(xiàn)象在一定時期內(nèi)的數(shù)量變化所進行的調(diào)查登記或數(shù)據(jù)收集一次性調(diào)查:又稱不連續(xù)性調(diào)查,它是對所研究的社會經(jīng)濟現(xiàn)象間隔一段時間所進行的調(diào)查登記或數(shù)據(jù)收集按數(shù)據(jù)收集實施主體的不同,分為政府統(tǒng)計調(diào)查和民間統(tǒng)計調(diào)查二、數(shù)據(jù)收集的調(diào)查方式數(shù)據(jù)收集的調(diào)查方式,按照組織方式主要有:普查、抽樣調(diào)查、典型調(diào)查、重點調(diào)查和統(tǒng)計報表制度普查:專門組織的一次性全面調(diào)查普查的特點:通常是一次性調(diào)查,周期性強⑵全面性調(diào)查,收集的資料全面、系統(tǒng)、準確⑶普查的點多面廣,工作量大,投入多普查應遵循以下原則:1時間統(tǒng)一性原則⑵登記工作的規(guī)范性原則⑶普查項目統(tǒng)一規(guī)定原則⑷同類普查同周期性原則抽樣調(diào)查:從總體中隨機抽取一部分單位作為樣本進行調(diào)查,并根據(jù)樣本數(shù)據(jù)推斷總體數(shù)量特征的一種非全面調(diào)查.1概率抽樣:根據(jù)隨機原則從總體中抽選樣本,并根據(jù)樣本信息對總體的某些特征做出估計推斷,對推斷可能出現(xiàn)的誤差可以從概率意義上加以控制非概率抽樣:調(diào)查組根據(jù)自己的方便或主觀判斷抽取樣本的方法抽樣調(diào)査優(yōu)勢:經(jīng)濟性、時效性、準確性⑶幾種具體的抽樣方式:簡單隨機抽樣-—是指從總體N個單位中隨機抽取n個單位作為樣本,使每個可能的樣本被抽中的概率相等的一種抽樣方式.分層抽樣—-主要特征分層按比例抽樣,主要使用于總體中的個體有明顯差異.共同點:每個個體被抽到的概率都相等N/M。整群抽樣——是將總體中各單位歸并成若干個互不交叉、互不重復的集合,稱之為群;然后以群為抽樣單位抽取樣本的一種抽樣方式.【應用整群抽樣時,要求各群有較好的代表性,即群內(nèi)各單位的差異要大,群間差異要小】等距抽樣——首先將總體各單位按一定順序排列,更具樣本容量大小確定抽選間隔然后隨機抽取一個進入樣本,直到滿足要求為止的一種抽樣方式多階段抽樣——是指將抽樣過程分階段進行,每個階段使用的抽樣方法往往不同,即將各種抽樣方法結合使用,其在大型流行病學調(diào)查中常用。第一階段,將總體分為若干個一級抽樣單位,從中抽選若干個一級抽樣單位入樣;第二階段,將入樣的每個一級單位分成若干個二級抽樣單位,從入樣的每個一級單位中各抽選若干個二級抽樣單位入樣……,依此類推,直到獲得最終樣本典型調(diào)查:從調(diào)查對象的全部單位中選擇少數(shù)典型單位進行調(diào)查。目的是描述和揭示事物的本質特征和規(guī)律.調(diào)查結果不能用于推斷總體重點調(diào)查:從調(diào)查對象的全部單位中選擇少數(shù)重點單位進行調(diào)查.調(diào)查結果不能用于推斷總體5。 統(tǒng)計報表制度:按照國家有關法規(guī)的規(guī)定,自上而下地統(tǒng)一布置、自下而上地逐級填報的一種調(diào)查組織方式。統(tǒng)計報表內(nèi)容:報表目錄、報表表式、填表說明統(tǒng)計報表的資料來源:原始記錄、統(tǒng)計臺賬、企業(yè)內(nèi)部報表三、數(shù)據(jù)收集的方法1。問卷法:郵寄調(diào)查、電話調(diào)查、電腦輔助電話調(diào)查、網(wǎng)絡調(diào)查2.訪談法優(yōu)點:廣泛地認識客觀現(xiàn)象、深入地研究問題、資料收集可靠和應用面很廣缺點:必須依賴具有較高素質的訪問員、直接交談會對獲取資料的客觀性產(chǎn)生負面影響、在不便詢問時訪談無法實施、調(diào)查費用大、時間長,可能會碰到意料不到的困難集體訪談:將一組被調(diào)查者集中在調(diào)查現(xiàn)場,讓他們對調(diào)查的主題發(fā)表意見以獲得資料【常用的有:頭腦風暴法、德爾非法(專家意見法)、深度訪談法】個別訪談:調(diào)查者對每一名受訪者進行一對一單獨訪談。3.觀察法:就調(diào)查對象的行動和意識,調(diào)查人員邊觀察邊記錄以收集所需信息調(diào)查人員不是強行介入能夠在被調(diào)查者不察覺的情況下獲得資料4.實驗法在設定的特殊實驗場所、特殊狀態(tài)下,對調(diào)查對象進行實驗以獲得所需資料.有室內(nèi)實驗法和市場實驗法第四節(jié)統(tǒng)計數(shù)據(jù)的質量一、統(tǒng)計數(shù)據(jù)的誤差統(tǒng)計調(diào)查誤差分為登記性誤差和代表性誤差登記性誤差:由于調(diào)查者或被調(diào)查者的人為因素所造成的誤差.理論上講可以消除代表性誤差:用樣本數(shù)據(jù)進行推斷時所產(chǎn)生的誤差.通常無法消除,但事先可以進行控制和計算第一節(jié)數(shù)據(jù)的整理與顯示問題的提出1.根據(jù)解決問題的目的確定分組的變量,如典型案例4中分組的變量為收入.2。確定組數(shù)等,如典型案例4中,收入由貧到富分為5組,連續(xù)型變量如收入還涉及到確定每組組距、上限和下限.3。按不重不漏的原則對數(shù)據(jù)進行分組,確定各組頻數(shù)、頻率,典型案例4還涉及到每組的收入值等。4.用表、圖顯示整理的數(shù)據(jù),如表3-1、圖3-1第二節(jié)定量數(shù)據(jù)的整理與顯示一、定量數(shù)據(jù)的整理1.主要采用統(tǒng)計分組來整理。數(shù)據(jù)分組后,把每組的個數(shù)稱為頻數(shù)。每組個數(shù)所占比例稱為頻率.2.統(tǒng)計分組就是指根據(jù)統(tǒng)計研究的目的和客觀現(xiàn)象的內(nèi)在特點,按某個變量(或幾個變量)把被研究的總體劃分成為若干個不同性質的組,然后再統(tǒng)計出各組的頻數(shù),就形成了一張頻數(shù)分布表.3.統(tǒng)計分組方法:單變量值分組和組距分組1) 單變量值分組就是將一個變量值作為一組,適合變量值較少的情況。比如居民家庭按照人口數(shù)進行分組,可分為1口人家庭、2口人家庭、3口人家庭、4口人家庭、5口人以上家庭的組別。2) 組距式分組是將變量值的一個區(qū)間作為一組,適合于連續(xù)變量和變量值較多的離散型變量情況。組距式分組可采用等距分組,也可采用不等距分組。等距分組是指每組組距相等.等距分組的基本步驟有:第一步:確定組數(shù):一般情況下,一批數(shù)據(jù)所分的組數(shù)不應少于5組且不多于15組.在實際分組時,可以參考經(jīng)驗公式來確定組數(shù)K,即第二步:確定組距:組距是一組的上限與下限之差組距=(最大值-最小值)三組數(shù)第三步:統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表。【統(tǒng)計各組頻數(shù)時要注意遵循不重不漏的原則。為解決不重的問題,統(tǒng)計分組時習慣規(guī)定“上組限不在組內(nèi)”比如100這一數(shù)值不能算在“90?100”這一組,而是算在“100?110”這一組內(nèi)?!块]口組:有上、下限值開口組:"XX以下”及"XX以上”組中值——常用作各組的代表值:下限與上限之間的中點值,即:(100以下,缺下限)(90以上,缺上限)不等距分組是指并非所有組距都相等。二、 定量數(shù)據(jù)的圖示定量數(shù)據(jù)常用的統(tǒng)計圖主要有直方圖、莖葉圖、曲線圖、散點圖等。三、 頻數(shù)分布圖的類型頻數(shù)分布圖則屬于其中一種統(tǒng)計圖,其主要類型有如下三種。鐘型分布:“兩頭小,中間大”即中間變量值分布的頻數(shù)多,兩端分布頻數(shù)少,(III)中,其分布特征是以變量的平均數(shù)為對稱軸,左右兩側對稱分布(I) (II)中為非對稱分布,(I)是右偏分布(II)是左偏分布,U型分布:“兩頭大,中間小”即中間的變量值分布頻數(shù)少,兩端的變量值分布頻數(shù)多,與鐘型分布剛好相反J型分布:有兩種類型,一種是正J型,即頻數(shù)隨著變量的增大而增多;另一種則呈反J型,即頻數(shù)隨著變量的增大而減少第三節(jié)品質數(shù)據(jù)的整理與顯示一、定類數(shù)據(jù)的整理與圖示(一) 定類數(shù)據(jù)的整理定類數(shù)據(jù)整理主要用頻數(shù)分布表進行。(二) 定類數(shù)據(jù)的圖示定類數(shù)據(jù)的圖示主要有條形圖、餅圖等二、定序數(shù)據(jù)的整理與圖示(一)定序數(shù)據(jù)的整理定序數(shù)據(jù)也是采用頻數(shù)分析表進行整理.還可以計算累計頻數(shù)和累計頻率,累計方法有兩種:向上累計和向下累計。(二)定序數(shù)據(jù)的圖示定序型數(shù)據(jù)的統(tǒng)計圖主要有累計頻數(shù)分布圖和環(huán)形圖。(P50-51)第四節(jié)圖表的合理使用一、鑒別圖形優(yōu)劣的準則(一)一張好的圖形應具有的特征1。 反映數(shù)據(jù)分布特征和規(guī)律。便于比較。3。 有對圖形的描述和文字說明。(二)鑒別圖形優(yōu)劣的準則是否有助于真實、準確洞察問題的實質。2。 是否提供完整的信息量,是否使復雜的觀點簡單化.二、統(tǒng)計表的設計(一)統(tǒng)計表的概念和結構概念統(tǒng)計表是表現(xiàn)統(tǒng)計資料的一種形式。2.結構從形式上看,由四部分構成:A、 總標題:是表的名稱,概括統(tǒng)計表中要說明的內(nèi)容;B、 橫行標題:是各組的名稱,反映總體各組成部分;C、 縱覽標題:是分組標志或指標的名稱,說明縱行所列各項資料的內(nèi)容;D、 指標數(shù)值:也稱數(shù)字資料,是統(tǒng)計表的具體內(nèi)容。從內(nèi)容上看,由主詞和賓詞兩個部分組成。主詞是統(tǒng)計表所說明的總體,總體的各組或各組的名稱。賓詞是用于說明主詞的各種指標.通常,統(tǒng)計表的主詞列在表的左方,賓詞列在表的右方,如表3-10所示(P52)(二) 統(tǒng)計表的種類統(tǒng)計表按照總體分組情況不同,可分為簡單表、分組表和復合表三類。(三) 統(tǒng)計表的編制1。 統(tǒng)計表線條的繪制。通常統(tǒng)計表的上下端以粗線繪制,表內(nèi)縱橫線以細線繪制。表格的左右不封口。2。 合計欄的設置。統(tǒng)計表各縱列需要合計時,可將合計列放在最后一行,各橫行若需要合計時,可將合計列放在最前一欄或最后一欄。3。 標題的設計.統(tǒng)計表的標題要簡明扼要,以簡練而準確的文字來概括統(tǒng)計資料的內(nèi)容、資料所屬時間、空間等。4。 計量單位的列法。指標數(shù)值一般要有計量單位,若只有一種計量單位時,可在表右上端注明.如果計量單位不統(tǒng)一,可專設計量單位欄。5。標志值的書寫。標志值應該填寫整齊,對準位數(shù).當數(shù)值太小可忽略不計時,寫上“0";當缺失某項資料時,用符號“…”表示;不應有數(shù)字時,用符號“-"表示。6。注解或資料來源的標明。一般而言,統(tǒng)計表下方應該注明資料來源,以便查考。第四章數(shù)據(jù)分布的數(shù)字特征第一節(jié)數(shù)據(jù)集中趨勢的測定一、集中趨勢測定問題的提出和作用(一)問題的提出對于總體中的個體數(shù)據(jù),有時會呈現(xiàn)出在一定范圍內(nèi)以某個數(shù)據(jù)為中心上下波動的分布特征,即數(shù)據(jù)有時具有它分布的中心,我們稱之為數(shù)據(jù)分布的集中趨勢.該如何測定一組數(shù)據(jù)的集中趨勢呢?二)集中趨勢測定的作用1。集中趨勢指標的分類集中趨勢指標的作用(1) 可以反映一組數(shù)據(jù)分布的中心或一般水平;(2) 可以反映同一現(xiàn)象在不同時間或空間條件下的發(fā)展趨勢或差異;(3) 可以用來分析現(xiàn)象之間的依存關系;(4) 樣本平均數(shù)是統(tǒng)計推斷的一個重要統(tǒng)計量。?二、集中趨勢的測定(一)數(shù)值平均數(shù)數(shù)值平均數(shù)只適用于定量數(shù)據(jù)(數(shù)值型數(shù)據(jù)),而不適用于定性數(shù)據(jù).?1。算術平均數(shù)(1) 簡單算術平均數(shù)簡單算術平均數(shù)是根據(jù)未分組數(shù)據(jù)(原始數(shù)據(jù))計算的一種平均數(shù),它是將所有的原始數(shù)據(jù)相加再除以數(shù)據(jù)總個數(shù)得到的.樣本計算的簡單算術平均數(shù)的計算公式是:總體數(shù)據(jù)計算的簡單算術平均數(shù)的計算公式為:(2) 加權算術平均數(shù)加權算術平均數(shù)是根據(jù)分組數(shù)據(jù)計算的一種平均數(shù)。設樣本被分為k組,各組的頻數(shù)為fi樣本計算的加權算術平均數(shù)的計算公式為:其中,Xi有兩種情況:在單變量值分組中,Xi代表各組的變量值;在組距式分組中,Xi代表各組的組中值,稱作權重(頻率)??傮w數(shù)據(jù)計算的加權算術平均數(shù)的計算公式為:(3) 算術平均數(shù)的主要數(shù)學性質各變量值與其算術平均數(shù)的離差之和等于零;即:各變量值與其算術平均數(shù)的離差平方和最小。即:2。調(diào)和平均數(shù)調(diào)和平均數(shù)加權算術平均數(shù)的一種變形.調(diào)和平均數(shù)與加權算術平均數(shù)的關系是:若已知各組變量值及其標志總量mi(mi=xifi),而缺乏fi的數(shù)據(jù)時,則加權算術平均數(shù)可通過變形得到fi(fi=mi/xi)后,再以mi為權數(shù)的調(diào)和平均數(shù)形式來計算.3。幾何平均數(shù)幾何平均數(shù)是n個變量值連乘積的n次方根(1)簡單幾何平均數(shù)當樣本數(shù)據(jù)中各變量值出現(xiàn)的次數(shù)都相同時,用簡單幾何平均數(shù)公式.式中,xi代表各變量值,n為樣本容量,為連乘符號(2)加權幾何平均數(shù)當樣本數(shù)據(jù)中各變量值出現(xiàn)的次數(shù)不全相同時,用加權幾何平均數(shù)公式。式中,xi代表各變量值,n為樣本容量,為連乘符號【如果獲得一組總體數(shù)據(jù),根據(jù)總體數(shù)據(jù)計算的幾何平均數(shù)的公式與樣本數(shù)據(jù)的基本相同?!啃枰⒁獾氖?當數(shù)據(jù)中出現(xiàn)零或負值時不宜計算幾何平均數(shù);幾何平均數(shù)是一種適用于特殊數(shù)據(jù)的平均數(shù),當變量值之間具有連乘積關系時,采用幾何平均數(shù)更加合理;現(xiàn)實生活中,幾何平均數(shù)主要用于計算現(xiàn)象的平均增長率和平均發(fā)展速度(詳見本書第九章).(二)位置代表值1.眾數(shù)眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多的變量值,通常用符號表示。眾數(shù)代表的是最常見、最普遍的情況。眾數(shù)不僅可以度量定性數(shù)據(jù)的集中趨勢,還可以度量定量數(shù)據(jù)的集中趨勢。眾數(shù)的特點:眾數(shù)是位置型平均數(shù),它只與位置有關,不受數(shù)據(jù)中極端值的影響;從分布形態(tài)上看,眾數(shù)是一組數(shù)據(jù)分布最高峰點所對應的變量值;眾數(shù)具有不唯一性(可以有一個或多個或沒有)組距式分組數(shù)據(jù)中眾數(shù)的求解較為復雜.在組距式分組數(shù)據(jù)中,求解眾數(shù)的步驟:先要確定眾數(shù)所在組;如果是等距分組數(shù)據(jù),那么次數(shù)最多的那一組就為眾數(shù)組;如果是不等距分組數(shù)據(jù),那么組密度(組頻率/組距)最大的組就為眾數(shù)組。之后再按照下列公式求解眾數(shù)的近似值。計算公式如下:下限公式:或上限公式:2。中位數(shù)中位數(shù)是一組數(shù)據(jù)從小到大排序后位于中間位置上的變量值,通常用符號表示。由于中位數(shù)和位置有關,所以中位數(shù)只能度量定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)的集中趨勢;求解中位數(shù)的步驟:首先,對數(shù)據(jù)進行排序;其次,確定中位數(shù)的位置,即中間位置;最后,計算中間位置上的變量值。中位數(shù)的位置計算公式為:①數(shù)據(jù)個數(shù)n為奇數(shù),中位數(shù)為:②數(shù)據(jù)個數(shù)n為偶數(shù)中位數(shù)為:分組數(shù)據(jù)中位數(shù)的求解對于分組數(shù)據(jù)而言,不需要再另外排序,直接按照分組的順序即可。分組數(shù)據(jù)中位數(shù)的位置計算公式:求出中位數(shù)位置后,按照下列公式求解中位數(shù)的近似值。(看例題P68)5) 中位數(shù)特點及應用①中位數(shù)是位置型度量值,其特點是不受極端值的影響,因此具有穩(wěn)定性;②在實際運用中,當數(shù)據(jù)的偏斜程度較大時,用中位數(shù)作為該組數(shù)據(jù)一般水平的代表值比較合適。6) 分位數(shù)①實際上,測度數(shù)據(jù)在特定位置上的水平,還可以計算四分位數(shù)、十分位數(shù)和百分位數(shù)等,我們統(tǒng)稱它們?yōu)榉治粩?shù)。②四分位數(shù)的計算方法:A.四分位數(shù):定義:一組數(shù)據(jù)由小到大排序后位于25%位置和75%位置處的變量值?!疚挥谠?5%位置處的變量值(即下四分位數(shù),用符號Ql表示)和處在75%位置處的變量值(即上四分位數(shù),用符號Qu表示),上、下四分位數(shù)之間恰好包含了50%的數(shù)據(jù)?】B.求解四分位數(shù)的步驟a)先排序;b)然后確定上、下四分位數(shù)的位置;C)最后,求相應位置上的變量值.(看例題P69)7) 箱線圖將中位數(shù)、四分位數(shù)和其他指標結合起來,可以更詳細的反應數(shù)據(jù)的分布特征。箱線圖是由一組數(shù)據(jù)的最小值(Xmin)、最大值(Xmax)、下四分位數(shù)(QJ、上四分位數(shù)(Q/和中位數(shù)(MJ這五個特征值構成?通過箱線圖,可以觀察數(shù)據(jù)的中心位置、離散程度及對稱性等特征,同時還可以進行多組數(shù)據(jù)分布的比較。(三)算術平均數(shù)、眾數(shù)和中位數(shù)三者的比較與應用(1) 算術平均數(shù)屬于數(shù)值型平均數(shù),它是根據(jù)全部數(shù)據(jù)計算的集中趨勢測度值,因此可以綜合反映全部數(shù)據(jù)的信息;眾數(shù)和中位數(shù)屬于位置型代表值,它們是根據(jù)數(shù)據(jù)分布的特定位置確定出的集中趨勢測度值,因此不能概括全部數(shù)據(jù)的信息(2) 算術平均數(shù)和中位數(shù)在任何一組數(shù)據(jù)中都存在且具有唯一性,但不一定所有數(shù)據(jù)都存在眾數(shù),且眾數(shù)也不具有唯一性。一般情況下,在數(shù)據(jù)量充分大并且具有明顯集中趨勢時,計算眾數(shù)才有意義;(3) 算術平均數(shù)只適用于定量數(shù)據(jù),中位數(shù)適用于定序數(shù)據(jù)和定量數(shù)據(jù),眾數(shù)則適用于所有數(shù)據(jù),即定性數(shù)據(jù)和定量數(shù)據(jù)均可;(4) 算術平均數(shù)受極端值的影響,因此,當數(shù)據(jù)偏斜程度較大時(數(shù)據(jù)中存在極端值),不宜用算術平均數(shù)來代表數(shù)據(jù)的一般水平。眾數(shù)和中位數(shù)不受極端值的影響,因此,當數(shù)據(jù)偏斜程度較大時,可以考慮用眾數(shù)或中位數(shù)來代表數(shù)據(jù)的一般水平;(5) 算術平均數(shù)可以估計或推斷總體特征值。而眾數(shù)和中位數(shù)不宜用作此類推斷(6) 算術平均數(shù)和眾數(shù)、中位數(shù)的數(shù)量關系主要取決于數(shù)據(jù)分布的偏斜程度(非對稱程度)對于呈現(xiàn)單峰分布的數(shù)據(jù),如果數(shù)據(jù)的分布是對稱的,則眾數(shù)M。、中位數(shù)Me和算術平均數(shù)X三者相等,即M0=M=X—0e如果數(shù)據(jù)呈現(xiàn)左偏(負偏)分布,說明數(shù)據(jù)中存在極小值從而略使中位數(shù)偏小,而眾數(shù)則完全不受極小值大小和位置的影響,因此一般情況下,三者的關系表現(xiàn)為7<mvm00如果數(shù)據(jù)呈現(xiàn)右偏(正偏)分布,則一般有:MO<Me<X(7)皮爾遜經(jīng)驗公式數(shù)據(jù)呈現(xiàn)偏斜但偏斜程度不大時,算術平均數(shù)、眾數(shù)和中位數(shù)之間存在一定的比例關系,即第二節(jié)數(shù)據(jù)離散程度的測定一、 離散程度測定問題的提出和作用(一) 離散程度測定問題的提出由于差異性是數(shù)據(jù)的本質屬性,所以各個數(shù)據(jù)與其分布中心之間總是存在著不同程度的偏離.我們把數(shù)據(jù)偏離其中心值的程度叫做離散程度,離散程度可以說明數(shù)據(jù)之間差異程度的大小,那么如何測定一組數(shù)據(jù)的離散程度呢?(二) 離散程度測定的作用離散程度的大小主要通過變異指標來測定。變異指標的主要作用有:1。 可以衡量平均指標的代表程度。變異指標值越大,則數(shù)據(jù)的離散程度越大、數(shù)據(jù)越分散,繼而平均指標的代表性就越弱;反之,變異指標值越小,則數(shù)據(jù)的離散程度越小、數(shù)據(jù)越集中,繼而平均指標的代表性就越強;可以反映數(shù)據(jù)的穩(wěn)定性和均衡性。變異指標值越大,則數(shù)據(jù)的離散程度越大,數(shù)據(jù)的穩(wěn)定性和均衡性就越差;反之,則數(shù)據(jù)的離散程度越小,數(shù)據(jù)的穩(wěn)定性和均衡性就越好。二、 離散程度的測定(一) 異眾比率異眾比率是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比重,通常用^表示,計算公式為:式中:是眾數(shù)組的頻數(shù);是變量值的總頻數(shù)異眾比率的特點:1) 可用來衡量眾數(shù)的代表性強弱,即,異眾比率越大,則眾數(shù)的代表性越弱;反之,眾數(shù)的代表性就越強;2) 異眾比率主要用于測度定性數(shù)據(jù)的離散程度,也可以用于定量數(shù)據(jù)離散程度的測度。(二) 極差、四分位差和平均差1。 極差極差(Range)又稱全距,是一組數(shù)據(jù)中最大值與最小值之差,通常用R表示。計算公式為:1) 對于原始數(shù)據(jù)和單變量值分組數(shù)據(jù):為一組數(shù)據(jù)的最大值;為一組數(shù)據(jù)的最小值。2) 對于組距式分組數(shù)據(jù),極差就用變量值最大組的上限減去變量值最小組的下限近似得到。3) 極差的特點:極差是變異指標中最簡單的測度值,其優(yōu)點是計算簡便、易于掌握。但因極差只利用了一組數(shù)據(jù)兩端的信息,容易受到極端值的影響。因此,極差不能全面、穩(wěn)定地反映數(shù)據(jù)的離散程度.四分位差1) 四分位差是指上四分位數(shù)(Qu)與下四分位數(shù)(QL)之差,因此也叫內(nèi)距或四分間距,通常用表示.計算公式為:2) 四分位差特點:四分位差只能說明中間50%數(shù)據(jù)的離散程度,它依然不能充分反映全部數(shù)據(jù)的離散狀況。四分位差越大,說明中間50%數(shù)據(jù)的離散程度越大;四分位差越小,說明中間50%數(shù)據(jù)的離散程度越??;在一定程度上,四分位差也可以反映中位數(shù)的代表性好壞;四分位差是一種順序統(tǒng)計量,因此四分位差適用于測度定序數(shù)據(jù)和定量數(shù)據(jù)的離散程度。3。平均差1) 平均差(meandeviation)是各變量值與其算術平均數(shù)離差絕對值的平均數(shù)。因此,也稱平均絕對離差,通常用M。D表示。2) 平均差的計算有兩種情況簡單平均法如果數(shù)據(jù)是未分組數(shù)據(jù)(原始數(shù)據(jù)),則用簡單算術平均法來計算平均差:加權平均法如果數(shù)據(jù)是分組數(shù)據(jù),采用加權算術平均法來計算平均差:3) 平均差的特點:平均差意義明確,計算結果易于理解,并且利用了全部數(shù)據(jù)的信息,反映了每個變量值與平均數(shù)的平均差異程度.因此能全面地反映一組數(shù)據(jù)的離散狀況。平均差越大,則數(shù)據(jù)的離散程度越大;平均差越小,則數(shù)據(jù)的離散程度越小;為了避免正負離差相互抵消的現(xiàn)象發(fā)生,平均差在計算時給離差加上了絕對值。但由于絕對值的出現(xiàn)給計算帶來了很大的不便,因此在實際應用中受到很大的限制。(三)方差和標準差1) 方差是各變量值與其算術平均數(shù)離差平方的算術平均數(shù)。標準差就是方差的平方根2) 方差、標準差特點:方差、標準差利用了全部數(shù)據(jù)的信息,能較好地反映數(shù)據(jù)的離散程度;方差、標準差是通過平方的方法消去離差的正負號,這更便于數(shù)學上的處理.因此,方差、標準差是統(tǒng)計中最重要的變異指標,同時也是實際中應用最廣泛的離散程度測度值。3) 方差、標準差計算公式總體數(shù)據(jù)樣本數(shù)據(jù)未分組數(shù)據(jù)(原始數(shù)據(jù))的樣本方差和樣本標準差的計算公式分別為:分組數(shù)據(jù)的樣本方差和樣本標準差的計算公式分別為:(k為組數(shù))(四)標準化值(標準分數(shù))標準化值就是用各變量值與其平均數(shù)的離差再除以其標準差。1) 標準化值的計算公式為:2) 標準化值的特點:標準化值具有均值為0,標準差為1的特性。3) 經(jīng)驗法則【3。質量管理法則的原理】使用條件:在正態(tài)分布或近似正態(tài)分布(對稱的鐘型分布)的條件下大約有68%的數(shù)據(jù)位于均值±1個標準差范圍內(nèi);大約有95%的數(shù)據(jù)位于均值土2個標準差范圍內(nèi);大約有99%的數(shù)據(jù)位于均值±3個標準差范圍內(nèi)4) 切比雪夫定理利用切比雪夫定理來判斷有多少的數(shù)據(jù)落入以均值為中心的k(標準化值)個標準差范圍內(nèi)。使用條件:任意分布形態(tài)的數(shù)據(jù):根據(jù)切比雪夫定理的內(nèi)容,至少有()的數(shù)據(jù)落入均值左右k個標準差范圍內(nèi),其中k為大于1的任意數(shù),當然也可以為小數(shù)。k=2說明至少有75%的數(shù)據(jù)落入均值土2個標準差范圍內(nèi);k=3說明至少有89%的數(shù)據(jù)落入均值土3個標準差范圍內(nèi);k=4說明至少有94%的數(shù)據(jù)落入均值±4個標準差范圍內(nèi).(五)離散系數(shù)離散系數(shù)也稱變異系數(shù)(coefficientofvariation),它是極差、四分位差、平均差或標準差等變異指標與其算術平均數(shù)對比的結果.常用的離散系數(shù)有極差系數(shù)、平均差系數(shù)和標準差系數(shù),但應用最廣泛的是標準差系數(shù)。標準差系數(shù)的計算公式:離散系數(shù)的作用離散系數(shù)是測度數(shù)據(jù)離散程度的相對統(tǒng)計量,可用于比較不同變量值水平或不同計量單位的不同組別數(shù)據(jù)的離散程度.離散系數(shù)大的,則該組數(shù)據(jù)的離散程度就大;離散系數(shù)小的,則該組數(shù)據(jù)的離散程度就小??偨Y:反映數(shù)據(jù)離散程度的各測定值的應用場合1) 對于分類數(shù)據(jù),主要用異眾比率來測度其離散程度;2) 對于順序數(shù)據(jù),主要用四分位差來測度其離散程度;3) 對于數(shù)值型數(shù)據(jù),主要用方差或標準差來測度其離散程度。4) 當需要對不同組別數(shù)據(jù)的離散程度進行比較時,則使用離散系數(shù).第三節(jié)數(shù)據(jù)分布形態(tài)的測定一、 分布形態(tài)測定問題的提出和作用(一)分布形態(tài)測定問題的提出集中趨勢和離散程度是數(shù)據(jù)分布特征的兩個重要方面,但要想全面了解數(shù)據(jù)的分布特點,我們還需要知道數(shù)據(jù)的分布形狀,那么如何測定一組數(shù)據(jù)的分布形狀呢?(二)分布形態(tài)測定的作用通過分布形態(tài)的測定,我們可以了解數(shù)據(jù)分布形狀的對稱性以及分布曲線的扁平陡峭程度。將這兩點結合,我們還可以判斷數(shù)據(jù)是否接近于正態(tài)分布。二、 矩數(shù)據(jù)分布形態(tài)的測度主要是通過偏度系數(shù)和峰度系數(shù)來實現(xiàn)的。矩又是計算偏度系數(shù)和峰度系數(shù)的基礎矩可分為總體矩和樣本矩樣本距一般來說,將一組樣本%,...,xn與其算術平均數(shù)乂離差的k次方的平均數(shù)稱為樣本的k階中心矩,即算術平均數(shù):一階原點矩方差:二階中心矩階數(shù)k=3和k=4時,矩則可以反映數(shù)據(jù)的分布形態(tài)特征。矩可以看成是一系列反映數(shù)據(jù)分布特征指標的統(tǒng)稱.三、偏度偏度(skewness)是指數(shù)據(jù)分布的不對稱程度或偏斜程度?偏度也就是對數(shù)據(jù)非對稱程度和方向的測度。用來測定偏度的統(tǒng)計量是偏度系數(shù),記作SK。對于分組數(shù)據(jù),偏度系數(shù)SK的計算公式為:偏態(tài)系數(shù)性質:如果分布是對稱的,則SK=0;如果SKH0,說明分布是非對稱的,當SK>0時,表明分布是右偏分布(正偏分布);當SKV0時,表明分布是左偏分布(負偏分布).SK的數(shù)值越大,表明數(shù)據(jù)的偏斜程度越大。四、峰度峰度(kurtosis)是指數(shù)據(jù)分布曲線的陡峭或扁平的程度。對峰度的度量通常以正態(tài)分布曲線為標準進行比較。如果比正態(tài)分布曲線更加尖峭,稱為尖峰分布;如果比正態(tài)分布曲線更加扁平,稱為扁平分布。測度峰度的統(tǒng)計量是峰度系數(shù),記作K。對于分組數(shù)據(jù),峰度系數(shù)K的計算公式為:峰態(tài)系數(shù)性質:當K=0時,說明分布為正態(tài)分布;當K〉0時,說明曲線是尖峰(陡峭)分布即數(shù)據(jù)比正態(tài)分布更集中,K的數(shù)值越大,則曲線越陡峭;當K<0時,說明曲線是扁平分布,即數(shù)據(jù)比正態(tài)分布更分散,K的數(shù)值越小,則曲線越平緩。第五章抽樣分布第一節(jié)抽樣分布基本概念一、 樣本容量和樣本個數(shù)總體是研究的所有個體構成的集合,常用表示從中隨機抽取部分個體構成一個樣本,構成樣本的個體的數(shù)目,常用n表示,稱為樣本容量,也稱樣本量。二、 參數(shù)和統(tǒng)計量參數(shù)是用來描述總體數(shù)量特征的,如總體均值卩、總體比例n、總體方差。2等統(tǒng)計量是用來描述樣本數(shù)量特征的,是由樣本構造的函數(shù)如樣本均值乂樣本比例P、樣本方差S2等由于總體是唯一的、固定不變的,故參數(shù)往往是一個未知的常數(shù);而樣本不唯一,且一旦抽取出來,就成為已知,故統(tǒng)計量是隨機變量,其取值隨著樣本的變化而改變。抽樣的目的就是要根據(jù)樣本統(tǒng)計量去估計或推斷總體參數(shù).三、 抽樣分布統(tǒng)計量是隨機變量。抽樣分布就是統(tǒng)計量的概率分布樣本均值的概率分布、樣本比例的概率分布、樣本方差的概率分布等都稱為抽樣分布.現(xiàn)實世界中,我們面對的總體往往很大,進而樣本數(shù)目將很可觀,不可能將所有的樣本都抽取出來。因此抽樣分布實質上是一種理論分布。它可能是精確的某已知分布,也可能是以某已知分布為極限的極限分布。抽樣分布理論在推斷統(tǒng)計中具有重要的作用,它是后續(xù)參數(shù)估計和假設檢驗的理論依據(jù)和基礎。四、 抽樣分布的數(shù)字特征(一)樣本均值的數(shù)字特征設總體的平均數(shù)為卩,方差為。2,采取重復抽樣的方式,從中抽取獨立同分布的樣本:X],…,xn.根據(jù)數(shù)學期望和方差的性質,可推出樣本均值X數(shù)學期望(平均數(shù))、方差與總體的平均數(shù)、方差之間的關系例題:樣本均值的平均數(shù)總體均值樣本均值的方差總體方差,n=2,【】以上結論均建立在重復抽樣情形下,若是在不重復抽樣情形下,方差需要用系數(shù)進行修正,從而樣本均值的數(shù)字特征為:(二)樣本比例的數(shù)字特征比例:總體(或樣本)中具有某種屬性的個體數(shù)與全部個體數(shù)之比,總體比例記為n。根據(jù)數(shù)學期望和方差的性質,可推出樣本比例p的數(shù)學期望、方差與總體的平均數(shù)、方差之間的關系:用P估計n理論依據(jù)成立以上結論均建立在重復抽樣情形下,若是在不重復抽樣情形下,當樣本容量很大時,方差需要用系數(shù)進行修正,從而樣本比例的數(shù)字特征為:(三)樣本方差的數(shù)字特征設總體X方差為。2,采取重復抽樣的方式,從中抽取獨立同分布的樣本:X]…,xn根據(jù)數(shù)學期望和方差的性質,可推出樣本方差的數(shù)學期望、方差與總體的方差之間的關系為:以上結論均建立在重復抽樣情形下,若是在不重復抽樣情形下,方差需要用系數(shù)進行修正,從而樣本方差的數(shù)字特征為(四)標準誤(重點)統(tǒng)計量抽樣分布的標準差,稱為統(tǒng)計量的標準誤,也稱標準誤差標準誤可用于說明抽樣誤差的大小。抽樣誤差是指由抽樣的隨機性引起的樣本結果與總體的真實值之間的差異,它描述的是所有樣本可能的結果與總體真值之間的平均性差異。若總體標準差未知,可用樣本標準差代替,此時的標準誤稱為估計標準誤.樣本均值的標準誤為。X樣本比例的標準誤為Op樣本方差的標準誤為。$2第二節(jié)幾個常見的抽樣分布?一、樣本均值的抽樣分布樣本均值的抽樣分布,就是采取重復抽樣的方式,選取容量為的所有樣本,由樣本均值所有可能的取值形成的概率分布。分兩種情況來討論樣本均值的抽樣分布類型.1) 總體服從正態(tài)分布正態(tài)分布的再生定理:若總體變量X?N(U,O2),從這個總體中抽取容量為n的樣本,則樣本均值X?N(u,02/n)a)什么是正態(tài)分布若X的概率密度函數(shù)為:其中,卩和。都是參數(shù),且。>0,則稱X服從參數(shù)為卩和。的正態(tài)分布,記作X?N(li,O2)ob)正態(tài)分布的概率密度曲線是一條對稱的鐘型曲線。卩決定了圖形的中位置,。決定了圖形中曲線的陡峭程度。當參數(shù)U=0,0=1時,這樣的正態(tài)分布為標準正態(tài)分布,記為N(0,1),其概率密度函數(shù)為:2) 總體服從非正態(tài)分布獨立同分布中心極限定理表明:無論總體服從何種分布,只要其平均數(shù)和方差存在,那么從中抽取的獨立同分布樣本X],???Xn,,其均值在當n很大時,就會近似服從正態(tài)分布X?N(U,02)o大樣本:nM30總結:?二、樣本比例的抽樣分布樣本比例是一種特殊的樣本均值。從而,根據(jù)樣本均值的抽樣分布理論可得樣本比例的抽樣分布大樣本:同時滿足叩$5和n(1-p)M5當樣本容量很大時,樣本比例P的抽樣分布為:在不重復抽樣情形下,當樣本容量很大時,樣本比例的抽樣分布為:需要修正:對于有限總體,要用修正系數(shù)修正不需要修正:無限總體/此時N很大而抽樣比時,修正系數(shù)趨于1,方差可以按重復抽樣情形時(即不用修正)的公式計算三、樣本方差的抽樣分布(不考)樣本方差S2的抽樣分布,就是釆取重復抽樣的方式,選取容量為n的所有樣本,由樣本方差S2的所有可能的取值形成的概率分布。設總體服從均值為U,方差S2的正態(tài)分布,Xj…,Xn為來自該總體的樣本,則樣本方差S2的抽樣分布為:稱服從自由度為n-1的X2分布(卡方分布)??ǚ椒植嫉臄?shù)字特征,可得:在不重復抽樣情形下,方差為:四、t分布和F分布t分布設且X與Y相互獨立,則稱隨機變量服從自由度為n的t分布,記作t?t(n)。t分布概率密度函數(shù)曲線是以縱軸為對稱軸的單峰對稱圖形。自由度n越大,分布越趨近于標準正態(tài)分布,當時,分布與標準正態(tài)分布完全一致。t分布的數(shù)字特征為:總體平均數(shù):、■、"八方差:F分布若且X與Y相互獨立,則隨機變量服從自由度為的F分布,記作F~。其中,n】稱為第一自由度,n2稱為第二自由度F分布的數(shù)字特征為:總體平均數(shù):>方^差 :第一節(jié)點估計點估計的相關概念1) 點估計是用對應的估計量的某個取值直接作為相應總體參數(shù)e的估計值?!救纾何覀冇脴颖揪底鳛榭傮w均值的估計,用樣本比例作為總體比例的估計,用樣本方差作為總體方差的估計等】2) 估計量:用于估計總體參數(shù)的隨機變量3) 估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值【如果樣本均值x=80,則80就是的估計值】點估計的求解方法矩估計法用樣本原點矩作為總體原點矩的估計。設k個參數(shù),求k個參數(shù)矩估計需要建立k個方程,方法是:設總體的一個樣本觀測值是,其丨階原點矩,總體觀測量X的丨階原點矩,用樣本原點矩A,作為總體原點矩口]的估計,得出k個方程,解此方程組得出的即為參數(shù)e的矩估計?!纠?-1】設總體X的均值卩及方差。2都存在但均未知,設來自總體X的一個樣本是,求卩,。的矩估計,。解:是兩個參數(shù),故需要建立兩個方程因為令得即*-■■J--------------------------------------------------------------f?結論:總體均值的矩估計是樣本均值,而總體方差(艮即總體的二階中心矩)矩估計是樣: 本二階中心矩【求總體均值與方差的矩估計無需知道總體服從什么分布】:②最大似然估計法?…固定樣本觀測值…在可能的取值中…挑選使似然函數(shù)達到最大(從而概率p達到最大)的作為參數(shù)e的估計。這樣得到的稱之為參數(shù)e的最大似然估計。因此求參數(shù)e的最大似然估計問題就轉化為求似然函數(shù)的最大值問題了.求總體均值與方差的最大似然估計需要知道總體分布。估計量的優(yōu)良性標準參數(shù)估計量的評價標準:無偏性、有效性和一致性,我們稱之為估計量的優(yōu)良性標準。1) 無偏性設為總體參數(shù),為的一個估計量,如果,則稱是的無偏估計量?即是重心,與的距離最近。2) 有效性設 為e的兩個無偏估計量,如果有: ,則稱 。即對于同一總體參數(shù)的兩個無偏估計量來說,方差越小的估計量越有效。3) 一致性設為e的一個估計量,若當 時,依概率收斂于e,則稱為e的一致估計量。此即隨著樣本容量n的增大,點估計量越來越接近被估總體參數(shù)e估計量樣本平均、樣本比例p、樣本方差S2分別是總體平均卩、總體比例n、總體方差。的無偏、有效、一致估計量。即滿足優(yōu)良性標準。點估計的優(yōu)點是簡潔明了,給出了具體的估計值;缺點是無法提供估計的精度和估計的可靠程度?第二節(jié)區(qū)間估計?圍繞點估計值構造總體參數(shù)的一個區(qū)間,這就是區(qū)間估計區(qū)間估計的概念1) 區(qū)間估計就是總體參數(shù)。落在區(qū)間估計量 內(nèi)的概率為1-a,即.稱區(qū)間為總體參數(shù)e的置信度為1-a的置信區(qū)間。2) 包含總體參數(shù)真值的區(qū)間所占的比例稱為置信水平,表示為(1-a)3) a是未包含總體參數(shù)的區(qū)間所占的比例4) 常用的置信水平值有99%,95%,90%【相應的a為0。01,0.05,0。10】5) 由樣本統(tǒng)計量所構造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間?其中區(qū)間的最小值稱為置信下限,最大值稱為置信上限.6) 統(tǒng)計學家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間?7) 用一個具體的樣本所構造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。8) 構造參數(shù)的區(qū)間估計時,要權衡以下兩個方面,一是估計量的精度要求,二是估計量的可靠性程度。9) 精度要求就是要把估計誤差控制在一定的范圍內(nèi),我們用極限誤差來反映?!髟叫?,表示估計的精度越高;△越大,表示估計的精度越低。10) 可靠性是指區(qū)間估計結果正確的概率保證。用置信度來反映。11) 在其它條件不變的情況下,置信度與精度二者呈反方向變化,要想提高置信度,置信區(qū)間就會增大,精度就會下降;要想提高精度,置信度就會下降。12) 在實際中,通常根據(jù)實際問題和研究的需要,選擇合適的置信度和精度,再確定樣本量總體均值的區(qū)間估計【分四種情況來討論?】總體服從正態(tài)分布,總體方差。2已知根據(jù)正態(tài)分布再生定理,樣本均值>將標準化,記。對于概率可靠程度1-a,有:將代入上式,經(jīng)過不等式的等價變形,得:總體均值卩在置信度1—a下的置信區(qū)間為:其中: 為抽樣極限誤差.影響極限誤差的因素:總體數(shù)據(jù)的離散程度,用。來測度樣本容量,置信水平(1一a),影響z的大小置信水平的值,喳標準正態(tài)分布表得到。例如:1-a=95%則:a=0。05 1-a/2=1—0.025=0.975找到0。975,其對應的橫+豎的值,為我們所求的值對于總體分布未知,大樣本(nM30),總體方差02已知根據(jù)中心極限定理■樣本均值近似服從■因而同樣可以用式(6。3)得出估計區(qū)間。總體分布未知,大樣本,方差02未知運用中心極限定理,總體均值卩在置信度1—a下的置信區(qū)間為:總體服從正態(tài)分布,小樣本,總體方差02未知....總體均值^在置信度丄—a下的置信區(qū)間為:使用t分布.…亠置信水平的ta/25—布表得到:例如:1—?a?=9S%,n=16:則:a=0.05 a/2=0。025,n-1=15 :找到a=0o025,v=15,其對應的值,為我們所求的ta/2(°—1)值■三、總體比例的區(qū)?間估計總體比例,是指總體中,具有某種特征的單位個數(shù)與全部單位數(shù)之比,記為n?樣本比例,是指樣本中,具有某種特征的單位個數(shù)與樣本容量之比,記為P總體比例是一種特殊的總體均值當樣本量充分大()時,近似服從正態(tài)分布總體比例n在置信度1—a下的置信區(qū)間為:總體比例n是未知的,通常用樣本比例p來代替總體比例n?總體方差的區(qū)間估計【不考】第七章假設檢驗第一節(jié)假設檢驗的基本原理?假設檢驗的基本原理用t分布、區(qū)間估計中區(qū)間事件的余集是小概率事件和小概率原理,得出了檢驗統(tǒng)計量t的數(shù)值及拒絕域,在樣本有代表性時,用統(tǒng)計量t和拒絕域可得出檢驗的更好決策。該方法稱為t檢驗使產(chǎn)品質量檢驗由大樣本被小樣本替代一、 假設檢驗的概念假設檢驗依據(jù)的是小概率原理,即小概率事件在一次試驗中是幾乎不可能發(fā)生的,如果小概率事件發(fā)生了,我們拒絕H0,即H1成立;否則,我們不能拒絕H0。將t稱為檢驗統(tǒng)計量,a稱為顯著性水平,水平,稱為拒絕域二、 假設檢驗的基本步驟以P112為例建立假設H0:u=卩0=5 H1:uHu0=5,確定檢驗統(tǒng)計量,并計算檢驗統(tǒng)計量值給定顯著水平a=0.05,查表得拒絕域(小概率事件)4。 判斷,t=—6。25落入拒絕域,拒絕H0,即此次抽樣認為該廠生產(chǎn)的筆記本電腦不符合規(guī)定標準[補充:檢驗規(guī)則有兩種臨界值規(guī)則和P—值規(guī)則,計算機軟件中通常用P—值規(guī)則。]三、假設檢驗中的兩類錯誤第I類錯誤是指原假設H0為真,卻拒絕H0的錯誤,也叫棄真錯誤或a錯誤。第II類錯誤是指原假設H0為假,卻接受H0的錯誤,也叫取偽錯誤或B錯誤。對于這兩類錯誤,人們總是希望a和B、越小越好。但當樣本容量n—定時,不能同時做到a和B都很小,若減少犯第一類錯誤的概率,則犯第二類錯誤的概率往往增大,即此時a和B反向變化。若要使犯兩類錯誤的概率都減小,只能增加樣本容量。在假設檢驗中,人們往往認為犯第一類錯誤后果更嚴重,而犯第二類錯誤后果的嚴重性會低一些。因此在實際檢驗中,犯第一類錯誤的概率總是優(yōu)先加以控制。第二節(jié)一個總體參數(shù)的檢驗兩種檢驗方式t檢驗(1)建立假設H0:?U=U0H1:uMu0,雙側檢驗②uWu0U>U0,右單側檢驗③U三U0U<U0,左單側檢驗(2)確定檢驗統(tǒng)計量,并計算檢驗統(tǒng)計量值根據(jù)前面兩步可確定①是雙側檢驗,②是右單側檢驗③是左單側檢驗(3)給定顯著水平a,求得拒絕域(小概率事件)①1t丨上t(n1)a/2(雙側檢驗)②t上ta(n-1)(右單側檢驗)③tW-t(n—1)(左單側檢驗)(4)判斷,如果t落入拒絕域,拒絕H0;如果t不落入拒絕域,不能拒絕H0。Z檢驗⑴建立假設H0:①卩=卩0 H1: 0,雙側檢驗uWu0 U>U0,右單側檢驗u三U0 UVU0,左單側檢驗(2)確定檢驗統(tǒng)計量,并計算檢驗統(tǒng)計量值根據(jù)前面兩步可確定①是雙側檢驗,②是右單側檢驗,③是左單側檢驗(3)給定顯著水平a,拒絕域(小概率事件),(雙側檢驗)(右單側檢驗)(左單側檢驗)(4)判斷,如果z落入拒絕域,拒絕H0;如果z不落入拒絕域,不能拒絕H。。?一、總體均值的檢驗小樣本(nV30),總體服從正態(tài)分布總體標準差。未知時,用t檢驗總體標準差。已知時,用Z檢驗大樣本(n>30)總體標準差。未知時,用Z檢驗總體標準差。已知時,用Z檢驗二、 總體成數(shù)(或總體比例)的檢驗?總體中只有兩種結果可用正態(tài)分布來近似。服從二項分布抽得大樣本情況下,即滿足:對于雙側檢驗,單側檢驗有如下檢驗步驟:建立假設H。:叫.卩工卩0u>u0u<u02。確定檢驗統(tǒng)計量,并計算檢驗統(tǒng)計量值根據(jù)前面兩步可確定①是雙側檢驗,②是右單側檢驗,③是左單側檢驗3。 給定顯著水平a,拒絕域(小概率事件)(雙側檢驗)(右單側檢驗)(左單側檢驗)4?判斷,如果z落入拒絕域,拒絕H0;如果z不落入拒絕域,則不能拒絕H0.三、 總體方差的檢驗(不考)第八章相關與回歸分析第一節(jié)相關分析一、函數(shù)關系與相關關系相關關系的定義變量之間有確定的關系,稱為函數(shù)關系.[如銷售額與價格、銷售量的關系]變量之間有關系,但不確定,稱為相關關系[如學生的學習時間與考試成績之間的關系。]2。 相關分析的作用1) 尋找變量之間數(shù)量方面的相互變動規(guī)律,為進一步研究現(xiàn)象之間的內(nèi)在因果聯(lián)系提供數(shù)據(jù)參考2) 許多有趣的經(jīng)濟金融科學問題的提出往往源于變量之間的相關關系二、相關關系的描述與度量相關分析一般按照以下步驟進行:(1) 確認變量之間是否存在關系,如果存在關系,確認它們之間是否是相關關系。(繪制散點圖)散點圖能初步直觀地判斷變量之間相關關系的類型、方向和強弱程度。從相關的方向來看,相關關系分為正相關和負相關從相關的形式來看,相關關系可以劃分為線性相關與非線性相關從相關關系的強弱來看,相關關系可以劃分為完全相關、不完全相關與不相關(2) 如果是相關關系,確認變量之間關系的類型、方向與強度。(計算相關系數(shù))?相關系數(shù)是測度線性相關關系方向與強弱程度的常用方法。?相關系數(shù)分為兩種:1)一種是總體相關系數(shù),其是用于測度x和y之間真實的線性相關程度,一般以下相關系數(shù)計算公式為:【P:總體相關系數(shù),Cov(X,Y):變量X和Y的協(xié)方差,Var(X)、Var(Y)分別表示X和Y的方差】總體相關系數(shù)通常是未知的??梢岳脴颖鞠嚓P系數(shù)作為總體相關系數(shù)的估計.樣本相關系數(shù)r的計算公式為:也可以按照以下公式進行計算:相關系數(shù)r的性質與特點:r的取值范圍介于—1與1之間。0VrW1,說明x和y兩個變量正線性相關;-1WrV0,說明x和y兩個變量負線性相關;r=1,說明x和y兩個變量完全正線性相關;r=—1,說明x和y兩個變量完全負線性相關;r=0,說明x和y兩個變量之間沒有線性相關關系。說明兩個變量之間的線性關系越強;說明兩個變量之間的線性關系越弱。相關系數(shù)r的絕對值與相關關系:相關系數(shù)r具有對稱性,即X和Y之間的相關系數(shù)與Y和X之間的相關系數(shù)相等.r是一個相對數(shù),其取值與X和Y這兩個變量具體的計量單位無關。相關系數(shù)r需要注意的地方:r是對變量之間線性相關關系的度量,r=0只是說明兩個變量之間不具有線性相關關系,但這不意味著兩個變量之間不存在其他類型的相關關系。r僅僅是對兩個變量之間線性關系的一個測度,即便是r不為零0,也只能從數(shù)量關系的角度反映兩個變量之間的聯(lián)系形式及其密切程度,但據(jù)此依然無法判斷兩個變量是否存在因果關系或者邏輯上的內(nèi)在聯(lián)系.僅僅依靠相關分析及回歸分析來分析,往往是一種“偽相關”或“偽回歸”.樣本所反映的變量之間的關系能否代表總體變量之間的關系?(相關系數(shù)的顯著性檢驗)P129第二節(jié)一元線性回歸一、一元線性回歸的相關概念相關分析不能判斷變量之間相關關系的具體數(shù)學形式,也無法通過一個變量的變化來預測另一個變量的變化情況,而回歸分析可以解決此問題。回歸分析主要解決以下幾個方面的問題:從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學關系式。對這些關系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響是顯著的,哪些是不顯著的。利用所求出的關系式,根據(jù)一個或幾個變量的取值來估計或預測另一個特定變量的取值并給出這種估計或預測的可靠程度.①猜測兩個變量的數(shù)量關系如下:【一元線性總體回歸模型】y是x的線性函數(shù)加上隨機誤差項u

上式中,為一元線性總體回歸模型x為確定性變量,B0和B]是未知的參數(shù),又叫回歸系數(shù)。Yi和Xi分別是Y和X的第i個觀測值。ui是相應的第i個隨機誤差項,是一個特殊的隨機變量,反映未列入方程式的其他各種因素對Y的影響。根據(jù)回歸模型中的假定,,對式(8?3)兩邊取平均值有:【一元線性總體回歸方程,也稱為直線回歸方程】其中B0是回歸直線在y軸上的截距,B1是直線的斜率,它表示當x每變動一個單位時,y的平均變動值.一元線性樣本回歸方程:由于回歸參數(shù)B0和B1是未知的,它們只能從總體中抽取樣本得到的數(shù)據(jù)去估計一元線性回歸模型對應的樣本回歸直線可表示為:式中,、為B。和B1的估計需要注意的地方:實際觀測到的因變量YI值,并不完全等于,用ei表示二者之差(),則有:上式稱為樣本回歸模型。式中ei稱為殘差。二、回歸模型參數(shù)的估計(一)參數(shù)的最小二乘估計下面用最小二乘法求總體回歸系數(shù)BO、B1的估計值.最小二乘法,也稱最小平方法。它是通過使因變量的觀測值與估計值之間的殘差平方和Q達到最小來估計B0和B]的方法。即令:根據(jù)微積分多元函數(shù)極值原理,要使上式達到最小,對B0和B]的一階偏導數(shù)都等于零,即:解方程組得:請寫出最小二乘估計的回歸方程,并解釋回歸系數(shù)的含義。相關系數(shù)判定系數(shù)是多少?比薩餅需求量的變差中有多大比例是由價格的變動引起的?說明該回歸方程擬合的情況。相關系數(shù)判定系數(shù)R2說明用估計的回歸方程預測因變量比薩餅需求量y時,平均的估計誤差是多少?孑(判定系數(shù)R2當價格為x=43元時,比薩餅需求量的點預測是多少?(二)最小二乘估計的優(yōu)良性質回歸系數(shù)的最小二乘估計具有線性性、無偏性、方差最小性?即最小二乘估計與用其他

參數(shù)估計方法求得的任何線性無偏估計相比,具有方差最小、一致的優(yōu)良統(tǒng)計性質.最小二乘估計具有上述優(yōu)良統(tǒng)計性質是有前提的,古典線性回歸模型需要滿足以下五個基本假定條件:Bi<(1)誤差項零均值假定,即E(ui)=0,i=1,2,BiCov(ui,Xi)=E[ui—E(ui)]E[Xi-E(Xi)]=E(口人)=0,i=1,2,…(5)誤差項正態(tài)性假定:ui服從正態(tài)分布,即q?N(0,。u2)以上五條稱為線性回歸分析的“古典假設”,是古典線性回歸模型的經(jīng)典假定。三、一元線性回歸模型的統(tǒng)計檢驗(一)回歸模型檢驗的類型:回歸模型的檢驗包括理論意義檢驗、統(tǒng)計檢驗(一級檢驗和二級檢驗)。理論意義檢驗主要涉及參數(shù)估計值的符號和取值區(qū)間,如果它們與實質性科學的理論以及人們的實踐經(jīng)驗不相符,就說明模型不能很好地解釋現(xiàn)實的現(xiàn)象。一級檢驗又稱統(tǒng)計學檢驗,它是利用統(tǒng)計學中的抽樣理論來檢驗樣本回歸方程的可靠性,具體又可分為擬合程度評價和顯著性檢驗.一級檢驗是對所有現(xiàn)象進行回歸分析時都必須通過的檢驗。二級檢驗又稱經(jīng)濟計量學檢驗,它是對標準線性回歸模型的假定條件能否得到滿足進行檢驗,具體包括序列相關檢驗、異方差性檢驗、多重共線性檢驗等。二級檢驗對于社會經(jīng)濟現(xiàn)象的定量分析具有特別重要的意義.(二)回歸模型的擬合優(yōu)度檢驗?1。判定系數(shù)為辨別估計的樣本回歸直線擬合實際樣本數(shù)據(jù)的優(yōu)劣程度,需要計算判定系數(shù)。為了說明判定系數(shù)的含義,需要對因變量y取值的總離差平方和進行分解。因變量y的取值是不同的,y取值的這種波動稱為變差?n次觀測值的總變差可由“總離差平方和”來表示。為考察所有Yi離差平方和的分解問題。所有Yi離差的平方和記為,稱“總離差平方和”.分解可得:【總平方和(SST)=回歸平方和(SSR)+殘差平方和(SSE)】即總離差平方和SST可分解為兩部分,一部分為:稱為“回歸平方和”,記為SSR;另一部分為:稱為“殘差平方和”,記為SSE回歸平方和(SSR):反映了y的總變差中由于x與y之間的線性關系引起的y的變化部分,它是可以由回歸直線來解釋的y變差部分;殘差平方和(SSE):它是除了x對y的線性影響之外的其他因素引起的y的變化部分。>判定系數(shù):是回歸平方和與總離差平方和之比。式中的定義,正是反映解釋變量對被解釋變量決定程度的指標,稱之為“樣本判定系數(shù)”也叫決定系數(shù),通常用R2表示?前一部分SSR相對于后一部分SSE越尢說明回歸擬合程度越好,Y與X之間的線性決定關系越明顯.判定系數(shù)的性質與解讀:R2是樣本回歸線與樣本觀測值擬合優(yōu)度的度量指標,其數(shù)值在0到1之間。R2=0,解釋變量X與Y沒有線性關系;R2=1,樣本回歸線與樣本觀測值重合,X與Y在一條直線上;0<R2<1,R2越接近1,樣本回歸線對樣本值的擬合優(yōu)度越高,X對Y的解釋能力越強。注:一元線性回歸中,判定系數(shù),r為x和y的相關系數(shù)。(三)回歸系數(shù)的顯著性檢驗?判定系數(shù)R2用來判斷樣本回歸直線對樣本觀測值的擬合優(yōu)度,但是卻不能告訴我們自變量x對因變量y是否具有統(tǒng)計意義上的顯著影響。如果通不過回歸系數(shù)的顯著性檢驗,我們還是不能認為自變量x對因變量y具有顯著的影響?;貧w系數(shù)的顯著性檢驗,即檢驗模型回歸系數(shù)是否顯著異于0,是基本的一種假設檢驗。若B1的估計數(shù)值較大,說明兩變量的關系是明顯的,若B1的估計數(shù)值較小,甚至無法排除它等于0的可能性,說明這兩個變量之間的關系不明顯,模型的基本設定不成立。回歸系數(shù)顯著性檢驗的步驟如下:(1)提出假設,即在原成立時的檢驗統(tǒng)計量~t(n-2)其中,為回歸系數(shù)估計量的標準差,其計算公式為:S=給定顯著性水平a,查t分布表,得拒絕域:判斷,如果t統(tǒng)計檢驗值落入拒絕域,拒絕原假設,說明變量x對變量y具有顯著的影響。?估計標準誤差就是度量各實際觀測點在直線周圍的散布狀況的一個統(tǒng)計量,它是均方殘差(MSE)平方根,用Se來表示,其計算公式為:e估計標準誤差反映了用估計的回歸方程預測因變量y時預測誤差的大小。Se越小,回歸直線對各觀測點的代表性就越好,可見,估計標準誤差從另一個角度說明了回歸直線的擬合優(yōu)度第九章時間序列分析第一節(jié)時間序列的基本概念一、時間序列的含義和作用1。含義:時間序列是不同時間上同一現(xiàn)象的觀測數(shù)據(jù)按時間順序排列而成的數(shù)據(jù)列。時間序列的兩大要素:時間和觀測值時間序列(舉例)\時間觀測值\2010年2011年2012年2013年2014年2015年國內(nèi)生產(chǎn)總值(萬億元)414853596368國內(nèi)生產(chǎn)總值增長率(%)10。69.57。87.77.36。92。作用描述被研究現(xiàn)象的發(fā)展過程、歷史狀態(tài)和結果;分析被研究現(xiàn)象的增長量、發(fā)展速度、趨勢,探索其發(fā)展變化的規(guī)律利用時間序列數(shù)據(jù)可建立計量模型,進行現(xiàn)象變動的趨勢分析和預測,為更好的決策提供依據(jù);將不同但又相互聯(lián)系的時間序列進行對比分析,可以研究同類現(xiàn)象在不同國家、地區(qū)之間的聯(lián)系以及發(fā)展變化的差別。時間序列分析的目的1)分析過去描述變化過程2)認識規(guī)律揭示變化規(guī)律3) 預測未來未來的數(shù)量趨勢4)二、時間序列的分類絕對數(shù)時間序列也叫總量指標時間序列,其描述現(xiàn)象總量指標的變化,反映了各時間某個指標發(fā)展的絕對水平。根據(jù)絕對數(shù)時間序列的時間不同,我們又可以將絕對數(shù)時間序列分為:時期時間序列:表示現(xiàn)象在某段時期內(nèi)的總量,將不同時期的時期指標按時間順序排列而成的數(shù)據(jù)列稱為時期時間序列。[如:某企業(yè)連續(xù)12個月的利潤額.]時點時間序列:表示現(xiàn)象在某個時點上所處的狀態(tài)和所達到的水平,將不同時點上的時點指標按時間順序排列而成的數(shù)據(jù)列稱為時點時間序列。[如:連續(xù)12個月月初工廠上班的工人人數(shù)]【注意】時期時間序列和時點時間序列的區(qū)別:(1) 定義上:時期時間序列反映現(xiàn)象在各個時期內(nèi)達到的總量,因此實際中又稱其為流量數(shù)據(jù);時點序列反映現(xiàn)象在各個時點上所處的狀態(tài)和所達到的水平,因此實際中又稱其為存量數(shù)據(jù)。(2) 可加性上:時期時間序列具有可加性,相加后表示更長一段時期的總量,如2013年GDP、2014年GDP相加后是2013年和2014年的GDP;時點時間序列不具有可加性,如2013年末人口數(shù)、2014年末人口數(shù)相加后沒有意義.(3) 數(shù)值大小與時間的長短關系上:時期時間序列數(shù)值大小與時間的長短有關,時間越長,同一現(xiàn)象同一總量指標的時期時間序列數(shù)值就越大;時點時間序列數(shù)值大小與時間的長短沒有關系。(4) 數(shù)據(jù)收集上:時期時間序列的每個數(shù)據(jù)是每段時期內(nèi)連續(xù)登記的結果;時點時間序列只需要收集現(xiàn)象代表性時點上的數(shù)據(jù).2。 相對數(shù)時間序列指不同時間上的相對指標按時間順序排列而成的數(shù)據(jù)列,其反映了不同現(xiàn)象的對比關系或同一現(xiàn)象不同時間上的發(fā)展情況。如:人均GDP時間序列,CPI時間序列等。由于相對數(shù)時間序列的比較基數(shù)不同,相對數(shù)時間序列不具有可加性.3。 平均數(shù)時間序列指不同時間上的平均指標按時間順序排列而成的數(shù)據(jù)列,其反映了事物平均水平的發(fā)展情況。如:平均工資時間序列與相對數(shù)時間序列類似,由于其比較的基數(shù)不同,平均數(shù)時間序列也不具有可加性。三、時間序列的編制原則保證時間序列中各項觀察值具有可比性:1。時間(長度或間隔)一致范圍一致內(nèi)容、計算口徑和計算方法一致第二節(jié)時間序列的描述性分析一、時間序列的圖形分析P144-146[用Excel畫線圖]二、時間序列的水平分析水平分析是指對事物變化的狀態(tài)進行的分析,描述事物發(fā)展變化的指標有:1.發(fā)展水平時間序列數(shù)據(jù)本身就描述了事物的發(fā)展水平。2.序時平均數(shù)【絕對數(shù)、相對數(shù)、平均數(shù)】1)表示不同時間上數(shù)據(jù)的平均數(shù)。2)在具體計算序時平均數(shù)時,我們需要根據(jù)時間序列數(shù)據(jù)的類型分別計算:絕對數(shù)時間序列的序時平均數(shù)絕對數(shù)時間序列有時期時間序列和時點時間序列,故其有兩種序時平均數(shù)。時期時間序列的序時平均數(shù)時期時間序列具有可加性,相加后等于現(xiàn)象在一段時期內(nèi)的總量,所以計算序時平均數(shù)采用簡單算術平均法。時點時間序列的序時平均數(shù)時點時間序列不具有可加性,因此其序時平均數(shù)的計算與時期時間序列不一樣,其根據(jù)時間間隔是否相等有不同的計算方法。時間間隔相等的時點時間序列序時平均數(shù)采用首末折半法其中:yi表示各時點的發(fā)展水平,n=數(shù)據(jù)項數(shù)一1時間間隔不等的時點時間序列序時平均數(shù)以每兩個相鄰時點指標的平均作為該時段指標估計值,把時段的時間間隔長度作為權數(shù),用它們的加權算術平均數(shù)作為序時平均數(shù)。其中:yi表示各時點的發(fā)展水平,fi為對應時段的時間間隔長度。相對數(shù)時間序列的序時平均數(shù)P150例9—5相對數(shù)時間序列中各相對數(shù)的分母通常不一致,在計算其序時平均數(shù)時,不能直接計算平均按照以下步驟計算:設相對數(shù)y=a/b,先分別計算分子a和分母b的序時平均數(shù),記為;相對數(shù)時間序列的序時平均數(shù).計算中,對時期時間序列的序時平均數(shù)采用簡單算術平均法,對時點時間序列的序時平均數(shù)采用首末折半法.平均數(shù)時間序列的序時平均數(shù)與相對數(shù)時間序列的序時平均數(shù)方法相同?!纠?-6】增長量描述事物報告期比基期增長變化的絕對量,計算公式:增長量=報告期水平-基期水平根據(jù)基期水平不同,增長量分:逐期增長量=報告期水平-前期水平=y.—y—1,i=l,2,?。.,n累計增長量=報告期水平-固定基期水平=y.-y0,i=1,2,?。,n逐期增長量與累計增長量的關系:逐期增長量的和=相應時期內(nèi)累計增長量,即:(y】-y°)+(卩2-兒)+???+(yn~yn—i)=y.%相鄰兩個累計增長量之差=逐期增長量,即:(yi-y0)—(yi—1-y0)=yi—yi—1此外,為了消除季節(jié)變動的影響,有:同期增長量=報告期水平-上年同期水平4.平均增長量指各個時期增長量的平均值.第1至第n期的平均增長量為:其中:yi表示時間i上的發(fā)展水平,n=數(shù)據(jù)項數(shù)一1三、時間序列的速度分析指事物變化的快慢程度。描述事物變化的快慢程度指標有:發(fā)展速度描述了事物在報告期相對于基期發(fā)展的倍數(shù).發(fā)展速度=報告期水平/基期水平在具體計算時,根據(jù)基期水平的不同,發(fā)展速度分為:環(huán)比發(fā)展速度=報告期水平/前期水平=yi ,=1,2,??。,n定基發(fā)展速度=報告期水平/固定基期水平=yi/y0,i=1,2,..。,n環(huán)比發(fā)展速度與定基發(fā)展速度的關系:環(huán)比發(fā)展速度連乘積=相應時期內(nèi)定基發(fā)展速度,即相鄰兩個定基發(fā)展速度之商=環(huán)比發(fā)展速度,即此外,為了消除季節(jié)變動的影響有:同期發(fā)展速度=報告期水平/上年同期水平增長速度【例9-10】P153表示事物報告期較基期增長的倍數(shù)或百分之幾:增長速度=報告期增長量/基期水平=發(fā)展速度一1在具體計算時,根據(jù)基期水平的不同,增長速度分為:環(huán)比增長速度=逐期增長量/前期水平=環(huán)比發(fā)展速度-1=(yi/yi—1)-1,i=1,2,..。,n定基增長速度=累計增長量/固定基期水平=定基發(fā)展速度-1=(yi/y0)-1,i=1,2,...,n此外,為了消除季節(jié)變動的影響有:同期增長速度=同期發(fā)展速度一1平均發(fā)展速度和平均增長速度平均發(fā)展速度是環(huán)比發(fā)展速度的平均,表示所觀察時間段內(nèi)環(huán)比發(fā)展速度的一般水平由于各期環(huán)比發(fā)展速度的基數(shù)不同,不能用各期環(huán)比發(fā)展速度相加后計算平均發(fā)展速度,其計算方法有兩種:① 幾何平均法【例9-11】P154假定各期環(huán)比發(fā)展速度yi/yi—1=平均發(fā)展速度平均發(fā)展速度:其中:y.表示時間/上的發(fā)展水平,n=數(shù)據(jù)項數(shù)-1因此,平均增長速度:且有對未來時期數(shù)據(jù)的預測公式為:② 累

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論