統(tǒng)計學復習提綱詳細_第1頁
統(tǒng)計學復習提綱詳細_第2頁
統(tǒng)計學復習提綱詳細_第3頁
統(tǒng)計學復習提綱詳細_第4頁
統(tǒng)計學復習提綱詳細_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 第二學期統(tǒng)計學復習提綱第一章:緒論1、統(tǒng)計的含義、研究對象和特點一、統(tǒng)計的含義:人們對客觀事物的數(shù)量表現(xiàn)、數(shù)量關系和數(shù)量變化進行描述和分析的 一種計量活動。在不同的場合,統(tǒng)計一詞有統(tǒng)計工作、統(tǒng)計資料、統(tǒng)計科學三種含義。二、統(tǒng)計的研究對象:是統(tǒng)計工作的規(guī)律,即搜集、整理和分析統(tǒng)計數(shù)據(jù)的方法,是一門方法論科學。(P11)三、統(tǒng)計的特點:1)數(shù)量性(最基本特點);2)具體性;3)綜合性(或者總體性)(P4)2、統(tǒng)計學的基本概念:總體、總體單位、標志、指標、變量一、總體:在某種共性的基礎上由許多個別事物結合起來的整體。其特征1)同質(zhì)性;2)大量性;3)差異性。其分類:1)有限總體;2)無限總體。(P

2、13)確定總體是為了確定調(diào)查研究的對象和范圍,確定總體單位是為確定調(diào)查登記項目的 承擔者。二、總體單位:構成總體的個別事物。(P13)三、標志:指說明總體單位特征的名稱,由標志名稱+標志值構成。其分類:1)品質(zhì)標志、數(shù)量標志;2)不變標志、可變標志(包括變異和變量) 。(P15)四、指標:是說明總體數(shù)量特征的概念。由指標名稱+指標值組成。五、變量:可變的數(shù)量標志。(P15)3、補充:標志和指標的區(qū)別和聯(lián)系1)區(qū)別:指標說明總體的特征;而標志說明總體單位的特征指標只反映總體的數(shù)量特征;標志既可以反映總體單位的數(shù)量特征,也可以反映總體單位的品質(zhì)特征2)聯(lián)系:指標的數(shù)值是由總體各單位的數(shù)量標志的標志

3、值匯總而得到的第二章:統(tǒng)計調(diào)查1、統(tǒng)計調(diào)查的組織形式有哪些。(紅色字體)2、什么是隨機抽樣;什么是非隨機抽樣。(藍色字體)3、非隨機抽樣的類型(粉紅色字體)一、普查:是指為搜集某種社會經(jīng)濟現(xiàn)象在某時某地的情況而專門組織的一次性全面調(diào) 查。特點:涉及面廣、工作量大、時間性強、耗費較多、組織工作復雜。二、隨機抽樣調(diào)查:是指按隨機原則從總體中抽取部分單位進行調(diào)查,并借以推斷和認識總體的一種統(tǒng)計方法。特點:最科學的非全面調(diào)查。三、非隨機抽樣調(diào)查:是指調(diào)查者有意識地或隨意而非隨機地從總體中抽取部分單位進 行調(diào)查的統(tǒng)計方法。特點:一般不用于推算總體指標。1)重點抽樣,是指只對總體中為數(shù)不多但影響頗大的重點

4、單位進行研究的一種非全面 調(diào)查。特點:以較少的人力、物力和財力,幾時地掌握總體的基本情況及其發(fā)展變化的基本 趨勢。2)典型抽樣,是指根據(jù)對調(diào)查對象的初步了解,有意識地從中挑選具有代表性的單位 進行研究的一種非全面調(diào)查。特點:唯物辯證法的引用,從個體了解一般,靈活反駁,反應 迅速,省時省力,深入具體。作用:“解剖麻雀”,推論一般,指導全局。研究新生書屋,推廣新鮮經(jīng)驗,促進新生事物的發(fā)展。有利于全局與典型、數(shù)字與輕狂的結合,促進 統(tǒng)計研究的深化。(=!不可靠的馬克思產(chǎn)物)3)任意抽樣(方便抽樣、 隨意抽樣),是指調(diào)查者隨意抽取調(diào)查單位進行調(diào)查的一種方 法。特點:不能保證每個單位都有相同的中選機會。

5、(與隨機抽樣相區(qū)分)4)配額抽樣,是在總體作若干種分類和樣本總容量既定的輕狂下,按配額從總體各部 分抽取調(diào)查單位進行調(diào)查的方法。四、定期統(tǒng)計報表:是指按國家統(tǒng)一規(guī)定的指標體系、表格形式、報送程序和報送時間,定期地自下向上地向國家和上級主管部門報送統(tǒng)計資料的一種統(tǒng)計調(diào)查形式。4、調(diào)查誤差的概念和種類。一、調(diào)查誤差的概念:是指調(diào)查所得的統(tǒng)計數(shù)字與調(diào)查對象的實際數(shù)量之間的差異。二、調(diào)查誤差的種類:1)工作誤差:由于調(diào)查工作中的失誤造成的誤差。(人為誤差,理論上可以消除)2)代表性誤差:以部分推斷總體時必然存在的誤差。(無法消除,但可以進行控制和計5、補充:統(tǒng)計資料的搜集方法。一、直接觀察法。二、采訪

6、法。三、報告法。四、通訊法。五、實驗調(diào)查法。六、網(wǎng)上調(diào)查法。6、補充:調(diào)查方案的基本內(nèi)容。一、統(tǒng)計調(diào)查的目的。二、調(diào)查對象、調(diào)查單位和報告單位。三、調(diào)查項目和調(diào)查表。四、調(diào)查的時間和地點。五、調(diào)查的方式、方法。六、調(diào)查工作的組織實施計劃。7、補充:調(diào)查技術。一、自由回答法。 二、二項選擇法。 三、多項選擇法。 四、賦值評價法。 五、空位答題法。 六、等級定位法。 七、排序順位法。 八、比較選擇法。九、連線配合法。第三章:統(tǒng)計整理1、統(tǒng)計分組:組數(shù)、組距、組限、組中值(及其計算)一、組數(shù):即將總體分為幾組。1)品質(zhì)分組的組數(shù)由兩個因素決定:事物本身的特點和統(tǒng)計研究的任務2)數(shù)量分組的組數(shù)由兩個因

7、素決定:全距=最大標志值-最小標志值組距=各組最大標志值(上限)-各組最小標志值(下限)=全距一組數(shù)二、組距:各組的最大標志值(上限)與最小標志值(下限)之差。三、組限:是指每組兩端的數(shù)值,其中每組的起點數(shù)值(最小值)稱為下限,最點數(shù)值(最大值)稱為上限。四、組中值:是各組組距的中點值,代表組內(nèi)各標志值的一般水平,具有平均數(shù)性質(zhì)(但不是平均數(shù))。五、計算:1)重合式:指相鄰兩組中,前一組的上限和后一組的下限數(shù)值重合。一般用于連續(xù)型 變量。組距= 上限-下限組中值二(上限+下限)+ 2=下限+組距/2=上限一組距/22)不重合式:指前一組的上限與后一組的下限,兩值緊密相連而不相重復。一般用于 離

8、散型變量。組距= 下組下限-本組下限 =本組上限-前組上限組中距=(本組下限+下一組下限)+2=本組下限+組距/2=下組下限組距/2補充:組數(shù)、組距確定的斯特杰斯經(jīng)驗公式n 1 3.3lgN.R X max X min dn 1 3.3lg Nn:組數(shù),N:總體單位數(shù),d:組距,R:全距X max:最大變量值,X min :最小變量值2435485261合計20君某車閶工人日加工零件數(shù)分組1按零件數(shù)分2且頻數(shù)(人)頻率%)105109361101145101151198161201241428125129102013013461213513948合計50100補充:分組形式:一、單項式分組:1

9、)適合于離散變量2)將一個變量值作為一組3)適合于變量值變動幅度較小的情況二、組距式分組:1、適合于連續(xù)變量和變動幅度較大的離散變量2、適合于變量值較多的情況3、將變量值的一個區(qū)間作為一組必須遵循“不重不漏” 的原則4、可采用等距分組,也可采用不等距分組補充:等距分組與不等距分組:一、等距分組:標志變量在各組保持相等組距。在分組標志變化比較均勻的情況下適合用等距分組。二、不等距分組:標志變量在各組中的組距不相同。標志值急劇增長或下降時適合用不等距分組。2、分布數(shù)列及其種類;一、分布數(shù)列(次數(shù)分布或次數(shù)分配):指反映總體單位在各組分布狀況的一系列數(shù)字。分布數(shù)列組成要素:1)組的名稱;2)各組次數(shù)

10、(頻數(shù))或頻率二、分布數(shù)列的種類:1)按分組標志的不同:品質(zhì)數(shù)列,是指按品質(zhì)標志分組所形成的分布數(shù)列,它由各組名稱和各組單位數(shù)構成。變量數(shù)列,是指按數(shù)量標志分組所形成的分布數(shù)列,由變量和次數(shù)兩個要素組成。2)按分組形式不同:1)單項式數(shù)列,是指各組都由一個具體的變量值(單項)來表示的數(shù)列。2)組距式數(shù)列,是指各組都由兩個變量值界定的變量區(qū)間(組距)來表示數(shù)列,又分 為等距數(shù)列和不等距數(shù)列。3)按次數(shù)分布的特征不同:1)鐘形分布數(shù)列,數(shù)列中愈靠近變量值中點分布次數(shù)愈多,愈遠離變量值中點分布次 數(shù)愈少。又分為對稱分布、右偏分布和左偏分布。審核一分組一匯總一制表。二、兜坐理的分組:1)統(tǒng)施如:指根據(jù)

11、社會經(jīng)濟現(xiàn)象的特點和統(tǒng)計研究的目的要求,按某種重要標志把總體分成若干部分的科學分類。分組原則:組內(nèi)盡量相似,組間盡量差異。統(tǒng)計分組的關鍵:選擇分組標志;劃分各組界限。2)統(tǒng)計分組的作用:劃分社會現(xiàn)象的不同類型揭示社會經(jīng)濟現(xiàn)象的內(nèi)部結構分析社會現(xiàn)象間的依存關系3)統(tǒng)計分組的種類:按分組的作用或目的不同:類型分組、結構分組和分析分組。按分組標志的多少和分組形式:簡單分組、復合分組和并列分組。按分組標志性質(zhì):品質(zhì)分組和數(shù)量分組。4)統(tǒng)計分組的標志選擇:分組標志:是指將總體劃分為性質(zhì)不同的組的標準或依據(jù)。分組標志選擇的要求:I要符合統(tǒng)計研究的目的和要求n必須選擇最主要的標志作為分組依據(jù)m要考慮社會經(jīng)濟

12、現(xiàn)象所處的具體歷史條件三、統(tǒng)計整理的匯總:1)概念:將統(tǒng)計資料歸并到各組中去,并計算各組和總體的合計數(shù)的工作過程。2)作用:將各個調(diào)查單位的情況,匯總成總體情況,使我們能看到全體,進而揭示總 體在多方面的數(shù)量特征。四、統(tǒng)計整理的制表:1)要合理安排統(tǒng)計表的結構。2)總標題應該簡要反映表的基本內(nèi)容,還要指出資料所屬時間和地點。3)數(shù)據(jù)計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出 一列標明。4)表中的上下兩條橫線一般用粗線,其他線用細線。5)通常情況下,統(tǒng)計表的左右兩邊不封口。6)表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應以小數(shù)點對齊,而且小數(shù)點的位數(shù)應統(tǒng)7)對于沒有數(shù)字的表格單

13、元,一般用“一”表示8)必要時可在表的下方加上注釋第四章:總量指標和相對指標1、總量指標和種類;一、總量指標(絕對指標):是反映社會經(jīng)濟現(xiàn)象在一定時間、地點條件下所達到的總規(guī)模、總水平或工作總量的綜合指標。 、二、總量指標的種類:1)按其反映總體內(nèi)容不同:總體總量,即總體單位數(shù),是由每個總體單位加總而得到的。標志總量,是指總體各單位某一數(shù)量標志的總和。2)按其反映時間狀態(tài)的不同:時期指標(時期數(shù)),是指反映社會經(jīng)濟現(xiàn)象在一段時間內(nèi)所達到的總規(guī)模、總水平或 工作總量。時點指標(時點數(shù)),是指反映社會經(jīng)濟現(xiàn)象在某一時點(時刻)所達到的數(shù)量狀態(tài)。3)按采用的計量單位不同:實物指標,是指以實物單位計量

14、的總量指標,即以事物的物理屬性或自然屬性作為計量單位的指標。價值指標,是指以貨幣為計量單位的總量指標。勞動量指標,是指以勞動量單位計量的總量指標。補充:時期指標與時點指標的比較:時期指標的特點1)時期指標數(shù)值連續(xù)統(tǒng)計2)不同時期的時期指標數(shù)值可以累計相加3)時期指標數(shù)值大小與統(tǒng)計期限長短有關時點指標的特點1)時點指標的數(shù)值間斷統(tǒng)計2)不同時期的時點的指標數(shù)值不能累計相加3)時點指標的數(shù)值大小與其時間間隔長短無直接相關1、相對指標和種類;一、相對指標:兩個有聯(lián)系的統(tǒng)計指標進行對比的比值,用以反映現(xiàn)象的發(fā)展程度、結構、強度、普遍程度或比例關系。表現(xiàn)形式:成數(shù);系數(shù)和倍數(shù);百分數(shù)、千分數(shù)、 萬分數(shù);

15、單名數(shù)和復名數(shù)二、相對指標的種類:1)計劃完成相對數(shù):現(xiàn)象在某一段時間內(nèi)的實際完成數(shù)與計劃完成數(shù)之比。作用:考 核、反映計劃完成的程度(進度)。計算公式:計劃完成相對數(shù) =實際完成數(shù)/計劃完成數(shù)x 100%產(chǎn)量、產(chǎn)值增長百分數(shù):計劃完成相對數(shù)=(100%+實際增長)/(100%+計戈ij增長)x 100%產(chǎn)品成本降低百分數(shù):計劃完成相對數(shù)=(100%-實際降低)/(100%-計劃規(guī)定降低)X100%2)結構相對數(shù):總體中某部分數(shù)值與該總體數(shù)值對比的比值。作用:反映總體內(nèi)部構 成情況的綜合指標。特點:必須與統(tǒng)計分組相結合;分子的數(shù)值是分母數(shù)值的一部分; 總體中各部分比重之和等于1或100%;表現(xiàn)

16、形式為無名數(shù)(百分數(shù)、千分數(shù)或 成數(shù))。計算公式:結構相對數(shù) =總體某部分數(shù)值/總體數(shù)值X 100%3)比例相對數(shù):同一總體內(nèi)某一部分數(shù)值與另一部分數(shù)值對比的比值。作用:反映總 體各部分間的內(nèi)在聯(lián)系與比例關系。(同一總體不同部分比較)特點:對比的分子分母屬于同一總體;分子分母可以互換(與結構相對數(shù)的區(qū)別);比例相對數(shù)的數(shù)值,一般用百分數(shù)或幾比幾的形式表示。計算公式:比例相對數(shù) =總體中某一部分數(shù)值/同一總體另一部分數(shù)值x 100%4)比較相對數(shù):同一時間的同類指標在不同空間對比的比值。作用:反映同類現(xiàn)象在 不同空間的數(shù)量差異或不平衡程度,發(fā)現(xiàn)先進與后進。特點:分子分母的數(shù)值分別屬于不同的總體;

17、分子分母是同類指標;分子分母可以互換。計算公式:比較相對數(shù)二甲地區(qū)某指標數(shù)值/乙地區(qū)同一指標數(shù)值X 100%5)動態(tài)相對數(shù):某一社會經(jīng)濟現(xiàn)象在不同時期兩個數(shù)值對比的比率,又稱發(fā)展速度或 指數(shù)。作用:反映事物發(fā)展變化的方向與程度。其中:報告期又稱計算期,是研究或計算時 期。基期是作為比較基礎的時期。計算公式:動態(tài)相對數(shù) =報告期數(shù)值/基期數(shù)值X 100%6)強度相對指標:兩個性質(zhì)不同但有一定聯(lián)系的總量指標之間的對比。作用:反映事物存在的密度、普遍程度、運動強度、負擔強度;反映經(jīng)濟效益的高低。特點強度相對數(shù)一般采用有名數(shù)(復名數(shù))為計量單位,即由分子分母原有的計量單位構成。有的 強度相對指標分子分

18、母可以互換,有正指標和逆指標,正指標的比值的大小與其反映的強度、 密度和普遍程度成正比,而逆指標正好相反。計算公式:強度相對數(shù) =某一指標數(shù)值/另一有聯(lián)系的指標數(shù)值x 100%第五章:平均指標1、平均指標及其種類;一、平均指標:同質(zhì)總體某一標志在一定時間、地點、條件下所達到的一般水平,是總 體的代表值,它描述分布數(shù)列的集中趨勢。特點:同質(zhì)性、代表性和抽象性。作用:可以 比較同類現(xiàn)象在不同單位、 不同地區(qū)間的平均水平; 可以比較同類現(xiàn)象在不同時期的平均 水平;可用于研究事物之間的依存關系;利用平均數(shù)還可以進行推算和預測。二、平均指標的種類:1)數(shù)值平均數(shù):算術平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)。2)

19、位置平均數(shù):眾數(shù)和中位數(shù)。、各種平均指標的計算:、算術平均數(shù):算術平均數(shù) =同一總體的標志總量/同一總體的總體總量Xii 1nXXif1X2 f2ff1)簡單算術平均數(shù):X Xi Xa L Xn n2)加權算術平均數(shù):L q X 1 fi X ”2 L X n fnXfX & 。f22L fnf3)交替標志平均數(shù):以1作為具有某種屬性的單位標志值,以0作為不具有某種屬性的單位標志值。利用加權算術平均數(shù)可得。補充:算術平均數(shù)的數(shù)學性質(zhì):1)算術平均數(shù)與總體單位數(shù)的乘積,等于各單位標志值的總和。 TOC o 1-5 h z 2)各單位標志值與算術平均數(shù)離差之和等于0.3)各單位標志值與算術平均數(shù)離

20、差平方之和為最小。4)對各單位標志值加或減一個任意數(shù)a,則算術平均數(shù)也要增加或者減少該數(shù)a。5)對各單位標志值乘以或除以一個任意數(shù)b,則算術平均數(shù)也要乘以或除以該數(shù)bo二、調(diào)和平均數(shù)(倒數(shù)平均數(shù))1)簡單調(diào)和平均數(shù):是標志值倒數(shù)的算數(shù)平均數(shù)的倒數(shù)。計算公式:H1n111111XX2XnX1X2Xnnn 1i 1 Xi2)加權調(diào)和平均數(shù):是指各單位標志值倒數(shù)的加權算術平均數(shù)的倒數(shù)。計算公式:m1m2mkmiH x.i 1m1m2mkk mX1X2.Xki 1 X inn 3)由相對數(shù)或平均數(shù)計算平均數(shù):(P110)三、幾何平均數(shù):幾何平均法是n個變量連乘積的n次根。一般適用于各變量值之間存 在環(huán)

21、比關系的事物。1)簡單幾何平均數(shù): _nG nx x2 x3 .X n X.2)加權幾何平均數(shù):3)注意:變量數(shù)列中任何一個變量值不能為0, 一個為0,則幾何平均數(shù)為 0。用環(huán)比指數(shù)計算的幾何平均易受最初水平和最末水平的影響。幾何平均法主要用于動態(tài)平均數(shù)的計算。四、眾數(shù):總體中出現(xiàn)次數(shù)最多的變量值,通常以符號M0表示。優(yōu)點:不受極端值的影響??赡軟]有眾數(shù)或有幾個眾數(shù)。1)由組距數(shù)列計算眾數(shù):第一步確定眾數(shù)所在的組,第二步通過公式計算眾數(shù)值。下限公式:M=L+Ai/( A i+A 2) Xi上限公式: M=U- A 2/( A i+ A 2) X i2)通過繪圖來求眾數(shù):第一步畫相鄰三組次數(shù)分布

22、直方圖,第二步連接相鄰兩組次數(shù)差的對角線,第三步以對角線的交點向 X軸垂線,它與X軸的交點即為眾數(shù)。通常以符號五、中位數(shù):總體各單位標志值按大小排序后,處于中間位置上的標志值, M表示。優(yōu)點:不受極端值的影響。1)未分組數(shù)據(jù):中位數(shù)位置 =(N+1)/22)組距分組數(shù)據(jù):中位數(shù)位置 二N/23、幾種平均數(shù)的關系:1)算術平均數(shù)、眾數(shù)和中位數(shù)的關系:1、變異度指標的概念和種類;變異度指標(標志變動度指標):是綜合反映總體各單位標志值及其分布的差異程度的 指標。變異度指標的作用:1)衡量平均數(shù)代表性的重要尺度。變異度指標值越大,平均數(shù)的代表性越低;反之亦 然。2)衡量現(xiàn)象變動的穩(wěn)定性和均衡程度。3

23、)計算抽樣誤差和確定樣本量的依據(jù)。變異度指標的種類:1)全距、四分位差2)平均差、標準差、方差、離散系數(shù)3)偏度、峰度2、掌握各種變異度指標的含義和計算(若考計算,數(shù)據(jù)都很少,計算過程非常 簡單):一、全距(極差):是指總體各單位標志值中最大值與最小值之差,一般以R表示。計算公式:R=Xma)-X min二、四分位差:是指四分位數(shù)中間兩個分位數(shù)之差,一般以Q表示。優(yōu)缺點:計算簡單,意義清楚,反映現(xiàn)象的差異程度較粗略和不全面,實用價值甚小。計算公式:四分位差 Q噪三個四分位數(shù) Q一第一個四分位數(shù) Q三、平均差:是指總體各單位標志值對其算術平均數(shù)的離差絕對值的算術平均數(shù),一般以A.D.表不優(yōu)缺點:

24、能全面反映一組數(shù)據(jù)的離散程度。由于采用絕對值運算,數(shù)學性質(zhì)較差,實際中應用較少。計算公式:未分組數(shù)據(jù)(不加權)A.D.組距分組數(shù)據(jù)(加權)A.D.四、標準差(均方差):是總體各單位標志值對算術平均數(shù)的離差的平方的算術平均數(shù) 的平方根。一般以(T表示。方差:標準差的平方。一般以b2表示。優(yōu)點:反映了各單位標志值與算術平均數(shù)的平均差異;且計算簡單,易于數(shù)學處理。計算公式:1)總體方差和標準差:未分組數(shù)據(jù)(不加權)(x X)2(X X)2 組距分組數(shù)據(jù)(加權)2 (X X)&f f-1X)2f2)樣本方差和標準差: 未分組數(shù)據(jù)nn(XiiX)22c2 JiJs n 1組距分組數(shù)據(jù)k(Mi x)22f

25、i2 ii 1s n 12(Mi X)2fiii力n五、變異系數(shù)(離散系數(shù)或標志變動度系數(shù)) 比得到的相對數(shù)。平均差系數(shù):平均差與算術平均數(shù)的比值。標準差系數(shù):標準差與算術平均數(shù)的比值。:是指各種變異度指標與其算術平均數(shù)對Va.d. =A.D./xV = 0- /X3、偏度和峰度:了解含義;能根據(jù)偏度和峰度系數(shù)判斷分布的特點。一、偏度:反映總體次數(shù)分布偏側方向和程度的指標。偏態(tài)系數(shù):是偏度與總體標準差之比,反映分布列的相對偏斜程度。偏態(tài)系數(shù)=0為對稱分布;偏態(tài)系數(shù) 0為右偏分布;偏態(tài)系數(shù) 0,右偏; SKP0,右偏;a 0,左偏。相對數(shù)指標。峰度磔偏分科度適中;偏態(tài) 系數(shù)3為尖峰分布。右偏分布

26、計算公式:3 =m/b 4=mVm22或者一 4XFiii 1N 4補充:k階隙點動若和 k階中點動差的求法。(P156)補充:峰度的mi=M扁平分伍ms=M-3M2M+2MmpM4-4MlM1+6MM3南補充:間接法。變量值較大且為等距數(shù)列的情況。1)先對變量x作線性變化,令 y=(x-a)/b , a為中間組的組中值,b為(x-a)的最大 公約數(shù)。2)求y的k階原點動差。3)由y的k階原點動差推算y的k階中心動差。4)由y的中心動差推算 x的中心動差。公式為:mv(x)=b k. mk(y)第七章:抽樣調(diào)查1、了解幾種常用分布的特點:二項分布、泊松分布和(標準)正態(tài)分布一、二項分布:進行

27、n次重復試驗,出現(xiàn)“成功”的次數(shù)的概率分布。PX=x=Cnx. px. (1-p) n-x, E(x)=np , D(x)=np(1-p)二、泊松分布:用于描述在一指定時間范圍內(nèi)或在一定的長度、面積、體積之內(nèi)每一事件出現(xiàn)次數(shù)的分布。E(x)=D(x尸入。eP X x=e=(x 0,1,2,n)x!一給定的時間間隔、長度、面積、體積內(nèi)“成功”的平均數(shù),e = 2.71828 , x 給定的時間間隔、長度、面積、體積內(nèi)“成功”的次數(shù)。f(x)e三、(標準)正態(tài)分布:/刈=隨機變量X的頻數(shù), (- x ,一般以H表示。備擇假設:與原假設對立的假設, 研究者想收集證據(jù)予以支持的假設,總有w, v或,一

28、般以H表示。3、基本概念:顯著性水平、置信水平、置信區(qū)間、P值;雙側檢驗和單側檢驗;z檢驗、t檢驗一、顯著性水平、置信水平、置信區(qū)間、P值:1)顯著性水平:原假設為真時,拒絕原假設的概率,由研究者事先確定,一般以a表示,常用 a 值:0.01、0.05、0.10。2)置信水平:是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間的概率,1- a。3)置信區(qū)間:是指在一定的概率保證程度下,某總體指標所在的區(qū)間范圍,用 p- Sx p+ 8 x表不。P值:在原假設為真的條件下,檢驗統(tǒng)計量的觀察值大于或等于其計算值的概率,反映實際觀測到的數(shù)據(jù)與原假設H0之間不一致的程度。決策規(guī)則:單側檢驗:若pa,則拒絕H;雙側檢

29、驗:若 p”或“”的假設檢驗。備擇假設的方向為“ ”,稱為右側檢驗。不僅僅要檢驗樣本平均數(shù)與總體平均數(shù)或樣本成數(shù)與總體成數(shù)有沒有顯著差異,而且要追究是否發(fā)生預先指定方向的差異時,應采用單側檢驗。二、z檢驗、t檢驗:z檢驗(正態(tài)分布檢驗):(P233)t檢驗(t分布檢驗)(P234)4、總體均值檢驗、小樣本檢驗方法的總結:假設雙側檢驗左側檢驗右側檢驗假設形式統(tǒng)計量”14拒絕域t - Q - DF式并-1)尸值決策第一類錯誤(棄真錯誤):原假設為真時,拒絕原假設,第一類錯誤的概率為(顯著性水平)。第二類錯誤(取偽錯誤):原假設為假時,接受原假設,第二類錯誤的概率為3 (Beta)?!板e誤和3錯誤的

30、關系:a和3就像蹺蹺板,a小3就大,a大3就小,二者不能同時減少。影響3錯誤的因素:1)總體參數(shù)的真值:隨著假設的總體參數(shù)的減少而增大;2)顯著性水平:當減少時增大;3)總體標準差:當增大時增大;4)樣本容量n:當n減少時增大。第九章:相關和回歸1、區(qū)分函數(shù)關系和相關關系一、函數(shù)關系:是指現(xiàn)象之間存在著嚴格的依存關系。特點:對于某一變量的每一個數(shù)值,都有另一變量的確定值與之相對應,并且這種關系可用一個數(shù)學表達式反映出來。二、相關關系:是指現(xiàn)象之間存在著非嚴格的、不確定的依存關系。特點:某一現(xiàn)象在數(shù)量上發(fā)生變化會影響另一現(xiàn)象數(shù)量上的變化,而且這種變化在數(shù)量上具有一定的隨機性。三、區(qū)別:1)函數(shù)關

31、系中兩變量之間的關系是確定的;相關關系中兩變量之間的關系是不確定。2)函數(shù)關系變量之間關系可以用方程y = f (x)表示出來;相關關系不能用一定的方程表示。3)函數(shù)關系是相關關系的特例,函數(shù)關系是完全的相關關系。2、相關關系的種類、相關系數(shù)的取值范圍一、相關關系的種類:1)按相關的程度分為:完全相關、不完全相關、不相關。2)按相關的方向分為:正相關、負相關。3)按相關的形式分為:線性相關、非線性相關。4)按影響因素的多少分為:單相關、復相關。二、相關系數(shù)取值范圍:1)符號:如果為正號,則表示正相關,如果為負號,則表示負相關。通俗點說,正相 關就是變量會與參照數(shù)同方向變動,負相關就是變量與參照

32、數(shù)反向變動;2、取值為0,這是極端,表示不相關;3、取值為1,表示完全正相關,而且呈同向變動的幅度是一樣的;4、如果為-1 ,表示完全負相關,以同樣的幅度反向變動;5、取值范圍:-1 , 1。3、熟悉回歸的含義和種類;一、回歸:研究自變量與因變量之間關系形勢的分析方法,其目的在于根據(jù)已知自變量來估計和與預測因變量的總平均值。二、種類:1)按變量多少:一元回歸方程和多元回歸方程。2)按是否線性:線性回歸方程和非線性回歸方程。3)按是否有滯后關系:自身回歸方程和無自身回歸方程。4、相關分析和回歸分析的區(qū)別和聯(lián)系;一、相關分析:是研究現(xiàn)象之間是否存在某種依存關系,并對具體有依存關系的現(xiàn)象探討其相關方

33、向以及相關程度,是研究隨機變量之間的相關關系的一種統(tǒng)計方法。二、回歸分析:是確定兩種或兩種以上變數(shù)間相互依賴的定量關系的一種統(tǒng)計分析方法。三、區(qū)別:1)相關分析中,變量 x變量y處于平等的地位;回歸分析中,變量 y稱為因變量, 處在被解釋的地位,x稱為自變量,用于預測因變量的變化;2)相關分析中所涉及的變量 x和y都是隨機變量;回歸分析中,因變量y是隨機變 量,自變量x可以是隨機變量,也可以是非隨機的確定變量;3)相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變 量x對變量y的影響大小,還可以由回歸方程進行預測和控制。 ?0 y紫 四、聯(lián)系:都是研究及測度兩個或兩個以上

34、變量之間關系的方法。5、簡單直線回歸的原理:最小平方法的中心思想一、相關分析與回歸分析的步驟:1)進行相關關系的定性分析;2)確定回歸方程;3)計算相關系數(shù)或相關指數(shù),對回歸方程變量之間的相關性進行顯著性檢驗;4)利用回歸方程式進行推算和預測;5)對推算和預測作出置信區(qū)間估計。二、簡單直線回歸的原理:1)簡單直線回歸分析:對兩個具有線性關系的變量,配合線性回歸方程,并根據(jù)自變 量的變動來測定因變量平均發(fā)展趨勢的分析方法。2)簡單直線回歸原理:總體回歸參數(shù)3 0和3 1是未知的,必須利用樣本數(shù)據(jù)去估計;樣本統(tǒng)計量3。和3 1代替回歸方程中的未知參數(shù) 3。和3 1,就得到了估計的回歸方程;一元線性

35、回歸中的估計回歸方程為:?0?1X一元線性回歸模型:描述因變量 y如何依賴于自變量x和誤差項 的方程稱為回 歸模型。y = 3 0 + 3 1 x + e , 3。和3 1成為模型的參數(shù)。誤差項e是一個期望值為 0的隨機變量,即 E( e )=0。對于一個給定的X值,y的期望值為E ( y ) =0+ 1 X ;對于所有的X值,e的方差b 2都相同;誤差項s是一個服從正態(tài)分布的隨機變量,且相互獨立。即e N( 0 , b 2 )。I獨立性意味著對于一個特定的X值,它所對應的e與其他 X值所對應的e不相關。n對于一個特定的X值,它所對應的y值與其他X所對應的y值也不相關。一元線性回歸方程:描述y

36、的平均值或期望值如何依賴于x的方程稱為回歸方程。E( y ) =3 0 + 3 1 x ,。是回歸直線在y軸上的截距,是當 x=0時y的期望值;1是直線的斜率,稱為回歸系數(shù),表示當 x每變動一個單位時,y的平均變動值。三、最小平方法的中心思想:通過數(shù)學方程,配合一條較為理想的趨勢線,這條趨勢線必須滿足;1)原數(shù)列的觀測值與方程的估計值的離差平方和為最小; TOC o 1-5 h z 2)原數(shù)列的觀測值與方程的估計值的離差總和為0。即 nn(y y)2(y?0?x)2 最小 HYPERLINK l bookmark146 o Current Document ii 1i 1根據(jù)最小二乘法的要求,

37、可得求解?和?的公式如下01mmmn xhyh% yh? ii 11ii i 1nn222n xixii 1i 16、總平方和、回歸平方和和殘差平方和;可決系數(shù)的含義、可決系數(shù)和相關系 數(shù)之間的數(shù)量關系。一、總方差和、回歸平方和和殘差平方和;1)總方差和(總變差、SST或Lyy):反映因變量的n個觀測值與其均值的總離差;2)回歸平方和(回歸變差、SSR或U):反映自變量 x的變化對因變量 y取值變化的影響,或者說,是由于 x與y之間的線性關系引起的y的取值變化;3)殘差平方和(剩余變差、SSE或Q):反映除x以外的其他因素對 y取值的影響。 TOC o 1-5 h z mmm220=222/

38、y?ii y% ?i 1i 1ii 1iSST (Lyy) = SSR (U) + SSE (Q)、可決系數(shù)的含義、可決系數(shù)和相關系數(shù)之間的數(shù)量關系。1)可決系數(shù)(R2):是回歸變差(回歸平方和)與總變差(總方差和)之比,是評價兩個變量之間線性關系強弱的一個重要指標,反映回歸直線的擬合程度。公式:SSRSSTm?iyii 1?2取值范圍在0 , 1 myiii 1y之間;22R21,說明回歸方程擬合的越好;R 0,說明回歸方程擬合的越差。2)可決系數(shù)和相關系數(shù)之間的數(shù)量關系:判定系數(shù)等于相關系數(shù)的平方,即R2=r2。7、重點:在Excel回歸分析表中,學會分析幾方面:相關系數(shù)及其相關關系、 判

39、定系數(shù)及其含義;回歸系數(shù)顯著性的P值檢驗;模型整體顯著性的F檢驗;寫出回歸方程,并對回歸系數(shù)的含義進行解釋;根據(jù)構建的回歸模型進行預測;了 解回歸系數(shù)的標準誤差、t統(tǒng)計量的含義?;貧w統(tǒng)計HultipLe R0.S43571艮 Square0. 711613Adjusted R Square0. &99074標推誤差1.979948觀測值25方差分析dfSSMSFSignificance F回歸分析1222. 486222, 48656.753841. 18349E-07域差2390.164423. 920192總計24312. 6504匚口iqt5標清誤差t 5t 3P-irg-liuLE1U

40、pper 35%不時與工收卜限95,玳ntercert-0. 8295206170.7230U3FJ舊60. 2630&3-2,325246230, 66208392 32525 0.520839務行度余前Lt)a, 03739707CL 00503T. 533 Bl 51. LEBO70.0274S9050, 04E30036Qg 02T4sg0 胡30036一、相關系數(shù)及其相關關系:(Multiple R 和x的Coefficients聯(lián)合判斷)R=0為不相關;Excel默認Multiple R 的取值為0,1,要判斷正負相關則需要用x的各項貸款余額c # . 1(8)0.03789470

41、7n 太口壬Coefficients二_1, Coefficients 大于 0,則正相關;Coefficients小于0,則負相關。二、判定系數(shù)及其含義:(Adjusted R Square )可決系數(shù)(F2):是評價兩個變量之間線性關系強弱的一個重要指標,反映回歸直線的擬合程度。取值范圍在0 , 1 之間;R21,說明回歸方程擬合的越好;R2 0,說明回歸方程擬合的越差。三、回歸系數(shù)顯著性的P值檢驗:(x P-value )若pa ,則不拒絕 H0。四、模型整體顯著性的F檢驗:(F)F值為F”的值,進行比較。FF”,表明兩組數(shù)據(jù)存在顯著差異。五、寫出回歸方程,并對回歸系數(shù)的含義進行解釋:(

42、Coefficients )3 0 為 Intercept Coefficients 的值,3 1為 x Coefficients 的值,y = 3。+ 3 1 x。0是回歸直線在y軸上的截距,是當x=0時y的期望值;i是直線的斜率,稱為回歸系數(shù),表示當 x每變動一個單位時,y的平均變動值。六、根據(jù)構建的回歸模型進行預測:把給出的x或y代入回歸方程,得出預測結果即可。七、了解回歸系數(shù)的標準誤差:(標準誤差)回歸系數(shù)的標準誤差(S)為標準誤差1. 979948用給定的x推測出y的預期結果后,根據(jù)所給的置信度(置信水平) ,求置信區(qū)間:1)落在y 土&區(qū)間內(nèi)的概率為 68.27%;2)落在y 2&

43、區(qū)間內(nèi)的概率為 95.45%;3)落在y 3&區(qū)間內(nèi)的概率為 99.73%。八、t統(tǒng)計量的含義:(x t Stat )t檢驗還可以用來檢驗樣本為來自一元正態(tài)分布的總體的期望,即均值;和檢驗樣本為來自二元正態(tài)分布的總體的期望是否相等。查表求出t”在n-1自由度下的值,若 t(x t Stat) t”則拒絕 也 若t(x t Stat) t“則不拒絕H)o第十章時間數(shù)列分析指標1、區(qū)分時期數(shù)列和時點數(shù)列一、時期數(shù)列,是指由一系列同類的總量指標數(shù)值所構成的時間數(shù)列。二、時點數(shù)列,是指由反映某種現(xiàn)象在一定時點(瞬間)上的發(fā)展狀況的總量指標所構成的絕對數(shù)時間數(shù)列。2、水平分析指標:發(fā)展水平、平均發(fā)展水平

44、;增長量、平均增長量;一、發(fā)展水平:是指時間數(shù)列中的每一具體指標值,反映某種社會經(jīng)濟現(xiàn)象在一定時期或時點所達到的規(guī)模或水平。通常用ai表示。二、平均發(fā)展水平(序時平均數(shù)或動態(tài)平均數(shù)):是指將不同時間的發(fā)展水平加以平均而得到的平均數(shù),說明某一現(xiàn)象在不同時間數(shù)值的一般水平。1)時間數(shù)列的序時平均數(shù):a2 L ann a二n2)時點數(shù)列的序時平均數(shù): I根據(jù)每日時點資料計算 時點數(shù)列資料逐日登記:a 琢 a2 L ann , n時點數(shù)列資料不是逐日登記:% ail a2f2 L anfnaffif2 Lfna 2 % Lan1ana& aa,L ,ann iam 力am2n根據(jù)間斷相等的時點資料計算

45、 首末班折法n 1m根據(jù)間斷不等的時點資料計算 計算出兩個時點數(shù)值之間的平均數(shù)用相隔的時期長度(fi )加權計算總的平均數(shù)aHa2a22%212% f2 an 力 am場 L 2 fnn 1L fn 1說明社會經(jīng)濟現(xiàn)象在一定時三、增長量:是指時間數(shù)列中計算期水平與基期水平之差, 期內(nèi)增減變化的絕對數(shù)量。1)累計增長量:al ao), a2 ao,L , an ao2)逐期增長量:an ao),a2 an,L ,ann ani四、平均增長量:是指逐期增長量的簡單算術平均數(shù),說明經(jīng)濟現(xiàn)象在一段較長時間內(nèi),平均每期增減變化的數(shù)量。公式為:平均增長量=逐期增長量之和/逐期增長量個數(shù)=累計增長量/ (觀

46、察期個數(shù)-1)3、速度分析指標:(環(huán)比、定基)發(fā)展速度、(環(huán)比、定基)增長速度;一、發(fā)展速度:是指計算期發(fā)展水平與基期發(fā)展水平之比,表示計算期水平已達到或相當于基期水平之多少, 反映了某種社會經(jīng)濟現(xiàn)象在一定時期內(nèi)發(fā)展的方向和速度,通常用倍數(shù)或百分數(shù)表示。1)定基發(fā)展速度:計算期水平與某一固定時期水平之比。 TOC o 1-5 h z al a2 a33 L ann ,ao ao ao)ao)2)環(huán)比發(fā)展 速度:計算期水平與前一時期水平之比。色 0a3L ann, ,aoalaa ann 1二、增長速度:是指計算期增長量與基期發(fā)展水平之比,說明社會經(jīng)濟現(xiàn)象在一定時期內(nèi)增減的快慢程度,通常用倍數(shù)或

47、百分數(shù)表示。公式:增長速度=增長量/基期水平=(計算期水平-基期水平)/基期水平1)定基增長速度:亙 1生 i,ai 1,L ,包 1aoa(oaoao)2)環(huán)比增長速度:曳 1,a2 1學 1,L , 1aoa1iaaan 14、平均發(fā)展速度和平均增長速度說明某種社會經(jīng)濟現(xiàn)象在一段較一、平均發(fā)展速度:是指環(huán)比發(fā)展速度的序時平均數(shù), 長時期內(nèi)逐期發(fā)展變化的平均速度。1)水平法(幾何平均法):一般用這種來求解。R-定期發(fā)展速度2)累計法(方程法):原理:從最初水平出發(fā),按照此法計算的平均發(fā)展速度所推算出來的各期發(fā)展水平的總 和,應等于各期實際發(fā)展水平的累計數(shù)公式:解方程,正根為平均發(fā)展速度。na

48、ii 1ao二、平均增長速度:平均增長速度=平均發(fā)展速度-1,說明某種社會經(jīng)濟現(xiàn)象在一段較長時期內(nèi)逐期平均增減變化的程度。5、增長1%勺絕對值速度每增長一個百分點而增加的絕對量,用于彌補速度分析中的局限性。公式:增長1%色對值=逐期增長量/(環(huán)比增長速度x 100)=前期水平/100第十一章時間數(shù)列預測方法1、時間數(shù)列的因素分解:長期趨勢、季節(jié)變動、循環(huán)變動和不規(guī)則變動及其含 義。時間數(shù)列,是指社會經(jīng)濟現(xiàn)象發(fā)展過程的數(shù)量表現(xiàn),隱含著社會經(jīng)濟現(xiàn)象發(fā)展變化的規(guī)律。一、長期趨勢,是指受事物發(fā)展的根本原因制約而形成的事物在一段較長時期內(nèi)持續(xù)增 長或持續(xù)下降的基本趨勢。二、季節(jié)變動,是指由于自然條件、

49、社會條件的影響,社會經(jīng)濟現(xiàn)象在 1年內(nèi)隨著季節(jié) 的轉變而引起的周期性變動。三、循環(huán)變動:是指社會經(jīng)濟現(xiàn)象以若干年為周期呈現(xiàn)波浪式的變動。四、不規(guī)則變動:由意外的偶然性因素引起的,突然發(fā)生的,無周期的隨機波動。2、了解時間數(shù)列預測分析的基本原理:乘法型和加法型時間數(shù)列預測分析的基本原理:在長期趨勢、季節(jié)變動、循環(huán)變動和不規(guī)則 變動四種因素中,先剔除其余幾種因素的影響來測定一種因素變動的影響; 然后 再結合起來測定各種因素變動的綜合影響。一、乘法型:是指時間數(shù)列由各種因素相乘的乘積所形成的結構類型。關系式為:Y = T xsxcx I二、加法型:是指時間數(shù)列由各種因素相加的總和所形成的結構類型。關

50、系式為:Y = T + S + C + I三、乘加法,是指時間數(shù)列由有關因素分別乘積之后再相加的總和所形成的結構類型。關系式為:Y=TX S+CX I3、長期趨勢預測:了解時距擴大法、移動平均法、一次指數(shù)平滑法、最小平方一、時距擴大法(間隔擴大法):是指將原有時間數(shù)列中若干時期加以合并,得出擴大間隔的較大時間單位的數(shù)據(jù),以便消除較小時距單位所受到的不規(guī)則變動影響,以顯示事物發(fā)展變化長期趨勢的方法。二、移動平均法,是指根據(jù)時間數(shù)列資料,逐項遞推移動,依次計算包含一定項數(shù)的擴 大時距平均數(shù),形成一個新的時間數(shù)列,反映長期趨勢并進行外推預測的方法。P為奇數(shù)項:ai 叫 1 L ai pp 11PP為

51、偶數(shù)項aiiaii P二aii 11 L -22P2)移動間隔的長度應長短注意:1)移動平均后的趨勢值應放在各移動項的中間位置;適中。三、指數(shù)平滑法,是一種特殊的加權平均法。利用本期實際觀察值和本期趨勢預測值,分別給予不同權數(shù)進行加權,求得一個指數(shù)平滑值,作為下一期趨勢預測的預測方法。一次指數(shù)平滑值:S(1)Vt 1S11四、最小平方法(最小二乘法):要求實際值和趨勢預測值的離差平法和為最小值,列 出聯(lián)立方程,估計參數(shù),配合趨勢模型,是分析預測長期趨勢的方法。1)直線模型:Tt a bx2)指數(shù)模型:Tt=abx。(其對數(shù)直線模型為:lg T t=|g a + x Ig b )3)二次曲線:Tt a bx cx

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論