統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第1頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第2頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第3頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第4頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、導(dǎo)論參數(shù):描述總體的特征,總體平均數(shù) ,總體標(biāo)準(zhǔn)差統(tǒng)計(jì)量:描述樣本的特征,樣本平均數(shù)X ,樣本標(biāo)準(zhǔn)差SD數(shù)據(jù) /變量的類型:統(tǒng)計(jì)數(shù)據(jù)的分類按計(jì)量層次按收集方法按時(shí)間狀況分順數(shù)觀實(shí)截時(shí)類序值察驗(yàn)面序的的型的的的的數(shù)數(shù)數(shù)數(shù)數(shù)數(shù)數(shù)據(jù)據(jù)據(jù)據(jù)據(jù)據(jù)據(jù)類別型(品質(zhì)型)變量(分類的數(shù)據(jù)),如性別,男、女(男、女表示兩種不同類別);數(shù)值型變量(數(shù)值型數(shù)據(jù)),如身高, 170cm。數(shù)據(jù)的搜集數(shù)據(jù)搜集方法:二手?jǐn)?shù)據(jù):網(wǎng)絡(luò)、年鑒、報(bào)紙、白皮書、研究報(bào)告、咨詢機(jī)構(gòu)的調(diào)研報(bào)告;一手?jǐn)?shù)據(jù):觀察、訪談、問卷調(diào)查(自填式、面訪式、電話式)、實(shí)驗(yàn)。收集一手?jǐn)?shù)據(jù)時(shí),由于人力物力財(cái)力的限制,很難窮盡所有的研究對(duì)象(普查),只能抽取量

2、一定的研究對(duì)象,構(gòu)成樣本。 借助樣本的信息,推斷總體的狀況。但樣本畢竟不等于總體,兩者的差別稱為抽樣誤差。增加樣本的容量以及采用不同的抽樣方法能一定程度降低誤差,但誤差不能根除。按照抽樣過程是否受主觀的因素的影響,分為概率抽樣 (客觀抽樣)和非概率抽樣(主觀抽樣) 。概率抽樣具體分為:簡(jiǎn)單隨機(jī)抽樣;分層抽樣;系統(tǒng)抽樣(等距隨機(jī)抽樣) ;整群抽樣(抽樣以群體為單位,如華軟學(xué)院被抽中了,則全院的教師和學(xué)生都成為樣本) ;多階段抽樣(每階段隨機(jī)抽取樣本既可以是以個(gè)體為單位,又可以是以群體為單位) 。概率抽樣的實(shí)施必須找到清晰的抽樣框,也就是研究對(duì)象的總體界限必須明確, 實(shí)際中大部分研究的對(duì)象包含哪些

3、并不明確,轉(zhuǎn)而采用非概率抽樣。非概率抽樣第1頁(yè)共6頁(yè)具體分為:方便抽樣;配額抽樣;判斷抽樣;自愿樣本;滾雪球抽樣。非概率抽樣的耗時(shí)短,成本低,無需確定抽樣框,但是樣本質(zhì)量不高,不能有效推斷總體的狀況,只能起到了解總體概況的作用。數(shù)據(jù)的誤差: 兩類型的來源抽樣誤差與非抽樣誤差。采用概率抽樣的方法能減少抽樣誤差。非抽樣誤差包括:抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測(cè)量誤差。數(shù)據(jù)的圖表展示頻數(shù):條形圖(每組頻數(shù)的統(tǒng)計(jì)可以借助Excel 的數(shù)據(jù)透視表模塊實(shí)現(xiàn))比例:餅圖變化趨勢(shì):折線圖X 與 Y 的關(guān)系:散點(diǎn)圖數(shù)據(jù)的分布狀況:直方圖,先將數(shù)值型數(shù)據(jù)排序,然后分組(組中距和組數(shù)),畫條形,條形

4、之間沒有間隔,勾畫出該組數(shù)據(jù)的全貌。數(shù)據(jù)的概括性度量(一)集中趨勢(shì)眾數(shù):頻數(shù)最多的組對(duì)應(yīng)的指標(biāo)值中位數(shù):處于中間位置的數(shù)據(jù)。步驟排序;定位(50%位置);抽取數(shù)值。平均數(shù):數(shù)據(jù)質(zhì)量高,但易受極端值的影響。類型簡(jiǎn)單平均數(shù);加權(quán)平均數(shù)(結(jié)合例題 P95 習(xí)題 4.5);幾何平均數(shù)(平均增長(zhǎng)率、平均盈利率)。(二)離散趨勢(shì)指標(biāo)異眾比率:非眾數(shù)對(duì)應(yīng)的頻數(shù)除以總頻數(shù)極差(全距):最大值 -最小值四分位差: 3rd 四分位數(shù) -1st 四分位數(shù)平均差:( mean deviation)每一數(shù)據(jù)與平均數(shù)的差的絕對(duì)值,再求和, 最后求平均數(shù) (用nXiX得比較少)。 M di 1n第2頁(yè)共6頁(yè)nX ) 22(

5、 X i方差:SDi 1,記得一般提供的是樣本數(shù)據(jù),分母是n-1,到了后面的n1n( XiX )2章節(jié) n-1 稱為自由度??傮w數(shù)據(jù)的話,2 = i 1。n標(biāo)準(zhǔn)差:方差的開方,由于標(biāo)準(zhǔn)差與原始數(shù)據(jù)同一個(gè)等級(jí),帶單位。標(biāo)準(zhǔn)差系數(shù)(離散系數(shù)):用于比較多組數(shù)據(jù)離散(波動(dòng))程度的差異。由于離散系數(shù)SD能克服各組數(shù)據(jù)單位的差別以及平均值的差異,所得結(jié)論更為精確。v S =。X(三)數(shù)據(jù)分布指標(biāo):偏態(tài)和峰態(tài)偏態(tài)系數(shù)SK, SK>0 右偏, SK<0 左偏, SK=0 無偏。 SK>1 ,嚴(yán)重右偏; SK<-1 ,嚴(yán)重左偏。這里要注意繪圖,如右偏,長(zhǎng)尾巴在右,高峰在左,則眾數(shù)<

6、;中位數(shù) <平均數(shù)。峰態(tài)系數(shù) >0,則分布形狀又高又窄;峰態(tài)系數(shù)<0,則分布形狀又矮又寬。指數(shù)指數(shù)反映的是某指標(biāo)隨時(shí)間推移的變化。 經(jīng)濟(jì)管理中, 生產(chǎn)者關(guān)注銷售量變化, 消費(fèi)者關(guān)注價(jià)格變化, 因此,常見的指數(shù)包括銷售量指數(shù)和價(jià)格指數(shù)。實(shí)際情況下,要合并幾種不同種類產(chǎn)品的價(jià)格或銷售量,但每種產(chǎn)品的價(jià)格、銷售量的單位都不相同,需要借助銷售額的形式進(jìn)行合并,所求指數(shù)稱“加權(quán)綜合指數(shù)” 。加權(quán)綜合指數(shù)的計(jì)算步驟為“先綜合(求和, pq),后對(duì)比(作差或作商;作差稱為絕對(duì)指數(shù),帶單位;作商稱為相對(duì)指數(shù),不帶單位)”。加權(quán)綜合指數(shù)中, 為了分離價(jià)格的變化, 研究者需要將銷售量固定在相同的

7、時(shí)期 (此時(shí)銷售量稱為同度量因素) 。如果選擇固定在基期( q0),該加權(quán)綜合指數(shù)稱為拉氏指數(shù);如果選擇固定在報(bào)告期(q1),該加權(quán)綜合指數(shù)稱為帕(派)氏指數(shù)。分離銷售量的變化時(shí),則將價(jià)格固定即可。對(duì)于指數(shù)的因素分析過程,p0q0 變?yōu)?p1q1,研究者規(guī)定,先量變(銷售量的影響,p0q0變?yōu)?p0q1),后質(zhì)變(價(jià)格的影響,p0q1 變?yōu)?p1q1)。抽樣分布研究者用概率抽樣的方法獲得代表性高的樣本,重復(fù)N 次抽樣后獲得N 個(gè)樣本,每個(gè)第3頁(yè)共6頁(yè)樣本包含n 個(gè)元素( n 稱為樣本容量)計(jì)算出X ,這些 X 構(gòu)成的分布稱為“抽樣分布”。抽樣分布的形狀根據(jù)以下規(guī)則判斷:總體分布為正態(tài),則抽樣分

8、布為正態(tài)分布;總體分布狀況為偏態(tài)或未知,如果樣本容量n>30,則抽樣分布趨近于正態(tài)分布(此定理稱 “中心極限定理” );如果 n<30,則抽樣分布形狀未能確定。抽樣分布的數(shù)量估計(jì)關(guān)系緊記下列兩條公式:X=,X=n區(qū)間估計(jì)理論上研究者用N 個(gè)樣本的均值去推斷總體的均值和標(biāo)準(zhǔn)差,現(xiàn)實(shí)由于人力物力財(cái)力的限制, 研究者大都用一個(gè)樣本均值推斷總體均值。但是 X 只會(huì)落在 附近,做出 X =的推斷未免太絕對(duì)了,因而研究者圍繞 X (以 X 為對(duì)稱軸)構(gòu)造一個(gè)區(qū)間 X -ZX , X +ZX ,這個(gè)區(qū)間包含 ,作出這個(gè)結(jié)論的把握為95%,95%稱為置信水平,22另外 1-95%=5% 則稱為 錯(cuò)

9、誤, ZX 稱為允許誤差(邊際誤差、估計(jì)誤差) 。2假設(shè)檢驗(yàn)假設(shè)包括原假設(shè)H 0 和研究(備擇)假設(shè)H 1,兩者是對(duì)立的關(guān)系,因此檢驗(yàn)的時(shí)候只需檢驗(yàn)其中一個(gè)即可,一般選擇H 0。檢驗(yàn) H 0 的時(shí)候,存在錯(cuò)誤是難免的,只是這個(gè)錯(cuò)誤比較小,在研究者可承受的范圍內(nèi)即可。這里規(guī)定了兩種類型的錯(cuò)誤:第類錯(cuò)誤,也稱錯(cuò)誤(棄真),當(dāng) H 0 正確時(shí),研究者拒絕了H 0,犯錯(cuò)了,此時(shí)的錯(cuò)誤為 錯(cuò)誤;第類錯(cuò)誤,也稱 錯(cuò)誤(取偽),當(dāng) H0 錯(cuò)誤時(shí),研究者接受了H0,犯錯(cuò)了,此時(shí)的錯(cuò)誤為錯(cuò)誤。根據(jù)題目寫假設(shè),按照英語(yǔ)的思維:H0, but H I ,H1 由研究者提出,研究者通常會(huì)做抽樣的工作,當(dāng)題目陳述樣本情

10、況時(shí),則是研究者的觀點(diǎn)(H 1),之前的內(nèi)容就是H0。建議先寫 H 0,再寫 H1,因?yàn)?H0 一般交代總體均值 狀況,寫假設(shè)只涉及 。如 H0: =1000,則H1: 1000。繼而進(jìn)行假設(shè)檢驗(yàn)先繪制正態(tài)分布圖,然后標(biāo)記H 1 的區(qū)域(由于 H1 為研究者, 即少數(shù)人的觀點(diǎn),小塊面積。上述H 1: 1000,包含兩種情況, <1000,在正態(tài)分布圖的左側(cè), >1000,在正態(tài)分布圖的右側(cè),分別標(biāo)記H 1 的區(qū)域), H1 的區(qū)域同時(shí)也是H0 的拒第4頁(yè)共6頁(yè)絕區(qū)域。 X 定位,計(jì)算ZXi- X,與 Z 臨界值比較,這里需要區(qū)分雙側(cè)檢驗(yàn)還是單側(cè)X檢驗(yàn)。雙側(cè)的話, ZZ (左側(cè))或

11、ZZ (右側(cè))。單側(cè)情況,左側(cè)的話 Z - Z;而22右側(cè)則是 Z Z。一旦出現(xiàn)這些結(jié)果,做出結(jié)論,支持H1,拒絕 H0;反之亦然。方差分析n( Xi X )2(離均差平方和)方差 = i 1SS(均方)n-1=MSdf (自由度)數(shù)據(jù)的總的變異以總方差表示,總方差分解為兩個(gè)來源,一個(gè)是組間方差,另一個(gè)是組內(nèi)方差。 組間方差 ( MSB )表示自變量造成的影響(藥劑: A 、B、C、D),組內(nèi)方差 ( MSW )表示干擾因素造成的影響(同一組內(nèi)4 棵水稻苗高不相等,由于遺傳因素的影響造成,但遺傳因素不是本實(shí)驗(yàn)探討的重點(diǎn),稱為干擾因素)。PK 兩個(gè)方差時(shí)作商,構(gòu)造出F 統(tǒng)計(jì)量,組間均方( MSB

12、)F組內(nèi)均方( MSW)。研究者預(yù)期,自變量造成的影響遠(yuǎn)大于干擾因素造成的影響,因此 F 越大越好,對(duì)應(yīng)只需要看F 值是否越過右側(cè)的臨界值Fcrit 即可。若F>Fcrit ,則 H1 成立。方差分析的H0 和 H 1 都比較固定。 H0: 1= 2= 3= 4(至少有3 組總體的平均值) ,H1: 1、 2、 3、 4 不全相等??梢?,方差分析的目的就是檢驗(yàn)3 組或以上的總體平均數(shù)是否相等,但是使用的途徑則是方差的分解以及F 統(tǒng)計(jì)量。方差分析有三個(gè)前提必須滿足:數(shù)據(jù)正態(tài)分布、 自變量是類別型 (自變量的取值或水平level )相互獨(dú)立、各組方差要齊性。具體解釋可查閱課本。相關(guān)與回歸分析

13、兩個(gè)變量的關(guān)系最簡(jiǎn)單的考察方式是繪制散點(diǎn)圖,如果要精確地加以衡量,則需要使用相關(guān)系數(shù)或回歸系數(shù)。相關(guān)分析和回歸分析都是考察兩個(gè)變量的關(guān)聯(lián)程度,只是相關(guān)分析中兩變量 X(吸煙)與Y(肺癌)的影響方向是雙向的,屬于共變關(guān)系,不能確切地說哪個(gè)影響哪個(gè);但回歸分析中明確規(guī)定由X (收入)影響Y (消費(fèi)),屬于典型的因果關(guān)系。分析不同的問題,我們將視情況選擇相關(guān)分析或回歸分析。相關(guān)系數(shù) r-1,1 ,正負(fù)號(hào)反映相關(guān)的方向,r>0 正相關(guān)表示X 與 Y 同方向變化,r<0第5頁(yè)共6頁(yè)負(fù)相關(guān)表示X 與 Y 反方向變化,r=0 零相關(guān)表示X 與 Y 不存在線性相關(guān)。其中,r=1 為完全正相關(guān), r

14、=-1 為完全負(fù)相關(guān)。相關(guān)系數(shù)的數(shù)值表示相關(guān)的程度大小,r 0.8 為高度(強(qiáng))相關(guān), 0.5 r<0.8 為中等相關(guān), 0.3r<0.5 為低度(弱)相關(guān)?;貧w方程y=B 1x+B 0,回歸系數(shù) B 1 表示當(dāng) x 變化一個(gè)單位時(shí), y 平均變化 B1 個(gè)單位。(注意: r 和 B1 的計(jì)算公式的區(qū)別)而回歸直線與散點(diǎn)的擬合程度( fit ),則用判斷(可決)系數(shù) R2 表示,一般要求 R275%(越大越好) ,表示 100 個(gè)散點(diǎn)中,有75 個(gè)或以上的點(diǎn)落在直線附近,說明該直線能較好地代表散點(diǎn)的位置關(guān)系,或者說直線能較好地?cái)M合這堆散點(diǎn)(擬合度高)。時(shí)間序列分析與預(yù)測(cè)時(shí)間序列指的是按時(shí)間先后順序排列的數(shù)據(jù),反映某指標(biāo)隨時(shí)間推移的變化規(guī)律,用于預(yù)測(cè)該指標(biāo)在未來一期或未來幾期的數(shù)值。指數(shù)雖然也是反映某指標(biāo)隨時(shí)間推移的變化趨勢(shì)(增加或減少),但其并不能用于預(yù)測(cè)未來一期的具體數(shù)值,其次不能還原指標(biāo)變化的具體過程(有可能是先增后減,然后過一段時(shí)間又重復(fù)先增后減的趨勢(shì),總的來說呈現(xiàn)出增加的趨勢(shì))。遇到增長(zhǎng)率的問題,用連乘,然后減 1 計(jì)算累計(jì)增長(zhǎng)率;對(duì)連乘結(jié)果開方(幾何平均數(shù)),然后減 1 計(jì)算平均增長(zhǎng)率。時(shí)間序列按照波動(dòng)幅度大小分為平穩(wěn)序列(波動(dòng)幅度?。?和非平穩(wěn)序列 (波動(dòng)幅度大) 。平穩(wěn)序列的預(yù)測(cè)通常用三種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論