統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答

上傳人：E*** IP屬地：天津上傳時(shí)間：2022-05-24 格式：DOC 頁(yè)數(shù)：9 大小：209KB 積分：32 舉報(bào) 版權(quán)申訴

統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第2頁(yè)

統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第3頁(yè)

統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答_第4頁(yè)

已閱讀5頁(yè)，還剩4頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、導(dǎo)論參數(shù)：描述總體的特征，總體平均數(shù) ，總體標(biāo)準(zhǔn)差統(tǒng)計(jì)量：描述樣本的特征，樣本平均數(shù)X ，樣本標(biāo)準(zhǔn)差SD數(shù)據(jù) /變量的類型：統(tǒng)計(jì)數(shù)據(jù)的分類按計(jì)量層次按收集方法按時(shí)間狀況分順數(shù)觀實(shí)截時(shí)類序值察驗(yàn)面序的的型的的的的數(shù)數(shù)數(shù)數(shù)數(shù)數(shù)數(shù)據(jù)據(jù)據(jù)據(jù)據(jù)據(jù)據(jù)類別型（品質(zhì)型）變量（分類的數(shù)據(jù)），如性別，男、女（男、女表示兩種不同類別）；數(shù)值型變量（數(shù)值型數(shù)據(jù)），如身高， 170cm。數(shù)據(jù)的搜集數(shù)據(jù)搜集方法：二手?jǐn)?shù)據(jù)：網(wǎng)絡(luò)、年鑒、報(bào)紙、白皮書、研究報(bào)告、咨詢機(jī)構(gòu)的調(diào)研報(bào)告；一手?jǐn)?shù)據(jù)：觀察、訪談、問卷調(diào)查（自填式、面訪式、電話式）、實(shí)驗(yàn)。收集一手?jǐn)?shù)據(jù)時(shí)，由于人力物力財(cái)力的限制，很難窮盡所有的研究對(duì)象（普查），只能抽取量

2、一定的研究對(duì)象，構(gòu)成樣本。借助樣本的信息，推斷總體的狀況。但樣本畢竟不等于總體，兩者的差別稱為抽樣誤差。增加樣本的容量以及采用不同的抽樣方法能一定程度降低誤差，但誤差不能根除。按照抽樣過程是否受主觀的因素的影響，分為概率抽樣（客觀抽樣）和非概率抽樣（主觀抽樣）。概率抽樣具體分為：簡(jiǎn)單隨機(jī)抽樣；分層抽樣；系統(tǒng)抽樣（等距隨機(jī)抽樣）；整群抽樣（抽樣以群體為單位，如華軟學(xué)院被抽中了，則全院的教師和學(xué)生都成為樣本）；多階段抽樣（每階段隨機(jī)抽取樣本既可以是以個(gè)體為單位，又可以是以群體為單位）。概率抽樣的實(shí)施必須找到清晰的抽樣框，也就是研究對(duì)象的總體界限必須明確，實(shí)際中大部分研究的對(duì)象包含哪些

3、并不明確，轉(zhuǎn)而采用非概率抽樣。非概率抽樣第1頁(yè)共6頁(yè)具體分為：方便抽樣；配額抽樣；判斷抽樣；自愿樣本；滾雪球抽樣。非概率抽樣的耗時(shí)短，成本低，無需確定抽樣框，但是樣本質(zhì)量不高，不能有效推斷總體的狀況，只能起到了解總體概況的作用。數(shù)據(jù)的誤差：兩類型的來源抽樣誤差與非抽樣誤差。采用概率抽樣的方法能減少抽樣誤差。非抽樣誤差包括：抽樣框誤差、回答誤差、無回答誤差、調(diào)查員誤差、測(cè)量誤差。數(shù)據(jù)的圖表展示頻數(shù)：條形圖（每組頻數(shù)的統(tǒng)計(jì)可以借助Excel 的數(shù)據(jù)透視表模塊實(shí)現(xiàn)）比例：餅圖變化趨勢(shì)：折線圖X 與 Y 的關(guān)系：散點(diǎn)圖數(shù)據(jù)的分布狀況：直方圖，先將數(shù)值型數(shù)據(jù)排序，然后分組（組中距和組數(shù)），畫條形，條形

4、之間沒有間隔，勾畫出該組數(shù)據(jù)的全貌。數(shù)據(jù)的概括性度量（一）集中趨勢(shì)眾數(shù)：頻數(shù)最多的組對(duì)應(yīng)的指標(biāo)值中位數(shù)：處于中間位置的數(shù)據(jù)。步驟排序；定位（50%位置）；抽取數(shù)值。平均數(shù)：數(shù)據(jù)質(zhì)量高，但易受極端值的影響。類型簡(jiǎn)單平均數(shù)；加權(quán)平均數(shù)（結(jié)合例題 P95 習(xí)題 4.5）；幾何平均數(shù)（平均增長(zhǎng)率、平均盈利率）。（二）離散趨勢(shì)指標(biāo)異眾比率：非眾數(shù)對(duì)應(yīng)的頻數(shù)除以總頻數(shù)極差（全距）：最大值 -最小值四分位差： 3rd 四分位數(shù) -1st 四分位數(shù)平均差：（ mean deviation）每一數(shù)據(jù)與平均數(shù)的差的絕對(duì)值，再求和，最后求平均數(shù) （用nXiX得比較少）。 M di 1n第2頁(yè)共6頁(yè)nX ) 22(

5、 X i方差：SDi 1，記得一般提供的是樣本數(shù)據(jù)，分母是n-1，到了后面的n1n( XiX )2章節(jié) n-1 稱為自由度?？傮w數(shù)據(jù)的話，2 = i 1。n標(biāo)準(zhǔn)差：方差的開方，由于標(biāo)準(zhǔn)差與原始數(shù)據(jù)同一個(gè)等級(jí)，帶單位。標(biāo)準(zhǔn)差系數(shù)（離散系數(shù)）：用于比較多組數(shù)據(jù)離散（波動(dòng)）程度的差異。由于離散系數(shù)SD能克服各組數(shù)據(jù)單位的差別以及平均值的差異，所得結(jié)論更為精確。v S =。X（三）數(shù)據(jù)分布指標(biāo)：偏態(tài)和峰態(tài)偏態(tài)系數(shù)SK， SK>0 右偏， SK<0 左偏， SK=0 無偏。 SK>1 ，嚴(yán)重右偏； SK<-1 ，嚴(yán)重左偏。這里要注意繪圖，如右偏，長(zhǎng)尾巴在右，高峰在左，則眾數(shù)<

6、;中位數(shù) <平均數(shù)。峰態(tài)系數(shù) >0，則分布形狀又高又窄；峰態(tài)系數(shù)<0，則分布形狀又矮又寬。指數(shù)指數(shù)反映的是某指標(biāo)隨時(shí)間推移的變化。經(jīng)濟(jì)管理中，生產(chǎn)者關(guān)注銷售量變化，消費(fèi)者關(guān)注價(jià)格變化，因此，常見的指數(shù)包括銷售量指數(shù)和價(jià)格指數(shù)。實(shí)際情況下，要合并幾種不同種類產(chǎn)品的價(jià)格或銷售量，但每種產(chǎn)品的價(jià)格、銷售量的單位都不相同，需要借助銷售額的形式進(jìn)行合并，所求指數(shù)稱“加權(quán)綜合指數(shù)” 。加權(quán)綜合指數(shù)的計(jì)算步驟為“先綜合（求和， pq），后對(duì)比（作差或作商；作差稱為絕對(duì)指數(shù)，帶單位；作商稱為相對(duì)指數(shù)，不帶單位）”。加權(quán)綜合指數(shù)中，為了分離價(jià)格的變化，研究者需要將銷售量固定在相同的

7、時(shí)期（此時(shí)銷售量稱為同度量因素）。如果選擇固定在基期（ q0），該加權(quán)綜合指數(shù)稱為拉氏指數(shù)；如果選擇固定在報(bào)告期（q1），該加權(quán)綜合指數(shù)稱為帕（派）氏指數(shù)。分離銷售量的變化時(shí)，則將價(jià)格固定即可。對(duì)于指數(shù)的因素分析過程，p0q0 變?yōu)?p1q1，研究者規(guī)定，先量變（銷售量的影響，p0q0變?yōu)?p0q1），后質(zhì)變（價(jià)格的影響，p0q1 變?yōu)?p1q1）。抽樣分布研究者用概率抽樣的方法獲得代表性高的樣本，重復(fù)N 次抽樣后獲得N 個(gè)樣本，每個(gè)第3頁(yè)共6頁(yè)樣本包含n 個(gè)元素（ n 稱為樣本容量）計(jì)算出X ，這些 X 構(gòu)成的分布稱為“抽樣分布”。抽樣分布的形狀根據(jù)以下規(guī)則判斷：總體分布為正態(tài)，則抽樣分

8、布為正態(tài)分布；總體分布狀況為偏態(tài)或未知，如果樣本容量n>30，則抽樣分布趨近于正態(tài)分布（此定理稱 “中心極限定理” ）；如果 n<30，則抽樣分布形狀未能確定。抽樣分布的數(shù)量估計(jì)關(guān)系緊記下列兩條公式：X=，X=n區(qū)間估計(jì)理論上研究者用N 個(gè)樣本的均值去推斷總體的均值和標(biāo)準(zhǔn)差，現(xiàn)實(shí)由于人力物力財(cái)力的限制，研究者大都用一個(gè)樣本均值推斷總體均值。但是 X 只會(huì)落在附近，做出 X =的推斷未免太絕對(duì)了，因而研究者圍繞 X （以 X 為對(duì)稱軸）構(gòu)造一個(gè)區(qū)間 X -ZX , X +ZX ，這個(gè)區(qū)間包含，作出這個(gè)結(jié)論的把握為95%，95%稱為置信水平，22另外 1-95%=5% 則稱為錯(cuò)

9、誤， ZX 稱為允許誤差（邊際誤差、估計(jì)誤差）。2假設(shè)檢驗(yàn)假設(shè)包括原假設(shè)H 0 和研究（備擇）假設(shè)H 1，兩者是對(duì)立的關(guān)系，因此檢驗(yàn)的時(shí)候只需檢驗(yàn)其中一個(gè)即可，一般選擇H 0。檢驗(yàn) H 0 的時(shí)候，存在錯(cuò)誤是難免的，只是這個(gè)錯(cuò)誤比較小，在研究者可承受的范圍內(nèi)即可。這里規(guī)定了兩種類型的錯(cuò)誤：第類錯(cuò)誤，也稱錯(cuò)誤（棄真），當(dāng) H 0 正確時(shí)，研究者拒絕了H 0，犯錯(cuò)了，此時(shí)的錯(cuò)誤為錯(cuò)誤；第類錯(cuò)誤，也稱錯(cuò)誤（取偽），當(dāng) H0 錯(cuò)誤時(shí)，研究者接受了H0，犯錯(cuò)了，此時(shí)的錯(cuò)誤為錯(cuò)誤。根據(jù)題目寫假設(shè)，按照英語(yǔ)的思維：H0， but H I ，H1 由研究者提出，研究者通常會(huì)做抽樣的工作，當(dāng)題目陳述樣本情

10、況時(shí)，則是研究者的觀點(diǎn)（H 1），之前的內(nèi)容就是H0。建議先寫 H 0，再寫 H1，因?yàn)?H0 一般交代總體均值狀況，寫假設(shè)只涉及。如 H0： =1000，則H1： 1000。繼而進(jìn)行假設(shè)檢驗(yàn)先繪制正態(tài)分布圖，然后標(biāo)記H 1 的區(qū)域（由于 H1 為研究者，即少數(shù)人的觀點(diǎn)，小塊面積。上述H 1： 1000，包含兩種情況， <1000，在正態(tài)分布圖的左側(cè)， >1000，在正態(tài)分布圖的右側(cè)，分別標(biāo)記H 1 的區(qū)域）， H1 的區(qū)域同時(shí)也是H0 的拒第4頁(yè)共6頁(yè)絕區(qū)域。 X 定位，計(jì)算ZXi- X，與 Z 臨界值比較，這里需要區(qū)分雙側(cè)檢驗(yàn)還是單側(cè)X檢驗(yàn)。雙側(cè)的話， ZZ （左側(cè)）或

11、ZZ （右側(cè)）。單側(cè)情況，左側(cè)的話 Z - Z；而22右側(cè)則是 Z Z。一旦出現(xiàn)這些結(jié)果，做出結(jié)論，支持H1，拒絕 H0；反之亦然。方差分析n( Xi X )2（離均差平方和）方差 = i 1SS（均方）n-1=MSdf （自由度）數(shù)據(jù)的總的變異以總方差表示，總方差分解為兩個(gè)來源，一個(gè)是組間方差，另一個(gè)是組內(nèi)方差。組間方差（ MSB ）表示自變量造成的影響（藥劑： A 、B、C、D），組內(nèi)方差（ MSW ）表示干擾因素造成的影響（同一組內(nèi)4 棵水稻苗高不相等，由于遺傳因素的影響造成，但遺傳因素不是本實(shí)驗(yàn)探討的重點(diǎn)，稱為干擾因素）。PK 兩個(gè)方差時(shí)作商，構(gòu)造出F 統(tǒng)計(jì)量，組間均方（ MSB

12、）F組內(nèi)均方（ MSW）。研究者預(yù)期，自變量造成的影響遠(yuǎn)大于干擾因素造成的影響，因此 F 越大越好，對(duì)應(yīng)只需要看F 值是否越過右側(cè)的臨界值Fcrit 即可。若F>Fcrit ，則 H1 成立。方差分析的H0 和 H 1 都比較固定。 H0： 1= 2= 3= 4（至少有3 組總體的平均值），H1： 1、 2、 3、 4 不全相等?？梢?，方差分析的目的就是檢驗(yàn)3 組或以上的總體平均數(shù)是否相等，但是使用的途徑則是方差的分解以及F 統(tǒng)計(jì)量。方差分析有三個(gè)前提必須滿足：數(shù)據(jù)正態(tài)分布、自變量是類別型（自變量的取值或水平level ）相互獨(dú)立、各組方差要齊性。具體解釋可查閱課本。相關(guān)與回歸分析

13、兩個(gè)變量的關(guān)系最簡(jiǎn)單的考察方式是繪制散點(diǎn)圖，如果要精確地加以衡量，則需要使用相關(guān)系數(shù)或回歸系數(shù)。相關(guān)分析和回歸分析都是考察兩個(gè)變量的關(guān)聯(lián)程度，只是相關(guān)分析中兩變量 X（吸煙）與Y（肺癌）的影響方向是雙向的，屬于共變關(guān)系，不能確切地說哪個(gè)影響哪個(gè)；但回歸分析中明確規(guī)定由X （收入）影響Y （消費(fèi)），屬于典型的因果關(guān)系。分析不同的問題，我們將視情況選擇相關(guān)分析或回歸分析。相關(guān)系數(shù) r-1,1 ，正負(fù)號(hào)反映相關(guān)的方向，r>0 正相關(guān)表示X 與 Y 同方向變化，r<0第5頁(yè)共6頁(yè)負(fù)相關(guān)表示X 與 Y 反方向變化，r=0 零相關(guān)表示X 與 Y 不存在線性相關(guān)。其中，r=1 為完全正相關(guān)， r

14、=-1 為完全負(fù)相關(guān)。相關(guān)系數(shù)的數(shù)值表示相關(guān)的程度大小，r 0.8 為高度（強(qiáng)）相關(guān)， 0.5 r<0.8 為中等相關(guān)， 0.3r<0.5 為低度（弱）相關(guān)?；貧w方程y=B 1x+B 0，回歸系數(shù) B 1 表示當(dāng) x 變化一個(gè)單位時(shí)， y 平均變化 B1 個(gè)單位。（注意： r 和 B1 的計(jì)算公式的區(qū)別）而回歸直線與散點(diǎn)的擬合程度（ fit ），則用判斷（可決）系數(shù) R2 表示，一般要求 R275%（越大越好），表示 100 個(gè)散點(diǎn)中，有75 個(gè)或以上的點(diǎn)落在直線附近，說明該直線能較好地代表散點(diǎn)的位置關(guān)系，或者說直線能較好地?cái)M合這堆散點(diǎn)（擬合度高）。時(shí)間序列分析與預(yù)測(cè)時(shí)間序列指的是按時(shí)間先后順序排列的數(shù)據(jù)，反映某指標(biāo)隨時(shí)間推移的變化規(guī)律，用于預(yù)測(cè)該指標(biāo)在未來一期或未來幾期的數(shù)值。指數(shù)雖然也是反映某指標(biāo)隨時(shí)間推移的變化趨勢(shì)（增加或減少），但其并不能用于預(yù)測(cè)未來一期的具體數(shù)值，其次不能還原指標(biāo)變化的具體過程（有可能是先增后減，然后過一段時(shí)間又重復(fù)先增后減的趨勢(shì)，總的來說呈現(xiàn)出增加的趨勢(shì)）。遇到增長(zhǎng)率的問題，用連乘，然后減 1 計(jì)算累計(jì)增長(zhǎng)率；對(duì)連乘結(jié)果開方（幾何平均數(shù)），然后減 1 計(jì)算平均增長(zhǎng)率。時(shí)間序列按照波動(dòng)幅度大小分為平穩(wěn)序列（波動(dòng)幅度?。?和非平穩(wěn)序列（波動(dòng)幅度大）。平穩(wěn)序列的預(yù)測(cè)通常用三種

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)復(fù)習(xí)串講(已更新)解答

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔