![統(tǒng)計學(xué)復(fù)習(xí)提綱終極版_第1頁](http://file4.renrendoc.com/view/537c2292f8c67d65627dd5f1af9e2942/537c2292f8c67d65627dd5f1af9e29421.gif)
![統(tǒng)計學(xué)復(fù)習(xí)提綱終極版_第2頁](http://file4.renrendoc.com/view/537c2292f8c67d65627dd5f1af9e2942/537c2292f8c67d65627dd5f1af9e29422.gif)
![統(tǒng)計學(xué)復(fù)習(xí)提綱終極版_第3頁](http://file4.renrendoc.com/view/537c2292f8c67d65627dd5f1af9e2942/537c2292f8c67d65627dd5f1af9e29423.gif)
![統(tǒng)計學(xué)復(fù)習(xí)提綱終極版_第4頁](http://file4.renrendoc.com/view/537c2292f8c67d65627dd5f1af9e2942/537c2292f8c67d65627dd5f1af9e29424.gif)
![統(tǒng)計學(xué)復(fù)習(xí)提綱終極版_第5頁](http://file4.renrendoc.com/view/537c2292f8c67d65627dd5f1af9e2942/537c2292f8c67d65627dd5f1af9e29425.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一章1.1什么是統(tǒng)計學(xué)
統(tǒng)計學(xué)是收集,處理,分析,解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。
1.2解釋描述統(tǒng)計和推斷統(tǒng)計
描述統(tǒng)計:研究數(shù)據(jù)收集,處理,匯總,圖表描述,概括與分析等統(tǒng)計方法。
推斷統(tǒng)計:研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。
1.3統(tǒng)計學(xué)的類型和不同類型的特點
統(tǒng)計數(shù)據(jù)的分類:1、按計量層次分:①分類數(shù)據(jù)(只能歸于某一類別的非數(shù)字型數(shù)據(jù),是對事物進行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述)
②順序數(shù)據(jù)(只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。對事物類別順序的測度,數(shù)據(jù)表現(xiàn)為類別,用文字來表述)
③數(shù)值型數(shù)據(jù)(按數(shù)字尺度測量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值,對事物的精確測度)2、按收集方法分:①觀測數(shù)據(jù)(是通過調(diào)查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對事物人為控制的條件下得到的,有關(guān)社會經(jīng)濟現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù))②實驗數(shù)據(jù)(在實驗中控制實驗對象而收集到的數(shù)據(jù)。自然科學(xué)領(lǐng)域的數(shù)據(jù)大多為實驗數(shù)據(jù))3、按時間狀況分:
①截面數(shù)據(jù)(在相同或近似相同的時間點上收集到的數(shù)據(jù),也叫靜態(tài)數(shù)據(jù)。描述現(xiàn)象在某一時刻的變化情況)
②時間序列數(shù)據(jù)(在不同時間上收集到的數(shù)據(jù),描述現(xiàn)象隨時間變化的情況,也叫動態(tài)數(shù)據(jù))1.4解釋分類數(shù)據(jù),順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)
答案見1.3
1.5統(tǒng)計學(xué)中的幾個基本概念1、總體:是包含所研究的全部個體(數(shù)據(jù))的集合,其中的每一個個體稱為元素。分為有限總體和無限總體。2、樣本:從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量。3、參數(shù):描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值。4、統(tǒng)計量:用來描述樣本特征的概括性數(shù)字度量,是根據(jù)樣本數(shù)據(jù)計算出來的一些量,是樣本的函數(shù)5、變量:說明現(xiàn)象某種特征的概念。1.6變量的分類
變量可以分為分類變量,順序變量,數(shù)值型變量。
變量也可以分為隨機變量和非隨機變量。經(jīng)驗變量和理論變量。
第二章2.1什么是二手資料?使用二手資料應(yīng)注意什么問題
與研究內(nèi)容有關(guān),由別人調(diào)查和試驗而來已經(jīng)存在,并會被我們利用的資料為“二手資料”。使用時要進行評估,要考慮到資料的原始收集人,收集目的,收集途徑,收集時間使用時要注明數(shù)據(jù)來源。
2.2比較概率抽樣和非概率抽樣的特點以及常用的抽樣方法比較:概率抽樣:遵循隨機原則進行抽樣,可以據(jù)以對總體參數(shù)進行估計;它的特點是更精確、技術(shù)含量高、調(diào)查成本高非概率抽樣:遵循非隨機原則,統(tǒng)計量的分布不穩(wěn)定,無法進行參數(shù)估計;它的特點是操作簡單,時效快,成本低,適合探索性的研究常用的抽樣方法概率抽樣方法:簡單隨機抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多階段抽樣非概率抽樣方法:方便抽樣、判斷抽樣、自愿抽樣、滾雪球抽樣、配額抽樣2.3除了自填式,面訪式和電話式還有什么搜集數(shù)據(jù)的辦法
觀察式2.4自填式,面訪式和電話式各自的長處和弱點自填式優(yōu)點:1、調(diào)查組織者管理容易2、成本低,可進行大規(guī)模調(diào)查3、對被調(diào)查者,可選擇方便時間答卷,減少回答敏感問題壓力。缺點:1、回收率低2、不適合結(jié)構(gòu)復(fù)雜的問卷,調(diào)查內(nèi)容有限3、調(diào)查周期長4在數(shù)據(jù)搜集過程中遇見問題不能及時調(diào)整。
面訪式優(yōu)點:1、回答率高2、數(shù)據(jù)質(zhì)量高3、在調(diào)查過程中遇見問題可以及時調(diào)整。缺點:1、成本比較高2、搜集數(shù)據(jù)的方式對調(diào)查過程的質(zhì)量控制有一定難度3、對于敏感問題,被訪者會有壓力。
電話式優(yōu)點:1、速度快2、對調(diào)查員比較安全3、對訪問過程的控制比較容易。缺點:1、實施地區(qū)有限2、調(diào)查時間不能過長3、使用的問卷要簡單4被訪者不愿回答時,不易勸服。
提綱第五點:抽樣誤差和非抽樣誤差的概念抽樣誤差:指由于抽樣的隨機性引起的樣本結(jié)果與總體真值之間的誤差非抽樣誤差:指除抽樣誤差以外的所有誤差的總和2.6如何控制調(diào)查中的回答誤差
抽樣誤差是不可避免的,能夠在調(diào)查過程中進行控制的只有非抽樣誤差。抽樣誤差可以計算,因此可以通過統(tǒng)計學(xué)專業(yè)知識根據(jù)允許誤差來確定樣本量,以控制抽樣誤差。費抽樣誤差控制的重要方面是調(diào)查過程的質(zhì)量控制。包括:調(diào)查員的挑選,調(diào)查員的培訓(xùn),督導(dǎo)員的調(diào)查專業(yè)水平,對調(diào)查過程進行控制的具體措施(包括對調(diào)查結(jié)果進行檢驗、評估,對現(xiàn)場調(diào)查人員進行獎懲制度等)第三章3.1數(shù)據(jù)預(yù)處理內(nèi)容
:數(shù)據(jù)審核(完整性和準(zhǔn)確性;適用性和時效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法各有哪些
分類數(shù)據(jù)的整理(基本過程):1、列出各類別2、計算各類別的頻數(shù)3、制作頻數(shù)分布表4、用圖形顯示數(shù)據(jù)分類數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率等進行描述性分析??捎脳l形圖,對比條形圖,帕累托圖和餅圖進行圖示分析。順序數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率。累計頻數(shù)和累計頻率等進行描述性分析。可用條形圖,帕累托圖和餅圖,累計頻數(shù)分布圖和環(huán)形圖進行圖示分析。提綱第五點:數(shù)值型數(shù)據(jù)的整理與展示圖示:分組數(shù)據(jù)——直方圖和折線圖未分組數(shù)據(jù)——莖葉圖和箱線圖時間序列數(shù)據(jù)——線圖多變量數(shù)據(jù)——兩個變量間的關(guān)系:二維散點圖三個變量間的關(guān)系:氣泡圖多變量數(shù)據(jù):雷達圖(蜘蛛圖)
3.3數(shù)值型數(shù)據(jù)的分組方法和步驟
分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。
分組步驟:1確定組數(shù)2確定各組組距3根據(jù)各組頻數(shù)整理成頻數(shù)分布表
3.4直方圖和條形圖的區(qū)別
條形圖使用條形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或百分比,寬度表示組距,2、直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。
3.5繪制線圖應(yīng)注意問題
時間在橫軸,觀測值繪在縱軸。圖形長寬比例為10:7,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大時,采用折斷符號將縱軸折斷。
3.6餅圖和環(huán)形圖的不同
餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數(shù)據(jù)系列,其圖形中間有個“空洞”,每個樣本或總體的數(shù)據(jù)系列為一個環(huán)。
3.7莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合
直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值。莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.9制作統(tǒng)計表應(yīng)注意的問題
1、合理安排統(tǒng)計表結(jié)構(gòu)2、標(biāo)題內(nèi)容應(yīng)滿足3W(數(shù)據(jù)的時間、地點以及何種數(shù)據(jù))要求3、數(shù)據(jù)計量單位相同時,可放在表的右上角標(biāo)明,不同時應(yīng)放在每個變量后或單列出一列標(biāo)明4、表中的上下兩條橫線一般用粗線,其他用細線5、通常情況下,統(tǒng)計表的左右兩邊不封口。表中的數(shù)據(jù)一般右對齊,有小數(shù)點時以小數(shù)點對其,而且小數(shù)點位數(shù)統(tǒng)一。對于沒有數(shù)據(jù)的表格單元用“—”表示
提綱:數(shù)據(jù)透視表的應(yīng)用1、可以從復(fù)雜的數(shù)據(jù)中提取有用的信息2、可以對數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進行匯總和作圖3、形成一個符合需要的交叉表(列聯(lián)表)4、在利用數(shù)據(jù)透視表時,數(shù)據(jù)源表中的首行必須有列標(biāo)題第4章
數(shù)據(jù)的概括性度量
4.1一組數(shù)據(jù)的分布特征可以從哪幾個方面進行測度?
三個方面:一、分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或聚集的程度;二、分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;三、分布的形狀,反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)。4.2怎樣理解平均數(shù)在統(tǒng)計學(xué)中的地位?
平均數(shù):1、平均數(shù)也稱為均值,是一組數(shù)據(jù)相加后除以數(shù)據(jù)的個數(shù)得到的結(jié)果2、是集中趨勢的最主要測度值,它主要適用于數(shù)值型數(shù)據(jù)3、是一組數(shù)據(jù)的均衡點所在4、體現(xiàn)了數(shù)據(jù)數(shù)據(jù)的必然性特征5、易受極端值影響6、有簡單平均數(shù)和加權(quán)平均數(shù)地位:平均數(shù)在統(tǒng)計學(xué)中具有重要地位,它是進行統(tǒng)計分析和統(tǒng)計推斷的基礎(chǔ)。從統(tǒng)計思想上看,平均數(shù)是一組數(shù)據(jù)的中心所在,是數(shù)據(jù)誤差相互抵消后的必然結(jié)果4.3簡述四分位數(shù)的計算方法。
四分位數(shù)是一組數(shù)據(jù)排序后處于25%和75%位置上的值。根據(jù)未分組數(shù)據(jù)計算四分位數(shù)時,首先對數(shù)據(jù)進行排序,然后確定四分位數(shù)所在的位置,該位置上的數(shù)值就是四分位數(shù)。
4.4對于比率數(shù)據(jù)的平均為什么采用幾何平均?
幾何平均數(shù)是指n個變量值乘積的n次方根,用G表示,計算公式為比率數(shù)據(jù)屬于相對數(shù),它不能如絕對數(shù)那樣對其進行累加,而只能對其進行連乘,因此對于比率數(shù)據(jù),在對其計算平均數(shù)的時候,我們不能像計算一般的平均數(shù)那樣計算,而要用幾何平均數(shù)的計算公式計算。
4.5簡述眾數(shù)、中位數(shù)和平均數(shù)的特點和應(yīng)用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數(shù)只有在數(shù)據(jù)量較多時才有意義,數(shù)據(jù)量較少時不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值。
中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受極端值的影響。當(dāng)數(shù)據(jù)的分布偏斜程度較大時,使用中位數(shù)也許是個好的選擇。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。
平均數(shù)是針對數(shù)值型數(shù)據(jù)計算的,而且利用了全部數(shù)據(jù)信息,在實際應(yīng)用中最廣泛。當(dāng)數(shù)據(jù)呈對稱分布或近似對稱分布時,三個代表值相等或相近,此時應(yīng)選擇平均數(shù)作為集中趨勢的代表值。但平均數(shù)易受極端值的影響,對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,此時應(yīng)考慮中位數(shù)或眾數(shù)。
4.6簡述異眾比率、四分位差、方差或標(biāo)準(zhǔn)差的適用場合
異眾比率主要用于衡量眾數(shù)對一組數(shù)據(jù)的代表程度,主要適合測度分類數(shù)據(jù)的離散程度;四分位差主要用于來測量順序數(shù)據(jù)的離散程度;方差或標(biāo)準(zhǔn)差主要用來測量數(shù)值型數(shù)據(jù)的離散程度。
4.7標(biāo)準(zhǔn)分數(shù)有哪些用途?
標(biāo)準(zhǔn)分數(shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個具有不同量綱的變量進行處理時,常需要對各變量進行標(biāo)準(zhǔn)化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。
4.9測度數(shù)據(jù)分布形狀的統(tǒng)計量有哪些?
對分布形狀的測度有偏態(tài)和峰態(tài),測度偏態(tài)的統(tǒng)計量是偏態(tài)系數(shù),測度峰態(tài)的統(tǒng)計量是峰態(tài)系數(shù)。數(shù)據(jù)集中趨勢度量的各統(tǒng)計量的計算、特點和應(yīng)用場合;①眾數(shù):M0=一個一個數(shù)?、谥形粩?shù):(n為數(shù)據(jù)個數(shù),(n為奇數(shù))Me=,(n為偶數(shù))③設(shè)下四分位數(shù)為QL,上四分位數(shù)為QU,根據(jù)四分位數(shù)的定義有:QL位置=QU位置=④平均數(shù)其中n為樣本量設(shè)原始數(shù)據(jù)被分為k組,組中值為M1,M2…Mk,各組變量出現(xiàn)的頻數(shù)為f1,f2…fk幾何平均數(shù)數(shù)據(jù)離散程度的度量的各統(tǒng)計量的計算、特點和應(yīng)用場合;分類數(shù)據(jù):異眾比率其中為變量值的總頻數(shù);為眾數(shù)組的頻數(shù)(比率越大,非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性越差;反之順序數(shù)據(jù):四分位差=上四分位數(shù)與下四分數(shù)之差(數(shù)值越小,說明中間的數(shù)據(jù)越集中;反之?dāng)?shù)值型數(shù)據(jù):極差R=max(xi)-min(xi)(一組數(shù)據(jù)最大值-最小值方差:標(biāo)注差:離散系數(shù):(即一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比)(離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;反之度量數(shù)據(jù)分布的偏態(tài)、峰態(tài)系數(shù)的計算及應(yīng)用場合;①偏態(tài)系數(shù)(SK):偏態(tài)是對數(shù)據(jù)分布對稱性的測度;SK=0,則數(shù)據(jù)分布是對稱的;SK>1或SK<-1,高度偏態(tài)分布;0.5<SK<1或-1<SK<-0.5,中等偏態(tài)分布;越接近0偏態(tài)程度越低當(dāng)SK為正值時,表示正離差值越大,可判斷為正偏或右偏;負值時,表示負離差值越大,可判斷為負偏或左偏②峰態(tài)系數(shù)(K):它是對數(shù)據(jù)分布平峰或尖峰程度的測度K>0,尖峰分布,數(shù)據(jù)分布更集中;K<0,扁平分布,數(shù)據(jù)分布越分散第九章分類數(shù)據(jù)分析1、分類數(shù)據(jù):是對事物進行分類的結(jié)果,其特征是,調(diào)查結(jié)果雖然用數(shù)值表示,但不同數(shù)值描述了調(diào)查對象的不同特征。分類數(shù)據(jù)的結(jié)果是頻數(shù),X2檢驗是對分類數(shù)據(jù)的頻數(shù)進行分析的統(tǒng)計方法2、X2統(tǒng)計量:X2可以用于測定兩個分類變量之間的相關(guān)程度,f0表示觀察值頻數(shù),fe表示期望值頻數(shù)。(f0-fe)2X2=E----------fe3、X2統(tǒng)計量特征:X2>=0,X2統(tǒng)計量分布與自由度有關(guān),X2統(tǒng)計量描述了觀察值與期望值的接近程度:自由度越小,分布越向左邊傾斜,隨著自由度的增加,X2分布的偏斜程度趨于緩解,逐漸顯露對稱性,隨著自由度的跡象增大,X2分布將趨近于對稱的正太分布。利用X2統(tǒng)計量可以對分類數(shù)據(jù)進行擬合優(yōu)度檢驗和獨立性檢驗。4、擬合優(yōu)度檢驗:利用X2統(tǒng)計量進行統(tǒng)計顯著性檢驗的重要內(nèi)容之一。依據(jù)總體分布狀況,計算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)進行對比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達到對分類變量進行分析的目的。例題:發(fā)生船難,共有2208人,其中男性1738人,女性470人,事后,幸存者共有718人,其中男性374人,女性344人,以a=0.1的顯著性水平檢驗存活狀況與性別是否有關(guān)H0:觀察頻數(shù)與期望頻數(shù)一致H1:觀察頻數(shù)與期望頻數(shù)不一致男性:觀察頻數(shù)374,期望頻數(shù)565女性:觀察頻數(shù)344,期望頻數(shù)153自由度計算公式:df=R-1R為分類變量類型的個數(shù),這里分類變量是男女,R=2,df=2-1=1,X20.1(1)=2.706,括號中的數(shù)字是自由度,因為X2遠大于X20.1,所以拒絕H0,接受H1,說明存活狀況與性別顯著相關(guān)。5、列聯(lián)分析:擬合優(yōu)度檢驗是對一個分類變量的檢驗,對于兩個分類變量的分析,稱為獨立性檢驗,分析過程可以通過列聯(lián)表的方式呈現(xiàn),所以有人把這種分析稱為列聯(lián)分析6、列聯(lián)表:由兩個以上的變量進行交叉分類的頻數(shù)分布表(N*N列聯(lián)表,不包括合計一欄)7、獨立性檢驗:就是分析列聯(lián)表中行變量和列變量是否相互獨立H0:XX和XX之間是獨立的(不存在依賴關(guān)系)H1:XX和XX之間不獨立(存在依賴關(guān)系)X2的自由度=(R-1)(C-1)R是行合計,C是列合計8、列聯(lián)表中的相關(guān)測量應(yīng)用場合:1、Φ相關(guān)系數(shù):描述2*2列聯(lián)表數(shù)據(jù)相關(guān)程度最常用的一種相關(guān)系數(shù)2、列聯(lián)相關(guān)系數(shù):主要用于大于2*2的列聯(lián)表的情況3、V相關(guān)系數(shù):對于同一個數(shù)據(jù),以上三個相關(guān)系數(shù)求出的結(jié)果不同思考題:1、簡述列聯(lián)表的構(gòu)造和列聯(lián)表的分布。(1)構(gòu)造:(2)分布:一、觀察值的分布(條件分布)二、百分比分布三、期望頻數(shù)的分布2、簡述Φ系數(shù)、c系數(shù)、V系數(shù)的各自特點(1)Φ系數(shù):A、主要用于2*2列聯(lián)表B、2*2列聯(lián)表中,數(shù)值位于0~1之間C、數(shù)值越大表明相關(guān)程度越強D、行數(shù)列數(shù)大于2后,系數(shù)值會隨行列數(shù)變大,且無上限(2)c系數(shù):A、主要用于2*2列聯(lián)表B、數(shù)值位于0~1之間C、數(shù)值越大表明相關(guān)程度越強D、相關(guān)系數(shù)的最大值與行列數(shù)的多少有關(guān),且隨著R和C的增大而增大E、當(dāng)列聯(lián)表中的兩個變量相互獨立時,系數(shù)C=0,但它不可能大于1(3)V系數(shù):A、適用于所有列聯(lián)表B、數(shù)值位于0~1之間C、數(shù)值越大表明相關(guān)程度越強3、構(gòu)造下列維數(shù)的列聯(lián)表,并給出X2檢驗的自由度。A、2行5列B、4行6列C、3行4列第十二章1、解釋多元回歸模型、多元回歸方程、估計的多元回歸方程的含義多元回歸模型是對統(tǒng)計關(guān)系進行定量描述的一種數(shù)學(xué)模型。多元回歸方程是對變量之間統(tǒng)計關(guān)系進行定量描述的一種數(shù)學(xué)表達式。指具有相關(guān)的隨機變量和固定變量之間關(guān)系的方程。主要有回歸直線方程。當(dāng)幾個變量有多重共線性時,多元回歸分析得出的回歸方程,靠手算精確值計算量太大,所以只能得出估計值2、多元線性回歸模型中有哪些基本的假定。在多元線性回歸模型中,對誤差項ε同樣有三個基本的假定:①誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。這意味著對于給定X1,X2…..Xk的值,y的期望值為E(y)=β0+β1X1+β2X2+……+βkXk。②對于自變量X1,X2,….Xk的所有值,ε的方差σ^2都相同。③誤差項ε是一個服從正態(tài)分布的隨機變量,且相互獨立,即ε~N(0,σ^2)。獨立性意味著自變量X1,X2......Xk的一組特定值所對應(yīng)的ε與X1,X2……Xk任意一組其他值所對應(yīng)的ε不相關(guān)。正態(tài)性意味著對于給定的X1,X2….Xk的值,因變量y也是一個服從正態(tài)分布的隨機變量。根據(jù)回歸模型的假定有:E(y)=β0+β1X1+β2X2+……+βkXk簡單版:
①
誤差項ε是一個期望值為0的隨機變量,即E(ε)=0
②
對于自變量x1,x2,…,xp的所有值,的方差2都相同
③
誤差項ε是一個服從正態(tài)分布的隨機變量,即ε~N(0,2),且相互獨立3、解釋多重判定系數(shù)和調(diào)整的多重判定系數(shù)的含義和作用。(1)多重判定系數(shù):是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個統(tǒng)計量,反應(yīng)了在因變量y的變差中被估計的回
歸方程所解釋的比例。
(2)調(diào)
整
的
多
重
判
定
系
數(shù):用樣本容量n和自變量的個數(shù)k去調(diào)整R2
得到,這使得
Ra
2
的值永遠小于
R2
且
Ra
2
的值不會由于模型中自變量個數(shù)的增加而越來越接近作用:避免增加自變量而高估多重判定系數(shù)(R2)。4、解釋多重共線性的含義當(dāng)回歸模型中兩個或兩個以上的自變量彼此相關(guān)時,稱回歸模型中存在多重共線性。5、多重共線性對回歸分析有哪些影響?1、變量之間高度相關(guān)時,可能會使回歸的結(jié)果混亂,甚至?xí)逊治鲆肫缤尽?、多重共線性可能對參數(shù)估計值的正負號產(chǎn)生影響,特別是βi的正負號有可能同預(yù)期的正負號相反。6、多重共線性的判別方法主要有哪些?其中最簡單的方法是計算模型中各對自變量之間的相關(guān)系數(shù),并對各相關(guān)系數(shù)進行顯著性檢驗。如果有一個或多個相關(guān)系數(shù)是顯著的,就表示模型中所使用的自變量之間相關(guān),因而存在多重共線性問題。具體來說,如果出現(xiàn)下列情況,暗示存在多重共線性:(1)模型中各對自變量之間顯著相關(guān)。
(2)當(dāng)模型的線性關(guān)系檢驗(F檢驗)顯著時,幾乎所有回歸系數(shù)βi的t檢驗卻不顯著。
(3)回歸系數(shù)的正負號與預(yù)期的相反。
(4)容忍度與方差擴大因子(VIF)。容忍度越小,多重共線性越嚴(yán)重,當(dāng)小于0.1時,存在嚴(yán)重多重共線性。VIF越大,多重共線性越嚴(yán)重,一般認為VIF大于10時,存在嚴(yán)重多重共線性。
7、多重共線性的處理方法有哪些?(1)將一個或多個相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)。(2)如果要在模型中保留所有的自變量,那就應(yīng)該:避免根據(jù)t統(tǒng)計量對單個參數(shù)β進行檢驗。對因變量y的推斷(估計或預(yù)測)限定在自變量樣本值的范圍內(nèi)。提綱:2、估計的多元線性回歸方程及參數(shù)的最小二乘估計;參數(shù)的最小二乘估計:回歸方程中的,,,···,仍然是根據(jù)最小二乘法求得,也就是使殘差平方和Q=最小。由此可以得到求解,,,···,的標(biāo)準(zhǔn)方程為:3、多重判定系數(shù)、估計標(biāo)準(zhǔn)誤差等概念;估計標(biāo)準(zhǔn)誤差:是對誤差項的方差的一個估計值,用于衡量多元回歸方程的擬合優(yōu)度計算公式:是根據(jù)自變量x1,x2,···,xk來預(yù)測因變量y時的平均預(yù)測誤差4、多元線性回歸方程的擬合優(yōu)度F檢驗;5、多元線性回歸方程參系數(shù)的顯著性t檢驗;6、多重共線性的概念、判別及其處理方法;概念:所謂多重共線性(Multicollinearity)是指線性回歸模型中的解釋變量之間由于存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系而使模型估計失真或難以估計準(zhǔn)確。一般來說,由于經(jīng)濟數(shù)據(jù)的限制使得模型設(shè)計不當(dāng),導(dǎo)致設(shè)計矩陣中解釋變量間存在普遍的相關(guān)關(guān)系。處理方法:(1)排除引起共線性的變量找出引起多重共線性的解釋變量,將它排除出去,以逐步回歸法得到最廣泛的應(yīng)用。(2)差分法時間序列數(shù)據(jù)、線性模型:將原模型變換為差分模型。減小參數(shù)估計量的方差:嶺回歸法(RidgeRegression)。第13章時間序列分析和預(yù)測1、時間序列組成要素及其分解;時間序列的構(gòu)成要素:趨勢(線性趨勢,非線性趨勢),季節(jié)性,周期性,隨機性趨勢:呈現(xiàn)出某種持續(xù)向上或持續(xù)下降的狀態(tài)或規(guī)律季節(jié)性:也稱季節(jié)變動,時間序列在一年內(nèi)重復(fù)出現(xiàn)的周期性波動周期性:也稱循環(huán)波動,圍繞長期趨勢的一種波浪形或振蕩式變動隨機性:也稱不規(guī)則波動,除去趨勢、周期性和季節(jié)性之后的偶然性波動2、時間序列的圖形描述、增長率分析等描述性分析;圖形描述:P325-327增長率分析:P327-3293、增長率的計算和分析方法;環(huán)比增長率:報告期增長率與前一期水平之比減1:定基增長率:報告期水平與某一固定時期水平之比減1:平均增長率:序列中各逐期環(huán)比值的幾何平均數(shù)減1:4、時間序列預(yù)測的程序;第一步:確定時間序列所包含的成分,也就是確定時間序列的類型。第二步:找出適合此類時間序列的預(yù)測方法。
第三步:對可能的預(yù)測方法進行評估,以確定最佳預(yù)測方案。
第四步:利用最佳預(yù)測方案進行預(yù)測。
5、平穩(wěn)序列的含義及預(yù)測方法;含義:基本上不存在趨勢的序列,各觀察值基本上在某個固定的水平上波動或雖有波動,但并不存在某種規(guī)律,而其波動可以看成是隨機的
預(yù)測方法:簡單平均法、移動平均法、指數(shù)平滑法P335-3386、含有線性趨勢、非線性趨勢的趨勢型序列的預(yù)測;①線性趨勢方程P341:線性模型法(a和b的求解方程)根據(jù)最小二乘法得到求解a和b的標(biāo)準(zhǔn)方程為:預(yù)測誤差可用估計標(biāo)準(zhǔn)誤差來衡量(m為未知常數(shù)個數(shù))②非線性趨勢包括指數(shù)曲線、多階曲線P343-345指數(shù)曲線:k階曲線函數(shù)形式7、季節(jié)型序列的預(yù)測;P3478、含有線性趨勢和季節(jié)成分的復(fù)合型序列的分解預(yù)測;第一步:確定并分離季節(jié)成分,計算季節(jié)指數(shù),以確定時間序列中的季節(jié)成分。然后將季節(jié)性因素從時間序列中分離出去,以便觀察和分析時間序列的其他特征。
第二步:對消除了季節(jié)成分的時間序列建立適當(dāng)預(yù)測模型,并進行預(yù)測。
第三步:計算出最后的預(yù)測值。用預(yù)測值乘以相應(yīng)的季節(jié)指數(shù),得到最終的預(yù)測值
9、應(yīng)用Excel對時間序列進行描述性分析及對不同成分時間序列進行預(yù)測。P330-334第十四章什么是指數(shù),它的性質(zhì)、分類及編制中的問題指數(shù),或稱統(tǒng)計數(shù),是分析社會經(jīng)濟現(xiàn)象數(shù)量變化的一種重要統(tǒng)計方法指數(shù)是測定多項內(nèi)容數(shù)量綜合變動的相對數(shù)。第一要點:指數(shù)的實質(zhì)是測定多項內(nèi)容第二要點:其表現(xiàn)形式為動態(tài)相對數(shù)P363指數(shù)分類:①按照考察對象的范圍不同:還在于計算方法的不同個體指數(shù):考察總體中個別現(xiàn)象或個別項目數(shù)量變動的相對數(shù)總指數(shù):綜合反映多種項目數(shù)量變動的相對數(shù)②按照反映指標(biāo)的性質(zhì)不同:指標(biāo)指數(shù):反映數(shù)量指標(biāo)變動程度的不同,常采用實物計量單位質(zhì)量指標(biāo)指數(shù):反映品質(zhì)指標(biāo)變動程度的相對數(shù),常采用貨幣計量單位③按照計算形式不同:簡單指數(shù):把計入指數(shù)的各個項目的重要性視為相同加權(quán)指數(shù):對計入指數(shù)的各個項目依據(jù)重要程度賦予不同的權(quán)數(shù),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高速公路緊急呼叫系統(tǒng)行業(yè)深度研究分析報告
- 2025年度建筑鋼結(jié)構(gòu)安裝工程合同
- 2025年度鋁型材行業(yè)人才培養(yǎng)與交流合同
- 2025年度蔬菜大棚冷鏈物流服務(wù)合同
- 進社團申請書
- 2025年度城市道路改造工程承包合同
- 2025年度荒山造林項目生態(tài)效益合同范本
- 漲工資申請書格式
- 2025年度個人汽車貸款利息支付及保險合同
- 自我認知與自我提升主題教育
- 監(jiān)獄安全課件
- 《初三開學(xué)第一課 中考動員會 中考沖刺班會》課件
- 護理干預(yù)在慢性病管理中的作用
- 慢性萎縮性胃炎的護理查房
- 住院醫(yī)師規(guī)范化培訓(xùn)臨床實踐能力結(jié)業(yè)專科技能考核(全科醫(yī)學(xué)科)婦科檢查及分泌物留取
- 加強網(wǎng)絡(luò)空間治理工作的調(diào)研與思考
- 產(chǎn)后修復(fù)學(xué)習(xí)培訓(xùn)課件
- mysql課件第五章數(shù)據(jù)查詢
- 超濾培訓(xùn)課件
- 《冠心病的介入治療》課件
- 中醫(yī)防感冒健康知識講座
評論
0/150
提交評論