《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納

上傳人：N*** IP屬地：廣東上傳時(shí)間：2020-05-21 格式：DOC 頁數(shù)：11 大?。?71KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩6頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)期末重點(diǎn)1. 統(tǒng)計(jì)學(xué)的類型和不同類型的特點(diǎn)統(tǒng)計(jì)數(shù)據(jù)；按所采用的計(jì)量尺度不同分；（1）（定性數(shù)據(jù)）分類數(shù)據(jù)：只能歸于某一類別的非數(shù)字型數(shù)據(jù)，它是對(duì)事物進(jìn)行分類的結(jié)果，數(shù)據(jù)表現(xiàn)為類別，用文字來表述；（2）（定性數(shù)據(jù)）順序數(shù)據(jù)：只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。它也是有類別的，但這些類別是有序的。（3）（定量數(shù)據(jù)）數(shù)值型數(shù)據(jù)：按數(shù)字尺度測量的觀察值，其結(jié)果表現(xiàn)為具體的數(shù)值。統(tǒng)計(jì)數(shù)據(jù)；按統(tǒng)計(jì)數(shù)據(jù)都收集方法分；（4）觀測數(shù)據(jù)：是通過調(diào)查或觀測而收集到的數(shù)據(jù)，這類數(shù)據(jù)是在沒有對(duì)事物人為控制的條件下得到的。（5）實(shí)驗(yàn)數(shù)據(jù)：在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)；按被描述的現(xiàn)象與實(shí)踐的關(guān)系分；（6）截面數(shù)據(jù)：在相同或相似的時(shí)間點(diǎn)收集到的數(shù)據(jù)，也叫靜態(tài)數(shù)據(jù)。（7）時(shí)間序列數(shù)據(jù)：按時(shí)間順序收集到的，用于描述現(xiàn)象隨時(shí)間變化的情況，也叫動(dòng)態(tài)數(shù)據(jù)。2. 變量的題型第10頁，習(xí)題1.1（1）年齡：數(shù)值型變量（2）性別：分類變量（3）汽車產(chǎn)量：離散型變量（4）員工對(duì)企業(yè)某項(xiàng)改革措施的態(tài)度（贊成、中立、反對(duì)）：順序變量（5）購買商品時(shí)的支付方式（現(xiàn)金、信用卡、支票）：分類變量3. 隨機(jī)抽樣（概率抽樣）的抽樣方式。（1）簡單隨機(jī)抽樣（2）分層抽樣：就是抽樣單位按某種特征或者某種規(guī)則劃分為不同的層，然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。將各層的樣本結(jié)合起來，對(duì)總體目標(biāo)量進(jìn)行估計(jì)。（3）整群抽樣：（4）系統(tǒng)抽樣（5）多階段抽樣分層抽樣與整群抽樣的區(qū)別：分層抽樣的層數(shù)就是樣本容量；整群抽樣的群中單位的個(gè)數(shù)就是樣本容量4. 非概率抽樣的幾種類型（1）方便抽樣（2）判斷抽樣（3）自愿樣本（4）滾雪球抽樣滾雪球抽樣往往用于對(duì)稀少群體的調(diào)查。在滾雪球抽樣中，首先選擇一組調(diào)查單位，對(duì)其實(shí)施調(diào)查后，再請(qǐng)他們提供另外一些屬于研究總特的調(diào)查對(duì)象，調(diào)查人員根據(jù)調(diào)查線索，進(jìn)行此后的調(diào)查。這個(gè)過程持續(xù)下去，就會(huì)形成滾雪球效應(yīng)。優(yōu)點(diǎn)：容易找到那些屬于特定群體的被調(diào)查者，調(diào)查成本也比較低。（5）配額抽樣比較概率抽樣和非概率抽樣的特點(diǎn)，指出各自適用情況概率抽樣：抽樣時(shí)按一定的概率以隨機(jī)原則抽取樣本。每個(gè)單位別抽中的概率已知或可以計(jì)算，當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí)，要考慮到每個(gè)單位樣本被抽到的概率。技術(shù)含量和成本都比較高。如果調(diào)查目的在于掌握和研究對(duì)象總體的數(shù)量特征，得到總體參數(shù)的置信區(qū)間，就使用概率抽樣。非概率抽樣：操作簡單，時(shí)效快，成本低，而且對(duì)于抽樣中的統(tǒng)計(jì)學(xué)專業(yè)技術(shù)要求不是很高。它適合探索性的研究，調(diào)查結(jié)果用于發(fā)現(xiàn)問題，為更深入的數(shù)量分析提供準(zhǔn)備。它同樣使用市場調(diào)查中的概念測試（不需要調(diào)查結(jié)果投影到總體的情況）。5. 數(shù)據(jù)預(yù)處理內(nèi)容數(shù)據(jù)審核（完整性和準(zhǔn)確性；適用性和實(shí)效性），數(shù)據(jù)篩選和數(shù)據(jù)排序。6. 數(shù)據(jù)型數(shù)據(jù)的分組方法和步驟分組方法：單變量值分組和組距分組，組距分組又分為等距分組和異距分組。分組步驟：（1）確定組數(shù)（2）確定各組組距（3）根據(jù)分組整理成頻數(shù)分布表7. 散點(diǎn)圖與餅圖的主要用途餅圖是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形，它主要用于表示一個(gè)樣本（或總體）中各組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例，對(duì)于研究結(jié)構(gòu)性問題十分有用。散點(diǎn)圖是描述變量之間關(guān)系的一種直觀方法，從中可以大體上看出變量之間的關(guān)系形態(tài)及關(guān)系強(qiáng)度。8. 舉例說明開口組組中值的計(jì)算方法缺下限開口組組中值上限1/2鄰組組距缺上限開口組組中值下限+1/2鄰組組距9. 怎樣理解平均數(shù)在統(tǒng)計(jì)學(xué)中的地位？平均數(shù)在統(tǒng)計(jì)學(xué)中具有重要的地位，是集中趨勢的最主要的測度，主要適用于數(shù)值型數(shù)據(jù)，而不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。10. 中位數(shù)與眾數(shù)的區(qū)別眾數(shù)：是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值，用表示。眾數(shù)主要用于測度分類數(shù)據(jù)的集中趨勢，當(dāng)然也適用于作為順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)集中趨勢的測度值。中位數(shù)：是一組數(shù)列排序后處于中間位置上的變量值，用。中位數(shù)主要用于測度順序數(shù)據(jù)的集中趨勢，當(dāng)然也適用測度數(shù)值型數(shù)據(jù)的集中趨勢，但不適用于分類數(shù)據(jù)。簡述眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn)和應(yīng)用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值，不受極端值的影響，缺點(diǎn)是具有不唯一性。眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義，數(shù)據(jù)量較少時(shí)不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值。中位數(shù)是一組數(shù)據(jù)中間位置上的代表值，不受極端值的影響。當(dāng)數(shù)據(jù)的分布偏斜較大時(shí)，使用中位數(shù)也許不錯(cuò)。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。平均數(shù)對(duì)數(shù)值型數(shù)據(jù)計(jì)算的，而且利用了全部數(shù)據(jù)信息，在實(shí)際應(yīng)用中最廣泛。當(dāng)數(shù)據(jù)呈對(duì)稱分布或近似對(duì)稱分布時(shí)，三個(gè)代表值相等或相近，此時(shí)應(yīng)選擇平均數(shù)。但平均數(shù)易受極端值的影響，對(duì)于偏態(tài)分布的數(shù)據(jù)，平均數(shù)的代表性較差，此時(shí)應(yīng)考慮中位數(shù)或眾數(shù)。11. 標(biāo)準(zhǔn)差系數(shù)（離散系數(shù)或變異系數(shù)）的計(jì)算及其應(yīng)用（第89頁，第96頁習(xí)題4.8（1）為什么要計(jì)算離散系數(shù)？方差和標(biāo)準(zhǔn)差是反映數(shù)據(jù)分散程度的絕對(duì)值，一方面其數(shù)值大小受原變量值本身水平高低的影響，也就是與變量的平均數(shù)大小有關(guān)；另一方面，它們與原變量的計(jì)量單位相同，采用不同計(jì)量單位的變量值，其離散程度的測度值也就不同。因此，為消除變量值水平高低和計(jì)量單位不同對(duì)離散程度測度值的影響，需要計(jì)算離散系數(shù)。12. 什么是次序統(tǒng)計(jì)量設(shè)，是從總體中抽取的一個(gè)樣本，稱為第個(gè)次序統(tǒng)計(jì)量，它是樣本滿足如下條件的函數(shù)：每當(dāng)樣本得到一組觀測值時(shí)，其由小到大的排序中，第個(gè)值就作為次序統(tǒng)計(jì)量的觀測值，而稱為次序統(tǒng)計(jì)量。其中，分別為最小的的最大次序統(tǒng)計(jì)量。13. 什么是自由度？自由度：隨機(jī)變量所包含的獨(dú)立變量的個(gè)數(shù)。14. 偏態(tài)系數(shù)（SK）取值的不同意義如果一組數(shù)據(jù)的分布是對(duì)稱的，則偏態(tài)系數(shù)等于0；如果偏態(tài)系數(shù)明顯不等于0，表明分布是非對(duì)稱的。若偏態(tài)系數(shù)大于1或小于-1，成為高度偏態(tài)分布；若偏態(tài)系數(shù)在0.5-1或-1-0.5之間，被認(rèn)為是中等偏態(tài)分布；偏態(tài)系數(shù)越接近0，偏斜程度就越低。15. 中心極限定理的內(nèi)容設(shè)從均值方差為的任意一個(gè)總體中抽取樣本量為n的樣本，當(dāng)n充分大時(shí)，樣本均值的抽樣分布近似服從均值為，方差為的正態(tài)分布。16. 評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)（1）無偏性無偏性是指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為，所選擇的估計(jì)量為，如果E（）=，則稱為的無偏估計(jì)量。（2）有效性有效性是指對(duì)同一整體參數(shù)的兩個(gè)無偏估計(jì)量，有更小的標(biāo)準(zhǔn)的估計(jì)量更有效。在無偏估計(jì)的條件下，估計(jì)量的方差越小，估計(jì)也就越有效。（3）一致性一致性是指隨著樣本量的增大，估計(jì)量的指越來越接近被估計(jì)總體的參數(shù)。換而言之，一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。17. 簡述樣本量與置信水平、總體方差、估計(jì)誤差的關(guān)系樣本量越大置信水平越高，總體方差和邊際誤差越小18. 大樣本條件下總體均值的區(qū)間估計(jì)（1）大樣本條件下，方差已知，正態(tài)總體或非正態(tài)總體總體均值在置信水平下的置信區(qū)間為：（為置信下限；為置信上限，為事先確定的一個(gè)概率值，也稱風(fēng)險(xiǎn)值，是總體均值不包括在置信區(qū)間的概率；為置信水平；是標(biāo)準(zhǔn)正態(tài)分布右側(cè)面積為時(shí)的z值；是總體均值的估計(jì)誤差）（2）大樣本條件下，方差未知，正態(tài)總體或非正態(tài)總體總體均值在置信水平下的置信區(qū)間為：（為樣本方差，s為樣本標(biāo)準(zhǔn)差）19. 置信區(qū)間可靠性與精確性的關(guān)系置信度又稱置信水平是對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)時(shí)構(gòu)造的隨機(jī)區(qū)間包含參數(shù)真值的概率。精確度是對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)時(shí)構(gòu)造的隨機(jī)區(qū)間的平均長度。置信度和精確度是評(píng)價(jià)區(qū)間估計(jì)優(yōu)劣的兩個(gè)標(biāo)準(zhǔn)，置信度度和精確度都高則說明區(qū)間估計(jì)較好，但是二者是此消彼長的關(guān)系，提高置信度必將以降低精確度為代價(jià)。20. 假設(shè)檢驗(yàn)和參數(shù)估計(jì)有什么相同點(diǎn)和不同點(diǎn)？參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分，它們都是利用樣本對(duì)總體進(jìn)行某種推斷，然而推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法，總體參數(shù)在估計(jì)前是未知的。而在參數(shù)假設(shè)檢驗(yàn)中，則是先對(duì)的值提出一個(gè)假設(shè)，然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。21. 假設(shè)檢驗(yàn)的種類及假設(shè)的正確寫法建設(shè)檢驗(yàn)的一般流程：首先提出原假設(shè)和備擇假設(shè)，分別為：然后，確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量，需要考慮樣本量的多與少，總體標(biāo)準(zhǔn)差已知與否，等等。規(guī)定顯著性水平檢驗(yàn)統(tǒng)計(jì)量的確定：若是大樣本條件下，采用z統(tǒng)計(jì)量，計(jì)算公式為：或若是小樣本條件下，采用t統(tǒng)計(jì)量，計(jì)算公式為（t統(tǒng)計(jì)量的自由度為n-1）注：即使是小樣本，若已知，仍可繼續(xù)使用z統(tǒng)計(jì)量。最后，進(jìn)行統(tǒng)計(jì)決策。比例問題的檢驗(yàn)，z統(tǒng)計(jì)量的計(jì)算公式為：（p為樣本比例；為總體比例的假設(shè)值）（1）雙側(cè)檢驗(yàn)在雙側(cè)檢驗(yàn)中，只要或兩者之中有一個(gè)成立，就可以拒絕原假設(shè)。以大樣本條件下為例，雙側(cè)檢驗(yàn)的決策準(zhǔn)則為：（z的下標(biāo)表示雙側(cè)檢驗(yàn)）不管雙側(cè)檢驗(yàn)或是單側(cè)檢驗(yàn)，若使用P值檢驗(yàn)，；。（2）單側(cè)檢驗(yàn) 左單側(cè)檢驗(yàn)（下限檢驗(yàn)）希望所考查的數(shù)值越大越好右單側(cè)檢驗(yàn)（上限檢驗(yàn)）希望所考查的數(shù)值越小越好22. 大樣本條件下總體均值的假設(shè)檢驗(yàn)（192頁例題）5. 總體方差假設(shè)檢驗(yàn)的方法若進(jìn)行雙側(cè)檢驗(yàn)，在確定的水平下，拒絕域分布在統(tǒng)計(jì)量分布曲線的兩邊；若是單側(cè)檢驗(yàn)，拒絕域分布在統(tǒng)計(jì)量分布曲線的一邊。具體在左還是在右，需根據(jù)原假設(shè)和備擇假設(shè)的情況而定。若樣本統(tǒng)計(jì)量，則拒絕原假設(shè)；若，則不能拒絕原假設(shè)。23. 假設(shè)檢驗(yàn)中犯兩類錯(cuò)誤及其概率之間的關(guān)系假設(shè)檢驗(yàn)的結(jié)果可能是錯(cuò)誤的，所犯的錯(cuò)誤有兩種類型，一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了，犯這種錯(cuò)誤的概率用表示，所以也稱錯(cuò)誤或棄真錯(cuò)誤；另一類錯(cuò)誤是原假設(shè)為偽我們卻沒有拒絕，犯這種錯(cuò)誤的概論用表示，所以也稱錯(cuò)誤或取偽錯(cuò)誤。兩類錯(cuò)誤之間存在什么樣的數(shù)量關(guān)系：在假設(shè)檢驗(yàn)中，與是此消彼長的關(guān)系。如果減小錯(cuò)誤，就會(huì)增大犯錯(cuò)誤的機(jī)會(huì)，若減小錯(cuò)誤，也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。故，二者是此消彼長的關(guān)系。24. 列聯(lián)表的概念及自由度的確定列聯(lián)表是由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表。自由度=（R-1）（C-1）簡述列聯(lián)表的構(gòu)造與列聯(lián)表的分布兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表，包括觀察值的分布與期望值的分布。25. 列聯(lián)表檢驗(yàn)的步驟(4個(gè)），即計(jì)算統(tǒng)計(jì)量步驟（1）計(jì)算（2）計(jì)算（3）計(jì)算（4）計(jì)算26. 相關(guān)系數(shù)的計(jì)算及性質(zhì)簡述相關(guān)系數(shù)性質(zhì)：（1） r的取值范圍為-1到1， r=1時(shí)，完全正線性相關(guān) R=-1時(shí)，完全負(fù)線性相關(guān) R=0時(shí)，不存在線性相關(guān)關(guān)系 0r=-1,負(fù)線性相關(guān) 0r=1,正線性相關(guān) R越趨近于+1，線性相關(guān)關(guān)系越密切 R越趨近于0，線性相關(guān)關(guān)系越不密切（2） r具有對(duì)稱性。x與y之間的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等。（3） r數(shù)值大小與x和y的原點(diǎn)及尺度無關(guān)。（4） r僅僅是x與y之間線性關(guān)系的一個(gè)度量，它不能用于描述非線性關(guān)系。（5） r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量，卻不一定意味著x與y一定有因果關(guān)系。27. 簡述參數(shù)最小二乘估計(jì)的基本原理未知量的最可能值是使各項(xiàng)實(shí)際觀測值和計(jì)算值之間差的平方乘以其精確度的數(shù)值以后的和為最小。28. 簡述判定系數(shù)的含義和作用回歸平方和占總平方和的比例稱為判定系數(shù)，判定系數(shù)是對(duì)估計(jì)得回歸方程擬合優(yōu)度的度量。三個(gè)平方和的關(guān)系為：總平方和（SST）=回歸平方和（SSR）+殘差平方和（SSE）判定系數(shù)R測度了回歸直線對(duì)觀測數(shù)據(jù)的擬合程度。判定系數(shù)R的取值范圍是0，1。R越接近1，表明回歸平方和占總平方和的比例越大，回歸直線各觀測點(diǎn)越接近，用x的變化來解釋y值變差的部分就越多，回歸直線的擬合程度就越好；反之R越接近0，回歸直線的擬合程度就越差。29. 簡單線性回歸方程的計(jì)算（是估計(jì)的回歸直線在y軸上的截距；是直線的斜率，表示x每變動(dòng)一個(gè)單位時(shí)，y的平均變動(dòng)值。）30. 平穩(wěn)序列與非平穩(wěn)序列平穩(wěn)序列是基本上不存在趨勢的序列。非平穩(wěn)序列是包含趨勢、季節(jié)性或周期性的序列，它可能只含有其中一種成分，也可能含有幾種成分的組合。31. 簡述時(shí)間序列的預(yù)測程序。第一步：確定時(shí)間序列所包含的成分，也就是確定時(shí)間序列的類型。第二步：找出適合此類時(shí)間序列的預(yù)測方法。第三步：對(duì)可能的預(yù)測方法進(jìn)行評(píng)估，以確定最佳預(yù)測方案。第四步：利用最佳預(yù)測方案進(jìn)行預(yù)測。32. 簡述復(fù)合型序列預(yù)測的步驟第一步：確定并分離季節(jié)成分，計(jì)算季節(jié)指數(shù)，以確定時(shí)間序列中的季節(jié)成分。然后將季節(jié)性因素從時(shí)間序列中分離出去，以便觀察和分析時(shí)間序列的其他特征。第二步：對(duì)消除了季節(jié)成分的時(shí)間序列建立適當(dāng)預(yù)測模型，并進(jìn)行預(yù)測。第三步：計(jì)算出最后的預(yù)測值。用預(yù)測值乘以相應(yīng)的季節(jié)指數(shù)，得到最終的預(yù)測值33. 簡述季節(jié)指數(shù)的計(jì)算步驟（1）計(jì)算移動(dòng)平均值(季度數(shù)據(jù)采用4項(xiàng)移動(dòng)平均，月份數(shù)據(jù)采用12項(xiàng)移動(dòng)平均)，并將其結(jié)果進(jìn)行“中心化”處理(將移動(dòng)平均的結(jié)果再進(jìn)行一次二項(xiàng)的移動(dòng)平均，即得出“中心化移動(dòng)平均值”(CMA)（2）計(jì)算移動(dòng)平均的比值，也成為季節(jié)比率(即將序列的各觀察值除以相應(yīng)的中心化移動(dòng)平均值，然

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納

文檔簡介

溫馨提示

最新文檔

評(píng)論

《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔