《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納_第1頁
《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納_第2頁
《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納_第3頁
《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納_第4頁
《統(tǒng)計(jì)學(xué)》重點(diǎn)歸納_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)期末重點(diǎn)1. 統(tǒng)計(jì)學(xué)的類型和不同類型的特點(diǎn)統(tǒng)計(jì)數(shù)據(jù);按所采用的計(jì)量尺度不同分;(1)(定性數(shù)據(jù))分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對(duì)事物進(jìn)行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述;(2)(定性數(shù)據(jù))順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。它也是有類別的,但這些類別是有序的。(3)(定量數(shù)據(jù))數(shù)值型數(shù)據(jù):按數(shù)字尺度測量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值。統(tǒng)計(jì)數(shù)據(jù);按統(tǒng)計(jì)數(shù)據(jù)都收集方法分;(4)觀測數(shù)據(jù):是通過調(diào)查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對(duì)事物人為控制的條件下得到的。(5)實(shí)驗(yàn)數(shù)據(jù):在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù);按被描述的現(xiàn)象與實(shí)踐的關(guān)系分;(6)截面數(shù)據(jù):在相同或相似的時(shí)間點(diǎn)收集到的數(shù)據(jù),也叫靜態(tài)數(shù)據(jù)。(7)時(shí)間序列數(shù)據(jù):按時(shí)間順序收集到的,用于描述現(xiàn)象隨時(shí)間變化的情況,也叫動(dòng)態(tài)數(shù)據(jù)。2. 變量的題型第10頁,習(xí)題1.1(1) 年齡:數(shù)值型變量(2) 性別:分類變量(3) 汽車產(chǎn)量:離散型變量(4) 員工對(duì)企業(yè)某項(xiàng)改革措施的態(tài)度(贊成、中立、反對(duì)):順序變量(5) 購買商品時(shí)的支付方式(現(xiàn)金、信用卡、支票):分類變量3. 隨機(jī)抽樣(概率抽樣)的抽樣方式。(1) 簡單隨機(jī)抽樣(2) 分層抽樣:就是抽樣單位按某種特征或者某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。將各層的樣本結(jié)合起來,對(duì)總體目標(biāo)量進(jìn)行估計(jì)。(3) 整群抽樣:(4) 系統(tǒng)抽樣(5) 多階段抽樣分層抽樣與整群抽樣的區(qū)別:分層抽樣的層數(shù)就是樣本容量;整群抽樣的群中單位的個(gè)數(shù)就是樣本容量4. 非概率抽樣的幾種類型(1) 方便抽樣(2) 判斷抽樣(3) 自愿樣本(4) 滾雪球抽樣滾雪球抽樣往往用于對(duì)稀少群體的調(diào)查。在滾雪球抽樣中,首先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查后,再請(qǐng)他們提供另外一些屬于研究總特的調(diào)查對(duì)象,調(diào)查人員根據(jù)調(diào)查線索,進(jìn)行此后的調(diào)查。這個(gè)過程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)。優(yōu)點(diǎn):容易找到那些屬于特定群體的被調(diào)查者,調(diào)查成本也比較低。(5) 配額抽樣比較概率抽樣和非概率抽樣的特點(diǎn),指出各自適用情況 概率抽樣:抽樣時(shí)按一定的概率以隨機(jī)原則抽取樣本。每個(gè)單位別抽中的概率已知或可以計(jì)算,當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)單位樣本被抽到的概率。技術(shù)含量和成本都比較高。如果調(diào)查目的在于掌握和研究對(duì)象總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣:操作簡單,時(shí)效快,成本低,而且對(duì)于抽樣中的統(tǒng)計(jì)學(xué)專業(yè)技術(shù)要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準(zhǔn)備。它同樣使用市場調(diào)查中的概念測試(不需要調(diào)查結(jié)果投影到總體的情況)。5. 數(shù)據(jù)預(yù)處理內(nèi)容數(shù)據(jù)審核(完整性和準(zhǔn)確性;適用性和實(shí)效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。6. 數(shù)據(jù)型數(shù)據(jù)的分組方法和步驟分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。分組步驟:(1)確定組數(shù)(2) 確定各組組距(3) 根據(jù)分組整理成頻數(shù)分布表7. 散點(diǎn)圖與餅圖的主要用途 餅圖是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形,它主要用于表示一個(gè)樣本(或總體)中各組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例,對(duì)于研究結(jié)構(gòu)性問題十分有用。 散點(diǎn)圖是描述變量之間關(guān)系的一種直觀方法,從中可以大體上看出變量之間的關(guān)系形態(tài)及關(guān)系強(qiáng)度。8. 舉例說明開口組組中值的計(jì)算方法缺下限開口組組中值上限1/2鄰組組距缺上限開口組組中值下限+1/2鄰組組距9. 怎樣理解平均數(shù)在統(tǒng)計(jì)學(xué)中的地位? 平均數(shù)在統(tǒng)計(jì)學(xué)中具有重要的地位,是集中趨勢的最主要的測度,主要適用于數(shù)值型數(shù)據(jù),而不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。10. 中位數(shù)與眾數(shù)的區(qū)別 眾數(shù):是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值,用表示。眾數(shù)主要用于測度分類數(shù)據(jù)的集中趨勢,當(dāng)然也適用于作為順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)集中趨勢的測度值。 中位數(shù):是一組數(shù)列排序后處于中間位置上的變量值,用。中位數(shù)主要用于測度順序數(shù)據(jù)的集中趨勢,當(dāng)然也適用測度數(shù)值型數(shù)據(jù)的集中趨勢,但不適用于分類數(shù)據(jù)。簡述眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn)和應(yīng)用場合。 眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點(diǎn)是具有不唯一性。眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義,數(shù)據(jù)量較少時(shí)不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值。 中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受極端值的影響。當(dāng)數(shù)據(jù)的分布偏斜較大時(shí),使用中位數(shù)也許不錯(cuò)。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。平均數(shù)對(duì)數(shù)值型數(shù)據(jù)計(jì)算的,而且利用了全部數(shù)據(jù)信息,在實(shí)際應(yīng)用中最廣泛。當(dāng)數(shù)據(jù)呈對(duì)稱分布或近似對(duì)稱分布時(shí),三個(gè)代表值相等或相近,此時(shí)應(yīng)選擇平均數(shù)。但平均數(shù)易受極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,此時(shí)應(yīng)考慮中位數(shù)或眾數(shù)。11. 標(biāo)準(zhǔn)差系數(shù)(離散系數(shù)或變異系數(shù))的計(jì)算及其應(yīng)用(第89頁,第96頁習(xí)題4.8(1)為什么要計(jì)算離散系數(shù)? 方差和標(biāo)準(zhǔn)差是反映數(shù)據(jù)分散程度的絕對(duì)值,一方面其數(shù)值大小受原變量值本身水平高低的影響,也就是與變量的平均數(shù)大小有關(guān);另一方面,它們與原變量的計(jì)量單位相同,采用不同計(jì)量單位的變量值,其離散程度的測度值也就不同。因此,為消除變量值水平高低和計(jì)量單位不同對(duì)離散程度測度值的影響,需要計(jì)算離散系數(shù)。12. 什么是次序統(tǒng)計(jì)量 設(shè),是從總體中抽取的一個(gè)樣本,稱為第個(gè)次序統(tǒng)計(jì)量,它是樣本滿足如下條件的函數(shù):每當(dāng)樣本得到一組觀測值時(shí),其由小到大的排序中,第個(gè)值就作為次序統(tǒng)計(jì)量的觀測值,而稱為次序統(tǒng)計(jì)量。其中,分別為最小的的最大次序統(tǒng)計(jì)量。13. 什么是自由度?自由度:隨機(jī)變量所包含的獨(dú)立變量的個(gè)數(shù)。14. 偏態(tài)系數(shù)(SK)取值的不同意義 如果一組數(shù)據(jù)的分布是對(duì)稱的,則偏態(tài)系數(shù)等于0;如果偏態(tài)系數(shù)明顯不等于0,表明分布是非對(duì)稱的。若偏態(tài)系數(shù)大于1或小于-1,成為高度偏態(tài)分布;若偏態(tài)系數(shù)在0.5-1或-1-0.5之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低。15. 中心極限定理的內(nèi)容設(shè)從均值方差為的任意一個(gè)總體中抽取樣本量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為,方差為的正態(tài)分布。16. 評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)(1) 無偏性無偏性是指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為,所選擇的估計(jì)量為,如果E()=,則稱為的無偏估計(jì)量。(2) 有效性有效性是指對(duì)同一整體參數(shù)的兩個(gè)無偏估計(jì)量,有更小的標(biāo)準(zhǔn)的估計(jì)量更有效。在無偏估計(jì)的條件下,估計(jì)量的方差越小,估計(jì)也就越有效。(3) 一致性一致性是指隨著樣本量的增大,估計(jì)量的指越來越接近被估計(jì)總體的參數(shù)。換而言之,一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。17. 簡述樣本量與置信水平、總體方差、估計(jì)誤差的關(guān)系樣本量越大置信水平越高,總體方差和邊際誤差越小18. 大樣本條件下總體均值的區(qū)間估計(jì)(1) 大樣本條件下,方差已知,正態(tài)總體或非正態(tài)總體總體均值在置信水平下的置信區(qū)間為:(為置信下限;為置信上限,為事先確定的一個(gè)概率值,也稱風(fēng)險(xiǎn)值,是總體均值不包括在置信區(qū)間的概率;為置信水平;是標(biāo)準(zhǔn)正態(tài)分布右側(cè)面積為時(shí)的z值;是總體均值的估計(jì)誤差)(2) 大樣本條件下,方差未知,正態(tài)總體或非正態(tài)總體總體均值在置信水平下的置信區(qū)間為:(為樣本方差,s為樣本標(biāo)準(zhǔn)差)19. 置信區(qū)間可靠性與精確性的關(guān)系 置信度又稱置信水平是對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)時(shí)構(gòu)造的隨機(jī)區(qū)間包含參數(shù)真值的概率。 精確度是對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)時(shí)構(gòu)造的隨機(jī)區(qū)間的平均長度。 置信度和精確度是評(píng)價(jià)區(qū)間估計(jì)優(yōu)劣的兩個(gè)標(biāo)準(zhǔn),置信度度和精確度都高則說明區(qū)間估計(jì)較好,但是二者是此消彼長的關(guān)系,提高置信度必將以降低精確度為代價(jià)。20. 假設(shè)檢驗(yàn)和參數(shù)估計(jì)有什么相同點(diǎn)和不同點(diǎn)? 參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是利用樣本對(duì)總體進(jìn)行某種推斷,然而推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法,總體參數(shù)在估計(jì)前是未知的。而在參數(shù)假設(shè)檢驗(yàn)中,則是先對(duì)的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。21. 假設(shè)檢驗(yàn)的種類及假設(shè)的正確寫法建設(shè)檢驗(yàn)的一般流程:首先提出原假設(shè)和備擇假設(shè),分別為:然后,確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,需要考慮樣本量的多與少,總體標(biāo)準(zhǔn)差已知與否,等等。規(guī)定顯著性水平檢驗(yàn)統(tǒng)計(jì)量的確定: 若是大樣本條件下,采用z統(tǒng)計(jì)量,計(jì)算公式為:或 若是小樣本條件下,采用t統(tǒng)計(jì)量,計(jì)算公式為(t統(tǒng)計(jì)量的自由度為n-1)注:即使是小樣本,若已知,仍可繼續(xù)使用z統(tǒng)計(jì)量。最后,進(jìn)行統(tǒng)計(jì)決策。比例問題的檢驗(yàn),z統(tǒng)計(jì)量的計(jì)算公式為:(p為樣本比例;為總體比例的假設(shè)值)(1) 雙側(cè)檢驗(yàn)在雙側(cè)檢驗(yàn)中,只要或兩者之中有一個(gè)成立,就可以拒絕原假設(shè)。以大樣本條件下為例,雙側(cè)檢驗(yàn)的決策準(zhǔn)則為:(z的下標(biāo)表示雙側(cè)檢驗(yàn))不管雙側(cè)檢驗(yàn)或是單側(cè)檢驗(yàn),若使用P值檢驗(yàn),;。(2) 單側(cè)檢驗(yàn) 左單側(cè)檢驗(yàn)(下限檢驗(yàn))希望所考查的數(shù)值越大越好 右單側(cè)檢驗(yàn)(上限檢驗(yàn))希望所考查的數(shù)值越小越好22. 大樣本條件下總體均值的假設(shè)檢驗(yàn)(192頁例題)5. 總體方差假設(shè)檢驗(yàn)的方法若進(jìn)行雙側(cè)檢驗(yàn),在確定的水平下,拒絕域分布在統(tǒng)計(jì)量分布曲線的兩邊;若是單側(cè)檢驗(yàn),拒絕域分布在統(tǒng)計(jì)量分布曲線的一邊。具體在左還是在右,需根據(jù)原假設(shè)和備擇假設(shè)的情況而定。若樣本統(tǒng)計(jì)量,則拒絕原假設(shè);若,則不能拒絕原假設(shè)。23. 假設(shè)檢驗(yàn)中犯兩類錯(cuò)誤及其概率之間的關(guān)系 假設(shè)檢驗(yàn)的結(jié)果可能是錯(cuò)誤的,所犯的錯(cuò)誤有兩種類型,一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了,犯這種錯(cuò)誤的概率用表示,所以也稱錯(cuò)誤或棄真錯(cuò)誤;另一類錯(cuò)誤是原假設(shè)為偽我們卻沒有拒絕,犯這種錯(cuò)誤的概論用表示,所以也稱錯(cuò)誤或取偽錯(cuò)誤。兩類錯(cuò)誤之間存在什么樣的數(shù)量關(guān)系:在假設(shè)檢驗(yàn)中,與是此消彼長的關(guān)系。如果減小錯(cuò)誤,就會(huì)增大犯錯(cuò)誤的機(jī)會(huì),若減小錯(cuò)誤,也會(huì)增大犯錯(cuò)誤的機(jī)會(huì)。故,二者是此消彼長的關(guān)系。24. 列聯(lián)表的概念及自由度的確定列聯(lián)表是由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表。自由度=(R-1)(C-1)簡述列聯(lián)表的構(gòu)造與列聯(lián)表的分布兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表,包括觀察值的分布與期望值的分布。25. 列聯(lián)表檢驗(yàn)的步驟(4個(gè)),即計(jì)算統(tǒng)計(jì)量步驟(1) 計(jì)算(2) 計(jì)算(3) 計(jì)算(4) 計(jì)算26. 相關(guān)系數(shù)的計(jì)算及性質(zhì)簡述相關(guān)系數(shù)性質(zhì):(1) r的取值范圍為-1到1, r=1時(shí),完全正線性相關(guān) R=-1時(shí),完全負(fù)線性相關(guān) R=0時(shí),不存在線性相關(guān)關(guān)系 0r=-1,負(fù)線性相關(guān) 0r=1,正線性相關(guān) R越趨近于+1,線性相關(guān)關(guān)系越密切 R越趨近于0,線性相關(guān)關(guān)系越不密切(2) r具有對(duì)稱性。x與y之間的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等。(3) r數(shù)值大小與x和y的原點(diǎn)及尺度無關(guān)。(4) r僅僅是x與y之間線性關(guān)系的一個(gè)度量,它不能用于描述非線性關(guān)系。(5) r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量,卻不一定意味著x與y一定有因果關(guān)系。27. 簡述參數(shù)最小二乘估計(jì)的基本原理未知量的最可能值是使各項(xiàng)實(shí)際觀測值和計(jì)算值之間差的平方乘以其精確度的數(shù)值以后的和為最小。28. 簡述判定系數(shù)的含義和作用回歸平方和占總平方和的比例稱為判定系數(shù),判定系數(shù)是對(duì)估計(jì)得回歸方程擬合優(yōu)度的度量。三個(gè)平方和的關(guān)系為:總平方和(SST)=回歸平方和(SSR)+殘差平方和(SSE)判定系數(shù)R測度了回歸直線對(duì)觀測數(shù)據(jù)的擬合程度。判定系數(shù)R的取值范圍是0,1。R越接近1,表明回歸平方和占總平方和的比例越大,回歸直線各觀測點(diǎn)越接近,用x的變化來解釋y值變差的部分就越多,回歸直線的擬合程度就越好;反之R越接近0,回歸直線的擬合程度就越差。29. 簡單線性回歸方程的計(jì)算(是估計(jì)的回歸直線在y軸上的截距;是直線的斜率,表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。)30. 平穩(wěn)序列與非平穩(wěn)序列平穩(wěn)序列是基本上不存在趨勢的序列。非平穩(wěn)序列是包含趨勢、季節(jié)性或周期性的序列,它可能只含有其中一種成分,也可能含有幾種成分的組合。31. 簡述時(shí)間序列的預(yù)測程序。第一步:確定時(shí)間序列所包含的成分,也就是確定時(shí)間序列的類型。第二步:找出適合此類時(shí)間序列的預(yù)測方法。第三步:對(duì)可能的預(yù)測方法進(jìn)行評(píng)估,以確定最佳預(yù)測方案。第四步:利用最佳預(yù)測方案進(jìn)行預(yù)測。32. 簡述復(fù)合型序列預(yù)測的步驟第一步:確定并分離季節(jié)成分,計(jì)算季節(jié)指數(shù),以確定時(shí)間序列中的季節(jié)成分。然后將季節(jié)性因素從時(shí)間序列中分離出去,以便觀察和分析時(shí)間序列的其他特征。第二步:對(duì)消除了季節(jié)成分的時(shí)間序列建立適當(dāng)預(yù)測模型,并進(jìn)行預(yù)測。第三步:計(jì)算出最后的預(yù)測值。用預(yù)測值乘以相應(yīng)的季節(jié)指數(shù),得到最終的預(yù)測值33. 簡述季節(jié)指數(shù)的計(jì)算步驟(1)計(jì)算移動(dòng)平均值(季度數(shù)據(jù)采用4項(xiàng)移動(dòng)平均,月份數(shù)據(jù)采用12項(xiàng)移動(dòng)平均),并將其結(jié)果進(jìn)行“中心化”處理(將移動(dòng)平均的結(jié)果再進(jìn)行一次二項(xiàng)的移動(dòng)平均,即得出“中心化移動(dòng)平均值”(CMA)(2)計(jì)算移動(dòng)平均的比值,也成為季節(jié)比率(即將序列的各觀察值除以相應(yīng)的中心化移動(dòng)平均值,然

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論