概率論與數(shù)理統(tǒng)計(jì)-統(tǒng)計(jì)量及其分布_第1頁
概率論與數(shù)理統(tǒng)計(jì)-統(tǒng)計(jì)量及其分布_第2頁
概率論與數(shù)理統(tǒng)計(jì)-統(tǒng)計(jì)量及其分布_第3頁
概率論與數(shù)理統(tǒng)計(jì)-統(tǒng)計(jì)量及其分布_第4頁
概率論與數(shù)理統(tǒng)計(jì)-統(tǒng)計(jì)量及其分布_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

概率論與數(shù)理統(tǒng)計(jì)—統(tǒng)計(jì)量及其分布匯報(bào)人:AA2024-01-19BIGDATAEMPOWERSTOCREATEANEWERA目錄CONTENTS統(tǒng)計(jì)量基本概念抽樣分布理論參數(shù)估計(jì)方法假設(shè)檢驗(yàn)原理及應(yīng)用方差分析與回歸分析初步非參數(shù)統(tǒng)計(jì)方法簡介BIGDATAEMPOWERSTOCREATEANEWERA01統(tǒng)計(jì)量基本概念統(tǒng)計(jì)量定義與性質(zhì)統(tǒng)計(jì)量定義統(tǒng)計(jì)量是樣本空間上的實(shí)值函數(shù),不依賴于任何未知參數(shù),僅通過樣本觀測值計(jì)算得出。統(tǒng)計(jì)量性質(zhì)統(tǒng)計(jì)量應(yīng)具有代表性、無偏性、一致性和充分性等性質(zhì),以保證基于統(tǒng)計(jì)量進(jìn)行的推斷是合理和可靠的。01020304樣本均值樣本均值是樣本觀測值的算術(shù)平均數(shù),用于估計(jì)總體均值。樣本方差樣本方差是樣本觀測值與樣本均值之差的平方的平均數(shù),用于估計(jì)總體方差。樣本協(xié)方差樣本協(xié)方差是描述兩個(gè)隨機(jī)變量線性相關(guān)程度的統(tǒng)計(jì)量,用于估計(jì)總體協(xié)方差。樣本相關(guān)系數(shù)樣本相關(guān)系數(shù)是描述兩個(gè)隨機(jī)變量之間線性相關(guān)強(qiáng)度和方向的統(tǒng)計(jì)量,用于估計(jì)總體相關(guān)系數(shù)。常見統(tǒng)計(jì)量類型通過計(jì)算樣本均值、方差等統(tǒng)計(jì)量,對數(shù)據(jù)進(jìn)行初步的描述和概括。描述性統(tǒng)計(jì)分析推斷性統(tǒng)計(jì)分析多元統(tǒng)計(jì)分析非參數(shù)統(tǒng)計(jì)分析基于樣本統(tǒng)計(jì)量對總體參數(shù)進(jìn)行推斷,如假設(shè)檢驗(yàn)和置信區(qū)間估計(jì)等。利用多個(gè)統(tǒng)計(jì)量對多個(gè)變量之間的關(guān)系進(jìn)行分析,如回歸分析、主成分分析等。在不假定總體分布形式的情況下,利用統(tǒng)計(jì)量對數(shù)據(jù)進(jìn)行分析,如非參數(shù)檢驗(yàn)和非參數(shù)回歸等。統(tǒng)計(jì)量在數(shù)據(jù)分析中應(yīng)用BIGDATAEMPOWERSTOCREATEANEWERA02抽樣分布理論抽樣方法從總體中隨機(jī)抽取一部分樣本進(jìn)行觀察和分析的方法,包括簡單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣等。抽樣分布概念由樣本統(tǒng)計(jì)量所構(gòu)成的分布,描述了樣本統(tǒng)計(jì)量在多次重復(fù)抽樣下的分布情況。抽樣方法與抽樣分布概念單個(gè)正態(tài)總體的抽樣分布當(dāng)總體服從正態(tài)分布時(shí),樣本均值服從正態(tài)分布,樣本方差服從卡方分布。兩個(gè)正態(tài)總體的抽樣分布當(dāng)兩個(gè)總體分別服從正態(tài)分布時(shí),樣本均值之差服從正態(tài)分布,樣本方差之比服從F分布。正態(tài)總體下抽樣分布定理當(dāng)樣本量足夠大時(shí),根據(jù)中心極限定理,樣本均值的分布近似于正態(tài)分布。大樣本情況下的抽樣分布當(dāng)樣本量較小時(shí),非正態(tài)總體的抽樣分布可能呈現(xiàn)出偏態(tài)或峰態(tài)等特征,此時(shí)需要采用適當(dāng)?shù)慕y(tǒng)計(jì)方法進(jìn)行推斷。小樣本情況下的抽樣分布非正態(tài)總體下抽樣分布簡介BIGDATAEMPOWERSTOCREATEANEWERA03參數(shù)估計(jì)方法VS點(diǎn)估計(jì)是用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù),因?yàn)闃颖窘y(tǒng)計(jì)量為數(shù)軸上某一點(diǎn)值,估計(jì)的結(jié)果也以一個(gè)點(diǎn)的數(shù)值表示,所以稱為點(diǎn)估計(jì)。評價(jià)標(biāo)準(zhǔn)點(diǎn)估計(jì)的評價(jià)標(biāo)準(zhǔn)包括無偏性、有效性和一致性。無偏性是指估計(jì)量的期望值等于被估計(jì)的總體參數(shù);有效性是指對于同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小方差的估計(jì)量更有效;一致性是指隨著樣本量的增加,點(diǎn)估計(jì)量的值越來越接近被估總體的參數(shù)。點(diǎn)估計(jì)原理點(diǎn)估計(jì)原理及評價(jià)標(biāo)準(zhǔn)區(qū)間估計(jì)方法及置信水平選擇區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。根據(jù)樣本統(tǒng)計(jì)量的抽樣分布可以對樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。區(qū)間估計(jì)方法置信水平是指總體參數(shù)值落在樣本統(tǒng)計(jì)量某一區(qū)間內(nèi)的概率;而置信區(qū)間是指在某一置信水平下,樣本統(tǒng)計(jì)量與總體參數(shù)之間所構(gòu)造的區(qū)間。置信區(qū)間的選擇通常取決于研究者的經(jīng)驗(yàn)和實(shí)際需求,常見的置信水平有90%、95%和99%。置信水平選擇最大似然估計(jì)法是一種具有理論性的點(diǎn)估計(jì)法,此方法的基本思想是:當(dāng)從模型總體隨機(jī)抽取n組樣本觀測值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測值的概率最大。首先構(gòu)造似然函數(shù),然后求導(dǎo)并令導(dǎo)數(shù)等于0,解得似然方程,最后求出參數(shù)的最大似然估計(jì)值。需要注意的是,在使用最大似然估計(jì)法時(shí),需要滿足一定的前提條件,例如樣本量要足夠大等。最大似然估計(jì)法原理最大似然估計(jì)法步驟最大似然估計(jì)法介紹BIGDATAEMPOWERSTOCREATEANEWERA04假設(shè)檢驗(yàn)原理及應(yīng)用作出決策根據(jù)檢驗(yàn)統(tǒng)計(jì)量的值和拒絕域,作出是否拒絕原假設(shè)的決策。計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值根據(jù)樣本數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值。確定拒絕域根據(jù)顯著性水平$alpha$和檢驗(yàn)統(tǒng)計(jì)量的分布,確定拒絕域。建立假設(shè)根據(jù)實(shí)際問題,提出原假設(shè)$H_0$和備擇假設(shè)$H_1$。選擇檢驗(yàn)統(tǒng)計(jì)量根據(jù)假設(shè)選擇合適的檢驗(yàn)統(tǒng)計(jì)量,并確定其分布。假設(shè)檢驗(yàn)基本思想和步驟單側(cè)檢驗(yàn)只關(guān)注參數(shù)的一側(cè),如只關(guān)注均值是否大于或小于某個(gè)值。雙側(cè)檢驗(yàn)關(guān)注參數(shù)的兩側(cè),如關(guān)注均值是否等于某個(gè)值。區(qū)別與聯(lián)系單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)的區(qū)別在于關(guān)注參數(shù)的方向不同,但都是基于假設(shè)檢驗(yàn)的原理進(jìn)行決策。在實(shí)際應(yīng)用中,應(yīng)根據(jù)具體問題選擇合適的檢驗(yàn)類型。單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)比較醫(yī)學(xué)領(lǐng)域檢驗(yàn)?zāi)硞€(gè)經(jīng)濟(jì)政策是否對經(jīng)濟(jì)增長有顯著影響。經(jīng)濟(jì)領(lǐng)域工程領(lǐng)域社會學(xué)領(lǐng)域01020403比較不同社會群體的收入、教育水平等是否有顯著差異。比較兩種藥物的療效是否有顯著差異。檢驗(yàn)新材料的性能是否滿足要求。假設(shè)檢驗(yàn)在實(shí)際問題中應(yīng)用舉例BIGDATAEMPOWERSTOCREATEANEWERA05方差分析與回歸分析初步方差分析原理方差分析是一種通過比較不同組別數(shù)據(jù)的方差來推斷總體均值是否存在顯著差異的統(tǒng)計(jì)方法。它基于組內(nèi)差異與組間差異的比較,判斷因素對結(jié)果的影響是否顯著。方差分析步驟包括建立假設(shè)、構(gòu)造檢驗(yàn)統(tǒng)計(jì)量、確定顯著性水平、計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值、作出統(tǒng)計(jì)決策等。方差分析原理及步驟多元線性回歸模型建立多元線性回歸模型用于描述因變量與多個(gè)自變量之間的線性關(guān)系。建立模型時(shí),需要確定自變量和因變量,選擇合適的模型形式,并通過最小二乘法等方法估計(jì)模型參數(shù)。要點(diǎn)一要點(diǎn)二多元線性回歸模型檢驗(yàn)?zāi)P徒⒑螅枰M(jìn)行擬合優(yōu)度檢驗(yàn)、方程顯著性檢驗(yàn)、變量顯著性檢驗(yàn)等,以評估模型的擬合效果和變量的解釋力度。多元線性回歸模型建立與檢驗(yàn)邏輯回歸模型定義邏輯回歸是一種廣義的線性模型,用于解決二分類問題。它通過引入邏輯函數(shù),將線性回歸模型的輸出轉(zhuǎn)換為概率值,從而實(shí)現(xiàn)分類任務(wù)。邏輯回歸模型應(yīng)用邏輯回歸模型廣泛應(yīng)用于醫(yī)學(xué)、金融、社會學(xué)等領(lǐng)域,如疾病預(yù)測、信用評分、市場調(diào)研等。它具有簡單易懂、計(jì)算高效等優(yōu)點(diǎn),在實(shí)際問題中具有良好的應(yīng)用效果。邏輯回歸模型簡介BIGDATAEMPOWERSTOCREATEANEWERA06非參數(shù)統(tǒng)計(jì)方法簡介無需假設(shè)總體分布非參數(shù)統(tǒng)計(jì)方法無需對總體分布做出假設(shè),因此適用范圍更廣。穩(wěn)健性強(qiáng)由于不依賴于總體分布的具體形式,非參數(shù)統(tǒng)計(jì)方法對異常值和離群點(diǎn)具有較強(qiáng)的穩(wěn)健性。適用于小樣本在樣本量較小的情況下,非參數(shù)統(tǒng)計(jì)方法通常比參數(shù)統(tǒng)計(jì)方法更為有效。非參數(shù)統(tǒng)計(jì)方法特點(diǎn)和優(yōu)勢卡方檢驗(yàn)是一種基于觀測頻數(shù)與期望頻數(shù)之間差異的顯著性檢驗(yàn)方法。通過計(jì)算卡方統(tǒng)計(jì)量,可以評估觀測數(shù)據(jù)與理論分布之間的差異程度。原理卡方檢驗(yàn)常用于分類數(shù)據(jù)的獨(dú)立性檢驗(yàn)和擬合優(yōu)度檢驗(yàn)。例如,在醫(yī)學(xué)研究中,可以用于評估某種疾病與基因型之間的關(guān)聯(lián)性;在市場調(diào)查中,可以用于檢驗(yàn)產(chǎn)品屬性與消費(fèi)者偏好之間的獨(dú)立性。應(yīng)用場景卡方檢驗(yàn)原理及應(yīng)用場景計(jì)算步驟首先,將兩組數(shù)據(jù)分別按照從小到大的順序排列,并求出每個(gè)數(shù)據(jù)的秩;然后,計(jì)算兩組數(shù)據(jù)秩的差值并求平方;最后,將所有平方差求和并除以樣本量減一,得到Spearman秩相關(guān)系數(shù)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論