




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1Chp7:非參數(shù)估計(jì) CDF估計(jì) 點(diǎn)估計(jì) 區(qū)間估計(jì) 統(tǒng)計(jì)函數(shù)估計(jì) 點(diǎn)估計(jì) 區(qū)間估計(jì)第1頁(yè)/共35頁(yè)2Chp7:非參數(shù)估計(jì) 一個(gè)非參數(shù)模型的例子: “非參數(shù)”并不意味著沒(méi)有參數(shù),而是指模型不能參數(shù)化(有無(wú)限個(gè)參數(shù))。第2頁(yè)/共35頁(yè)3非參數(shù)化方法 一些流行的非參數(shù)化方法: 直方圖、核密度估計(jì) (密度估計(jì)) 樣條、小波回歸 (回歸) 核判別分析、最近鄰、支持向量機(jī)SVM (分類)第3頁(yè)/共35頁(yè)4非參數(shù)化方法 非參數(shù)模型有時(shí)亦稱局部模型(local model) 如:核回歸 常用核函數(shù) :第4頁(yè)/共35頁(yè)5CDF估計(jì)和統(tǒng)計(jì)函數(shù)估計(jì) 回到最基本狀態(tài),無(wú)需任何假設(shè)第5頁(yè)/共35頁(yè)6經(jīng)驗(yàn)分布函數(shù)(Em
2、pirical Distribution Function, EDF) 令 為IID,則經(jīng)驗(yàn)分布函數(shù) 定義為 其中 稱為指示函數(shù)(indicator function)。 注意: 是基于排序好的樣本數(shù)據(jù)的一個(gè)步長(zhǎng)函數(shù),在有樣本時(shí)跳 1/n 。第6頁(yè)/共35頁(yè)7 是F的一個(gè)很好估計(jì)? 給定x, 是一個(gè)隨機(jī)變量: 服從二項(xiàng)分布 所以第7頁(yè)/共35頁(yè)8 是F F的一個(gè)很好估計(jì)? 所以無(wú)偏估計(jì)一致估計(jì)第8頁(yè)/共35頁(yè)9EDF的置信區(qū)間 Glivenko-Cantelli 定理 如果 ,則 Dvoretzky-Kiefer-Wolfowitz (DKW)不等式 如果 ,則對(duì)任意 可根據(jù)下面的步驟構(gòu)造F的
3、1-置信區(qū)間。第9頁(yè)/共35頁(yè)10EDF置信區(qū)間 定義 則對(duì)任意F和所有x 所以 為F的 非參數(shù)置信區(qū)間。其中第10頁(yè)/共35頁(yè)11例:神經(jīng)纖維上相鄰脈沖的相隔時(shí)間95%的置信區(qū)間中的參數(shù)為:時(shí)間t第11頁(yè)/共35頁(yè)12統(tǒng)計(jì)函數(shù)的估計(jì) 統(tǒng)計(jì)函數(shù)/統(tǒng)計(jì)泛函:F的任意函數(shù) 均值: 方差: 中值: 統(tǒng)計(jì)函數(shù)的估計(jì):嵌入式估計(jì)量(Plug-in Estimator) 的嵌入式估計(jì)量為 插入 代替未知的F( )xdF xm=()( )22xdF xsm=-()11 2mF-=第12頁(yè)/共35頁(yè)13嵌入式估計(jì)量:線性函數(shù) 若對(duì)某個(gè)函數(shù) ,有 ,則稱T為一個(gè)線性函數(shù)。 T為一個(gè)線性函數(shù): 該函數(shù)的嵌入式估計(jì)
4、量為 例如:均值第13頁(yè)/共35頁(yè)14例:方差 方差: 因此 注意:與樣本方差稍有不同。該估計(jì)不是無(wú)偏估計(jì)第14頁(yè)/共35頁(yè)15例:偏度 令 和 分別表示隨機(jī)變量X的均值和方差,偏度定義為: 表示分布偏離對(duì)稱的程度。 因?yàn)?所以 的嵌入式估計(jì)量為:m2s第15頁(yè)/共35頁(yè)16例:樣本相關(guān)系數(shù) 令 表示X與Y之間的相關(guān)系數(shù),其中 為二元隨機(jī)向量的分布 。 其中 用 代替 中的F,得到樣本相關(guān)系數(shù):( )( )( )( )( )( )()12345,T FT FTFT FTFTFa=第16頁(yè)/共35頁(yè)17例:樣本分位數(shù) 令F為密度為f的嚴(yán)格增函數(shù) 第p分位數(shù): 的估計(jì)為 由于 不可逆,為避免歧義,
5、定義 稱為樣本分位數(shù)。第17頁(yè)/共35頁(yè)18線性函數(shù)估計(jì)的置信區(qū)間 通??梢约俣ň€性函數(shù)滿足中心極限定理,即 這樣只要知道了 ,就可以比較容易得到置信區(qū)間:漸近正態(tài)性 基于正態(tài)的置信區(qū)間: 如95%的置信區(qū)間為: 問(wèn)題:標(biāo)準(zhǔn)誤差 的估計(jì)第18頁(yè)/共35頁(yè)19標(biāo)準(zhǔn)誤差 的估計(jì) 影響函數(shù) Bootstrap方法第19頁(yè)/共35頁(yè)20影響函數(shù)(Influence Functions) 影響函數(shù)用于估計(jì)一個(gè)嵌入式估計(jì)量的標(biāo)準(zhǔn)誤差。影響函數(shù)定義為 其中x 為x處的一個(gè)Delta函數(shù), 為F和點(diǎn)x的混合體 影響函數(shù)形式同導(dǎo)數(shù)相同,表示統(tǒng)計(jì)函數(shù) 的變化率。影響函數(shù)越大,當(dāng)F變成 時(shí), 變化越大(與估計(jì)的方差
6、有關(guān))概率為1-概率為第20頁(yè)/共35頁(yè)21經(jīng)驗(yàn)影響函數(shù) 影響函數(shù)為 簡(jiǎn)記為 經(jīng)驗(yàn)影響函數(shù)為第21頁(yè)/共35頁(yè)22影響函數(shù)的性質(zhì) 令 為一個(gè)線性函數(shù), 則 1. 證明:T(F)是線性函數(shù)第22頁(yè)/共35頁(yè)23影響函數(shù)的性質(zhì) 2. 對(duì)任意G,有證明:第23頁(yè)/共35頁(yè)24影響函數(shù)的性質(zhì) 3. 證明:L的期望為0第24頁(yè)/共35頁(yè)25影響函數(shù)的性質(zhì) 4. 令 ,若 ,則證明:根據(jù)性質(zhì)2,令L的方差所以根據(jù)CLT,第25頁(yè)/共35頁(yè)26影響函數(shù)的性質(zhì) 5. 令 則 其中證明:第26頁(yè)/共35頁(yè)27影響函數(shù)的性質(zhì)證明(續(xù)):類似的,根據(jù)大數(shù)定律,另所以第27頁(yè)/共35頁(yè)28影響函數(shù)的性質(zhì) 6. 證明:
7、根據(jù)性質(zhì)4和性質(zhì)5,將性質(zhì)4中中的 用其估計(jì) 代替,極限分布仍然成立,即或第28頁(yè)/共35頁(yè)29影響函數(shù)與標(biāo)準(zhǔn)誤差 對(duì)線性函數(shù), 令 得到標(biāo)準(zhǔn)誤差估計(jì): 最后: 可用于計(jì)算置信區(qū)間第29頁(yè)/共35頁(yè)30與直接用方差的嵌入式估計(jì)量 結(jié)果一致例:均值 線性函數(shù)為 嵌入式估計(jì)量為 , 所以95%的置信區(qū)間為 。第30頁(yè)/共35頁(yè)31例7.11:Plasma Cholesterol51位無(wú)心臟病病人的血漿膽固醇()211nniiXXns=-$第31頁(yè)/共35頁(yè)32例7.11:Plasma Cholesterol320位動(dòng)脈狹窄病人的血漿膽固醇第32頁(yè)/共35頁(yè)33例7.11:Plasma Cholesterol 兩組的差別: 初步結(jié)論:有心臟病的病人的膽固醇更高。這個(gè)結(jié)論的可靠性需考察該估計(jì)的標(biāo)準(zhǔn)誤差: 95%的置信區(qū)間:方差較小該結(jié)論比較可靠但并不能馬上說(shuō)明膽固醇會(huì)引起心臟病
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川省儀隴中學(xué)2023-2024學(xué)年高二上學(xué)期10月月考化學(xué)題 含解析
- 安徽省名校聯(lián)盟2023-2024學(xué)年高三上學(xué)期實(shí)驗(yàn)班12月大聯(lián)考化學(xué)含解析
- 山西工程職業(yè)學(xué)院《催化劑導(dǎo)論》2023-2024學(xué)年第二學(xué)期期末試卷
- 北京經(jīng)濟(jì)技術(shù)職業(yè)學(xué)院《漢彝翻譯理論與實(shí)踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 浙江舟山群島新區(qū)旅游與健康職業(yè)學(xué)院《汽輪機(jī)課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北健康職業(yè)學(xué)院《土地資源管理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北交通職業(yè)技術(shù)學(xué)院《建筑意匠》2023-2024學(xué)年第二學(xué)期期末試卷
- 青島職業(yè)技術(shù)學(xué)院《廣播理論與業(yè)務(wù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安城市建設(shè)職業(yè)學(xué)院《動(dòng)物生產(chǎn)學(xué)牛羊》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東科技大學(xué)《新聞采寫基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 兒童行為干預(yù)效果評(píng)估的機(jī)器學(xué)習(xí)方法-洞察闡釋
- 區(qū)塊鏈考試試題及答案
- 2025-2030中國(guó)氟化工行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及發(fā)展趨勢(shì)與投資前景研究報(bào)告
- 2025年保密觀知識(shí)競(jìng)賽題庫(kù)附答案(黃金題型)含答案詳解
- 2024年呼和浩特市玉泉區(qū)消防救援大隊(duì)招聘真題
- 2025年山東省青島市萊西市中考一模英語(yǔ)試題(原卷版+解析版)
- 2025-2030中國(guó)傳染病體外診斷行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 低阻抗條件下構(gòu)網(wǎng)型變流器多機(jī)系統(tǒng)的建模與穩(wěn)定性分析
- 2025年糧油倉(cāng)儲(chǔ)管理員職業(yè)技能競(jìng)賽參考試題庫(kù)(含答案)
- (廣東二模)2025年廣東省高三高考模擬測(cè)試(二)語(yǔ)文試卷(含答案解析)
- 2025-2030白酒行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及競(jìng)爭(zhēng)形勢(shì)與投資前景研究報(bào)告
評(píng)論
0/150
提交評(píng)論