




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第3章k-最近鄰和k-d樹算法掌握k-最近鄰法的基本原理。熟悉k-最近鄰法的三個(gè)關(guān)鍵要素和優(yōu)缺點(diǎn)。熟悉k的取值對k-最近鄰法的影響因素。熟悉k-d樹的構(gòu)建過程。本章學(xué)習(xí)目標(biāo)3.1k-最近鄰法3.2k-d樹第3章
k-最近鄰和k-d樹算法3.1k-最近鄰法3.1.1k-最近鄰法的基本思想距離度量,特征空間中樣本點(diǎn)的距離是樣本點(diǎn)間相似程度的反映。算法超參數(shù)
k的取值。決策規(guī)則,例如,對于分類任務(wù),采取少數(shù)服從多數(shù)的“投票法”;對于回歸任務(wù),采用取平均值的規(guī)則。給定一個(gè)訓(xùn)練樣本集,對于待預(yù)測類別標(biāo)簽的新輸入測試實(shí)例,可以在特征空間中計(jì)算它與所有訓(xùn)練樣本的距離,然后在訓(xùn)練樣本集中找到與該測試實(shí)例最鄰近的
k
個(gè)訓(xùn)練樣本,統(tǒng)計(jì)這
k
個(gè)樣本所屬的類別,其中樣本數(shù)最多的那個(gè)類就是該測試實(shí)例所屬的類別。k-最近鄰(kNN)法涉及到以下三個(gè)關(guān)鍵要素:3.1k-最近鄰法3.1.2距離度量閔可夫斯基距離(Minkowskidistance)曼哈頓距離(Manhattandistance)3.1k-最近鄰法3.1.2距離度量歐氏距離(Euclideandistance)切比雪夫距離(Chebyshevdistance)漢明距離(Hammingdistance
)
3.1k-最近鄰法3.1.3k值的選擇3.1k-最近鄰法3.1.3k值的選擇如果選擇較小的k值優(yōu)點(diǎn):
訓(xùn)練誤差會(huì)減小,只有與輸入的測試實(shí)例較近或相似的訓(xùn)練樣本才會(huì)對預(yù)測結(jié)果起作用。缺點(diǎn):泛化誤差會(huì)增大,預(yù)測結(jié)果會(huì)對近鄰的訓(xùn)練樣本非常敏感。如果近鄰的訓(xùn)練樣本恰巧是噪聲,則預(yù)測就會(huì)出錯(cuò)。如果選擇較大的k值優(yōu)點(diǎn):可以減小泛化誤差。缺點(diǎn):訓(xùn)練誤差會(huì)增大。k值太大會(huì)使模型整體變得簡單,容易發(fā)生欠擬合。3.1k-最近鄰法3.1.4k-最近鄰法的優(yōu)缺點(diǎn)優(yōu)點(diǎn)算法簡單,易于理解,既可以用于分類任務(wù)也可以用于回歸任務(wù),且適用于多分類和非線性分類問題。沒有顯式的訓(xùn)練過程,k值是唯一的超參數(shù),在確定k值后,直接進(jìn)行預(yù)測。由于kNN法并不關(guān)注樣本的類別數(shù)量,因此在處理類別交叉或重疊較多的待分類樣本時(shí),選用kNN法比較合適。缺點(diǎn)當(dāng)訓(xùn)練樣本集較大、樣本的特征向量維數(shù)較高時(shí)計(jì)算量大,耗時(shí)長,時(shí)間復(fù)雜度高;需要大量的內(nèi)存,空間復(fù)雜度高。當(dāng)存在樣本不平衡問題時(shí),對稀有類別的預(yù)測準(zhǔn)確度低。k值的選取沒有一個(gè)良好的準(zhǔn)則。適用數(shù)據(jù)范圍數(shù)值型和標(biāo)稱型
3.1k-最近鄰法3.2k-d樹第3章
k-最近鄰和k-d樹算法k-d樹是一種對k維空間中的實(shí)例點(diǎn)進(jìn)行存儲(chǔ)以便對其進(jìn)行快速檢索的樹形數(shù)據(jù)結(jié)構(gòu)。k-d樹是二叉樹,表示對k維空間的一個(gè)劃分(partition)。構(gòu)造k-d樹相當(dāng)于不斷地用垂直于坐標(biāo)軸的超平面將k維空間切分,構(gòu)成一系列的k維超矩形區(qū)域。k-d樹的每個(gè)結(jié)點(diǎn)對應(yīng)于一個(gè)k維超矩形區(qū)域。3.2k-d樹3.2k-d樹3.2.1如何構(gòu)建k-d樹圖3-3二叉搜索樹的一個(gè)例子
①3.2.1如何構(gòu)建k-d
樹構(gòu)建k-d樹的過程如下:
①②②3.2.1如何構(gòu)建k-d
樹
①②②③③3.2.1如何構(gòu)建k-d
樹
①②②③③④
3.2.1如何構(gòu)建k-d
樹①③③④②②3.2.1如何構(gòu)建k-d
樹
(1)首先要找到該目標(biāo)點(diǎn)的葉子節(jié)點(diǎn),然后以目標(biāo)點(diǎn)為圓心,目標(biāo)點(diǎn)到葉子節(jié)點(diǎn)的距離為半徑,建立一個(gè)超球體,我們要找尋的最近鄰點(diǎn)一定是在該球體內(nèi)部。搜索(4,4)的最近鄰時(shí)。首先從根節(jié)點(diǎn)(6,4)出發(fā),將當(dāng)前最近鄰設(shè)為(6,4),對該KD樹作深度優(yōu)先遍歷。以(4,4)為圓心,其到(6,4)的距離為半徑畫圓(多維空間為超球面),可以看出(7,2)右側(cè)的區(qū)域與該圓不相交,所以(7,2)的右子樹全部忽略。3.2.2如何在k-d樹中搜索
(2)返回葉子結(jié)點(diǎn)的父節(jié)點(diǎn),檢查另一個(gè)子結(jié)點(diǎn)包含的超矩形體是否和超球體相交,如果相交就到這個(gè)子節(jié)點(diǎn)尋找是否有更加近的近鄰,有的話就更新最近鄰。接著走到(6,4)左子樹根節(jié)點(diǎn)(4,5),與原最近鄰對比距離后,更新當(dāng)前最近鄰為(4,5)。以(4,4)為圓心,其到(4,5)的距離為半徑畫圓,發(fā)現(xiàn)(6,4)右側(cè)的區(qū)域與該圓不相交,忽略該側(cè)所有節(jié)點(diǎn),這樣(6,4)的整個(gè)右子樹被標(biāo)記為已忽略。3.2.2如何在k-d樹中搜索
(3)如果不相交直接返回父節(jié)點(diǎn),在另一個(gè)子樹繼續(xù)搜索最近鄰。(4)當(dāng)回溯到根節(jié)點(diǎn)時(shí),算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國自動(dòng)滅火噴淋產(chǎn)品數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025至2030年中國耐磨熱電阻數(shù)據(jù)監(jiān)測研究報(bào)告
- 二零二五年度家庭資產(chǎn)保全與分配協(xié)議
- 2025至2030年中國耐腐蝕耐磨防附著熱電偶數(shù)據(jù)監(jiān)測研究報(bào)告
- 二零二五年度金融理財(cái)產(chǎn)品解除三方協(xié)議依據(jù)說明
- 2025年度智能家居系統(tǒng)樣機(jī)試用及服務(wù)協(xié)議
- 科技發(fā)展下的生命教育新模式研究
- 二零二五年度個(gè)人房屋租賃與物業(yè)托管服務(wù)協(xié)議
- 2025年度智能家電研發(fā)股東入股合作協(xié)議
- 二零二五年度美容院商標(biāo)轉(zhuǎn)讓使用許可合同
- 2022年醫(yī)學(xué)專題-健康危險(xiǎn)因素干預(yù)
- 平岡中學(xué)教師任職條件
- 小老鼠找朋友 演示文稿
- 2023年青島職業(yè)技術(shù)學(xué)院高職單招(英語)試題庫含答案解析
- 2023年蘇州衛(wèi)生職業(yè)技術(shù)學(xué)院高職單招(數(shù)學(xué))試題庫含答案解析
- GB/T 37864-2019生物樣本庫質(zhì)量和能力通用要求
- 中國國防:新中國國防建設(shè)成就【2】
- 慢性病建檔表系列
- GB 19641-2015食品安全國家標(biāo)準(zhǔn)食用植物油料
- 科室會(huì)專用-元治-鹽酸貝尼地平-產(chǎn)品介紹
- 英語四六級翻譯技巧課件
評論
0/150
提交評論