版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
圖像標(biāo)注的翻譯模型及K-means(K-均值聚類)1什么是圖像標(biāo)注就是通過計(jì)算機(jī)給這幅圖像加上sky、horse、grass這樣能表達(dá)圖像語義內(nèi)容的詞。2
如何實(shí)現(xiàn)?先要提供一個(gè)由人工標(biāo)注了語義詞的圖像集,在此圖像集上通過各種方法尋找圖像特征與標(biāo)注詞之間的映射關(guān)系。對(duì)于一副未標(biāo)注圖像,先提取其圖像特征,然后根據(jù)前面找到的特征與標(biāo)注詞之間的映射關(guān)系,確定出這幅圖像應(yīng)標(biāo)注的語義詞。3
翻譯模型(就是一種尋找圖像特征與語義詞之間映射關(guān)系的方法)思想:將圖像標(biāo)注的過程看作是從“視覺”語言到“文本”語言的翻譯問題。其中,視覺詞匯是由圖像的各個(gè)分割區(qū)域經(jīng)過聚類的結(jié)果,被稱為“聚類塊”;而文本詞匯就是標(biāo)注詞,然后利用機(jī)器語言翻譯的方法建立起“聚類塊”與文本詞匯之間的對(duì)應(yīng)關(guān)系,進(jìn)而得到圖像的語義標(biāo)注。4翻譯模型的標(biāo)注過程(1)對(duì)已人工標(biāo)記的圖像集進(jìn)行分塊、特征提取、聚類分塊:每幅圖像分為9個(gè)塊,整個(gè)圖像集共有4×9=36個(gè)塊特征提取:對(duì)36個(gè)塊分別提取圖像特征[xx,xx,xx,xx],共有36個(gè)特征值聚類:對(duì)36個(gè)特征值進(jìn)行聚類,得到N個(gè)聚類聚類1:對(duì)應(yīng)分塊2、4、5、6、19、20、25、28、30、33、35、36聚類2:對(duì)應(yīng)分塊11、12、13、14、21、22、24、26、27聚類N:……4翻譯模型的標(biāo)注過程(2)對(duì)N個(gè)聚類進(jìn)行標(biāo)注詞統(tǒng)計(jì)聚類1:對(duì)應(yīng)分塊2、4、5、6、19、20、25、28、30、33、35、361#{山、水、船}各4次
(2、4、5、6)3#{山、草、水}各3次
(19、20、25)4#{山、水、樹}各5次
(28、30、33、35、36)統(tǒng)計(jì)得:山:12次
水:12次
樹:5次
船:4次草:3次
結(jié)論為:聚類1=>{山、水}(注:取統(tǒng)計(jì)值較大的前幾個(gè),或設(shè)定一個(gè)閾值)4翻譯模型的標(biāo)注過程(2)對(duì)N個(gè)聚類進(jìn)行標(biāo)注詞統(tǒng)計(jì)聚類2:對(duì)應(yīng)分塊11、12、13、14、21、22、24、26、272#{水、草、鳥}各4次
(11、12、13、14)3#{山、草、水}各5次
(21、22、24、26、27)統(tǒng)計(jì)得:水:9次
草:9次
山:5次
鳥4次結(jié)論為:聚類2
=>{水、草}最終得到一個(gè)特征向量及對(duì)應(yīng)語義詞的映射表:一個(gè)聚類對(duì)應(yīng)的特征向量怎么計(jì)算出來的?4翻譯模型的標(biāo)注過程(3)標(biāo)注一副圖像圖像特征向量?,?,?向量語義詞映射表語義詞4翻譯模型的標(biāo)注過程(3)標(biāo)注一副圖像4翻譯模型的標(biāo)注過程相似度計(jì)算:歐氏距離、曼哈頓距離、切比雪夫距離、閔可夫斯基距離、標(biāo)準(zhǔn)化歐氏距離、馬氏距離、夾角余弦、漢明距離、杰卡德相似系數(shù)、相關(guān)系數(shù)與相關(guān)距離、信息熵(3)標(biāo)注一副圖像5
K-means(K-均值聚類)K-means聚類算法是將N*P的矩陣X劃分為K個(gè)類,使得類內(nèi)對(duì)象之間距離最小,而類之間距離最大。它是一個(gè)無監(jiān)督的機(jī)器學(xué)習(xí)過程。5
K-means(K-均值聚類)Kmeans的計(jì)算過程大概表示如下:(1)從N個(gè)樣本中隨機(jī)選擇K個(gè)做為聚類中心。(2)計(jì)算每個(gè)樣本到K個(gè)聚類中心的距離。(3)將每個(gè)樣本聚類到離它最近的中心,此時(shí)共有K個(gè)聚類,每個(gè)樣本點(diǎn)屬于其中一個(gè)。(4)對(duì)每個(gè)新類從新計(jì)算聚類中心(求質(zhì)心),并以此中心替代原中心。(5)轉(zhuǎn)至(2)步,重復(fù)以上步驟直到滿足收斂要求。(就是中心點(diǎn)不再改變或滿足一定迭代次數(shù))5
K-means(K-均值聚類)下面為一個(gè)對(duì)平面上20個(gè)點(diǎn)的K均值聚類matlab仿真:clearall;data=floor(100*rand(20,2));%隨機(jī)范圍0-100;共有20個(gè)點(diǎn);x=data(:,1);y=data(:,2);plot(x,y,'*');%畫出20個(gè)點(diǎn)axis([01000100]);K=input('請(qǐng)輸入一個(gè)K值:');[Idx,C,sumD,D]=kmeans(data,K,'dist','sqEuclidean','rep',4);%Idx:N*1的矩陣,存儲(chǔ)N個(gè)向量的分類標(biāo)記;%C:K*P的矩陣,存儲(chǔ)的是K個(gè)聚類質(zhì)心%sumD:1*K的和向量,存儲(chǔ)的是類間所有點(diǎn)與該類質(zhì)心點(diǎn)距離之和%D:N*K的矩陣,存儲(chǔ)的是每個(gè)點(diǎn)與所有質(zhì)心的距離5
K-means(K-均值聚類)%畫出K個(gè)質(zhì)心點(diǎn)holdonx=C(:,1);y=C(:,2);plot(x,y,'ro');%質(zhì)心與同類點(diǎn)連接線段fori=1:size(C,1)forj=1:size(Idx,1)ifi==Idx(j)plot([C(i,1),data(j,1)],[C(i,2),data(j,2)],'k:');endendend5
K-means(K-均值聚類)算法特點(diǎn):(1)聚類結(jié)果與初始點(diǎn)有關(guān),因?yàn)槭堑f進(jìn)的過程;(2)是局部最優(yōu)解,對(duì)臟數(shù)據(jù)敏感,K值不易確定;(3)在實(shí)際做的時(shí)候,可隨機(jī)選擇多
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市縣(2024年-2025年小學(xué)五年級(jí)語文)人教版摸底考試(下學(xué)期)試卷及答案
- 五年級(jí)數(shù)學(xué)(小數(shù)四則混合運(yùn)算)計(jì)算題專項(xiàng)練習(xí)及答案
- 初中作文課教學(xué)實(shí)錄
- 熱水鍋爐技術(shù)規(guī)格書
- 江西省上饒市華東師范大學(xué)上饒實(shí)驗(yàn)中學(xué)2024-2025學(xué)年高二上學(xué)期11月月考測(cè)試語文試題(含答案)
- 性認(rèn)識(shí)課件教學(xué)課件
- 在線賀卡傳送行業(yè)營銷策略方案
- 折疊式車頂產(chǎn)業(yè)深度調(diào)研及未來發(fā)展現(xiàn)狀趨勢(shì)
- 塑料制飯盒產(chǎn)業(yè)運(yùn)行及前景預(yù)測(cè)報(bào)告
- 冷凍運(yùn)輸容器行業(yè)經(jīng)營分析報(bào)告
- Unit2 Sports and Fitness Lesson 3教學(xué)設(shè)計(jì)-2023-2024學(xué)年高中英語北師大版(2019)必修第一冊(cè)
- 2024年部編新改版語文小學(xué)一年級(jí)上冊(cè)第五單元復(fù)習(xí)課教案
- 2024-2030年中國養(yǎng)老機(jī)器人市場(chǎng)發(fā)展調(diào)查與應(yīng)用需求潛力分析報(bào)告
- 中國古代刑罰
- 人教部編版(五四)語文六年級(jí)上冊(cè)名著導(dǎo)讀《童年》說課稿
- 人教鄂教版(2024秋) 三年級(jí)上冊(cè)5.15建筑中的材料 教學(xué)設(shè)計(jì)
- 2024年高考新課標(biāo)全國卷政治試題分析及2025屆高考復(fù)習(xí)備考建議
- 廣東省佛山市2023屆普通高中教學(xué)質(zhì)量檢測(cè)(二)化學(xué)試題
- 工業(yè)產(chǎn)品質(zhì)量安全日管控、周排查、月調(diào)度工作制度
- 華東師大版(2024年新教材)七年級(jí)上冊(cè)數(shù)學(xué)期中綜合素質(zhì)評(píng)價(jià)試卷(含答案)
- 混凝土路面施工中的技術(shù)難點(diǎn)及解決方案
評(píng)論
0/150
提交評(píng)論