圖像標(biāo)注的翻譯模型

上傳人：x*** IP屬地：湖北上傳時(shí)間：2024-01-14 格式：PPTX 頁(yè)數(shù)：16 大?。?47.59KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩11頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

圖像標(biāo)注的翻譯模型及K-means(K-均值聚類(lèi))1什么是圖像標(biāo)注就是通過(guò)計(jì)算機(jī)給這幅圖像加上sky、horse、grass這樣能表達(dá)圖像語(yǔ)義內(nèi)容的詞。2

如何實(shí)現(xiàn)？先要提供一個(gè)由人工標(biāo)注了語(yǔ)義詞的圖像集，在此圖像集上通過(guò)各種方法尋找圖像特征與標(biāo)注詞之間的映射關(guān)系。對(duì)于一副未標(biāo)注圖像，先提取其圖像特征，然后根據(jù)前面找到的特征與標(biāo)注詞之間的映射關(guān)系，確定出這幅圖像應(yīng)標(biāo)注的語(yǔ)義詞。3

翻譯模型（就是一種尋找圖像特征與語(yǔ)義詞之間映射關(guān)系的方法）思想：將圖像標(biāo)注的過(guò)程看作是從“視覺(jué)”語(yǔ)言到“文本”語(yǔ)言的翻譯問(wèn)題。其中，視覺(jué)詞匯是由圖像的各個(gè)分割區(qū)域經(jīng)過(guò)聚類(lèi)的結(jié)果，被稱(chēng)為“聚類(lèi)塊”；而文本詞匯就是標(biāo)注詞，然后利用機(jī)器語(yǔ)言翻譯的方法建立起“聚類(lèi)塊”與文本詞匯之間的對(duì)應(yīng)關(guān)系，進(jìn)而得到圖像的語(yǔ)義標(biāo)注。4翻譯模型的標(biāo)注過(guò)程（1）對(duì)已人工標(biāo)記的圖像集進(jìn)行分塊、特征提取、聚類(lèi)分塊：每幅圖像分為9個(gè)塊，整個(gè)圖像集共有4×9=36個(gè)塊特征提?。簩?duì)36個(gè)塊分別提取圖像特征[xx,xx,xx,xx]，共有36個(gè)特征值聚類(lèi)：對(duì)36個(gè)特征值進(jìn)行聚類(lèi)，得到N個(gè)聚類(lèi)聚類(lèi)1：對(duì)應(yīng)分塊2、4、5、6、19、20、25、28、30、33、35、36聚類(lèi)2：對(duì)應(yīng)分塊11、12、13、14、21、22、24、26、27聚類(lèi)N：……4翻譯模型的標(biāo)注過(guò)程（2）對(duì)N個(gè)聚類(lèi)進(jìn)行標(biāo)注詞統(tǒng)計(jì)聚類(lèi)1：對(duì)應(yīng)分塊2、4、5、6、19、20、25、28、30、33、35、361#｛山、水、船｝各4次

（2、4、5、6）3#｛山、草、水｝各3次

（19、20、25）4#｛山、水、樹(shù)｝各5次

（28、30、33、35、36）統(tǒng)計(jì)得:山：12次

水：12次

樹(shù)：5次

船：4次草：3次

結(jié)論為：聚類(lèi)1=>{山、水}（注：取統(tǒng)計(jì)值較大的前幾個(gè)，或設(shè)定一個(gè)閾值）4翻譯模型的標(biāo)注過(guò)程（2）對(duì)N個(gè)聚類(lèi)進(jìn)行標(biāo)注詞統(tǒng)計(jì)聚類(lèi)2：對(duì)應(yīng)分塊11、12、13、14、21、22、24、26、272#{水、草、鳥(niǎo)}各4次

（11、12、13、14）3#{山、草、水}各5次

（21、22、24、26、27）統(tǒng)計(jì)得：水：9次

草：9次

山：5次

鳥(niǎo)4次結(jié)論為：聚類(lèi)2

=>{水、草}最終得到一個(gè)特征向量及對(duì)應(yīng)語(yǔ)義詞的映射表：一個(gè)聚類(lèi)對(duì)應(yīng)的特征向量怎么計(jì)算出來(lái)的？4翻譯模型的標(biāo)注過(guò)程（3）標(biāo)注一副圖像圖像特征向量？，？，？向量語(yǔ)義詞映射表語(yǔ)義詞4翻譯模型的標(biāo)注過(guò)程（3）標(biāo)注一副圖像4翻譯模型的標(biāo)注過(guò)程相似度計(jì)算：歐氏距離、曼哈頓距離、切比雪夫距離、閔可夫斯基距離、標(biāo)準(zhǔn)化歐氏距離、馬氏距離、夾角余弦、漢明距離、杰卡德相似系數(shù)、相關(guān)系數(shù)與相關(guān)距離、信息熵（3）標(biāo)注一副圖像5

K-means(K-均值聚類(lèi))K-means聚類(lèi)算法是將N*P的矩陣X劃分為K個(gè)類(lèi)，使得類(lèi)內(nèi)對(duì)象之間距離最小,而類(lèi)之間距離最大。它是一個(gè)無(wú)監(jiān)督的機(jī)器學(xué)習(xí)過(guò)程。5

K-means(K-均值聚類(lèi))Kmeans的計(jì)算過(guò)程大概表示如下:（1）從N個(gè)樣本中隨機(jī)選擇K個(gè)做為聚類(lèi)中心。（2）計(jì)算每個(gè)樣本到K個(gè)聚類(lèi)中心的距離。（3）將每個(gè)樣本聚類(lèi)到離它最近的中心，此時(shí)共有K個(gè)聚類(lèi)，每個(gè)樣本點(diǎn)屬于其中一個(gè)。（4）對(duì)每個(gè)新類(lèi)從新計(jì)算聚類(lèi)中心（求質(zhì)心），并以此中心替代原中心。（5）轉(zhuǎn)至（2）步，重復(fù)以上步驟直到滿(mǎn)足收斂要求。(就是中心點(diǎn)不再改變或滿(mǎn)足一定迭代次數(shù))5

K-means(K-均值聚類(lèi))下面為一個(gè)對(duì)平面上20個(gè)點(diǎn)的K均值聚類(lèi)matlab仿真：clearall;data=floor(100*rand(20,2));%隨機(jī)范圍0-100；共有20個(gè)點(diǎn)；x=data(:,1);y=data(:,2);plot(x,y,'*');%畫(huà)出20個(gè)點(diǎn)axis([01000100]);K=input('請(qǐng)輸入一個(gè)K值:');[Idx,C,sumD,D]=kmeans(data,K,'dist','sqEuclidean','rep',4);%Idx:N*1的矩陣，存儲(chǔ)N個(gè)向量的分類(lèi)標(biāo)記；%C:K*P的矩陣，存儲(chǔ)的是K個(gè)聚類(lèi)質(zhì)心%sumD：1*K的和向量，存儲(chǔ)的是類(lèi)間所有點(diǎn)與該類(lèi)質(zhì)心點(diǎn)距離之和%D：N*K的矩陣，存儲(chǔ)的是每個(gè)點(diǎn)與所有質(zhì)心的距離5

K-means(K-均值聚類(lèi))%畫(huà)出K個(gè)質(zhì)心點(diǎn)holdonx=C(:,1);y=C(:,2);plot(x,y,'ro');%質(zhì)心與同類(lèi)點(diǎn)連接線(xiàn)段fori=1:size(C,1)forj=1:size(Idx,1)ifi==Idx(j)plot([C(i,1),data(j,1)],[C(i,2),data(j,2)],'k:');endendend5

K-means(K-均值聚類(lèi))算法特點(diǎn)：（1）聚類(lèi)結(jié)果與初始點(diǎn)有關(guān)，因?yàn)槭堑f進(jìn)的過(guò)程；（2）是局部最優(yōu)解，對(duì)臟數(shù)據(jù)敏感，K值不易確定；（3）在實(shí)際做的時(shí)候，可隨機(jī)選擇多

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

圖像標(biāo)注的翻譯模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

圖像標(biāo)注的翻譯模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔