![多媒體信息檢索_第1頁](http://file4.renrendoc.com/view/43ddb741b999ac10ab0a3e63db025970/43ddb741b999ac10ab0a3e63db0259701.gif)
![多媒體信息檢索_第2頁](http://file4.renrendoc.com/view/43ddb741b999ac10ab0a3e63db025970/43ddb741b999ac10ab0a3e63db0259702.gif)
![多媒體信息檢索_第3頁](http://file4.renrendoc.com/view/43ddb741b999ac10ab0a3e63db025970/43ddb741b999ac10ab0a3e63db0259703.gif)
![多媒體信息檢索_第4頁](http://file4.renrendoc.com/view/43ddb741b999ac10ab0a3e63db025970/43ddb741b999ac10ab0a3e63db0259704.gif)
![多媒體信息檢索_第5頁](http://file4.renrendoc.com/view/43ddb741b999ac10ab0a3e63db025970/43ddb741b999ac10ab0a3e63db0259705.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、多媒體信息檢索1021313871概念多媒體檢索是一種基于內(nèi)容特征的檢索(CBR:content-based retrieval)。基于內(nèi)容的檢索是對媒體對象的內(nèi)容及上下文語義環(huán)境進(jìn)行檢索,如圖像中的顏色、紋理、形狀,視頻中的鏡頭、場景、鏡頭的運(yùn)動,聲音中的音調(diào)、響度、音色等。基于內(nèi)容的檢索突破了傳統(tǒng)的基于文本檢索技術(shù)的局限,直接對圖像、視頻、音頻內(nèi)容進(jìn)行分析,抽取特征和語義,利用這些內(nèi)容特征建立索引并進(jìn)行檢索。在這一檢索過程中,它主要以圖像處理、模式識別、計(jì)算機(jī)視覺、圖像理解等學(xué)科中的一些方法為部分基礎(chǔ)技術(shù),是多種技術(shù)的合成。2體系結(jié)構(gòu)媒體數(shù)據(jù)特征提取目標(biāo)標(biāo)識媒體庫特征庫知識庫知識輔助用戶查
2、詢接口檢索引擎索引/過濾數(shù)據(jù)庫特征提取子系統(tǒng)數(shù)據(jù)庫查詢子系統(tǒng)3檢索過程用戶需求媒體資源內(nèi)容查詢內(nèi)容索引匹配4分類文本檢索多媒體檢索圖像檢索視頻檢索音頻檢索5基于文本的檢索人工建立元數(shù)據(jù)標(biāo)引,本質(zhì)類似于純文本信息檢索普及程度:是現(xiàn)行網(wǎng)絡(luò)檢索系統(tǒng)中的主流方式。檢索方式:信息分類、擴(kuò)展名、關(guān)鍵詞優(yōu)勢:實(shí)現(xiàn)原理相對簡單,技術(shù)成熟劣勢:具有主觀性,仁者見仁、智者見智;多媒體信息的多 維性,人工描述難以窮盡Google 圖片搜索、音樂搜索與視頻搜索,Yahoo 音樂搜索與圖片搜索,Yahoo Video Search,百度mp3、圖片與視頻搜索6普通搜索引擎搜索圖片、圖像格式:image:文件名功能:檢索
3、含有指定文件名圖像的所有網(wǎng)頁。搜索多媒體信息格式:media: text功能:檢索文件的名字中含有指定文字的多媒體信息7基于內(nèi)容的信息檢索Content-Based Retrieval一種新的檢索技術(shù),是對多媒體對象的內(nèi)容及上下文語義環(huán)境進(jìn)行檢索原理:提取特征并進(jìn)行量化,表示成向量空間,建立索引庫,將用戶提問轉(zhuǎn)化成向量,并與已有信息的向量空間進(jìn)行相似度匹配計(jì)算。常用多媒體文件特征: 圖像:顏色、紋理及時(shí)空關(guān)系等 視頻:對象運(yùn)動特征、顏色和光線變化等 音頻:時(shí)域、頻域、時(shí)頻、短時(shí)幀和音頻特征等普及程度:局限在較小的數(shù)據(jù)集合上,大多只是實(shí)驗(yàn)室研究成果8基于內(nèi)容的圖像檢索分析圖像的內(nèi)容提取其顏色、形
4、狀、紋理,以及對象空間關(guān)系等信息建立圖像的特征索引9QBICQuery By Image ContentIBM Almaden研究中心開發(fā)的第一個(gè)商用基于內(nèi)容的圖像及視頻檢索系統(tǒng)提供對靜止圖像及視頻信息基于內(nèi)容的檢索手段系統(tǒng)結(jié)構(gòu)及所用技術(shù)對后來的視頻檢索有深遠(yuǎn)的影響1011Photobook由MIT的媒體實(shí)驗(yàn)室開發(fā)研制圖像在存儲時(shí)按人臉、形狀或紋理特性自動分類圖像根據(jù)類別通過顯著語義特征壓縮編碼1213VisualSeek美國哥倫比亞大學(xué)開發(fā)的圖像查詢系統(tǒng)主要特點(diǎn)是用到了圖像區(qū)域的空間關(guān)系查詢和直接從壓縮數(shù)據(jù)中提取視覺特征1415EXCALIBUR技術(shù)公司開發(fā)的retrieval ware系統(tǒng)
5、16Virage公司開發(fā)的virage檢索系統(tǒng)17香港公共圖書館的多媒體信息系統(tǒng)(MMIS)Multimedia Information System IBM和分包商ICO于1999年底開始承建190萬美元的數(shù)字圖書館項(xiàng)目被認(rèn)為是世界上最大且最復(fù)雜的“中文/英文”雙語圖書館服務(wù)之一采用的DB2 Text 和Image Extenders既支持文本查找,也支持圖片查找1819相似顏色20相似形狀21相似內(nèi)容22IMEDIAIMEDIA按照數(shù)據(jù)庫的內(nèi)容劃分為五個(gè)功能系統(tǒng)。 Visual Retrieval (generalist databases)、 Visual Retrieval (biod
6、iversity collections)、Visual Retrieval with relevance feedback(satellite images)、partial visual queries (local descriptors)和3D retrieval2324基于內(nèi)容的視頻檢索通過對非結(jié)構(gòu)化的視頻數(shù)據(jù)進(jìn)行結(jié)構(gòu)化分析和處理,采用視頻分割技術(shù),將連續(xù)的視頻流劃分為具有特定語義的視頻片段鏡頭,作為檢索的基本單元,在此基礎(chǔ)上進(jìn)行代表幀(representative frame)的提取和動態(tài)特征的提取,形成描述鏡頭的特征索引鏡頭組織和特征索引,采用視頻聚類等方法研究鏡頭之間的關(guān)系,把
7、內(nèi)容相近的鏡頭組合起來,逐步縮小檢索范圍,直至查詢到所需的視頻數(shù)據(jù)視頻分割、代表幀和動態(tài)特征提取是基于內(nèi)容的視頻檢索的關(guān)鍵技術(shù)。25卡內(nèi)基梅隆大學(xué)的informedia數(shù)字視頻圖書館系統(tǒng)CMU Informedia Video Research結(jié)合語音識別、視頻分析和文本檢索技術(shù),支持2000小時(shí)的視頻廣播的檢索實(shí)現(xiàn)全內(nèi)容的、基于知識的查詢和檢索同步元數(shù)據(jù)搜索和導(dǎo)航2627天線視頻以視頻搜索技術(shù)為核心的視頻媒體平臺 可檢索國內(nèi)多家主流電視臺的節(jié)目、國內(nèi)各大主流視頻網(wǎng)站及播客網(wǎng)站的內(nèi)容可以通過關(guān)鍵詞搜索可以搜索文件中的某句話或某段文字2829哥倫比亞大學(xué)的VideoQ允許用戶使用視覺特征和時(shí)空關(guān)系來檢索視頻 集成文本和視覺搜索方法 自動的視頻對象分割和追蹤豐富的視覺特征庫,包括顏色、紋理、形狀和運(yùn)動3031基于內(nèi)容的音頻檢索從音頻數(shù)據(jù)中提取聽覺特征信息音頻特征分為:聽覺感知特征和聽覺非感知特征(物理特性)聽覺感知特征包括音量、音調(diào)、音強(qiáng)等32IBM的Via Voice語音識別已趨于成熟3334劍橋大學(xué)的VMR系統(tǒng)Video Mail Retrieval Us
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Module 10 Unit 2 You shouldn't be late(說課稿)-2024-2025學(xué)年外研版(一起)英語五年級上冊001
- 16 滑輪 說課稿-2023-2024學(xué)年科學(xué)六年級上冊青島版001
- 3 珍貴的淡水資源(說課稿)-2023-2024學(xué)年四年級科學(xué)下冊大象版
- 3 我不拖拉 第2課時(shí)(說課稿)-2023-2024學(xué)年道德與法治一年級下冊統(tǒng)編版
- 2023二年級數(shù)學(xué)上冊 二 角的初步認(rèn)識 銳角和鈍角說課稿 西師大版
- 19《夜宿山寺》說課稿-2024-2025學(xué)年二年級上冊語文統(tǒng)編版
- 2023八年級道德與法治上冊 第四單元 維護(hù)國家利益 第八課 國家利益至上 第1框 國家好 大家才會好說課稿 新人教版
- 2024年八年級道德與法治下冊 第三單元 人民當(dāng)家作主 第五課 我國基本制度 第2框 根本政治制度說課稿 新人教版
- 2024年秋九年級歷史上冊 第一單元 古代亞非文明 第3課 古代印度說課稿2 新人教版001
- 2025北京建筑材料購貨合同
- 2024年05月浙江金華成泰農(nóng)商銀行員工招考筆試歷年參考題庫附帶答案詳解
- 北京市海淀區(qū)2024-2025學(xué)年七年級上學(xué)期期末考試數(shù)學(xué)試題(含答案)
- 帶看協(xié)議書范本(2篇)
- 2025-2030年中國科教玩具行業(yè)發(fā)展動態(tài)及前景趨勢分析報(bào)告新版
- 股權(quán)投資項(xiàng)目建議書
- 2025年北京廣播電視臺招聘(140人)歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024復(fù)工復(fù)產(chǎn)安全培訓(xùn)
- 中學(xué)生宿舍日常與管理
- 2025中國南光集團(tuán)限公司校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 【歷史】秦漢時(shí)期:統(tǒng)一多民族國家的建立和鞏固復(fù)習(xí)課件-2024-2025學(xué)年統(tǒng)編版七年級歷史上冊
- 社區(qū)中心及衛(wèi)生院65歲及以上老年人健康體檢分析報(bào)告模板
評論
0/150
提交評論