第8章 多媒體數(shù)據(jù)庫_第1頁
第8章 多媒體數(shù)據(jù)庫_第2頁
第8章 多媒體數(shù)據(jù)庫_第3頁
第8章 多媒體數(shù)據(jù)庫_第4頁
第8章 多媒體數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第8

多媒體數(shù)據(jù)庫引言8.1多媒體數(shù)據(jù)庫概述8.1.1傳統(tǒng)的數(shù)據(jù)庫技術(shù)8.1.2多媒體數(shù)據(jù)庫的特點8.1.3多媒體數(shù)據(jù)庫的功能8.2多媒體數(shù)據(jù)庫的管理8.2.1多媒體數(shù)據(jù)的管理8.2.2多媒體數(shù)據(jù)庫管理系統(tǒng)的體系結(jié)構(gòu)8.3多媒體數(shù)據(jù)庫的檢索8.3.1基于文本的多媒體數(shù)據(jù)庫檢索8.3.2基于內(nèi)容的多媒體數(shù)據(jù)檢索技術(shù)概述8.3.3基于內(nèi)容檢索的應(yīng)用8.3.4多種類型媒體對象檢索的應(yīng)用本章小結(jié)思考與練習(xí)引言與數(shù)值、字符等格式化數(shù)據(jù)不同,圖像、音頻、視頻等媒體信息所涉及的是非格式化數(shù)據(jù),并且數(shù)據(jù)量相對龐大,我們一般稱其為多媒體數(shù)據(jù)。

傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)在多媒體數(shù)據(jù)的處理、存儲和檢索上顯得力不從心,因此需要研究和建立一種新型數(shù)據(jù)庫技術(shù)——多媒體數(shù)據(jù)庫技術(shù)。

本章首先介紹了傳統(tǒng)數(shù)據(jù)庫的一些基本知識,然后介紹了多媒體數(shù)據(jù)庫涉及的主要內(nèi)容,最后對多媒體數(shù)據(jù)庫中的一個重要的研究內(nèi)容:基于內(nèi)堂的數(shù)據(jù)檢索做了介紹。8.1多媒體數(shù)據(jù)庫概述數(shù)據(jù)庫(Database)是一個依照某種數(shù)據(jù)模型,組織、存儲和管理數(shù)據(jù)的數(shù)據(jù)集合。數(shù)據(jù)庫的兩層含義:1.數(shù)據(jù)庫基本概念是一個實體,能夠合理保管數(shù)據(jù)的“倉庫”,用戶在“倉庫”中存放要管理的事務(wù)數(shù)據(jù)。是數(shù)據(jù)管理的新方法和技術(shù),能更合適的組織數(shù)據(jù)、更方便的維護(hù)數(shù)據(jù)、更嚴(yán)密的控制數(shù)據(jù)和更有效的利用數(shù)據(jù)。8.1.1傳統(tǒng)的數(shù)據(jù)庫技術(shù)2.數(shù)據(jù)庫管理數(shù)據(jù)的特點數(shù)據(jù)結(jié)構(gòu)化:從全局整體觀點組織數(shù)據(jù)。描述數(shù)據(jù)時,既描述數(shù)據(jù)本身,又描述數(shù)據(jù)間關(guān)系;既考慮某個應(yīng)用的數(shù)據(jù)結(jié)構(gòu),又考慮整個組織的數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)具有高共享性、低冗余度:通過數(shù)據(jù)模型和數(shù)據(jù)控制機(jī)制提高數(shù)據(jù)共享性數(shù)據(jù)共享可以大大減少數(shù)據(jù)冗余數(shù)據(jù)和程序之間獨立性較高指數(shù)據(jù)的組織和存儲方法與應(yīng)用程序互不依賴、彼此獨立包括物理數(shù)據(jù)的獨立性和邏輯數(shù)據(jù)的獨立性兩個方面。2.數(shù)據(jù)庫管理數(shù)據(jù)的特點數(shù)據(jù)的安全性和完整性較高數(shù)據(jù)庫系統(tǒng)通過數(shù)據(jù)保護(hù)措施防止數(shù)據(jù)破壞。數(shù)據(jù)庫系統(tǒng)能提供完整性檢查。數(shù)據(jù)可以并發(fā)使用并能保證數(shù)據(jù)的一致性數(shù)據(jù)庫系統(tǒng)提供并發(fā)機(jī)制和協(xié)調(diào)機(jī)制,允許在同一時間內(nèi),多個用戶同時對數(shù)據(jù)實現(xiàn)多路存取,而不產(chǎn)生任何沖突,數(shù)據(jù)不遭到破壞。數(shù)據(jù)庫的故障恢復(fù)提供一套方法及時發(fā)現(xiàn)故障和修復(fù)故障,從而防止數(shù)據(jù)不被丟失或破壞。數(shù)據(jù)庫的運行管理功能:核心功能,包括:多用戶環(huán)境下的并發(fā)控制安全性檢查和存取限制完整性條件檢查和執(zhí)行運行日志組織管理事務(wù)管理和自動恢復(fù)等數(shù)據(jù)庫操作功能:數(shù)據(jù)操作語言DML可進(jìn)行增刪改查等操作數(shù)據(jù)定義功能:DBMS提供數(shù)據(jù)定義語言DDL提供建庫機(jī)制,可建立和修改庫結(jié)構(gòu)、存儲結(jié)構(gòu)、數(shù)據(jù)間聯(lián)系,定義數(shù)據(jù)的完整性約束條件和保證完整性的觸發(fā)機(jī)制等。3.數(shù)據(jù)庫管理系統(tǒng)的主要功能數(shù)據(jù)庫維護(hù)功能:包括:數(shù)據(jù)庫數(shù)據(jù)的載入、轉(zhuǎn)儲和恢復(fù),數(shù)據(jù)庫的維護(hù)及數(shù)據(jù)庫的功能、性能分析和檢測等。數(shù)據(jù)庫通信功能:與操作系統(tǒng)的聯(lián)機(jī)處理、分時系統(tǒng)及遠(yuǎn)程作業(yè)輸入的相關(guān)接口負(fù)責(zé)處理數(shù)據(jù)的傳送與網(wǎng)絡(luò)中其他軟件的通信以及數(shù)據(jù)庫之間的互操作3.數(shù)據(jù)庫管理系統(tǒng)的主要功能表示數(shù)據(jù)之間聯(lián)系的方法。先后經(jīng)歷了層次模型、網(wǎng)狀模型、關(guān)系模型和面向?qū)ο竽P偷入A段目前關(guān)系模型在實際應(yīng)用中處于主導(dǎo)地位,而面向?qū)ο竽P凸烙嬙诓痪玫膶韺玫綇V泛的應(yīng)用。4.數(shù)據(jù)模型滿足以下條件:有且僅有一個結(jié)點無父結(jié)點,這個結(jié)點稱為根結(jié)點。除根結(jié)點之外,其他結(jié)點有且僅有一個父結(jié)點。層次模型滿足以下條件:允許一個以上的結(jié)點無父結(jié)點。一個結(jié)點可以有多個父結(jié)點。網(wǎng)狀模型數(shù)據(jù):二維表中的元素,表格中每一行稱作一個元組,相當(dāng)于一個記錄值;列:屬性值集,列的名字稱為屬性名。關(guān)鍵字(Key):能夠唯一識別一個元組的屬性。關(guān)系模型多媒體數(shù)據(jù)的數(shù)據(jù)量大,數(shù)據(jù)差異也大。媒體種類多,且每種媒體數(shù)據(jù)在又演變出幾十種不同的媒體格式。多媒體數(shù)據(jù)具有模糊性。難以表達(dá)和描述。多媒體數(shù)據(jù)的分布性。多媒體事務(wù)的處理時間比傳統(tǒng)事務(wù)要長。不同應(yīng)用系統(tǒng)對多媒體數(shù)據(jù)的傳輸、表現(xiàn)和存儲方式的質(zhì)量要求不一樣。多媒體信息涉及的版本眾多,包括歷史版本和選擇版本。數(shù)據(jù)量大,8.1.2多媒體數(shù)據(jù)庫的特點1.多媒體數(shù)據(jù)的特點需要設(shè)計合適的數(shù)據(jù)庫的組織和存儲方法。多種媒體類型增加了數(shù)據(jù)處理的困難。數(shù)據(jù)庫的多解查詢。用戶接口的支持。多媒體信息的分布性影響多媒體數(shù)據(jù)庫體系。數(shù)據(jù)庫應(yīng)增加處理長事務(wù)的能力。

對于不同應(yīng)用的不同的服務(wù)質(zhì)量的要求,要根據(jù)的情況進(jìn)行控制。版本控制的問題。2.多媒體數(shù)據(jù)對數(shù)據(jù)庫的影響8.1.3多媒體數(shù)據(jù)庫的功能能表達(dá)和處理多種復(fù)雜的數(shù)據(jù)類型。存儲技術(shù)具有數(shù)據(jù)壓縮和解壓等新功能。有能組織和管理各種媒體數(shù)據(jù)的特征和集成機(jī)制的時空關(guān)聯(lián)的方法。強(qiáng)調(diào)物理數(shù)據(jù)、邏輯數(shù)據(jù)和媒體數(shù)據(jù)獨立性。提供比傳統(tǒng)數(shù)據(jù)庫更強(qiáng)大的操作。提供網(wǎng)絡(luò)分布式數(shù)據(jù)功能。具有開放功能。提供事務(wù)和版本管理功能。多媒體數(shù)據(jù)庫的恢復(fù)和安全機(jī)制功能。8.2多媒體數(shù)據(jù)庫的管理8.2.1多媒體數(shù)據(jù)的管理實現(xiàn)多媒體數(shù)據(jù)管理的三種途徑:1、擴(kuò)充關(guān)系數(shù)據(jù)庫2、面向?qū)ο髷?shù)據(jù)庫方式3、基于超文本和超媒體方式1.擴(kuò)充關(guān)系數(shù)據(jù)庫主要有三種:擴(kuò)展現(xiàn)有的數(shù)據(jù)類型。增加一種大二進(jìn)制對象BLOB(BinarylargeObject)字段來支持對多媒體數(shù)據(jù)對象的存取。擴(kuò)充用戶自定義的數(shù)據(jù)類型允許用戶自定義一個抽象數(shù)據(jù)類型作為另一關(guān)系的列的值,而不僅僅是采用系統(tǒng)己定義的數(shù)據(jù)類型。擴(kuò)充嵌套語義,采用NF2數(shù)據(jù)模型

2.面向?qū)ο髷?shù)據(jù)庫方式更接近人類思維方式。面向?qū)ο髷?shù)據(jù)模式語義豐富,具有很強(qiáng)的抽象能力,具有良好的可擴(kuò)充性,可以很好地滿足復(fù)雜的多媒體對象的各種表示需求。以非線性的信息組織方來管理多媒體對象,較符合人們的思維方式,較適合制作電子文檔或電子出版物,但不適合一般用戶的資料管理。3.基于超文本和超媒體的方式8.2.2多媒體數(shù)據(jù)庫管理系統(tǒng)的體系結(jié)構(gòu)針對每一種媒體建立一個獨立的數(shù)據(jù)庫管理系統(tǒng);這些數(shù)據(jù)庫通過相互通信來協(xié)調(diào)和執(zhí)行相應(yīng)操作;對每種多媒體數(shù)據(jù)的管理是分開的。缺陷:當(dāng)多種媒體的聯(lián)合操作時,增加了用戶的負(fù)擔(dān)。如果各種媒體數(shù)據(jù)庫設(shè)計時沒有按照標(biāo)準(zhǔn)化的原則進(jìn)行,他們之間的通信和使用都會產(chǎn)生問題。1.組合型多媒體數(shù)據(jù)庫結(jié)構(gòu)各種類型的媒體統(tǒng)一建模,只用一個單一的多媒體數(shù)據(jù)庫進(jìn)行管理,并只用一個多媒體數(shù)據(jù)庫管理系統(tǒng)對這些媒體信息進(jìn)行操作,各種用戶需求被統(tǒng)一到一個多媒體用戶接口上,多媒體的查詢檢索結(jié)構(gòu)可以統(tǒng)一表現(xiàn)。缺陷:目前還沒有一個比較恰當(dāng)而且高效的方法來管理所有的多媒體數(shù)據(jù),因此很難實現(xiàn)。2.集中型多媒體數(shù)據(jù)庫結(jié)構(gòu)多個數(shù)據(jù)庫管理系統(tǒng)組成的,每個數(shù)據(jù)庫管理系統(tǒng)之間沒有主從之分,只要求系統(tǒng)中每個數(shù)據(jù)庫管理系統(tǒng)能諧調(diào)地工作。缺陷:通信中必須首先解決每個成員多媒體數(shù)據(jù)庫系統(tǒng)的差異。3.協(xié)作型多媒體數(shù)據(jù)庫結(jié)構(gòu)適合網(wǎng)絡(luò)環(huán)境下的工作。系統(tǒng)對每一種媒體的操作各用一個服務(wù)器來實現(xiàn),所有服務(wù)的綜合和操作也用一個服務(wù)器完成,與用戶的接口采用客戶進(jìn)程實現(xiàn)??蛻襞c服務(wù)器之間通過特定的中間系統(tǒng)連接。缺陷:要對服務(wù)器和客戶進(jìn)行仔細(xì)的規(guī)劃和統(tǒng)一的考慮,采用標(biāo)準(zhǔn)化和開放的接口界面。4.客戶機(jī)-服務(wù)器型多媒體數(shù)據(jù)庫結(jié)構(gòu)8.3多媒體數(shù)據(jù)庫的檢索8.3.1基于文本的多媒體數(shù)據(jù)庫檢索利用人工對多媒體信息進(jìn)行分析,并抽取反映該多媒體數(shù)據(jù)的物理特性和內(nèi)容特性的文本信息;對這些文本信息按照學(xué)科領(lǐng)域分類,或用關(guān)鍵字標(biāo)引,并建立類似于文本文獻(xiàn)的標(biāo)引著錄數(shù)據(jù)庫。用戶則通過輸入關(guān)鍵字,匹配查詢(關(guān)鍵字)和多媒體信息的注釋來搜索相關(guān)數(shù)據(jù)。1.基于文本的多媒體數(shù)據(jù)庫檢索流程利用文件擴(kuò)展名和超文本標(biāo)識。將多媒體文件名和文字解說中帶有的媒體信息作為關(guān)鍵詞。多媒體所在網(wǎng)頁的標(biāo)題或多媒體數(shù)據(jù)附近的文本。人工選擇或指定的某些多媒體信息內(nèi)容的關(guān)鍵詞。2.檢索途徑優(yōu)點:利用關(guān)鍵字匹配的多媒體檢索技術(shù)成熟,查詢效率高。缺點:人工注釋工作量大,在海量系統(tǒng)中幾乎是不現(xiàn)實的;支持的查詢復(fù)雜程度完全取決于人工標(biāo)注的詳盡程度,會出現(xiàn)同一對象描述程度不一的情況;人工標(biāo)注信息帶有很大的主觀性;文本描述無法完全揭示和表達(dá)多媒體信息的實質(zhì)內(nèi)容和語義之間的關(guān)系,難以充分揭示和描述多媒體數(shù)據(jù)中有代表性的特征;對于實時廣播流媒體,人工處理是完全不可行的3.基于文本檢索的優(yōu)缺點“內(nèi)容”的概念:概念級內(nèi)容:表達(dá)對象的語義,一般用文本形式來描述,通過分類和目錄來組織層次瀏覽,用鏈來組織上下文關(guān)聯(lián)。感知特征:視覺特征,聽覺特征等。邏輯關(guān)系:音頻、視頻對象的時間和空間關(guān)系,語義和上下文關(guān)聯(lián)等。信號特征:通過信號處理方法獲得的明顯的媒體區(qū)分特征。特定領(lǐng)域的特征:與應(yīng)用相關(guān)的媒體特征。8.3.2基于內(nèi)容的多媒體檢索技術(shù)概述特征抽取系統(tǒng)。將用戶或系統(tǒng)標(biāo)明的媒體對象的特征提取出來。可由人工或系統(tǒng)自動完成;可以是全局性的或針對某個目標(biāo)的。查詢系統(tǒng)。以示例查詢的方式向用戶提供檢索接口。主要是相似性檢索。1.基于內(nèi)容檢索系統(tǒng)的體系結(jié)構(gòu)(1)提交查詢要求。(2)相似性匹配。(3)返回候選結(jié)果。(4)特征調(diào)整。2.基于內(nèi)容檢索的過程(1)模式識別法用戶在查詢請求中給定圖像、聲音或視像數(shù)據(jù),系統(tǒng)用模式識別技術(shù),把該媒體對象與多媒體數(shù)據(jù)庫中存儲的同類媒體對象進(jìn)行逐個匹配。(2)特征描述法給每個媒體對象附上一個特征描述數(shù)據(jù),用這種特征描述來表達(dá)媒體數(shù)據(jù)的內(nèi)容。關(guān)鍵問題是如何獲取這種特征描述數(shù)據(jù)。(3)特征向量法用圖像壓縮技術(shù)對圖像進(jìn)行分解并向量化。3.基于內(nèi)容的檢索方法直接從媒體內(nèi)容中提取信息線索?;趦?nèi)容的檢索是一種近似匹配,這一點與常規(guī)數(shù)據(jù)庫檢索的精確匹配方法有明顯不同,基于內(nèi)容的檢索只能是一種相似度的檢索。在應(yīng)用中要換取其他性能的提高(比如檢索速度),因此不要求查詢結(jié)果一定是多媒體數(shù)據(jù)庫中滿足相似度和檢索結(jié)果集合大小限制的所有對象,而允許有所遺漏。特征提取和索引建立可由計算機(jī)自動實現(xiàn),避免了人工描述的主觀性,也大大減少了工作量。4.基于內(nèi)容檢索的特點關(guān)鍵技術(shù)顏色特征的提取顏色特征表達(dá)方法有顏色直方圖、顏色矩、顏色集、顏色聚合向量以及顏色相關(guān)圖等,而顏色直方圖是最常用一種方法。紋理特征的提取紋理特征的提取方法主要有結(jié)構(gòu)分析方法、統(tǒng)計分析方法和頻譜分析方法。形狀特征的提取形狀表示:基于邊界的和基于區(qū)域的。前者典型方法是傅立葉描述子;后者典型方法有不變矩等。8.3.3基于內(nèi)容檢索的應(yīng)用1.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)(1)鏡頭分割技術(shù)通過對鏡頭邊界的檢測將視頻分割為各個獨立的鏡頭。主要有基于全局特征的切變檢測、基于局部特征的切變檢測以及閩值法、光流法和模型法漸變檢測法。(2)關(guān)鍵幀提取技術(shù)有基于鏡頭邊界、基于圖像信息、基于運動分析、基于某種聚類算法等各種方法。(3)動態(tài)特征提取技術(shù)利用攝像機(jī)操作的表示來查詢鏡頭,可以利用運動方向和幅度特征來檢索運動的主體目標(biāo)。2.基于內(nèi)容的視頻檢索分類:(1)語音檢索。語音檢索技術(shù)主要包括①基于關(guān)鍵詞檢出技術(shù)的語音檢索。②基于大詞表連續(xù)語音識別技術(shù)的語音檢索。③基于子詞基元的語音檢索。④基于說話人的語音檢索技術(shù)。(2)音樂檢索??梢圆捎煤叱⒐?jié)拍拍打、演奏輸入、樂譜錄入等多種方式提交查詢請求進(jìn)行檢索。(3)音頻例子檢索??梢苑譃閮煞N:一種是將某類音頻用一個模板表示出來,對于用戶提交查詢的音頻例子,先使用模板去進(jìn)行匹配,判斷其屬于模板,然后將這類模板對應(yīng)的音頻例子按序反饋給用戶;另一種是對每個音頻例子建立模板,然后進(jìn)行相似匹配。3.基于內(nèi)容的音頻檢索查詢結(jié)果既能反映語義層次上的相似性,而能體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論