多媒體技術(shù)復(fù)習(xí)資料.doc_第1頁
多媒體技術(shù)復(fù)習(xí)資料.doc_第2頁
多媒體技術(shù)復(fù)習(xí)資料.doc_第3頁
多媒體技術(shù)復(fù)習(xí)資料.doc_第4頁
多媒體技術(shù)復(fù)習(xí)資料.doc_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多媒體技術(shù)復(fù)習(xí)資料感覺媒體直接作用于人的感官、使人能直接產(chǎn)生感覺的一類媒體。聲音、文字、圖形和圖像,物體的質(zhì)地、 形狀、溫度表示媒體為了加工感覺媒體而構(gòu)造出來的一種媒體。各種編碼:語音編碼、圖像編碼等顯示媒體感覺媒體與通信電信號進行轉(zhuǎn)換的一類媒體可分為:輸入表現(xiàn)媒體,輸出表現(xiàn)媒體存儲媒體用于存放表示媒體的一類媒體如:硬盤、光盤等傳輸媒體用來將表示媒體從一處傳送到另一處的物理傳輸介質(zhì),如各種通信電纜。多媒體概念 以數(shù)字化為基礎(chǔ),能夠?qū)Χ喾N媒體信息進行采集、編碼、存儲、傳輸、處理和表現(xiàn),綜合處理多種媒體信息并使之建立起有機的邏輯聯(lián)系,集成為一個系統(tǒng)并能具有良好交互性的技術(shù)。簡言之, 多媒體技術(shù)就是計算機綜合處理聲、文、圖信息, 具有多樣性、集成性和交互性多媒體的關(guān)鍵特性多樣性適應(yīng)了信息載體的多樣性o交互性易于人和計算機的交互集成性實現(xiàn)了信息處理的集成性多媒體計算機的關(guān)鍵技術(shù)視頻音頻信號獲取技術(shù);多媒體數(shù)據(jù)壓縮編碼和解碼技術(shù);視頻音頻數(shù)據(jù)的實時處理和特技;視頻音頻數(shù)據(jù)的輸出技術(shù)。要把一臺普通的計算機變成多媒體計算機需要解決哪些關(guān)鍵技術(shù)?答:視頻音頻信號的獲取技術(shù); 多媒體數(shù)據(jù)壓縮編碼和解碼技術(shù); 視頻音頻數(shù)據(jù)的實時處理和特技;視頻音頻數(shù)據(jù)的輸出技術(shù)。多媒體計算機的關(guān)鍵技術(shù)及其主要應(yīng)用領(lǐng)域。答:多媒體計算機的關(guān)鍵技術(shù)是: 視頻音頻信號獲取技術(shù); 多媒體數(shù)據(jù)壓縮編碼和解碼技術(shù); 視頻音頻數(shù)據(jù)的實時處理和特技; 視頻音頻數(shù)據(jù)的輸出技術(shù)。多媒體計算機的主要應(yīng)用領(lǐng)域: 多媒體數(shù)據(jù)庫和基于內(nèi)容的檢索; 多媒體通信; 多媒體創(chuàng)作工具。音頻處理技術(shù)什么是模擬音頻和數(shù)字音頻?它們的特點是什么? 聲音是機械振動。振動越強,聲音越大,話筒把機械振動轉(zhuǎn)換成電信號,模擬音頻技術(shù)中以模擬電壓的幅度表示聲音強弱。 在計算機內(nèi),所有的信息均是以數(shù)字表示的。各種命令是不同的數(shù)字,各種幅度的物理量也是不同的數(shù)字。當(dāng)然,語音信號也是由一系列數(shù)字來表示,稱之為數(shù)字音頻。 數(shù)字音頻的特點是保真度好,動態(tài)范圍大。模擬聲音在時間上是連續(xù)的。數(shù)字聲音在時間上是斷續(xù)的。什么是音頻信息的數(shù)字化?計算機內(nèi)的音頻必須是數(shù)字形式的,因此必須把模擬音頻信號轉(zhuǎn)換成用有限個數(shù)字表示的離散序列,即實現(xiàn)音頻數(shù)字化。在這一處理技術(shù)中,涉及到音頻的采樣、量化和編碼。 聲音數(shù)字化的兩個步驟是什么:聲音數(shù)字化的兩個步驟是:采樣和量化。采樣就是每間隔一段時間就讀一次聲音信號的幅度,量化就是把采樣得到的聲音信號幅度轉(zhuǎn)換為數(shù)字值。 時間o上的離散叫采樣,幅度上的離散稱為量化。什么是采樣和量化?音頻實際上是一個連續(xù)的信號,或稱連續(xù)時間函數(shù)x(t)。用計算機處理這些信號時,必須先對連續(xù)信號采樣,即按一定的時間間隔(T)取值, 得到x(nT)(n為整數(shù))。T稱采樣周期,1/T稱為采樣頻率。稱x(nT)為離散信號。離散信號x(nT)是從連續(xù)信號x(t)上取出的一部分值,在滿足采樣定理的條件下,可以用x(nT)通過數(shù)字-模擬轉(zhuǎn)換恢復(fù)出x(t)。 為了把采樣序列x(nT)存入計算機,必須將樣值量化成一個有限個幅度值的集合x(nT)。通常情況下用二進制數(shù)字表示量化后的樣值。常用的音頻采樣頻率有哪些?常用的音頻采樣頻率有:8kHz、11.025kHz、16kHz、22.05kHz、37.8kHz、44.1kHz、48kHz等。如果采用更高的采樣頻率,還可以做出DVD的音質(zhì)。 音頻編碼的目的是什么?從哪些方面來考慮音頻信號的冗余度?音頻編碼的目的在于壓縮數(shù)據(jù)。在多媒體音頻數(shù)據(jù)的存儲和傳輸中,數(shù)據(jù)壓縮是必須的。通常數(shù)據(jù)壓縮造成音頻質(zhì)量的下降、計算量的增加。因此,人們在實施數(shù)據(jù)壓縮時,要在音頻質(zhì)量、數(shù)據(jù)量、計算復(fù)雜度三方面進行綜合考慮。從信息保持的角度講,只有當(dāng)信源本身有冗余時,才能對其進行壓縮。 根據(jù)統(tǒng)計分析結(jié)果,語音信號中存在多種冗余,其最主要部分可以分別從時域和頻域來考慮。另外,由于語音主要是給人聽的,所以也要考慮人的聽覺感知機理。因此,可以從以下三個方面來考慮音頻信號的冗余度: 時域信息的冗余度 頻域信息的冗余度 人的聽覺感知機理 。時域信息和頻域信息的冗余度體現(xiàn)在哪些方面?如何從人的聽覺感知機理方面對音頻信息進行壓縮?時域信息冗余度體現(xiàn)在以下幾個方面: 幅度的非均勻分布 樣本間的相關(guān) 周期之間的相關(guān) 基音之間的相關(guān) 靜音系數(shù) 長時自相關(guān)函數(shù) 頻域信息冗余度體現(xiàn)在以下幾個方面: 非均勻的長時功率譜密度 語音特有的短時功率譜密度 人的聽覺感知機理方面 人的聽覺具有掩蔽效應(yīng) 人耳對不同頻段的聲音的敏感程度不同 人耳對語音信號的相位變化不敏感。音頻編碼是如何分類的?音頻編碼的分類如下: (1)基于音頻數(shù)據(jù)的統(tǒng)計特性進行o編碼,其典型技術(shù)是波形編碼。其目標(biāo)是使重建語音波形保持原波形的形狀。PCM(脈沖編碼調(diào)制)是最簡單最基本的編碼方法。它直接賦予抽樣點一個代碼,沒有進行壓縮,因而所需的存儲空間較大。為了減少存儲空間,人們尋求壓縮編碼技術(shù)。利用音頻抽樣的幅度分布規(guī)律和相鄰樣值具有相關(guān)性的特點,提出了差值量化(DPCM)、自適應(yīng)量化(APCM)和自適應(yīng)預(yù)測編碼(ADPCM)等算法,實現(xiàn)了數(shù)據(jù)的壓縮。波形編碼適應(yīng)性強,音頻質(zhì)量好,但壓縮比不大,因而數(shù)據(jù)率較高。 (2)基于音頻的聲學(xué)參數(shù),進行參數(shù)編碼,可進一步降低數(shù)據(jù)率。其目標(biāo)是使重建音頻保持原音頻的特性。常用的音頻參數(shù)有共振峰、線性預(yù)測系數(shù)、濾波器組等。這種編碼技術(shù)的優(yōu)點是數(shù)據(jù)率低,但還原信號的質(zhì)量較差,自然度低。 將上述兩種編碼算法很好地結(jié)合起來,采用混合編碼的方法。這樣就能在較低的碼率上得到較高的音質(zhì)。如碼本激勵線性預(yù)測編碼(CELP)、多脈沖激勵線性預(yù)測編碼(MPLPC)等。 (3)基于人的聽覺特性進行編碼:從人的聽覺系統(tǒng)出發(fā),利用掩蔽效應(yīng),設(shè)計心理聲學(xué)模型,從而實現(xiàn)更高效率的數(shù)字音頻的壓縮。其中以MPEG標(biāo)準(zhǔn)中的高頻編碼和DolbyAC-3最有影響。量化可以分為幾類? 量化有好幾種方法,但可以歸納為兩類:一類稱為均勻量化,另一類稱為非均勻量化。采用的量化方法不同,量化后的數(shù)據(jù)量也不同。因此,可以說量化也是一種壓縮。什么是均勻量化?什么是非均勻量化?它們的特點是什么? 采用相等的量化間隔對采樣得到的信號做量化就是均勻量化。均勻量化就是采用相同的等分尺來度量采樣得到的幅度,也稱為線性量化。 用這種方法量化輸入信號時,無論對大的輸入信號還是對小的輸入信號一律都采用相同的量化間隔。為了適應(yīng)幅度大的輸入信號,同時又要滿足精度高的要求,就需要增加樣本的位數(shù)。但是,對語音信號來說,大信號出現(xiàn)的機會并不多,增加的樣本位數(shù)就沒有充分利用。為了克服這個不足,就出現(xiàn)了非均勻量化的方法,這種方法也稱為非線性量化。 非均勻量化的基本思想是,對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,這樣就可以在滿足精度要求的情況下使用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時,采用相同的規(guī)則。什么是自適應(yīng)量化PCM?改變量化階距有哪兩種方法? 自適應(yīng)量化PCM (adaptive pulse code modulation , APCM)是一種根據(jù)輸入信號幅度大小來改變量化階距大小的一種波形編碼技術(shù)。這種自適應(yīng)可以是瞬時自適應(yīng),即量化階距的大小每隔幾個樣本就改變,也可以是音節(jié)自適應(yīng),即量化階距的大小在較長時間周期里發(fā)生變化。 改變量化階距的大小有兩種方法:一種稱為前向自適應(yīng)(forward adaptation),另一種稱為后向自適應(yīng)(backward adaptation)。 前向自適應(yīng)是根據(jù)未量化的樣本值的均方根值來估算輸入信號的電平,以此來確定量化階距的大小,并對其電平進行編碼作為邊信息傳送到接收端。 后向自適應(yīng)是從量化器剛輸出的過去樣本中來提取量化階距信息。由于后向自適應(yīng)能在發(fā)和收兩端自動生成量化階距,所以它不需要傳送邊信息。什么是調(diào)頻音樂合成?什么是波表合成? 調(diào)頻音樂合成是使高頻振蕩波的頻率按調(diào)制信號規(guī)律變化的一種調(diào)制方式。采用不同調(diào)制波頻率和調(diào)制指數(shù),就可以方便的合成具有不同頻譜分布的波形,再現(xiàn)某些樂器的音色。我們可以采用這種方法得到具有獨特效果的電子模擬聲,創(chuàng)造出豐富多彩的聲音,是真實樂器所不具備的音色,這也是FM音樂合成方法特有的魅力之一。 波表的英文名稱為WAVE TABLE,從字面翻譯就是波形表格的意思。其實它是將各種真實樂器所能發(fā)出的所有聲音(包括各個音域、聲調(diào))錄制下來,存貯為一個波表文件。播放時,根據(jù)MIDI文件紀(jì)錄的樂曲信息向波表發(fā)出指令,從表格中逐一找出對應(yīng)的聲音信息,經(jīng)過合成、加工后回放出來。什么是MIDI?什么情況下使用MIDI? MIDI是樂器數(shù)字接口的縮寫,它始建于1982年,MIDI泛指數(shù)字樂器接口國際標(biāo)準(zhǔn)。標(biāo)準(zhǔn)的多媒體PC平臺能夠通過內(nèi)部合成器或連到計算機端口的外部合成器播放MIDI文件。MIDI標(biāo)準(zhǔn)規(guī)定了不同廠家的電子樂器與計算機連接的電纜和硬件。它還指定了從一個裝置傳送數(shù)據(jù)到另一個裝置的通信協(xié)議。這樣,任何電子樂器,只要有處理MIDI信息的處理器和適當(dāng)?shù)挠布涌诙寄茏兂蒑IDI裝置。MIDI間靠這個接口傳遞消息(massage),消息是樂譜(Score)的數(shù)字描述。樂譜由音符序列、定時和合成音色(Patches)的樂器定義所組成。當(dāng)一組MIDI消息通過音樂合成芯片演奏時,合成器解釋這些符號,并產(chǎn)生音樂。 以下幾種情況下,使用MIDI譜曲比使用波形音頻更合適,如: 需要播放長時間高質(zhì)量音樂。比如你想在硬盤上存儲的音樂大于1分鐘,而硬盤又沒有足夠的存儲容量。 需要以音樂作為背景音響效果。同時從CD-ROM中裝載其他數(shù)據(jù),如圖像、文字的顯示。 需要以音樂作背景音響效果。同時播放波形音頻或?qū)崿F(xiàn)文-語轉(zhuǎn)換,以實現(xiàn)音樂和語音同時輸出。什么是AC-3 ? 美國杜比公司(Dolby)制定的環(huán)境立體聲音頻壓縮編碼標(biāo)準(zhǔn),它在制定了AC-1和AC-2后又制定了AC-3。AC-3采用了頻譜分析技術(shù),非線性子帶帶寬分配、動態(tài)時域譜域帶寬分配、心理聲學(xué)模型和多聲道耦合技術(shù),具有很高的數(shù)據(jù)壓縮率和很低的失真度。杜比AC-3有完全獨立的個聲道,全頻帶的左、右、中、左環(huán)繞、右環(huán)繞和一個低于120HZ的超低音,因此,又稱為5.1聲道。多媒體數(shù)據(jù)壓縮文本 文本是計算機文字處理程序的基礎(chǔ),包括ASCII、中文。 圖形 一般指用計算機繪制的畫面。也稱矢量圖。圖像 圖像是指由輸入設(shè)備捕捉的實際場景畫面,或以數(shù)字化形式存儲的任意畫面。靜止的圖像是一個矩陣,由一些排成行列的點組成,這些點稱之為像素點(pixel),這種圖像稱為位圖(bitmap)。視頻 由連續(xù)的畫面組成。這些畫面以一定的速率連續(xù)地投射在屏幕上,使觀察者具有圖像連續(xù)運動的感覺音頻 波形聲音,包含了所有的聲音形式,它可以把任何聲音都進行采樣量化。語音,人的說話聲雖是一種特殊的媒體,但也是一種波形。音樂,符號化了的聲音,樂譜可轉(zhuǎn)變?yōu)榉柮襟w形式。動畫 實質(zhì)是一幅幅靜態(tài)圖像的連續(xù)播放。動畫的連續(xù)播放既指時間上的連續(xù),也指圖像內(nèi)容上的連續(xù),即播放的相鄰兩幅圖像之間內(nèi)容相差不大 壓縮的必要性:音頻、視頻的數(shù)據(jù)量很大,如果不進行處理,計算機系統(tǒng)幾乎無法對它進行存取和交換。壓縮的可行性:信息論認為:若信源編碼的熵大于信源的實際熵,該信源中一定存在冗余度。數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)壓縮比,壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)圖象質(zhì)量,無損壓縮(圖象質(zhì)量不變);有損壓縮,失真情況很難量化,只能對測試的圖象進行估計。壓縮和解壓的速度,壓縮和解壓可能不同時用,壓縮、解壓速度分別估計。數(shù)據(jù)冗余的類型 空間冗余時間冗余信息熵冗余視覺冗余聽覺冗余其它冗余結(jié)構(gòu)冗余知識冗余根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致可以分為兩大類:一類是熵編碼、冗余壓縮法,也稱無損壓縮法、無失真壓縮法;多用于文本、數(shù)據(jù)的壓縮,非線性編輯系統(tǒng)為了保證視頻質(zhì)量,有些高檔系統(tǒng)采用的是無失真壓縮方法。二是熵壓縮法,也稱有損壓縮法、有失真壓縮法。圖像、聲音、動態(tài)視頻 根據(jù)編碼原理預(yù)測編碼,變換編碼,統(tǒng)計編碼,分析合成編碼,混合編碼等預(yù)測編碼:預(yù)測編碼是指利用前面的一個或多個信號對下一個信號進行預(yù)測,然后對實際值和預(yù)測值的差進行編碼。DPCM與ADPCM是兩種典型的預(yù)測編碼。線性預(yù)測、非線性預(yù)測 理論基礎(chǔ):現(xiàn)代統(tǒng)計學(xué)和控制論 目標(biāo):減少數(shù)據(jù)在時間和空間上的相關(guān)性如何理解數(shù)據(jù)壓縮的概念?數(shù)據(jù)壓縮就是以最少的數(shù)碼表示信源所發(fā)的信號,減少容納給定消息集合或數(shù)據(jù)采樣集合的信號空間。理解這一概念的關(guān)鍵是要理解信源和信號空間以及最少的含義。信源可以是數(shù)據(jù)、靜止圖象、語音、電視或其他需要存儲和傳輸?shù)男盘枺恍盘柨臻g是指信號集合所占的空域、時域和頻域空間??沼颉r域和頻域空間是指:(1)物理空間:如存儲器、磁盤、磁帶、光盤等數(shù)據(jù)存儲介質(zhì)。(2)時間區(qū)間:如傳輸給定信源所需的時間。(3)電磁頻譜區(qū)域:如傳輸給定信源所需的帶寬。最少是指在保證信源的一定質(zhì)量或者說是有效的前提下的最少。何為有損壓縮和無損壓縮?有損壓縮是指經(jīng)過壓縮后經(jīng)解碼再還原的信號與原信號不能嚴(yán)格一致,無損壓縮是指壓縮后經(jīng)解碼還原的信號與原信號嚴(yán)格一致。存儲1分鐘的分辨率為512512的NTSC制彩色視頻圖像,其數(shù)據(jù)存儲量有多大?一幅512512的彩色圖像,每像素用8bit表示,則其大小為: 51251283=629145bit6.3M bit=768kB 每秒鐘傳送30幀,其每秒的數(shù)據(jù)量為: 6.3Mbit30幀/s =188M bit/s = 23.5MB/s 一分鐘的數(shù)據(jù)量為:23.5MB/s60 = 1410 MB信息熵的概念。信源X發(fā)出的xj(j=1,2,n), 共n個隨機事件的自信息統(tǒng)計平均(求數(shù)學(xué)期望),它的含義是信源X發(fā)出任意一個隨機變量的平均信息量。圖像處理技術(shù)亮度亮度是人眼對光強度的感受。目標(biāo)的亮度和周圍的背景有關(guān),對比度視覺上也有等亮曲線,反映了視覺在亮度上與波長的關(guān)系。在同一亮度感覺下,不同波長的光具有不同的光強。視覺也有掩蔽現(xiàn)象,在很亮的高光周圍時難以看清的彩色三種心理屬性:色調(diào)、亮度和飽和度色調(diào)就是通常意義下的彩色,它隨波長的變化而變化,反映顏色的基本特性。飽和度是代表為了產(chǎn)生所感知到的彩色在白光中必須混入的純單色光的相對數(shù)量,或者說是顏色的深淺程度。對同一色調(diào)的彩色光,飽和度越深顏色越鮮艷。亮度是光作用于人眼所引起的明亮程度的感覺,與光強有關(guān)。色調(diào)和飽和度統(tǒng)稱為色度。人眼一般感到紅光最暗,藍光次之,而黃綠光最亮。研究表明,人眼對亮度信息敏感,而對顏色的敏感程度相對較弱。 幾個重要的技術(shù)參數(shù)分辨率:屏幕分辨率、圖像分辨率、像素分辨率圖像顏色數(shù):真彩色概念、圖象與象素深度位圖圖像的數(shù)據(jù)量:設(shè)圖像的垂直方向分辨率為h像素,水平方向分辨率為w像素,顏色深度為c位,則該圖像所需數(shù)據(jù)空間大小B為: B=(h*w*c)/8(字節(jié)) 真彩色指在組成一幅彩色圖象的每個象素值中,有R、G、B三個基色分量,每個基色分量直接決定顯示設(shè)備的基色強度,這樣產(chǎn)生的彩色稱為真彩色。例如用RGB 555表示的彩色圖象,R、G、B各用5位,用R、G、B分量大小的值直接確定三個基色的強度,這樣得到的彩色是真實的原圖彩色。偽彩色:指每個象素的顏色不是由每個基色分量的數(shù)值直接決定,而是把象素值當(dāng)作彩色查找表CLUT(color look-up table)的表項入口地址,去查找一個顯示圖象時使用的R、G、B強度值,用查找出的R、G、B強度值產(chǎn)生的彩色稱為偽彩色。圖像的處理:圖像數(shù)據(jù)的壓縮:在存儲和傳輸前進行,要考慮算法、實時性-硬件完成 圖像的優(yōu)化:圖像增強、噪聲過濾、畸變校正、亮度調(diào)整、色度調(diào)整等圖像的編輯:裁剪、旋轉(zhuǎn)、縮放、綜合疊加等圖像格式轉(zhuǎn)化: 圖形:圖形以一組指令的形式存在。指令可描述:線、圓、弧、矩形的大小和形狀及曲面、光照、材質(zhì)等。圖形的顯示過程:解釋指令,以顯示中的計算時間換存儲空間 色度抽樣在數(shù)字圖像處理領(lǐng)域中,色度抽樣是指在表示圖像時使用較亮度信息低的分辨率來表示色彩(色度)信息。當(dāng)對模擬分量視頻或者YUV信號進行數(shù)字抽樣時,一般會用到色度抽樣。由于人眼對色度的敏感度不及對亮度的敏感度,圖像的色度分量不需要有和亮度分量相同的清晰度,所以許多視頻系統(tǒng)在色差通道上進行較低(相對亮度通道)清晰度(例如,抽樣頻率)的抽樣。這樣在不明顯降低畫面質(zhì)量的同時降低了視頻信號的總帶寬。因抽樣而丟失的色度值用內(nèi)插值,或者前一色度值來替代。視頻系統(tǒng)的抽樣率通常用一個三分比值表示。第一個值是亮度(Y)分量樣本的數(shù)量,后兩個值是兩個色彩(“色度”)分量樣本的數(shù)量:U/Cb分量在前,V/Cr分量在后。在比較圖像質(zhì)量時,這三個值之間的比值才是重要的,所以4:4:4可以簡化為1:1:1;但是習(xí)慣上亮度樣本的數(shù)量值總為4,其他兩個值依此類推。有時抽樣率為四分比值,如4:2:2:4。這時第四個值是調(diào)制通道的抽樣頻率比值。事實上,因為在調(diào)制應(yīng)用中非常需要高質(zhì)量圖像,所以這個值在任何情況下都為4。 4:4:4三個通道的抽樣率相同,因此在生成的圖像里,每個象素的三個分量信息完整(每個分量通常8比特或10比特),經(jīng)過8比特量化之后,未經(jīng)壓縮的每個象素3個字節(jié)。 4:2:2每個色差通道的抽樣率是亮度通道的一半,所以水平方向的色度抽樣率只是4:4:4的一半。對非壓縮的8比特量化的視頻來說,每個由兩個水平方向相鄰的像素組成的宏像素需要占用4字節(jié)內(nèi)存。 4:1:14:1:1的色度抽樣,是在水平方向上對色度進行4:1抽樣。對于低端用戶和消費類產(chǎn)品這仍然是可以接受的。對非壓縮的8比特量化的視頻來說,每個由4個水平方向相鄰的像素組成的宏像素需要占用6字節(jié)內(nèi)存。 4:2:04:2:0并不意味著只有Y,Cb而沒有Cr分量。它指的是對每行掃描線來說,只有一種色度分量以2:1的抽樣率存儲。相鄰的掃描行存儲不同的色度分量,也就是說,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是4:2:0.以此類推。對每個色度分量來說,水平方向和豎直方向的抽樣率都是2:1,所以可以說色度的抽樣率是4:1。 圖像處理技術(shù)什么是圖像文件格式?有那幾類?:數(shù)字化的圖形、圖像及視頻信息,都以文件的形式存儲到計算機的存儲器中,大多數(shù)是工廠和企業(yè)的標(biāo)準(zhǔn)。通常將其分成兩類:一類是靜止圖像文件格式,另一類是動態(tài)視頻文件格式。常見的六種靜止圖像文件格式:GIF(Graphics Interchange Format)、TIFF(Tag Image File Format)、TGA(Targe Image Format)、BMP(Bitmap)、PCX和MMP。位圖圖像的優(yōu)缺點:位圖圖像的主要優(yōu)點是清晰、美觀、逼真,能畫出比較復(fù)雜的圖像,并支持鼠標(biāo)。顯示位圖圖像要比顯示矢量圖形快,位圖可裝入內(nèi)存直接顯示。位圖圖像的主要缺點是存儲容量大,因為位圖必須把屏幕上顯示的每一個像素的信息存儲起來。一般同樣的一幅畫,位圖的容量往往要比矢量圖多一至二倍,甚至好幾倍。分辨率對位圖圖像的影響也是比較大的,分辨率的高低將直接影響位圖圖像的質(zhì)量。位圖與矢量圖的區(qū)別:由于圖像存儲方法的截然不同,不同方法表示的圖像其應(yīng)用領(lǐng)域也不盡相同。位圖適用于具有復(fù)雜的顏色、灰度或形狀變化的圖像,如照片、繪畫和數(shù)字化的視頻圖像。計算機顯示就采用位圖格式,因而位圖圖像的計算機處理是有硬件基礎(chǔ)的。與位圖格式相比較,矢量格式適用于線型圖,如計算機輔助設(shè)計(CAD)的圖形和圖像,只有簡單的形狀、灰度和顏色。由于點陣和矢量兩種不同的存儲方法,其所用的文件格式也不同,如BMP、PCX、GIF、PIC、TGA等文件格式是用來存儲位圖圖像的,而如AutoCAD的DWC、DXF以及GDS使用的GRA文件都是存儲矢量圖像的。TIFF格式的優(yōu)缺點:TIFF格式是由Microsoft,Hewlett Packard與Aldus組成委員會制定的。目的就是提供一個與平臺無關(guān),與應(yīng)用程序無關(guān),與圖像本身無關(guān)的圖像文件格式。它的最大優(yōu)點是兼容性非常好,幾乎可運用在任何方面,用它保存圖像可以保證順利地與任何人進行交流。該格式文件的擴展名是tiff或tif。缺點是數(shù)據(jù)量大 圖像的數(shù)字化過程:數(shù)字化是指將許多復(fù)雜多變的信息轉(zhuǎn)變?yōu)榭梢远攘康臄?shù)字,再以數(shù)字建立起適當(dāng)?shù)臄?shù)字化模型,把它們轉(zhuǎn)變?yōu)橐幌盗卸M制代碼,引入計算機內(nèi)部,進行統(tǒng)一處理。 數(shù)字化將任何連續(xù)變化的輸入分離為獨立的單元,在計算機中用數(shù)字“0”和“1”表示。數(shù)字轉(zhuǎn)換設(shè)備獲取圖像的過程實質(zhì)上是信號掃描和數(shù)字化的過程,它的處理步驟大體分為采樣、量化、編碼三個步驟圖像的顯示分辨率、圖像分辨率、像素分辨率:顯示分辨率:在某種顯示方式下,顯示器屏幕上的最大顯示區(qū)域,即水平與垂直方向的像素個數(shù)。圖像分辨率:數(shù)字化圖像的大小,即該圖像的水平與垂直方向的像素個數(shù)。像素分辨率:指像素的寬和高的比例, 一般為1:1。 相同大小的顯示屏上,顯示分辨率越高,像素越高,像素密度越大,顯示的圖像越精細,但同一字號的字在屏幕上卻顯得越小。最大顯示分辨率由顯示器和顯卡(顯示緩存)決定;當(dāng)前顯示分辨率由當(dāng)前設(shè)置的參數(shù)決定。圖像分辨率決定圖像的顯示質(zhì)量。圖像分辨率和顯示分辨率決定了顯示圖像的大小。什么是顏色深度:是指記錄每個像素所使用的二進制位數(shù)。對于彩色圖像,顏色深度決定了圖像可以使用的最大顏色數(shù)目。對于灰度圖像,顏色深度決定了該圖像可以使用的亮度級別數(shù)目。顏色深度越大,顯示的圖像越豐富,畫面越好,但數(shù)據(jù)量也隨之增長。圖像的顏色類型:圖像的顏色需要使用三維空間來表示,但表示法不唯一,每個像素點的圖像深度的分配與圖像所使用的顏色空間有關(guān)。真彩色:圖像中的每個像素值都分成R、G、B三個基色分量,每個基色分量直接決定其基色的強度。偽彩色:圖像的每個像素值實際上是一個索引值或代碼值。該代碼值作為顏色查找表CLUT中某一項的入口地址。根據(jù)該地址可以查找出包含實際R、G、B的強度值。這種用查找映射的方法產(chǎn)生的色彩稱為偽彩色。直接色:是通過每個像素點的R、G、B分量分別作為單獨的索引值進行變換,經(jīng)相應(yīng)的顏色變換表找出各自的強度,用變換后的R、G、B強度值產(chǎn)生的色彩?;叶葓D:灰度圖(Grayscale image)按照灰度等級的數(shù)目來劃分。只有黑白色的圖像稱為單色圖像(monochrome image),圖中每個像素值用1位存儲。如果每個像素的像素值用一個字節(jié)表示,灰度等級數(shù)為256,每個像素可以是0255之間的任何一個值。 色調(diào):引起視覺的色光,可能是由數(shù)種波長的光波混合而成,但正常人眼均能感受出它最接近紅、橙、黃、綠、藍、紫等純光譜色中的那一種,這種屬性稱為色調(diào)。色調(diào)有一個自然的順序:紅、橙、黃、綠、青、藍、紫。在這個次序中,當(dāng)人們混合相鄰顏色時,可以獲得在這兩種顏色之間連續(xù)變化的色調(diào)。顏色的飽和度:指的是顏色偏離灰色、接近純光譜色的程度。黑、白、灰色的飽和度最低(0%),而純光譜色的飽和度最高(100%)。純光譜色與白光混合,可以產(chǎn)生各種混合色光,其中純光譜色所占的百分比,就是該色光的飽和度。視頻處理技術(shù)電視的三大制式: NTSC(National Television System Committee(525/60):1953,美國 PAL(Phase Alternation Line)(625/50):1962,西德o SECAM(625/50):法國o光柵掃描原理 視頻攝像機將圖像轉(zhuǎn)換為電信號,電信號是一維的,但圖像是二維的,將二維圖像轉(zhuǎn)成為一維電信號是由光柵掃描的方法實現(xiàn)的。 快速的掃描線從頂部開始,一行一行地向下掃描,直至顯示器的最底部,然后再返回頂部的起點,重新開始掃描。這個過程產(chǎn)生的一個有序的圖像信號集合,就組成了電視顯示中的一幅圖像,在此稱為幀。 連續(xù)不斷的圖像序列就形成了動態(tài)視頻圖像。常見的電視制式:目前世界上常用的電視制式有中國、歐洲使用的PAL制,美國、日本使用的NTSC制及法國等國所使用的SECAM制。oNTSC(National Television Standard Committe)是美國國家電視系統(tǒng)委員會在1953年制定的一種兼容的彩色電視制式,在美國、日本和其他國家廣為使用。定義了彩色電視機對所接受的電視信號的解碼方式、色彩的處理方式、屏幕的掃描頻率。NTSC制規(guī)定水平掃描線有525條,以每秒30幀速率傳送。NTSC采用隔行掃描方式,每一幀畫面由兩次掃描完成,每一次掃描畫出一個場需要1/60秒,兩個場構(gòu)成一幀。PAL(Phase Alternate Lock)是聯(lián)邦德國1962年制定的一種兼容電視制式。PAL意指“相位逐行交變”,我國和大部分西歐國家都使用這種制式。PAL制規(guī)定水平掃描625行、每秒25幀 、隔行掃描、每場需要1/50秒。SECAM(SEquential Color And Memory)稱為順序傳送彩色與存儲,是用于法國、俄羅斯及幾個東歐國家的彩色電視制式。基本技術(shù)及廣播方式與NTSC和PAL有很大的區(qū)別。水平掃描625行、每秒25幀。YUV模型:在PAL彩色電視制式中采用YUV模型來表示彩色圖像。其是Y表示亮度,U,V用來表示色差,是構(gòu)成彩色的兩個分量。YUV表示法的重要性是它的亮度信號(Y)和色度信號(U、V)是相互獨立的,也就是Y信號分量構(gòu)成的黑白灰度圖與用U、V信號構(gòu)成的另外兩幅單色圖是相互獨立的。由于Y、U、V是獨立的,所以可以對這些單色圖分別進行編碼。采用YUV模型的優(yōu)點之一是亮度信號和色差信號是分離的,使彩色電視系統(tǒng)與黑白電視機亮度信號兼容。幾種常用的視頻處理技術(shù):視頻剪輯根據(jù)需要剪除不需要的視頻片段,連接多段視頻信息;視頻疊加根據(jù)需要把多個視頻影像疊加在一起;視頻和聲音同步在單純的視頻信息上添加聲音,并精確定位;添加特殊效果使用濾鏡加工視頻影像,使影像具有各種特殊效果。電視信號數(shù)字化的兩種基本方法:(a)先從復(fù)合彩色電視圖像中分離出彩色分量,然后數(shù)字化。對彩色全電視信號,通常是首先把模擬的全彩色電視信號分離成YCbCr,YUV,RGB彩色空間中的分量信號,然后用三個A/D(模/數(shù)Analog Digital)轉(zhuǎn)換器分別對它們數(shù)字化。(b)首先用一個高速A/D轉(zhuǎn)換器對彩色全電視信號進行數(shù)字化,然后在數(shù)字域中進行分離,以獲得所希望的YCbCr,YUV或RGB分量數(shù)據(jù)。、多媒體數(shù)據(jù)存儲光存儲技術(shù)原理光存儲的類型:只讀型光存儲系統(tǒng),只讀型光盤包括LV和CD-ROM等;一次寫型光存儲系統(tǒng),一次寫(WORM)光存儲系統(tǒng)可一次寫入,任意多次讀出;可重寫型光存儲系統(tǒng),可重寫光盤(E-R/W,Rewritable或Erasable)像硬盤一樣可任意讀寫數(shù)據(jù)。DVD盤片的物理結(jié)構(gòu)分類:單面單層、單面雙層、雙面單層、雙面雙層;容量:4.7GB17GB;最小凹坑長度僅為0.4m,道間距為0.74m,采用波長為635650nm的紅外激光器讀取數(shù)據(jù); DVD盤的厚度為1.2mm。對于單面盤而言,只有下層基底包含數(shù)據(jù),上層基底沒有數(shù)據(jù);而雙面盤的上下兩層基底上均有數(shù)據(jù)。DVD-5:采用單層單面,所以標(biāo)準(zhǔn)的資料記錄量為4.7GB。DVD-9:單面雙層,也就是將資料層增加到兩層,但是中間夾入一個半透明反射層,如此一來讀取第二層資料的時候,不需要將DVD盤片翻面,直接切換激光讀取頭的聚焦位置就可以了DVD-10:采用單層雙面,也就是DVD片的正反面都可以存儲資料,一般標(biāo)準(zhǔn)的資料記錄量為9.4GB,為DVD-5的兩倍。DVD-18:雙面雙層。藍光DVD:藍光標(biāo)準(zhǔn)可以使單層碟片的存儲容量達到25GB,雙層碟片的存儲容量則達到50GB以上。多媒體網(wǎng)絡(luò)技術(shù)多媒體網(wǎng)絡(luò)特性:業(yè)務(wù)等級保證,也就是我們常說的QOS(Quality Of Service)服務(wù)質(zhì)量保證。高帶寬,也就是網(wǎng)絡(luò)的寬帶化??煽啃员WC。時性,這是多媒體通信網(wǎng)與傳統(tǒng)數(shù)據(jù)網(wǎng)的本質(zhì)區(qū)別 多媒體會議系統(tǒng)通過計算機遠程參加會議或交流,以可視化的、實時的、交互的形式實現(xiàn)了在不同地理位置上人們的多媒體資源共享和信息的相互交流,體現(xiàn)了超越空間的多點通信、群體的“面對面”的協(xié)同工作特點。視頻會議系統(tǒng)主要由視頻會議終端、多點控制器、信道(網(wǎng)絡(luò))及控制管理軟件等組成。 RSVP(Resource Reserve Protocol):Internet上的資源預(yù)訂協(xié)議用來為因特網(wǎng)中的一次會話預(yù)留資源,在一定程度上為流媒體的傳輸提供QoS服務(wù)質(zhì)量保證。RSVP支持兩種服務(wù)類型:受控載荷服務(wù)(Best-Effort),保證服務(wù)(帶寬、延遲)。流媒體:流媒體指在Internet/Intranet中使用流式傳輸技術(shù)的連續(xù)時基媒體。 流媒體簡單來說就是應(yīng)用流技術(shù)在網(wǎng)絡(luò)上傳輸?shù)亩嗝襟w文件,而流技術(shù)就是把連續(xù)的影象和聲音信息經(jīng)過壓縮處理后放上網(wǎng)站服務(wù)器。用戶一邊下載一邊觀看、收聽,而不需要等整個壓縮文件下載到自己機器后才可以觀看的網(wǎng)絡(luò)傳輸技術(shù)。實現(xiàn)流式傳輸?shù)膬煞N方法:順序流式傳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論