多媒體技術(shù)和教育ppt課件_第1頁
多媒體技術(shù)和教育ppt課件_第2頁
多媒體技術(shù)和教育ppt課件_第3頁
多媒體技術(shù)和教育ppt課件_第4頁
多媒體技術(shù)和教育ppt課件_第5頁
已閱讀5頁,還剩119頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、l MPC-I標(biāo)準(zhǔn):1990年制定。l MPC-II標(biāo)準(zhǔn):1993年5月制定。l MPC-III標(biāo)準(zhǔn):2019年6月制定。工程MPC-IMPC-IIMPC-IIIRAM2MB4MB8MB運算處理器16MHZ386SX25MHZ486SX75HZ Pentimu同等級X86硬盤容量30MB160MB540MBCD-ROM150KB/s最大尋址時間1S300Kb/s最大尋址時間400MSCD-ROM XA600Kb/s最大尋址時間200MSCD-ROM XA聲卡8Bit 數(shù)字聲音8個合成音MIDI16Bit數(shù)字聲音8個合成音MIDI16Bit數(shù)字聲音Wave Table波表)MIDI顯卡64048

2、016色64048065536色64048065536色視頻播放352240 30fps(352288) 25fps15bit/Pixel輸入輸出端口MIDI I/O,遙桿端口,串并聯(lián)端口MIDI I/O,遙桿端口,串并聯(lián)端口MIDI I/O,遙桿端口,串并聯(lián)端口分辨率:指把采樣所得值通常為反映某一瞬間聲波幅度的電壓值),即用二進制來表示模擬量國際標(biāo)準(zhǔn)的語音標(biāo)準(zhǔn):8位256個量化級)16位 (65536個量化級)聲道 : 單聲道 (一個波形) 雙聲道 (二個波形)聲音文件數(shù)據(jù)量:單聲道:S=RD (r/8) 1雙聲道:S=RD (r/8) 2S 表示文件大小,單位為字節(jié)R 表示采樣頻率,單位為

3、kHZD 表示錄音的時間,時間為秒S=(44100 10 16/8) 2 = 1764kB一、位圖圖像: 指在空間和亮度上已經(jīng)離散化了的圖像。又稱位圖影射圖像,簡稱位圖圖像。 描述位圖圖像的參數(shù)有:1 分辨率??煞譃槠聊环直媛?、圖像分辨率和像素分辨率三種形式。(1) 屏幕分辨率:指某一特定顯示方式下,計算機屏幕上的最大顯示區(qū)域,以水平和垂直像素表示。(2) 圖像分辨率:指數(shù)字化圖像的大小 ,以水平和垂直像素表示。(3像素分辨率:是指一個像素的寬和長之比。不同像素的長寬比將導(dǎo)致圖像變形。3.圖像顏色數(shù)指一幅位圖圖像中最多能使用的顏色數(shù)。在黑白圖像下即為灰度等級256級,0256) 二、矢量圖形是

4、對圖像依據(jù)某個標(biāo)準(zhǔn)進行分析而產(chǎn)生的結(jié)果。它僅是一種抽象化的圖形。1 矢量圖形的特性:(1) 圖形是對圖像進行抽象的結(jié)果。一般采用計算機或人工自動完成。(2) 圖形的矢量化使得有可能對圖中的各個部分進行控制。(3) 圖形的產(chǎn)生需要計算時間。2 矢量圖形的類型(1) 二維圖形2D):其變換在二維空間中進行。三維3D):實現(xiàn)三維空間圖形的顯示與變換。 多媒體系統(tǒng)的基本配置1、聲音卡的基本知識聲音卡作為MPC的主要組件。聲音卡性能的高低與它采用的技術(shù)和方法有很大關(guān)系系。下面介紹聲音卡所涉及的有關(guān)技術(shù)及其概念。(1模數(shù)轉(zhuǎn)換(ADC)將輸入的模擬音頻信號轉(zhuǎn)換成數(shù)值。而數(shù)字化后的音頻信號是數(shù)值,是離散的數(shù)據(jù)

5、,并非像音頻信號一樣為連續(xù)的波形。因而數(shù)字化時并不能連續(xù)采樣,而是按一定的采樣頻率進行,數(shù)字化音頻信號涉及兩個基本的技術(shù)指標(biāo)是:(1)采樣頻率。(2)采樣值的編碼位數(shù)(大小)。l 采樣頻率:單位時間內(nèi)的采樣次數(shù)。一般來說,語音信號的采樣頻率是語音所必需的頻率寬度的2倍以上。人耳可聽到的頻率為20Hz22KHz的聲音,所以對聲音卡來講,其采樣頻率為最高頻率22KHz的2倍以上,即采樣頻率應(yīng)在44KHz以上。較高的采樣頻率能獲得較好的聲音還原。目前的聲音卡的采樣頻率一般采用44.1KHz或48KHz。當(dāng)然48KHz更好一些。l 采樣值的編碼位數(shù):記錄每次采樣值使用的二進制編碼位數(shù)。而二進制編碼位數(shù)

6、直接影響還原聲音的質(zhì)量。當(dāng)前聲音卡有8位、16位和32位三種,主要以16位聲音卡為主,8位聲音卡趨于淘汰。8位聲音卡對語言的解釋能滿足需要,可達到電臺中波廣播的音質(zhì),但播放音樂的效果不好。16位聲音卡可以達到CD音響水平。真正的32位聲音卡還比較少。(2數(shù)模轉(zhuǎn)換(DAC)完成將數(shù)字化的聲音數(shù)據(jù)轉(zhuǎn)換成模擬音頻信號輸出,它是模數(shù)轉(zhuǎn)換的逆過程。其主要指標(biāo)與模數(shù)轉(zhuǎn)換相同。(3MIDI音頻多媒體PC機技術(shù)指標(biāo)要求所有聲音卡支持MIDIMusicInstrumentDigitalInterface,即樂器數(shù)字化接口規(guī)范。MIDI是由音樂家們建立的電子合成樂器的統(tǒng)一標(biāo)準(zhǔn),可以用電器件模擬大提琴、小提琴、鋼琴

7、等幾乎常見的樂器聲音卡中一般采用兩種不同的方法還原MIDI聲音:l FM合成。FM合成由FM合成器完成,F(xiàn)M合成器利用調(diào)頻(FM)技術(shù)以波形模擬實際樂器的聲音,樂器的聲音由兩種、三種或四種不同的頻率的波形疊加合成,一般的聲音卡就采用這種技術(shù)。由于樂器的音效可分解成無窮多種正弦波通過傅立葉變換),四種波不足以還原逼真的音質(zhì),所以一般的聲音卡播放的MIDI音樂都不夠逼真,效果與電子琴差不多,屬于MIDI的中低檔產(chǎn)品。l 波表Wave Table合成。波表合成采用一種稱之為“波表查找技術(shù)來產(chǎn)生MIDI音樂,這種技術(shù)采用真實樂器的數(shù)字錄制技術(shù),并將錄制的大提琴、小提琴、鋼琴、鼓等各種實際樂器的數(shù)字化聲

8、音響存儲在只讀存儲器(ROM)中,在產(chǎn)生MIDI音樂時再從存儲的波表中找出進行合成,這樣還原的聲音質(zhì)量非常高,所產(chǎn)生的音響效果自然比FM合MICLine OUTLine INSpeaker圖2-2-1 聲卡與音源連接示意圖MIDI聲音卡的選擇:聲音卡作為多媒體計算機的主要組件,正確的選購聲音卡可以達到預(yù)期的音響效果。下面介紹聲音卡的選擇時,應(yīng)注意和考慮的幾個問題:1、支持的聲道數(shù)(4有無內(nèi)置混音芯片、功放及3D聲音效果卡中有內(nèi)置混音芯片可完成對各種聲音進行混合與音量調(diào)節(jié),具有功率放大器才可以在無源音箱中放音。具有3D聲音效果的聲音卡更能表現(xiàn)真實的聲音效果。3D定位系統(tǒng)這里我們首先必須弄清兩個容

9、易混淆的概念-3D音頻API和HRTF算法。API其實就是3D定位標(biāo)準(zhǔn),而HRTF就是實現(xiàn)這種定位的算法。目前主流的3D音頻API有3個-微軟的DS3D、創(chuàng)新的EAX和傲瑞的A3D。而我們在選購聲卡時更應(yīng)該注重HRTF算法,因為實際的3D定位是通過聲卡芯片采用的HRTF算法實現(xiàn)的,定位效果也是由HRTF算法決定的。諸如Aureal和Creative這樣的大公司,他們既能夠開發(fā)出強大指令集規(guī)范,同時也可以開發(fā)出先進的HRTF算法并集成在自己的芯片中。(5配備的軟件聲音卡若要發(fā)揮其功能,隨卡配備的應(yīng)用軟件是非常重要的。一塊聲音卡功能再強,如果缺乏相應(yīng)的軟件,很難發(fā)揮其特長。聲音卡一般都有隨卡軟件,

10、這些軟件至少包括錄音和編輯程序包,MIDI播放軟件、調(diào)音臺(混音器)等。高檔聲音卡還應(yīng)配有特殊效果播放器、文字閱讀和語言識別等軟件。購買時,將聲音卡和隨卡軟件在微機上進行實際測試。(6有無數(shù)字信號處理器功能聲音卡提供數(shù)字信號處理器功能用來處理聲音合成、特殊效果和音頻文件的壓縮與解壓縮。這樣數(shù)字信號處理器DSP就可以代替CPU的工作,使復(fù)雜的音頻功能得以執(zhí)行。如果聲音卡沒有提供DSP功能,那么,就要由CPU來執(zhí)行這些音頻處理功能,則系統(tǒng)性能將直線下降;。DPS可幫助用戶對聲音卡進行升級,延長聲音卡的生命期。SoundBlaster16withAdvancedSignalProcessing聲霸卡

11、就提供了這一功能,卡上有DPS相對價格也高一些。AC-97標(biāo)準(zhǔn)簡介:全稱Audio Codec,是INTEL和微軟這電腦界兩大強手聯(lián)合制訂的針對聲卡的規(guī)范,要求聲卡上的數(shù)、模D/A與A/D轉(zhuǎn)換部分、混音部分和數(shù)字音效芯片分離,由單獨的芯片完成以達到良好的信噪比,此芯片的正式名稱是CODEC,(coder - decoder),編碼/解碼器。按照規(guī)定,聲卡的SNR值必須80dB,F(xiàn)R在3dB之間, THD + N值至少要高于60dB才算合格。SNR:(signal to noise ratio信噪比,也就是聲卡抑制噪音的能力,單位是分貝dB,decibei);聲卡處理的是我們有用的音頻信號,而噪

12、音是不希望出現(xiàn)的音頻信號,如背景的靜電噪音,工作時電流的噪音等等,應(yīng)該盡可能的減少這些噪音的產(chǎn)生,在正常工作狀態(tài),沒有出現(xiàn)飽失真和與截止的情況下,有用信號的功率和噪音信號功率的比值就是SNR,SNR的值越高說明聲卡的濾波性能越好,聲音聽起來也就越清澈。 視頻卡概述視頻信號連續(xù)換成計算機存儲的數(shù)字視頻信號離散保存在計算機中或在VGA顯示器上顯示。通??赏瓿蓪⑼獠恳曨l輸入信號疊加在顯示器上畫面可做到滿屏而流暢和將視頻輸入信號變換成計算機可存儲的信息保存在硬盤中視頻轉(zhuǎn)換卡基本原理視頻轉(zhuǎn)換卡可將視頻圖像PAL制式或NTSC制式的模擬信號經(jīng)過AD(模數(shù))轉(zhuǎn)換成數(shù)字化的混合視頻信號,再經(jīng)過解碼變成色亮度Y

13、和藍、紅色差信號UV),最后通過顏色空間變換,將YUA信號轉(zhuǎn)換成RGB紅綠藍數(shù)字信號,而RGB數(shù)字信號經(jīng)過視頻轉(zhuǎn)換卡的一系列操作處理如縮放裁減等后,存放在幀緩存中FrameBuffer)。RGB數(shù)字信號可經(jīng)過VGA顯示卡的DA數(shù)模轉(zhuǎn)換成模擬信號顯示在屏幕上。視頻轉(zhuǎn)換卡疊加視頻信號的方式l Colorkey方式。在VGA中定義某種顏色對視頻圖像透明,視頻卡在將疊加信號輸出時,與VGA的顏色進行比較,若VGA中某一顯示位置為所定義的顏色,則該位置顯示相應(yīng)視頻信號的顏色,否則顯示原來VGA的顏色。l 窗口方式(WINDOWS),在VGA中按坐標(biāo)設(shè)定一個窗口作為顯示視頻信號的區(qū)域,其余仍為VGA顯示區(qū)

14、AGPAccelerated Graphics Port,圖形加速端口),是Intel公司推出的新一代圖形顯示卡專用總線,它將顯示卡同主板芯片組直接相連,進行點對點傳輸,大幅提高了電腦對3D圖形的顯示能力,也將原先占用的大量PCI帶寬資源留給了其它PCI插卡。在AGP插槽上的AGP顯示卡,其視頻信號的傳送速率可以從PCI總線的133MB/s提高533MB/s。AGP的工作頻率為66.6MHz,是現(xiàn)行PCI總線的一倍,最高可以提高到133MHz或更高,傳送速率則會達到1GB/s以上。AGP速度之分AGP總線依據(jù)當(dāng)初AGP 1.0規(guī)格的制定而分為1X/2X。后來隨著AGP 2.0規(guī)格的確定而出現(xiàn)了

15、4X模式。先來看PCI總線,PCI的工作頻率為33MHz,數(shù)據(jù)寬度是32bit,所以傳輸頻寬的尖峰值是133MB/s。1X模式的AGP則是提高原本PCI的工作頻率至66MHz,使得其傳輸頻寬的尖峰理論值變成兩倍:266MB/s。而2X模式的AGP其工作頻率和1X模式一樣是維持在66MHz,只不過其利用正負緣Rising and Falling Edges觸發(fā)的方式,也就是一個頻率周期觸發(fā)兩次,使得傳輸頻寬再次加倍,成為532MB/s。至于AGP 4X模式,其clock timing的模型相似于2X模式,不過每個頻率周期所能傳輸?shù)臄?shù)據(jù)寬度變?yōu)?6個字節(jié),使得其最高傳輸頻寬的理論值達到1GB/s以

16、上。目前市面上的最新主板,只要是支持AGP 4X的芯片組如Intel i820、VIA 694X),板子上都采用Universal AGP Socket,這種AGP插槽是for 4X模式的,不過由于有回溯兼容的特性,所以1X/2X/4X的顯卡皆通用;而對于稍早不支持AGP 4X的主板,上面的AGP插槽則是for AGP 2X的,只能向下兼容至1X的顯卡。不過需注意的是,把AGP 4X的顯卡插在2X的槽上,并非不能動作,只不過是會以2X模式來工作。AGP 2X與4X的插槽不同,2X插槽內(nèi)有一個隔板,而4X的則沒有;另外,2X與4X顯卡金手指部分的缺口notch數(shù)也不同,雖然彼此可以混插,但如此設(shè)

17、計可以方便識別。AGP加速卡上的芯片集能夠提供的圖形函數(shù)計算能力,這個芯片集通常也稱為加速器或圖形處理器。一般來說在芯片集的內(nèi)部會有有一個時鐘發(fā)生器、VGA核心和硬件加速函數(shù),。芯片集可以通過它們的數(shù)據(jù)傳輸帶寬來劃分,最近的芯片多為64位或128位,而早期的顯卡芯片為32位或16位。更多的帶寬可以使芯片在一個時鐘周期中處理更多的信息。做為顯示卡的重要組成部分,顯存也一直隨著加速芯片的發(fā)展而逐步改變著。從早期的DRAM到現(xiàn)在廣泛流行的SDRAM,顯存的速度以及它對3D加速卡性能的影響也越來越大。顯存也被乘為幀緩存,通常它是用來存儲顯示芯片(組)所處理的數(shù)據(jù)信息。當(dāng)顯示芯片處理完數(shù)據(jù)后會將數(shù)據(jù)輸送

18、到顯存中,然后RAMDAC從顯存中讀取數(shù)據(jù)并將數(shù)字信號轉(zhuǎn)換為模擬信號,最后將信號輸出到顯示屏。所以顯存的速度以及帶寬直接影響著一塊加速卡的速度,如果你的3D加速卡有一顆強勁的“芯”,但是板載顯存卻無法將處理過的數(shù)據(jù)即時傳送,那么你就無法得到滿意的顯示效果。CDROM的格式標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)表示CD光盤上數(shù)據(jù)組織所采用的國際標(biāo)準(zhǔn)方式,一般CDROM驅(qū)動器不僅支持CDROM標(biāo)準(zhǔn),還可能支持其它標(biāo)準(zhǔn)。常見的CD光盤標(biāo)準(zhǔn)有:l CDDA標(biāo)準(zhǔn)。CDDA(DigitalAudio)標(biāo)準(zhǔn)也稱之為AudioCD標(biāo)準(zhǔn),或RebBook標(biāo)準(zhǔn),是最早的CDROM標(biāo)準(zhǔn)。是為激光數(shù)字音頻而制定的格式,即人們常說的CD音盤,主

19、要存儲歌曲和音樂制品。l CDROM標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)是從CDDA發(fā)展而來,用于存儲計算機數(shù)據(jù)。該標(biāo)準(zhǔn)亦稱為YellowBook標(biāo)準(zhǔn)。l CDI標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)亦稱GreenBook標(biāo)準(zhǔn),與前面二種標(biāo)準(zhǔn)不兼容。CDI標(biāo)準(zhǔn)用于存放采用從PEG壓縮算法獲得的立體聲視頻信號。國外大多數(shù)影視產(chǎn)品均以該標(biāo)準(zhǔn)制作發(fā)行。l CDROMXA(ExpandedArchitecture)規(guī)范。該標(biāo)準(zhǔn)與CDI標(biāo)準(zhǔn)兼容,是一種擴展的音頻、文本和圖形的混合格式。l CDR標(biāo)準(zhǔn)。CDR(Recordable)光盤又稱“金盤”,該盤由CD刻錄機刻制出來,提供給生產(chǎn)廠家用來大批量生產(chǎn)CD盤光。CD-ROM的數(shù)據(jù)傳輸率數(shù)據(jù)傳輸率表示單位

20、時間內(nèi)CDROM驅(qū)動器可從CD盤上讀取的數(shù)據(jù)量。按數(shù)據(jù)傳輸率可將CDROM驅(qū)動器分為單倍速(150KB秒)、雙倍速300(KB秒)、三倍速(450KB秒)、四倍速(600KB秒)、六倍速(900KB秒)、八倍速(1200KB秒)、十倍速(1500KB秒)。l 單倍速是CD唱片的標(biāo)準(zhǔn)速度,要想播放視頻信號,則需要雙速以上的CDROM驅(qū)動器。驅(qū)動器的速度越高,其價格越高。l 多數(shù)多媒體軟件按雙速標(biāo)準(zhǔn)MPCLEVEL2制造,如CDI,VCD影視產(chǎn)品,無論驅(qū)動器的速度有多高,讀盤時速降為雙速。在選擇時,根據(jù)購買力和具體情況選購。購買能力強的可選四、六速或八速,甚至十速CDROM驅(qū)動器,以滿足今后發(fā)展的

21、需要。術(shù)發(fā)展的需求,推薦使用6001200DPI的掃描儀。感光元件是掃描圖像的拾取設(shè)備,相當(dāng)于人的眼球,其重要性不言而喻,目前掃描儀所使用的感光器件有三種:光電倍增管,電荷偶合器CCD),接觸式感光器件CIS或LIDE)。感光元件接觸式感光元件,又稱CIS技術(shù)就性能而言,接觸式感光器件存在著嚴重的先天不足,首先由于不能使用鏡頭,只能貼近稿件掃描,其實際清晰度遠遠達不到標(biāo)稱指標(biāo),而且沒有景深,不能掃描立體物體。另外,硫化鎘光敏電阻本身漏電很大,各感光單元之間干擾嚴重,進一步降低了清晰度。而且由于無法實現(xiàn)同時制造三條平行的感光單元同時實現(xiàn)三色掃描,接觸式感光器件使用LED發(fā)光二極管陣列作為光源,這

22、種光源無論在光色還是在光線的均勻度上都是比較差的,同時由于LED陣列是由數(shù)百個發(fā)光二極管組成,一旦有一個損壞就意味著整個陣列的報廢,因此這種產(chǎn)品的壽命比較短。但是這類掃描儀具有體積小、重量輕、器件少和抗震性較高的優(yōu)點,而且生產(chǎn)成本很低,市場上能夠見到的1000元甚至1500元以下的6001200DPI掃描儀幾乎都是采用CIS作感光元件的 上面提到的模型可以統(tǒng)稱為“統(tǒng)計模型”,因為他們都是基于對每個字符出現(xiàn)次數(shù)的統(tǒng)計得到字符概率的。另一大類模型叫做“字典模型”。實際上,當(dāng)我們在生活中提到“工行這個詞的時候,我們都知道其意思是指“中國工商銀行”,類似的例子還有不少,但共同的前提是我們心中都有一本約

23、定俗成的縮寫字典。字典模型也是如此,他并不直接計算字符出現(xiàn)的概率,而是使用一本字典,隨著輸入信息的讀入,模型找出輸入信息在字典中匹配的最長的字符串,然后輸出該字符串在字典中的索引信息。匹配越長,壓縮效果越好。事實上,字典模型本質(zhì)上仍然是基于對字符概率的計算的,只不過,字典模型使用整個字符串的匹配代替了對某一字符重復(fù)次數(shù)的統(tǒng)計??梢宰C明,字典模型得到的壓縮效果仍然無法突破熵的極限。當(dāng)然,對通用的壓縮程序來說,保存一本大字典所需的空間仍然是無法讓人忍受的,況且,任何一本預(yù)先定義的字典都無法適應(yīng)不同文件中數(shù)據(jù)的變化情況。對了,字典模型也有相應(yīng)的“自適應(yīng)方案。我們可以隨著信息的不斷輸入,從已經(jīng)輸入的信

24、息中建立合適的字典,并不斷更新這本字典,以適應(yīng)數(shù)據(jù)的不斷變化。編碼編碼通過模型,我們已經(jīng)確定了對某一個符號該用多少位二進制數(shù)進行編碼?,F(xiàn)在的問題是通過模型,我們已經(jīng)確定了對某一個符號該用多少位二進制數(shù)進行編碼?,F(xiàn)在的問題是,如何設(shè)計一種編碼方案,使其盡量精確地用模型計算出來的位數(shù)表示某個符號。,如何設(shè)計一種編碼方案,使其盡量精確地用模型計算出來的位數(shù)表示某個符號。最先被考慮的問題是,如果對最先被考慮的問題是,如果對 a 用用 3 個二進制位就可以表示,而對個二進制位就可以表示,而對 b 用用 4 個二進制位就個二進制位就可以表示,那么,在解碼時,面對一連串的二進制流,我怎么知道哪三個位是可以表

25、示,那么,在解碼時,面對一連串的二進制流,我怎么知道哪三個位是 a,哪四個,哪四個位是位是 b 呢?所以,必須設(shè)計出一種編碼方式,使得解碼程序可以方便地分離每個字符的呢?所以,必須設(shè)計出一種編碼方式,使得解碼程序可以方便地分離每個字符的編碼部分。于是有了一種叫編碼部分。于是有了一種叫“前綴編碼的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個字符的前綴編碼的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個字符的編碼,都不是另一個字符編碼的前綴。反過來說就是,任何一個字符的編碼,都不是由編碼,都不是另一個字符編碼的前綴。反過來說就是,任何一個字符的編碼,都不是由另一個字符的編碼加上若干位另一個字符的編碼加上若干位 0 或或

26、 1 組成??匆幌虑熬Y編碼的一個最簡單的例子:組成??匆幌虑熬Y編碼的一個最簡單的例子:符號 編碼 A 0 B 10 C 110 D 1110 E 11110 有了上面的碼表,你一定可以輕松地從下面這串二進制流中分辨出真正的信息內(nèi)容了:1110010101110110111100010 - DABBDCEAAB1) 將給定符號按照其頻率從大到小排序。對上面的例子,應(yīng)該得到: a - 16 b - 7 c - 6 d - 6 e - 5 2) 將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有: a - 16 b - 7- c - 6 d - 6 e - 5 3) 我們把第二步中

27、劃分出的上部作為二叉樹的左子樹,記 0,下部作為二叉樹的右子樹,記 1。4) 分別對左右子樹重復(fù) 2 3 兩步,直到所有的符號都成為二叉樹的樹葉為止?,F(xiàn)在我們有如下的二叉樹: 根(root) 0 | 1 +-+-+ 0 | 1 0 | 1 +-+-+ +-+-+ | | | | a b c | 0 | 1 +-+-+ | | d e Huffman Huffman 編碼編碼Huffman Huffman 編碼構(gòu)造二叉樹的方法和編碼構(gòu)造二叉樹的方法和 Shannon-Fano Shannon-Fano 正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹。如今,我們?nèi)匀皇褂蒙险孟喾?,不是自上而?/p>

28、,而是從樹葉到樹根生成二叉樹。如今,我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí)面的例子來學(xué)習(xí) Huffman Huffman 編碼方法。編碼方法。1) 1) 將各個符號及其出現(xiàn)頻率分別作為不同的小二叉樹目前每棵樹只有根節(jié)點)。將各個符號及其出現(xiàn)頻率分別作為不同的小二叉樹目前每棵樹只有根節(jié)點)。 a(16) b(7) c(6) d(6) e(5) 2) 在 1 中得到的樹林里找出頻率值最小的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對上面的例子,我們得到一個新的樹林: | (11) a(16) b(7) c(6) +-+-+ | | d e 3) 對上面得到

29、的樹林重復(fù) 2 的做法,直到所有符號都連入樹中為止。這一步完成后,我們有這樣的二叉樹: 根(root) 0 | 1 +-+-+ | 0 | 1 | +-+-+ | 0 | 1 0 | 1 a +-+-+ +-+-+ | | | | b c d e 由此,我們可以建立和 Shannon-Fano 編碼略微不同的編碼表: a - 0 b - 100 c - 101 d - 110 e - 111 對例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101 0 100 101 111 110 111 0 101 0 101 . 碼長共 88 位。這比

30、使用 Shannon-Fano 編碼要更短一點。讓我們回顧一下熵的知識,使用我們在第二章學(xué)到的計算方法,上面的例子中,每個字符的熵為:Ea = - log2(16 / 40) = 1.322 Eb = - log2( 7 / 40) = 2.515 Ec = - log2( 6 / 40) = 2.737 Ed = - log2( 6 / 40) = 2.737 Ee = - log2( 5 / 40) = 3.000 信息的熵為:E = Ea * 16 + Eb * 7 + Ec * 6 + Ed * 6 + Ee * 5 = 86.601也就是說,表示該條信息最少需要 86.601 位。我

31、們看到,Shannon-Fano 編碼和 Huffman 編碼都已經(jīng)比較接近該信息的熵值了。1、基于音頻數(shù)據(jù)的統(tǒng)計特性進行編碼2、基于音頻的聲學(xué)參數(shù),進行參數(shù)編碼3、基于人的聽覺特性進行編碼聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:聲音質(zhì)量帶寬方式比特率壓縮比率2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD15kHz立體聲112-128kbps14-12:1MPEG是運動圖象專家組Moving Pictur

32、es Experts Group的英文縮寫。這個專家組是由國際標(biāo)準(zhǔn)化組織ISO (International Standards Organization)與國際電子委員會IEC于1988年聯(lián)合成立的,致力于運動圖像及其伴音編碼的標(biāo)準(zhǔn)化工作,其成員均為視頻、音頻及系統(tǒng)領(lǐng)域的技術(shù)專家。MPEG制訂過三種版本的運動圖像及其伴音的編碼標(biāo)準(zhǔn),即MPEG1、MPEG2和MPEG3。2019年又推出了兩種新的圖像壓縮編碼標(biāo)準(zhǔn),這就是MPEG4和MPEG7MPEG與其它算法或壓縮方案相比有什么優(yōu)點?一、 國際化的開放標(biāo)準(zhǔn),兼容性好,代表技術(shù)發(fā)展趨勢。二、 能夠比其他算法提供更好的壓縮比。三、MPEG在提供高

33、壓縮比的同時,對數(shù)據(jù)的損失很小。圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4 MPEG2MPEG1MJPEG特點兼容前幾種標(biāo)準(zhǔn),采用更為優(yōu)化的編碼技術(shù),基于場景描述和面向帶寬設(shè)計基于幀重建算法進行壓縮和傳輸,動態(tài)監(jiān)測圖像變化,根據(jù)對象的空間及時間特征來調(diào)整壓縮方法,幀間加入預(yù)測幀單獨對一幀進行壓縮,基本不考慮視頻流中不同幀之間的變化優(yōu)點圖像質(zhì)量好; 可變帶寬傳輸; 錯誤恢復(fù)能力強。壓縮比可調(diào)范圍廣,支持包括高速體育運動在內(nèi)的活動圖像在實時壓縮、每幀數(shù)據(jù)量和處理速度上優(yōu)于MJPEG圖像質(zhì)量好缺陷無現(xiàn)成算法,實現(xiàn)的技術(shù)難度大 壓縮效率仍不理想、窄帶網(wǎng)傳輸質(zhì)量受限,對媒體的兼容能力有待提高圖像質(zhì)量相當(dāng)于VH

34、S視頻,不能滿足廣播級的要求;傳輸帶寬有一定的要求。實時性差,壓縮效率低, 文件量巨大應(yīng)用領(lǐng)域固定和無線網(wǎng)絡(luò),交互AV服務(wù)以及遠程傳輸DVD, 廣播級的數(shù)字電視, HDTVVCD, CD-ROM, VOD分辨率768X576PAL) 或720X480(NTSC)NTSC: 720X480SIF標(biāo)準(zhǔn)分辨率(NTSC:352X240;PAL: 352X288) 碼流多種帶寬可調(diào) 分 四 級 , 3 -100Mbits/sec最高1.5Mbits/sec圖像質(zhì)量在各種碼率下畫質(zhì)良好極低碼率下無法保證圖像質(zhì)量基本無法進行窄帶傳輸多路實時存儲多路實時存儲,占用存儲空間小能實現(xiàn)多路實時存儲,文件量大,消耗

35、硬盤。能實現(xiàn)多路實時存儲,文件量大,消耗硬盤。單路存儲,丟幀切換聯(lián)網(wǎng)要求全帶寬解決方案, 支 持 P S T N ,ISDN,DDN,局域網(wǎng),廣域網(wǎng)等適用于局域網(wǎng)適用于局域網(wǎng)定制帶寬,不支持聯(lián)網(wǎng)。五、多媒體教學(xué)軟件的素材類型二、聲音類素材在多媒體教學(xué)軟件中,朗誦、講解、背景音樂、效果聲等,都是聲音類素材或稱音頻類素材。按照文件格式的不同,可以將聲音分為WAV格式的聲音文件、MIDI格式的聲音文件和MP3格式的聲音文件等。1常用的聲音文件格式(1WAV格式WAV格式的聲音是波形聲音的一種,它是Windows操作系統(tǒng)中的標(biāo)準(zhǔn)數(shù)字音頻,它能直接保存聲音的采樣數(shù)據(jù),可以用來不失真地重現(xiàn)噪聲、音樂聲包括

36、立體聲、單聲等各種聲音信息。由于WAV格式的聲音文件是未經(jīng)壓縮的聲音文件,其主要缺點是占據(jù)的存儲空間較大。所以,在制作對聲音質(zhì)量要求不是特別高的多媒體教學(xué)軟件中,不主張用WAV格式來保存聲音文件。(2MIDI格式MIDI是指電子樂器的數(shù)字化接口,MIDI格式中的數(shù)據(jù)是以數(shù)值形式存儲的命令。它將樂器彈奏的每個音符表示為一串?dāng)?shù)字,用這組數(shù)字代表音符的聲調(diào)、力度、長短等。應(yīng)用MIDI格式的聲音文件時,是通過聲卡上的合成器將這組數(shù)字進行合成,并通過揚聲器輸出。與WAV格式的聲音文件相比,MIDI格式的聲音文件占用的存儲空間要小得多。一般情況下,同樣一段聲音,用MIDI格式進行存儲所占用的存儲空間,大約

37、是用WAV格式存儲時所占存儲空間的1/500。但是,MIDI格式的主要缺陷是表達能力有限,無法重現(xiàn)原始自然聲,而且MIDI格式的聲音文件在回放時聲音質(zhì)量也受到聲卡性能的限制。此外,MIDI格式的文件只能記錄有限的集中樂器演奏的組合聲音,許多中國民族樂器的樂聲就不能用MIDI格式記錄。但總的來說,占用存儲空間不多的MIDI格式聲音文件在多媒體教學(xué)軟件中仍然有非常廣泛的應(yīng)用。(3MP3格式MP3格式是采用MPEG技術(shù)將WAV聲音數(shù)據(jù)進行特殊的數(shù)據(jù)壓縮后產(chǎn)生的一種聲音文件格式。其特點是占據(jù)的存儲空間小、質(zhì)量高、制作和播放簡單。因此,用MP3格式存儲的聲音文件在多媒體計算機系統(tǒng)和因特網(wǎng)上都得到了廣泛應(yīng)

38、用,現(xiàn)在大量的電腦音樂都以MP3格式出現(xiàn)。(4WMA格式WMA是Windows Media Audio的縮寫,WMA格式是微軟新發(fā)布的一種音頻壓縮格式,所占據(jù)的存儲空間比MP3格式的文件還小,并且支持Stream流技術(shù)。WMA格式可以將一首歌曲壓縮得很小,并且保持很高的音質(zhì)。(5RA格式RA全稱是Real Audio,RA格式的文件目前在互聯(lián)網(wǎng)上非常流行。目前,很多音樂網(wǎng)站和網(wǎng)絡(luò)廣播都使用RA格式,RA格式支持流技術(shù),但壓縮率和音質(zhì)都非常一般。(6CD唱片CD唱片存放的也是一種數(shù)字化聲音,是以16位采樣精度,44.1KHz采樣頻率的立體聲進行存儲,可較好地實現(xiàn)對原始聲音的重現(xiàn),它是幾種聲音格式

39、中效果最好的,其缺點是占用的存儲空間較大。2常用的聲音處理軟件在制作多媒體教學(xué)軟件時,通常利用計算機上的聲卡及其配套軟件來完成聲音的錄制、編輯和播放??梢酝ㄟ^錄音機把聲音錄在磁帶上,然后通過聲卡錄入到計算機中,也可以直接通過聲卡錄入到計算機內(nèi)。聲音錄制好后,編輯人員可以通過專門的制作軟件,對聲音進行剪輯、加工。在加工處理過程中甚至可以輕而易舉地把渾厚的男聲變成尖利的女聲,稚嫩的童音變成沙啞的老人聲。在各種聲音編輯軟件中,Windows系統(tǒng)自帶的“錄音機可以用來完成功能簡單的聲音編輯,豪杰超級解霸也有較簡單的聲音處理功能。實際上,我們常用的專門編輯聲音的軟件有WaveEdit、SoundEdit

40、、AudioView等,其中WaveEdit是一個值得推崇的聲音編輯工具軟件。在本書中主要介紹豪杰超級解霸和WaveEdit的使用。(1位圖文件的格式位圖是以點或像素的方式來記錄圖像。位圖圖像的優(yōu)點是色彩顯示自然、柔和、逼真。其缺點是圖像在放大或縮小的轉(zhuǎn)換過程中會產(chǎn)生一些失真,并且隨著圖像精度提高或尺寸增大,所占用的存儲空間也會急劇增加。BMP格式BMP格式是Windows使用的基本圖像格式之一,它是位圖文件的一種格式,用一組數(shù)據(jù)2位至24位來表示一個像素的色彩。大多數(shù)圖形軟件都支持BMP格式,例如,Windows系統(tǒng)中自帶的圖像文件大多采用未經(jīng)壓縮的BMP格式,這種BMP格式的圖像文件往往占用較大的存儲空間,但優(yōu)點是不會丟失圖像的任何細節(jié),適合在對圖像質(zhì)量要求嚴格的情況下使用。GIF格式GIF格式的圖像文件包括三種格式,一種是靜態(tài)的GIF格式,它不支持生成動畫,另兩種是GIF89a格式和GIF87a格式,能夠支持動畫格式和透明效果。GIF格式是目前Internet上應(yīng)用最廣泛的圖像文件格式之一,主要用于不同平臺間圖像的交流與傳輸,它的文件壓縮率比較高,文件占用的存儲空間比較小,但僅能表達256色圖像。JPEG格式JPEG格式是目前比較流行的一種圖像格式。它采用了JPEG標(biāo)準(zhǔn)進行壓縮,因此文件占用的存儲空間小,而且可以通過降低壓縮比來獲得較高質(zhì)量的圖像,或反之,降低圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論