第章多媒體技術(shù)概論課件_第1頁
第章多媒體技術(shù)概論課件_第2頁
第章多媒體技術(shù)概論課件_第3頁
第章多媒體技術(shù)概論課件_第4頁
第章多媒體技術(shù)概論課件_第5頁
已閱讀5頁,還剩489頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第1章多媒體技術(shù)概論1.1多媒體的基本概念1.1.1媒體與多媒體1.媒體媒體又稱媒質(zhì)或媒介,它是信息表示、信息傳遞和信息存儲的載體。傳統(tǒng)的媒體,如報(bào)紙、雜志、廣播、電影和電視等,都是以各自的媒體形式進(jìn)行傳播。在計(jì)算機(jī)領(lǐng)域中,媒體有兩種含義:表示信息的載體和存儲信息的實(shí)體。如文本、音頻、圖形、圖像、動(dòng)畫和視頻等是用來表示信息的載體,而紙張、磁帶、磁盤、光盤和半導(dǎo)體存儲器等都是存儲信息的實(shí)體?,F(xiàn)代科技的發(fā)展大大方便了人們之間的交流和溝通,也給媒體賦予許多新的內(nèi)涵。根據(jù)國際電信聯(lián)盟電信標(biāo)準(zhǔn)局ITU-T(原國際電報(bào)電話咨詢委員會CCITT)建議的定義,媒體可分為下列五大類。第1章多媒體技術(shù)概論1(1)感覺媒體感覺媒體是指直接作用于人的感官,使人能直接產(chǎn)生感覺一類媒體,如視覺、聽覺、觸覺和味覺等。(2)表示媒體表示媒體是為了加工、處理和傳輸感覺媒體而人為構(gòu)造出來的一種媒體,如文字、音頻、圖形、圖像、動(dòng)畫和視頻等信息的數(shù)字化編碼表示。借助于表示媒體,可以很方便地將感覺媒體從一個(gè)地方傳輸?shù)搅硪粋€(gè)地方。(3)顯示媒體顯示媒體是指媒體傳輸中電信號與媒體之間轉(zhuǎn)換所用的一類媒體。它又分為兩種:一種是輸入顯示媒體,如鍵盤、鼠標(biāo)器、話筒和掃描儀等;另一種是輸出顯示媒體,如顯示器、打印機(jī)、音箱和投影儀等。(4)存儲媒體存儲媒體又稱存儲介質(zhì),用來存放表示媒體,以便計(jì)算機(jī)隨時(shí)調(diào)用和處理信息編碼,如磁盤、光盤和內(nèi)存等。(5)傳輸媒體傳輸媒體又稱傳輸介質(zhì),它是用來將媒體從一處傳送到另一處的物理載體,如雙絞線、同軸電纜、光纖和無線傳輸介質(zhì)等。(1)感覺媒體感覺媒體是指直接作用于人的感官,使人能直接產(chǎn)生22.多媒體通常,人們所指的多媒體就是表示媒體,即文本、音頻、圖形、圖像、動(dòng)畫和視頻等媒體信息。多媒體是融合兩種或者兩種以上表示媒體的一種人機(jī)交互式信息交流和傳播媒體,它是多種媒體信息的綜合。多媒體的實(shí)質(zhì)是將自然形式存在的各種媒體數(shù)字化,然后利用計(jì)算機(jī)對這些數(shù)字信息進(jìn)行加工或處理,以一種友好的方式提供給用戶使用。因此,多媒體是一個(gè)豐富多彩的感官世界,它能使人的眼睛、耳朵、手指,特別是大腦興奮起來。人類感知信息的第一個(gè)途徑是視覺,通過視覺可以從外部世界獲取80%左右的信息;其次是聽覺,通過聽覺可以從外部世界獲取10%左右的信息;第三個(gè)途徑是觸覺、嗅覺和味覺,它們合起來能獲取的信息量約占10%。目前,多媒體只利用了人的視覺和聽覺,虛擬現(xiàn)實(shí)中用到了觸覺(如數(shù)據(jù)手套、數(shù)據(jù)衣服等)和嗅覺(如電子鼻等),而味覺尚未集成進(jìn)來。隨著多媒體技術(shù)的進(jìn)步,多媒體的含義和范圍還將擴(kuò)展。2.多媒體通常,人們所指的多媒體就是表示媒體,即文本、音頻、31.1.2多媒體技術(shù)的主要特性多媒體技術(shù)至今無公認(rèn)統(tǒng)一的嚴(yán)格定義,但可以從其特點(diǎn)來進(jìn)行描述。多媒體技術(shù)是利用計(jì)算機(jī)把文本、圖形、圖像、音頻和視頻等多種信息一體化,使之建立邏輯連接,集成為一個(gè)具有交互性的系統(tǒng),并能對多種媒體信息進(jìn)行獲取、壓縮編碼、編輯、加工處理、存儲和展示。簡單地說,多媒體技術(shù)就是把聲、文、圖、像和計(jì)算機(jī)結(jié)合在一起的技術(shù)。實(shí)際上,多媒體技術(shù)是計(jì)算機(jī)技術(shù)、通信技術(shù)、音頻技術(shù)、視頻技術(shù)、圖像壓縮技術(shù)、文字處理技術(shù)等多種技術(shù)綜合的技術(shù)。由多媒體技術(shù)的定義可知,它具有如下幾個(gè)特性:1.信息媒體的多樣性人類對信息的接收主要依靠5種感覺,即視覺、聽覺、觸覺、嗅覺和味覺。其中前三者所獲取的信息量占95%以上。多媒體技術(shù)目前只提供了多維化信息空間中音頻和視頻信息的獲得和表示方法,它使得計(jì)算機(jī)中信息表達(dá)的方式不再局限于數(shù)字與文字,而廣泛采用圖像、圖形、視頻、音頻等信息形式,使我們的思維表達(dá)有了更充分更自由的擴(kuò)展空間。多媒體信息的多樣化不僅僅指輸入,而且還指輸出。對輸入信息進(jìn)行變換、組合和加工,就可以大大豐富信息的表現(xiàn)能力,實(shí)現(xiàn)有聲有色、生動(dòng)逼真的效果。2.實(shí)時(shí)性由于多媒體技術(shù)是研究多種媒體集成的技術(shù),其中聲音和活動(dòng)的視頻圖像都與時(shí)間有著密切的關(guān)系,這就決定了多媒體技術(shù)應(yīng)支持實(shí)時(shí)處理。如播放時(shí),聲音和圖像都不能有停頓的現(xiàn)象。1.1.2多媒體技術(shù)的主要特性43.交互性在多媒體系統(tǒng)中,不僅操作上可控制自如,而且在媒體綜合處理上也可隨心所欲,這種交互操作也要求多媒體具有實(shí)時(shí)性,對整個(gè)系統(tǒng)的軟硬件系統(tǒng)都能實(shí)時(shí)響應(yīng)。從數(shù)據(jù)庫中查找圖像、聲音及文字材料,這是初級交互應(yīng)用。不是被動(dòng)地接受文字、圖形、圖像和聲音,而是主動(dòng)地進(jìn)行檢索、提問和回答,這是中級交互應(yīng)用。而完全進(jìn)入到一個(gè)與信息環(huán)境一體化的虛擬信息空間中,則是高級交互應(yīng)用。4.集成性集成性包括兩方面,一方面是把不同媒體設(shè)備集成在一起,形成多媒體系統(tǒng);另一方面是多媒體技術(shù)能將各種不同的媒體信息有機(jī)地同步組合成為完整的多媒體信息。從硬件角度來說,應(yīng)當(dāng)具備能夠處理多媒體的高速并行處理機(jī)系統(tǒng),大容量的存儲設(shè)備,以及具備多媒體、多通道的輸入輸出處理能力的主機(jī)及外設(shè)和寬帶的通信網(wǎng)絡(luò)接口。從軟件角度來說,應(yīng)當(dāng)具有集成化的多媒體操作系統(tǒng),適合于多媒體信息管理和使用的軟件系統(tǒng)等。在網(wǎng)絡(luò)的支持下,集成構(gòu)造出支持廣泛應(yīng)用的的信息系統(tǒng)。5.高質(zhì)性早期處理音像信息時(shí),存儲和輸出的都是模擬信息。因模擬信號是連續(xù)的,其衰減和噪音干擾較大,且復(fù)制和傳播過程中存在誤差積累現(xiàn)象,所以這種模擬信號質(zhì)量差。而以計(jì)算機(jī)處理的多媒體則以全數(shù)字化方式加工和處理聲音與圖像信息,精確度高,特別是復(fù)制和傳播過程中不會有改變,聲音和圖像質(zhì)量好。3.交互性在多媒體系統(tǒng)中,不僅操作上可控制自如,而且在媒體綜51.1.3多媒體系統(tǒng)的分類多媒體系統(tǒng)可按其功能不同和應(yīng)用不同進(jìn)行分類。1.多媒體系統(tǒng)基于功能的分類多媒體系統(tǒng)按其功能不同可分為開發(fā)系統(tǒng)、培訓(xùn)系統(tǒng)、演示系統(tǒng)、家庭系統(tǒng)等。(1)開發(fā)系統(tǒng)主要用于多媒體應(yīng)用的開發(fā),因此系統(tǒng)配有功能強(qiáng)大的計(jì)算機(jī)系統(tǒng)和聲、文、圖等信息齊全的外部設(shè)備及多媒體演示工具,主要應(yīng)用于多媒體應(yīng)用制作。非線性編輯等,如視頻、音頻制作系統(tǒng)。(2)培訓(xùn)系統(tǒng)單用戶多媒體播放系統(tǒng),以計(jì)算機(jī)為基礎(chǔ),配有光驅(qū)、聲卡、音響與圖像接口控制卡以及相應(yīng)的外設(shè)。常用于小型商業(yè)銷售和教育培訓(xùn)等。(3)演示系統(tǒng)它是增強(qiáng)型的演示窗口,可完成多媒體的應(yīng)用,并與網(wǎng)絡(luò)連接。主要用于單位多媒體教學(xué)和會議演示等。(4)家庭系統(tǒng)家庭多媒體播放系統(tǒng)、通常配有光驅(qū),可作為家庭影院等。1.1.3多媒體系統(tǒng)的分類62.多媒體系統(tǒng)基于應(yīng)用的分類多媒體按其應(yīng)用不同可分為:多媒體信息咨詢系統(tǒng)、多媒體管理系統(tǒng)、多媒體輔助教學(xué)系統(tǒng)、多媒體通信系統(tǒng)和多媒體娛樂系統(tǒng)等。(1)多媒體信息咨詢系統(tǒng)圖書資料檢索系統(tǒng)、交通樞紐信息咨詢系統(tǒng)、證券交易咨詢系統(tǒng)、旅游咨詢系統(tǒng)、房地產(chǎn)交易咨詢系統(tǒng)、酒店信息咨詢系統(tǒng)、多媒體產(chǎn)品廣告系統(tǒng)等。(2)多媒體管理系統(tǒng)檔案管理系統(tǒng)、超級市場管理系統(tǒng)、名片管理系統(tǒng)等。(3)多媒體輔助教學(xué)系統(tǒng)課件、電子教材、多媒體學(xué)習(xí)軟件等。(4)多媒體通信系統(tǒng)可視電話、視頻會議系統(tǒng)等。(5)多媒體娛樂系統(tǒng)電腦卡拉OK系統(tǒng)、視頻VOD系統(tǒng)、網(wǎng)絡(luò)游戲等。多媒體技術(shù)的發(fā)展為人類實(shí)現(xiàn)以自然的方式來傳遞各種信息和進(jìn)行人機(jī)交互提供了平臺,使得人們擺脫了那些靜止的、固定不變的應(yīng)用程序和設(shè)備,進(jìn)入可以表現(xiàn)才能、實(shí)現(xiàn)人機(jī)交互的多媒體境界,開創(chuàng)了計(jì)算機(jī)應(yīng)用的新紀(jì)元。2.多媒體系統(tǒng)基于應(yīng)用的分類多媒體按其應(yīng)用不同可分為:多媒體71.1.4媒體系統(tǒng)的層次結(jié)構(gòu)多媒體系統(tǒng)的層次結(jié)構(gòu)如圖1-1所示,該結(jié)構(gòu)與常用的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)原則上是相通的,它主要包括以下幾層:圖1-1多媒體系統(tǒng)的層次結(jié)構(gòu)第一層(最底層)是多媒體硬件系統(tǒng),它是多媒體系統(tǒng)的硬件設(shè)備。除了一般PC機(jī)的硬件外,還有各種媒體控制板卡及其輸入輸出設(shè)備,其中包括多媒體實(shí)時(shí)壓縮和解壓縮卡。由于實(shí)時(shí)性要求高,有些板卡使用以專用集成電路為核心的硬件來實(shí)現(xiàn)。第二層是多媒體驅(qū)動(dòng)程序,它是直接用來控制和管理多媒體硬件,完成設(shè)備的初始化、設(shè)備的啟動(dòng)和停止、設(shè)備的各種操作,基于硬件的壓縮/解壓縮、圖像快速變換以及功能調(diào)用等。一種多媒體硬件需要相應(yīng)的驅(qū)動(dòng)程序,它通常隨著多媒體硬件產(chǎn)品一起提供。第三層是多媒體操作系統(tǒng),又稱多媒體核心系統(tǒng)。它除了一般操作系統(tǒng)的功能外,還具有實(shí)時(shí)任務(wù)調(diào)度、多媒體數(shù)據(jù)轉(zhuǎn)換和同步控制機(jī)制、對多媒體設(shè)備的驅(qū)動(dòng)和控制以及具有圖形和聲像功能的用戶接口等。根據(jù)多媒體系統(tǒng)的用途,多媒體操作系統(tǒng)的設(shè)計(jì)方法有兩種:1.1.4媒體系統(tǒng)的層次結(jié)構(gòu)81.2多媒體的關(guān)鍵技術(shù)在開發(fā)多媒體應(yīng)用系統(tǒng)中,要使多媒體系統(tǒng)能交互地綜合處理和傳輸數(shù)字化的聲音、文字、圖像信息,實(shí)現(xiàn)面向三維圖形、立體聲音、彩色全屏幕運(yùn)動(dòng)畫面的技術(shù)處理和傳播的效果,它的關(guān)鍵技術(shù)是要進(jìn)行數(shù)據(jù)壓縮/解壓縮、生產(chǎn)專用芯片、解決大容量信息存儲等問題。1.2多媒體的關(guān)鍵技術(shù)91.2.1視頻音頻數(shù)據(jù)壓縮/解壓縮技術(shù)研制多媒體計(jì)算機(jī)需要解決的關(guān)鍵問題之一,是要使計(jì)算機(jī)能適時(shí)地綜合處理聲、文、圖信息。由于數(shù)字化的圖像、聲音等媒體數(shù)據(jù)量非常大,致使在微型計(jì)算機(jī)上實(shí)現(xiàn)多媒體應(yīng)用十分困難。例如,未經(jīng)壓縮的視頻圖像在處理時(shí)的數(shù)據(jù)量為每秒約28MB,播放一分鐘立體聲音樂也需要100MB存儲空間。視頻與音頻信號不僅需要較大的存儲空間,還要求傳輸速度快。因此,必須對多媒體信息進(jìn)行實(shí)時(shí)壓縮和解壓縮。如果不經(jīng)過數(shù)據(jù)壓縮,實(shí)時(shí)處理數(shù)字化的較長的聲音和多幀圖像信息所需要的存儲容量、傳輸率和計(jì)算速度,都是目前PC機(jī)難以達(dá)到的和不經(jīng)濟(jì)實(shí)用的。數(shù)據(jù)壓縮技術(shù)的發(fā)展大大推動(dòng)了多媒體技術(shù)的發(fā)展。目前的研究結(jié)果表明,選用合適的數(shù)據(jù)壓縮技術(shù),有可能將字符數(shù)據(jù)量壓縮到原來的1/2左右,語音數(shù)據(jù)量壓縮到原來的1/2~1/10,圖像數(shù)據(jù)量壓縮到原來的1/2~1/60。數(shù)據(jù)壓縮理論的研究已有40多年的歷史,技術(shù)日趨成熟。如今已有壓縮編碼和解壓縮編碼的國際標(biāo)準(zhǔn)JPEG和MPEG,并且已經(jīng)產(chǎn)生了各種各樣針對不同用途的壓縮算法、壓縮手段和實(shí)現(xiàn)這些算法的大規(guī)模集成電路及計(jì)算機(jī)軟件。1.2.1視頻音頻數(shù)據(jù)壓縮/解壓縮技術(shù)101.2.2多媒體專用芯片技術(shù)專用芯片是多媒體計(jì)算機(jī)硬件體系結(jié)構(gòu)的關(guān)鍵。因?yàn)橐獙?shí)現(xiàn)音頻、視頻信號的快速壓縮、解壓縮和播放處理,需要大量的快速計(jì)算。而實(shí)現(xiàn)圖像的許多特殊效果(如改變比例、淡入淡出、馬賽克等)、圖形的處理(圖形的生成和繪制等)、語音信號處理(抑制噪聲、濾波等等,也都需要較快的運(yùn)算和處理速度。因此只有采用專用芯片,才能獲得滿意的效果。多媒體計(jì)算機(jī)專用芯片可歸納為兩種類型:一種是固定功能的芯片,另一種是可編程的數(shù)字信號處理器(DSP)芯片。DSP芯片是為完成某種特定信號處理設(shè)計(jì)的,在通用機(jī)上需要多條指令才能完成的處理,在DSP上可用一條指令完成。最早出現(xiàn)的固定功能專用芯片是基于圖像處理的壓縮處理芯片,即將實(shí)現(xiàn)靜態(tài)圖像的數(shù)據(jù)壓縮/解壓縮算法做在一個(gè)芯片上,從而大大提高其處理速度。之后,許多半導(dǎo)體廠商或公司又推出了基于國際標(biāo)準(zhǔn)壓縮編碼的專用芯片,例如,支持用于運(yùn)動(dòng)圖像及其伴音壓縮的MPEG標(biāo)準(zhǔn)芯片,芯片的設(shè)計(jì)還充分考慮到MPEG標(biāo)準(zhǔn)的擴(kuò)充和修改。由于壓縮編碼的國際標(biāo)準(zhǔn)較多,一些廠家和公司還推出了多功能視頻壓縮芯片。另外還有高效可編程多媒體處理器,其計(jì)算能力可望達(dá)到2Bips(BillionInstructionsPerSecond)。這些高檔的專用多媒體處理器芯片,不僅大大提高了音頻、視頻信號處理速度,而且在音頻、視頻數(shù)據(jù)編碼時(shí)可增加特技效果。1.2.2多媒體專用芯片技術(shù)111.2.3大容量信息存儲技術(shù)多媒體的音頻、視頻、圖像等信息雖經(jīng)過壓縮處理,但仍然需要相當(dāng)大的存儲空間。而且硬盤存儲器的盤片是不可交換的,不能用于多媒體信息和軟件的發(fā)行。大容量只讀光盤存儲器(CD-ROM)的出現(xiàn),解決了多媒體信息存儲空間及交換問題。CD-ROM以其存儲量大、密度高、介質(zhì)可交換、數(shù)據(jù)保存壽命長、價(jià)格低廉以及應(yīng)用多樣化等特點(diǎn)成為多媒體計(jì)算機(jī)中必不可少的設(shè)備。利用數(shù)據(jù)壓縮技術(shù),在一張CD-ROM光盤上能夠存取70多分鐘的全運(yùn)動(dòng)的視頻圖像或者十幾個(gè)小時(shí)的語音信息或數(shù)千幅靜止圖像。CD-ROM光盤機(jī)技術(shù)已比較成熟,但速度慢,其只讀特點(diǎn)適合于需長久保存的資料。在CD-ROM基礎(chǔ)上,還開發(fā)了CD-I和CD-V,即具有活動(dòng)影像的全動(dòng)作與全屏電視圖像的交互式可視光盤。在只讀CD家族中還有稱為“小影碟”的VCD,可刻錄式光盤CD-R,高畫質(zhì)、高音質(zhì)的光盤DVD以及用數(shù)字方式把傳統(tǒng)照片轉(zhuǎn)存到光盤,使用戶在屏幕上可欣賞高清晰度的照片的PHOTOCD。DVD(DigitalVideoDisc)是1996年底推出的新一代光盤標(biāo)準(zhǔn),它使得基于計(jì)算機(jī)的數(shù)字視盤驅(qū)動(dòng)器將能從單個(gè)盤片上讀取4.7~17GB的數(shù)據(jù)量,而盤片的尺寸與CD相同。1.2.3大容量信息存儲技術(shù)121.2.4多媒體輸入/輸出技術(shù)多媒體輸入輸出技術(shù)包括媒體變換技術(shù)、媒體識別技術(shù)、媒體理解技術(shù)和綜合技術(shù)。媒體變換技術(shù)是指改變媒體的表現(xiàn)形式,如當(dāng)前廣泛使用的視頻卡、音頻卡(聲卡)都屬媒體變換設(shè)備。媒體識別技術(shù)是對信息進(jìn)行一對一的映像過程。例如,語音識別是將語音映像為字、詞或句子;觸摸屏是根據(jù)觸摸位置識別操作要求。媒體理解技術(shù)是對信息進(jìn)行更進(jìn)一步的分析處理,以理解信息的內(nèi)容,如自然語言理解、圖像理解、模式識別等技術(shù)。媒體綜合技術(shù)是把低維信息表示映像成高維模式空間的過程,例如,語音合成器就可以把語音的內(nèi)部表示綜合為聲音輸出。前兩種技術(shù)相對比較成熟,應(yīng)用較廣泛,而媒體理解和綜合技術(shù)目前還不成熟,只用在某些特定場合。1.2.4多媒體輸入/輸出技術(shù)131.2.5多媒體軟件技術(shù)多媒體軟件技術(shù)主要包括多媒體操作系統(tǒng)、多媒體素材采集與制作技術(shù)、多媒體編輯與創(chuàng)作技術(shù)、多媒體應(yīng)用程序開發(fā)技術(shù)、多媒體數(shù)據(jù)庫管理技術(shù)等。1.多媒體操作系統(tǒng)多媒體操作系統(tǒng)是多媒體軟件的核心。它負(fù)責(zé)多媒體環(huán)境下多任務(wù)的調(diào)度,保證音頻、視頻同步控制以及信息處理的實(shí)時(shí)性,提供多媒體信息的各種基本操作和管理,具有對設(shè)備的相對獨(dú)立性與可擴(kuò)展性。要求該操作系統(tǒng)要像處理文本、圖像文件一樣能方便靈活地處理動(dòng)態(tài)音頻和視頻;在控制功能上,要擴(kuò)展到對錄像機(jī)、音響、MIDI以及CD-ROM等設(shè)備的控制。多媒體操作系統(tǒng)要能處理多任務(wù),易于擴(kuò)充,要求數(shù)據(jù)存取與數(shù)據(jù)格式無關(guān),提供統(tǒng)一友好的用戶界面。為支持上述要求,一般是在現(xiàn)有操作系統(tǒng)上進(jìn)行擴(kuò)充。目前流行的操作系統(tǒng),如Windows、OS/2和Macintosh操作系統(tǒng)等都提供了對多媒體的支持。在我國,目前微機(jī)上開發(fā)多媒體軟件用得較多的是Windows操作系統(tǒng)。1.2.5多媒體軟件技術(shù)142.多媒體素材采集與制作技術(shù)素材的采集與制作主要包括采集并編輯多種媒體數(shù)據(jù),如聲音信號的錄制、編輯和播放,圖像掃描及預(yù)處理,全動(dòng)態(tài)視頻采集及編輯,動(dòng)畫生成編輯,音頻/視頻信號的混合與同步等。3.多媒體編輯與創(chuàng)作工具多媒體編輯創(chuàng)作軟件又稱多媒體創(chuàng)作工具,是多媒體專業(yè)人員在多媒體操作系統(tǒng)之上開發(fā)的,供應(yīng)用領(lǐng)域的專業(yè)人員組織、編排多媒體數(shù)據(jù),并把它們連接成完整的多媒體應(yīng)用系統(tǒng)的工具。高檔的創(chuàng)作工具可用于影視系統(tǒng)的動(dòng)畫制作及特技效果,中檔的用于培訓(xùn)、教育和娛樂節(jié)目的制作,低檔的可用于商業(yè)簡介、家庭學(xué)習(xí)材料的編輯等。2.多媒體素材采集與制作技術(shù)素材的采集與制作主要包括采集并編154.多媒體數(shù)據(jù)庫技術(shù)由于多媒體信息是結(jié)構(gòu)型的,致使傳統(tǒng)的關(guān)系數(shù)據(jù)庫已不適用于多媒體的信息管理,需要從下面幾個(gè)方面研究數(shù)據(jù)庫。(1)多媒體數(shù)據(jù)模型。目前主要采用基于關(guān)系模型加以擴(kuò)充,因?yàn)閭鹘y(tǒng)的關(guān)系數(shù)據(jù)庫將所有的對象都看成二維表,難以處理多媒體數(shù)據(jù)模型。而面向?qū)ο蠹夹g(shù)的發(fā)展推動(dòng)了數(shù)據(jù)庫技術(shù)的發(fā)展,面向?qū)ο蠹夹g(shù)與數(shù)據(jù)庫技術(shù)的結(jié)合導(dǎo)致了基于面向?qū)ο竽P秃统襟w模型的數(shù)據(jù)庫的研究。(2)媒體數(shù)據(jù)壓縮和解壓縮的模式。該技術(shù)主要解決多媒體數(shù)據(jù)過大的空間和時(shí)間開銷問題。壓縮技術(shù)要考慮算法復(fù)雜度、實(shí)現(xiàn)速度以及壓縮質(zhì)量等問題。(3)多媒體數(shù)據(jù)管理及存取方法。采用目前常用的分頁管理、B+樹和HASH方法外,多媒體數(shù)據(jù)庫還要引入矢量空間模型、信息索引檢索技術(shù)、超位檢索技術(shù)、智能索引技術(shù)以及基于內(nèi)容的檢索方法等。尤其是超媒體組織數(shù)據(jù)機(jī)制更為多媒體數(shù)據(jù)庫操作增加了活力。(4)用戶界面。用戶界面除提供多媒體功能調(diào)用外,還應(yīng)提供對各種媒體的編輯功能、變換功能和用戶接口。4.多媒體數(shù)據(jù)庫技術(shù)由于多媒體信息是結(jié)構(gòu)型的,致使傳統(tǒng)的關(guān)系165.超文本/超媒體技術(shù)超文本是一種新穎的文本信息管理技術(shù)。它提供的方法是建立各種媒體信息之間的網(wǎng)狀鏈接結(jié)構(gòu)。這種結(jié)構(gòu)由節(jié)點(diǎn)組成,沒有固定的順序,也不要求必須按某個(gè)順序檢索,與傳統(tǒng)的線性文本結(jié)構(gòu)有著很大的區(qū)別。以節(jié)點(diǎn)為基礎(chǔ)的信息塊容易按照人們的“聯(lián)想”關(guān)系加以組織,符合人們的“聯(lián)想”邏輯思維習(xí)慣。一般把已組織成的網(wǎng)狀信息稱為超文本,而把對其進(jìn)行管理使用的系統(tǒng)稱為超文本系統(tǒng)。典型的超文本系統(tǒng)應(yīng)具有用于瀏覽節(jié)點(diǎn)、防止迷路的交互式工具,即瀏覽器,或稱為導(dǎo)航圖。它是超文本網(wǎng)絡(luò)的結(jié)構(gòu)圖與數(shù)據(jù)中的節(jié)點(diǎn)和鏈形成一一對應(yīng)的關(guān)系。導(dǎo)航圖可以幫助用戶在網(wǎng)絡(luò)中定向和觀察信息的連接。超文本中的節(jié)點(diǎn)數(shù)據(jù)不僅可以是文本,還可以是圖像、動(dòng)畫、音頻、視頻,后者通常稱為超媒體。超文本和超媒體已廣泛應(yīng)用于多媒體信息管理中。5.超文本/超媒體技術(shù)超文本是一種新穎的文本信息管理技術(shù)。它176.多媒體應(yīng)用開發(fā)技術(shù)在多媒體應(yīng)用開發(fā)方面,目前還缺少一個(gè)定義完整的應(yīng)用開發(fā)方法學(xué)。采用傳統(tǒng)的軟件開發(fā)方法在多媒體應(yīng)用領(lǐng)域中成功的例子很少。多媒體應(yīng)用的開發(fā)會使一些采用不同問題解決方法的人集中到一起,包括計(jì)算機(jī)開發(fā)人員、音樂創(chuàng)作人員、圖像創(chuàng)作人員等,他們的工作方法以及思考問題的方法都將是完全不同的。對于項(xiàng)目管理者來說,研究和推出一個(gè)多媒體應(yīng)用開發(fā)方法學(xué)將是極為重要的。6.多媒體應(yīng)用開發(fā)技術(shù)在多媒體應(yīng)用開發(fā)方面,目前還缺少一個(gè)定181.2.6多媒體通信技術(shù)多媒體通信要求能夠綜合地傳輸、交換各種信息類型,而不同的信息呈現(xiàn)出不同的特征。比如,語音和視頻有較強(qiáng)的適應(yīng)性要求,它容許出現(xiàn)某些文字的錯(cuò)誤,但不能容忍任何延遲。而對于數(shù)據(jù)來說,則可容忍延遲,但卻不能有錯(cuò),因?yàn)榧幢闶且粋€(gè)字節(jié)的錯(cuò)誤都會改變數(shù)據(jù)的意義。多媒體通信技術(shù)包含語音壓縮、圖像壓縮及多媒體的混合傳輸技術(shù)。為了只用一根電話線同時(shí)傳輸語音、圖像、文件等信號,必須要用復(fù)雜的多路混合傳輸技術(shù),而且要采用特殊的約定來完成?,F(xiàn)有的通信網(wǎng)大都不太適應(yīng)數(shù)字化的多媒體數(shù)據(jù)的傳輸。人們期望未來能夠?qū)⒍喾N網(wǎng)絡(luò)進(jìn)行統(tǒng)一,包括用于話音通信的電話網(wǎng)、用于計(jì)算機(jī)通信的計(jì)算機(jī)網(wǎng)和用于大眾傳播的廣播電視網(wǎng)。對于實(shí)時(shí)性要求不高且數(shù)據(jù)量不很大的應(yīng)用來說,矛盾尚不突出。但一旦涉及到大量的數(shù)據(jù),許多網(wǎng)絡(luò)中的特性就難以滿足要求。寬帶綜合業(yè)務(wù)數(shù)字網(wǎng)B-ISDN)是解決這個(gè)問題的一個(gè)比較完整的方法,其中ATM(異步傳送模式)是近年來在研究和開發(fā)上的一個(gè)重要成果。實(shí)現(xiàn)多媒體通信,對不同的應(yīng)用,其技術(shù)支持要求有所不同。例如,在信息點(diǎn)播服務(wù)中,用戶和信息中心為點(diǎn)對點(diǎn)的關(guān)系,信息的傳輸要采用雙向通路;電視中心把信息發(fā)往各用戶,則要實(shí)現(xiàn)一點(diǎn)對多點(diǎn)的關(guān)系;而在協(xié)同工作環(huán)境CSCW應(yīng)用中,各用戶的關(guān)系就成為多點(diǎn)對多點(diǎn)的關(guān)系,所以多媒體通信技術(shù)要提供上述連接類型。1.2.6多媒體通信技術(shù)191.2.7虛擬現(xiàn)實(shí)技術(shù)虛擬現(xiàn)實(shí)技術(shù)是用計(jì)算機(jī)生成現(xiàn)實(shí)世界的技術(shù)。虛擬現(xiàn)實(shí)的本質(zhì)是人與計(jì)算機(jī)之間進(jìn)行交流的方法,它以其更加高級的集成性和交互性,給用戶以十分逼真的體驗(yàn),可以廣泛應(yīng)用于模擬訓(xùn)練、科學(xué)可視化等領(lǐng)域,如飛機(jī)駕駛訓(xùn)練、分子結(jié)構(gòu)世界、宇宙作戰(zhàn)游戲等。虛擬現(xiàn)實(shí)的定義可歸納為:利用計(jì)算機(jī)技術(shù)生成一個(gè)逼真的視覺、聽覺、觸覺及嗅覺等的感覺世界,用戶可以用人的自然技能對這個(gè)生成的虛擬實(shí)體進(jìn)行交互考察。這個(gè)定義有三層含義:首先,虛擬實(shí)體是用計(jì)算機(jī)來生成的一種模擬環(huán)境,“逼真”就是要達(dá)到三維視覺,甚至包括三維的聽覺及觸覺、嗅覺等;其次,用戶可以通過人的自然技能與這個(gè)環(huán)境交互,這里的自然技能可以是人的頭部轉(zhuǎn)動(dòng)、眼睛轉(zhuǎn)動(dòng)、手勢或其他的身體動(dòng)作;第三,虛擬現(xiàn)實(shí)往往要借助于一些三維傳感設(shè)備來完成交互動(dòng)作,常用的如頭盔立體顯示器、數(shù)據(jù)手套、數(shù)據(jù)服裝、三維鼠標(biāo)等。1.2.7虛擬現(xiàn)實(shí)技術(shù)201.3多媒體技術(shù)的應(yīng)用及其發(fā)展前景1.3.1多媒體技術(shù)的應(yīng)用多媒體符合信息社會的應(yīng)用需求。目前,多媒體應(yīng)用系統(tǒng)豐富多彩、層出不窮,已深入到人類學(xué)習(xí)、工作和生活的各個(gè)方面。其應(yīng)用領(lǐng)域從教育、培訓(xùn)、商業(yè)展示、信息咨詢、電子出版、科學(xué)研究到家庭娛樂,特別是多媒體技術(shù)與通信、網(wǎng)絡(luò)相結(jié)合的遠(yuǎn)程教育、遠(yuǎn)程醫(yī)療、視頻會議系統(tǒng)等。這些新的應(yīng)用領(lǐng)域給人類的生產(chǎn)生活帶來了巨大的變革。1.3多媒體技術(shù)的應(yīng)用及其發(fā)展前景211.教育、培訓(xùn)應(yīng)用領(lǐng)域在多媒體的應(yīng)用中,教育、培訓(xùn)應(yīng)用大約占40%。多媒體教育、培訓(xùn)始于計(jì)算機(jī)輔助教學(xué)CAI。它是提高教學(xué)質(zhì)量和普及教育的有效途徑,學(xué)習(xí)不再是傳統(tǒng)的讀教材、聽講課、記筆記、做作業(yè)的方式,而是根據(jù)教學(xué)的基本原理,利用計(jì)算機(jī)對信息具有的大容量存儲、高速度處理等特點(diǎn),通過與用戶之間的交互活動(dòng),用最優(yōu)化的教學(xué)方式來實(shí)現(xiàn)教學(xué)目標(biāo)的教學(xué)手段。它既可代替教師進(jìn)行課堂的教學(xué),也可作為常規(guī)課堂教學(xué)的補(bǔ)充手段。它有如下明顯的優(yōu)勢:(1)多媒體教學(xué)以圖文、聲像并茂的形式提供信息,提高獲取知識的速度,提高教學(xué)質(zhì)量,激發(fā)學(xué)生的學(xué)習(xí)積極性。(2)實(shí)現(xiàn)學(xué)習(xí)個(gè)別化,按照學(xué)生的能力、特點(diǎn)進(jìn)行教學(xué)。(3)把多媒體技術(shù)與計(jì)算機(jī)通信技術(shù)及知識庫相結(jié)合,能提供多元化的教學(xué),并可使教育走向家庭。(4)把以教師為中心的教學(xué)模式轉(zhuǎn)變?yōu)橐詫W(xué)生為中心,增加了學(xué)生的主觀能動(dòng)性,使學(xué)生產(chǎn)生一種學(xué)習(xí)責(zé)任感。1.教育、培訓(xùn)應(yīng)用領(lǐng)域在多媒體的應(yīng)用中,教育、培訓(xùn)應(yīng)用大約占222.商業(yè)展示、信息咨詢應(yīng)用領(lǐng)域多媒體技術(shù)與觸摸屏技術(shù)的結(jié)合為商業(yè)展示和信息咨詢提供了新的手段,現(xiàn)已廣泛地應(yīng)用于交通、商場、飯店、賓館、郵電、旅游、娛樂等公共場所。例如大商場的導(dǎo)購系統(tǒng),用戶只要在觸摸屏上一按,就能根據(jù)自己的需要選購商品;上海黃頁電話號簿公司制作的《CD-ROM電子電話簿》,可以通過鼠標(biāo)操作,查出所需區(qū)域所有企事業(yè)單位的地理位置,也可查詢兩地之間最短路徑的走向;以多媒體技術(shù)制作的產(chǎn)品演示光盤為商家提供了一種全新的廣告形式,商家通過多媒體演示光盤可以將產(chǎn)品表現(xiàn)得淋漓盡致,客戶可通過多媒體演示盤隨心所欲地觀看廣告,直觀、經(jīng)濟(jì)、便捷,效果非常好。它可用于房地產(chǎn)公司、計(jì)算機(jī)銷售公司、汽車制造廠商等多種行業(yè)的展示。2.商業(yè)展示、信息咨詢應(yīng)用領(lǐng)域多媒體技術(shù)與觸摸屏技術(shù)的結(jié)合為233.多媒體電子出版物計(jì)算機(jī)多媒體技術(shù)的發(fā)展正在改變傳統(tǒng)的出版業(yè),CD-ROM大容量、低成本及CD-ROM驅(qū)動(dòng)器能重現(xiàn)聲、文、圖、像等信息的特點(diǎn)更加快了電子出版物的發(fā)展。多媒體電子出版物是一種新型的信息媒體,它將文字、聲音、圖片、圖像、動(dòng)畫、視頻等多種媒體與計(jì)算機(jī)程序融合,以電子信息的形式存放在CD-ROM中。從本質(zhì)上說,多媒體電子出版物是一種應(yīng)用軟件產(chǎn)品,它是由計(jì)算機(jī)軟件控制,并對其多媒體對象進(jìn)行綜合處理編輯的結(jié)果。電子出版物的很多性能優(yōu)于傳統(tǒng)出版物,如查找方便迅速、體積小、攜帶方便、可靠性高、壽命長等,而且用戶在接受多媒體電子信息時(shí),不僅僅是單純閱讀信息,還能親身感受信息。3.多媒體電子出版物計(jì)算機(jī)多媒體技術(shù)的發(fā)展正在改變傳統(tǒng)的出版244.多媒體通信多媒體技術(shù)與通信技術(shù)結(jié)合形成了新的應(yīng)用領(lǐng)域,如視頻會議、可視電話、雙向電視、電子商務(wù)、遠(yuǎn)程教學(xué)、遠(yuǎn)程醫(yī)療等??梢曤娫捪到y(tǒng)一般由語言處理、圖像信號輸入、圖像信號輸出及圖像信號處理4部分組成。目前,國際上已經(jīng)有許多成熟產(chǎn)品,如MCI公司推出的可視電話,可利用電視機(jī)和普通邏輯電話線,其內(nèi)部裝有攝像機(jī)、解調(diào)器和多媒體芯片;日本電報(bào)電話公司(NTT)的筆談電話既能像普通電話那樣進(jìn)行口頭通信,還能通過電話附屬的傳真機(jī)進(jìn)行“筆談”。圖文電視機(jī)是普通電視機(jī)與圖文解碼器二合一體機(jī)。電視圖像在場與場之間不傳送圖像的空隙稱為“場消隱期”。圖文信息經(jīng)過數(shù)字化編碼處理后插入到“場消隱期”。目前,世界上許多發(fā)達(dá)國家圖文電視的普及率已經(jīng)超過90%。視頻會議讓人們可以在世界的任何地方通過顯示器或電視屏幕來“面對面”地討論、交談、傳送文件等,使人們的活動(dòng)范圍擴(kuò)大而物理距離縮小,進(jìn)一步提高了工作效率和質(zhì)量。遠(yuǎn)程教學(xué)可通過因特網(wǎng)讓學(xué)員自己選擇教學(xué)計(jì)劃、教學(xué)進(jìn)度及教學(xué)地點(diǎn),聆聽遠(yuǎn)方教授的教學(xué)指導(dǎo)。遠(yuǎn)程醫(yī)療可通過因特網(wǎng)傳送病人的各種化驗(yàn)單、CT及X光片等圖像,供在遠(yuǎn)方的專家會診;還可傳送手術(shù)鏡頭讓遠(yuǎn)方的專家對手術(shù)進(jìn)行指導(dǎo)。交互式電視――又叫VOD(VideoOnDemand)的功能是用戶可根據(jù)自己的需要來點(diǎn)播電視節(jié)目或電視上顯示的其他選項(xiàng),還可以隨意設(shè)計(jì)故事情節(jié),交互地“指揮”節(jié)目進(jìn)行。法國已于1997年推出MediaHighway數(shù)字平臺系統(tǒng)提供交互電視網(wǎng)。之后,德國交互電視節(jié)目也已開始在柏林試播。2001年8月8日,國內(nèi)最早的視頻點(diǎn)播在河北電視臺開播,它是一種NVOD,即近似VOD。電影數(shù)字化后,電影制片廠只要把電影的數(shù)字文件通過網(wǎng)絡(luò)發(fā)往電影院和家庭就可以了,而且質(zhì)量和效果都比普通電影高得多。2001年9月20日,上海永樂宮放映美國哥倫比亞公司制作的數(shù)碼電影《終極幻想》,它是通過遠(yuǎn)程傳輸放映的。在2001年的上海國際電影節(jié)上,上海影城也曾放映用硬盤存儲的數(shù)碼電影。多媒體通信技術(shù)使計(jì)算機(jī)的交互性、通信的分布性及電視的真實(shí)性融為一體,多媒體通信技術(shù)的廣泛應(yīng)用將能極大地提高人們的工作效率,減輕社會的交通負(fù)擔(dān),改變?nèi)藗儌鹘y(tǒng)的教育和娛樂方式。多媒體通信必將成為21世紀(jì)人們通信的基本方式。4.多媒體通信多媒體技術(shù)與通信技術(shù)結(jié)合形成了新的應(yīng)用領(lǐng)域,如255.家庭娛樂多媒體技術(shù)由于處理圖文、聲像等,軟件制造商們已開發(fā)了豐富多彩的多媒體游戲和娛樂軟件,擺脫了以往的單調(diào),有較好的視聽效果且交互性強(qiáng),給人以身臨其境的感覺。一臺普通計(jì)算機(jī)配上CD-ROM驅(qū)動(dòng)器、MPEG影視卡便可播放VCD。近年來隨著DVD的普及,使我們能在計(jì)算機(jī)上觀看具有高清晰的畫面質(zhì)量、更具震撼力的音響效果的影視節(jié)目。雙向電影及雙向電視的出現(xiàn)使多媒體在家庭娛樂方面的應(yīng)用達(dá)到更高一級的階段。5.家庭娛樂多媒體技術(shù)由于處理圖文、聲像等,軟件制造商們已開261.3.2多媒體技術(shù)的發(fā)展趨勢1.從應(yīng)用角度看,多媒體技術(shù)主要向以下五個(gè)方向發(fā)展。(1)多媒體通信網(wǎng)絡(luò)環(huán)境的研究和建立,將使多媒體從單機(jī)、單點(diǎn)向分布、協(xié)同多媒體環(huán)境發(fā)展,在世界范圍內(nèi)建立一個(gè)可全球自由交互的通信網(wǎng)。對該網(wǎng)絡(luò)及其設(shè)備的研究和網(wǎng)上分布應(yīng)用與信息服務(wù)研究將是熱點(diǎn)。未來的多媒體通信將朝著不受時(shí)間、空間、通信對象等方面的任何約束和限制的方向發(fā)展,其目標(biāo)是“任何人,在任何時(shí)刻,與任何地點(diǎn)的任何人,進(jìn)行任何形式的通信”。人類將通過多媒體通信迅速獲取大量信息,反過來又以高效的多媒體通信方式為社會創(chuàng)造更大的社會效益。(2)利用圖像理解、語音識別、全文檢索等技術(shù),研究多媒體基于內(nèi)容的處理,開發(fā)能進(jìn)行基于內(nèi)容處理的系統(tǒng),是多媒體信息管理的重要方向。(3)多媒體標(biāo)準(zhǔn)仍是研究的重點(diǎn)。各類標(biāo)準(zhǔn)的研究將有利于產(chǎn)品規(guī)范化,應(yīng)用更方便。因?yàn)橐远嗝襟w為核心的信息產(chǎn)業(yè)突破了單一行業(yè)的限制,涉及到諸多行業(yè),而多媒體系統(tǒng)集成特性對標(biāo)準(zhǔn)化提出了很高的要求,所以必須開展標(biāo)準(zhǔn)化研究,它是實(shí)現(xiàn)多媒體信息交換和大規(guī)模產(chǎn)業(yè)化的關(guān)鍵所在。(4)多媒體技術(shù)與其他技術(shù)相結(jié)合,提供了完善的人機(jī)交互環(huán)境。同時(shí),多媒體技術(shù)將繼續(xù)向其他領(lǐng)域擴(kuò)展,并使其應(yīng)用范圍進(jìn)一步擴(kuò)大。多媒體仿真、智能多媒體等新技術(shù)層出不窮,擴(kuò)大了原有技術(shù)領(lǐng)域的內(nèi)涵,并不斷創(chuàng)造出新的概念。(5)多媒體技術(shù)與外圍技術(shù)構(gòu)造的虛擬現(xiàn)實(shí)研究仍在繼續(xù)進(jìn)展。多媒體虛擬現(xiàn)實(shí)與可視化技術(shù)需要相互補(bǔ)充,并與語音、圖像識別、智能接口等技術(shù)相結(jié)合,建立高層次虛擬現(xiàn)實(shí)系統(tǒng)。1.3.2多媒體技術(shù)的發(fā)展趨勢272.從性能角度來看,多媒體技術(shù)將向以下六個(gè)方向發(fā)展:(1)高分辨化,提高顯示質(zhì)量;(2)高速度化,縮短處理時(shí)間;(3)簡單化,便于操作;(4)高維化,三維、四維或更高維;(5)智能化,提高信息識別能力;(6)標(biāo)準(zhǔn)化,便于信息交換和資源共享。多媒體技術(shù)總的發(fā)展趨勢是具有更好、更自然的交互性,更大范圍的信息存取服務(wù),為未來人類生活創(chuàng)造出一個(gè)在功能、空間、時(shí)間及人與人交互方面更完美的嶄新世界。2.從性能角度來看,多媒體技術(shù)將向以下六個(gè)方向發(fā)展:(1)高281.4多媒體信息的計(jì)算機(jī)表示多媒體信息是利用計(jì)算機(jī)技術(shù)生成的一個(gè)逼真的視覺、聽覺、觸覺及嗅覺等的感覺世界,用戶可以用人的自然技能對這個(gè)生成的虛擬實(shí)體進(jìn)行交互考察。這種傳遞信息的技術(shù)是在眾多相關(guān)技術(shù)上發(fā)展起來的一個(gè)高度集成的技術(shù),是計(jì)算機(jī)軟硬件技術(shù)、傳感技術(shù)、機(jī)器人技術(shù)、人工智能及心理學(xué)等飛速發(fā)展的結(jié)晶。以后我們將會有專門的課程學(xué)習(xí)虛擬現(xiàn)實(shí)的有關(guān)知識。1.4多媒體信息的計(jì)算機(jī)表示291.4.1文本的基本格式一.文本的基本知識在多媒體信息系統(tǒng)中,文本是人們最為熟悉,指各種文字,包括各種字體、尺寸、格式及色彩的文本。是一種最常用空間信息表示方法,如各種文字介紹、區(qū)域環(huán)境解說、系統(tǒng)標(biāo)題、功能菜單、補(bǔ)充說明、地理名稱、現(xiàn)象或事物的質(zhì)量或數(shù)量特征標(biāo)識等都是信息系統(tǒng)的重要內(nèi)容,文本媒體是構(gòu)成多媒體信息系統(tǒng)信息庫的主要內(nèi)容,如地名數(shù)據(jù)庫、統(tǒng)計(jì)數(shù)據(jù)庫等都是文本媒體。文本類素材常用的存儲格式有TXT、DOC、RTF、WPS格式。文本素材中漢字采用GB碼統(tǒng)一編碼和存儲;英文字母和符號使用ASCII方式編碼和存儲。二.常見的文本格式1.4.1文本的基本格式302.DOC格式DOC格式是微軟公司W(wǎng)ord文字處理軟件的存儲格式,由于其巨大的影響力,大多數(shù)軟件環(huán)境都兼容DOC格式。但DOC文件是微軟的Office中的Word程序獨(dú)有的文件格式。Word程序中很多設(shè)置譬如修訂信息、域信息等等Word所獨(dú)有的功能只能存為.doc格式。如果word的文件需要讓其他字處理程序打開,只能存為純文本即.txt格式。但是這種純文本格式只能存儲文字,像格式(居中、文字顏色等)的信息根本無法保留下來。2.DOC格式DOC格式是微軟公司W(wǎng)ord文字處理軟件的313.TXT格式TXT格式是一種純文本格式,也是計(jì)算機(jī)中最簡單、最常用的一種文本文件格式,可適用于任何一種文字編輯軟件和機(jī)型的需要。雖然簡單,但它被多種計(jì)算機(jī)操作系統(tǒng)支持。而且還有很多種其他格式的文本文件能以.txt的格式打開,并可以其他格式文件的源代碼。手機(jī)電子書的出現(xiàn)是一個(gè)劃時(shí)代的進(jìn)步,電子書的格式就是.txt格式的文本文件。目前已有MicroReader、ReadManiac等專門為手機(jī)電子書設(shè)計(jì)的閱讀軟件,通過這類閱讀軟件,就能把網(wǎng)上浩瀚的TXT文件資源轉(zhuǎn)變?yōu)槭謾C(jī)電子書。以MicroReader軟件為例,它可以自動(dòng)翻頁而且速度可調(diào)、可以設(shè)置書簽、可以設(shè)置字體行距、可以進(jìn)行編碼切換等,使手機(jī)更像一個(gè)功能豐富的電子書閱讀器終端。3.TXT格式TXT格式是一種純文本格式,也是計(jì)算機(jī)中最簡324.WPS格式WPS格式是國內(nèi)著名軟件公司金山公司W(wǎng)psOffice/2000文字處理軟件的存儲格式,它的通用性受到一定限制。在實(shí)際應(yīng)用中,微軟公司的Word和金山公司的Wps文字處理軟件都提供了讀取和轉(zhuǎn)換不同文本格式的功能。文本文件可以在文本編輯軟件中制作,如用WPS或WORD等,用掃描儀也可獲得文本文件,但一般多媒體文本大多直接在制作圖形的軟件或多媒體編輯軟件中制作。文本的多樣化是由文字的變化即指文字的格式(Style)、文字的定位(Align)、字體(Font)、字的大?。⊿ize)以及由這四種變化的各種組合形成。4.WPS格式WPS格式是國內(nèi)著名軟件公司金山公司W(wǎng)psO331.4.2圖形圖像的基本格式一.圖形圖像的基本知識圖形一般指用計(jì)算機(jī)繪制的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等;圖像則指由輸入設(shè)備捕捉實(shí)際場景畫面產(chǎn)生的數(shù)字圖像。數(shù)字圖像通常有位圖和矢量圖形兩種表示形式。1.位圖圖像位圖圖像由數(shù)字陣列信息組成,用以描述圖像中各像素點(diǎn)的強(qiáng)度與顏色。位圖適用于具有復(fù)雜色彩、明度多變、虛實(shí)豐富的圖象,例如照片、繪畫等。使用位圖格式的繪畫程序叫做位圖繪畫程序,例如AdobePhotoshop。它以與屏幕相對應(yīng)的存儲位來記憶和處理圖象,把圖形作為點(diǎn)的集合,這是繪畫程序應(yīng)用的典型文件格式。位圖圖象依賴于解析度,放大和以高清晰度打印時(shí),容易出現(xiàn)鋸齒狀的邊緣。像素的多少?zèng)Q定文件的大小和圖象細(xì)節(jié)的豐富程度。位圖圖像占用存儲空間較大。一般需要進(jìn)行數(shù)據(jù)壓縮。為了便于位圖的存儲和交流,產(chǎn)生了種類繁多的文件格式,常見有PCX、BMP、DLB、PIC、GIF、TGA和TIFF等。1.4.2圖形圖像的基本格式一.圖形圖像的基本知識342.矢量圖形矢量圖形的特點(diǎn)是,繪畫程序中物體定位、形體構(gòu)造建立在以數(shù)學(xué)方式記錄構(gòu)件(圖形元素)的幾何性質(zhì)上,例如直線、曲線、圓形、方形的形狀和大小。它不是記錄像素的數(shù)量,在任何解析度下輸出時(shí)都同樣清晰。例如AdobeIllustrator就是使用這種格式的軟件。矢量格式更適合于以線條物體定位為主的繪制,通常用于計(jì)算機(jī)輔助設(shè)計(jì)(CAD)和工藝美術(shù)設(shè)計(jì)、插圖等。使用物體定位繪畫程序可以把特定物體作為一組,單獨(dú)改變線條的長度,放大或縮小原形,移動(dòng)和重疊。但是在屏幕上顯示的時(shí)候,由于監(jiān)視器的特點(diǎn),矢量圖也是以像素方式來顯示的。矢量圖形是用一組指令集合來描述圖形的內(nèi)容,這些指令用來描述構(gòu)成該圖形的所有直線、圓、圓弧、矩形、曲線等圖無的位置、維數(shù)和形狀。在屏幕上顯示矢量圖形要有專門軟件將描述圖形的指令轉(zhuǎn)換成在屏幕上顯示的形狀和顏色。用于產(chǎn)生和編輯矢量圖形的程序通常稱為Draw程序。這種程序可以產(chǎn)生和操作矢量圖形的各個(gè)成分,并對矢量圖形進(jìn)行移動(dòng)、縮放、旋轉(zhuǎn)和扭曲等變換;使用矢量圖形的一個(gè)很大的優(yōu)點(diǎn)就是容易進(jìn)行這類變換。但是,用矢量圖形格式表示復(fù)雜圖像(如人物或風(fēng)景照片)的開銷大大,因此矢量圖形主要用于表示線框型的圖畫、工程制圖、美術(shù)字等。絕大多大多數(shù)CAD和3D造型軟件使用矢量圖形作為基本的圖形存儲格式。2.矢量圖形矢量圖形的特點(diǎn)是,繪畫程序中物體定位、形體構(gòu)造353.處理圖形圖像要考慮的基本因素(1)分辨率:注意不同的分辨率給圖像帶來的不同的視覺效果。通常分辨率有如下幾種: 屏幕分辨率屏幕分辨率就是用戶在屏幕上觀察圖象時(shí),所感受到的分辨率。一般屏幕分辨率是由計(jì)算機(jī)的顯示卡所決定的。例如標(biāo)準(zhǔn)的VGA顯示卡的分辨率是640×480,即寬640點(diǎn)(像素),高480點(diǎn)(像素)。至于較高級的顯示卡,通??梢灾С?00×600或是1024×768點(diǎn)以上。顯示器分辨率只會影響用戶處理圖像時(shí)的方便性,不會影響圖像的輸出質(zhì)量。 圖象分辨率圖象分辨率,指的是圖象中儲存的信息量,這種分辨率又有多種衡量法,典型的是以每英寸的像素?cái)?shù)(ppi)來衡量。圖象分辨率和圖像尺寸一起決定文件的大小及輸出質(zhì)量。該值越大,圖象文件所占用的磁盤空間也越大,進(jìn)行打印或修改圖象等操作所花時(shí)間也就越多。 像素分辨率指像素的寬高比,一般為1:1,在像素分辨率不同的機(jī)器間傳輸圖像時(shí)會產(chǎn)生畸變。3.處理圖形圖像要考慮的基本因素(1)分辨率:36(2)色彩數(shù)和圖形灰度色彩數(shù)和圖形灰度用位(bit)表示,一般寫成2的n次方,n代表位數(shù)。當(dāng)圖形、圖像達(dá)到24位時(shí),可表現(xiàn)1677萬種顏色,即真彩?;叶鹊谋硎痉愃?。(3)圖像亮度和顏色對于黑白圖像用灰度表示像素的亮度,灰度用灰度級別或比特?cái)?shù)表示,目前多采用256級即8比特,對于彩色圖像的顏色,物理上用H.S.B描述,在電視系統(tǒng)中可用R.G.B三基色的比例表示。(4)圖像深度圖像深度是指色彩及色彩的柔和程度,主要由表示象素的二進(jìn)制數(shù)位決定。目前使用較多的是8~24位。圖像中每個(gè)像素可顯示出的顏色數(shù)稱作顏色深度,通常有以下幾種顏色深度標(biāo)準(zhǔn): 24位真彩色:每個(gè)像素所能顯示的顏色數(shù)為24位,也就是2的24次方,約有1680萬種顏色; 16位增強(qiáng)色:增強(qiáng)色為16位顏色,每個(gè)像素顯示的顏色數(shù)為2的16次方,有65536種顏色; 8位色:每個(gè)像素顯示的顏色數(shù)為2的8次方,有256種顏色。(2)色彩數(shù)和圖形灰度色彩數(shù)和圖形灰度用位(bit)表示,37(5)圖像文件的大小文件大小決定占據(jù)存儲空間的多少,由圖像分辨率和圖像深度決定,可用下式計(jì)算:文件大小(字節(jié)數(shù))=水平方向象素?cái)?shù)×垂直方向象素?cái)?shù)×圖像深度/8。例如一幅分辨率為1200×1024,深度為16位的圖像,其大小為2.46MB1KB=1024Byte1MB=1024KB1GB=1024MB二.常見的圖形、圖像格式下面我們就通過圖形文件的特征后綴名(就是如圖.bmp這樣的)來逐一認(rèn)識當(dāng)前常見的圖形文件格式:1.BMP是Microsoft公司圖形文件自身的點(diǎn)位圖格式,也是PC機(jī)上最常用的位圖格式,有壓縮和不壓縮兩種形式,支持1-24bit色彩,分辨率也可從480x320至1024x768。在保存為這種格式時(shí)彈出的對話框會詢問用于Windows或是0S/2系統(tǒng)。BMP格式保存的圖像質(zhì)量不變,文件也比較大,因?yàn)橐4婷總€(gè)像素的信息。該格式在Windows環(huán)境下相當(dāng)穩(wěn)定,在文件大小沒有限制的場合中運(yùn)用極為廣泛。(5)圖像文件的大小文件大小決定占據(jù)存儲空間的多少,由圖像分382.DIB描述圖像的能力基本與BMP相同,并且能運(yùn)行于多種硬件平臺,只是文件較大。3.PCP由Zsoft公司創(chuàng)建的一種經(jīng)過壓縮且節(jié)約磁盤空間的PC位圖格式,它最高可表現(xiàn)24位圖形(圖像)。過去有一定市場,但隨著JPEG的興起,其地位已逐漸日落終天。4.DIFAutoCAD中的圖形文件,它以ASCII方式存儲圖形,表現(xiàn)圖形在尺寸大小方面十分精確,可以被CorelDraw,3DS等大型軟件調(diào)用編輯。5.WMF是一種矢量圖形格式,Word中內(nèi)部存儲的圖片或繪制的圖形對象屬于這種格式。具有文件短小、圖案造型化的特點(diǎn),無論放大還是縮小,圖形的清晰度不變,但該類圖形比較粗糙,并只能在MicrosoftOffice中調(diào)用編輯。2.DIB描述圖像的能力基本與BMP相同,并且能運(yùn)行于多種硬396.GIF是一種圖像交換格式,可提供壓縮功能,在各種平臺的各種圖形處理軟件上均可處理的經(jīng)過壓縮的圖形格式,但只支持256色,很少用于照片級圖像處理工作。在PhotoShop中把對顏色數(shù)要求不高的圖片變?yōu)樗饕?,再以GIF格式保存,使文件縮小后用更快的速度在網(wǎng)上傳輸,以實(shí)現(xiàn)網(wǎng)上特殊效果圖形的傳送。X-Space個(gè)人門戶KGD2FeH5V7.JPG是一種較常用的有損壓縮方案,可以大幅度地壓縮圖形文件的一種圖形格。JPG格式存儲的文件是其他類型圖形文件的1/10到1/20,而且色彩數(shù)最高可達(dá)到24位,所以它被廣泛應(yīng)用于Internet上的homepage或internet上的圖片庫。在相應(yīng)程序中以"jpg"存儲時(shí),會進(jìn)一步詢問使用哪檔圖像品質(zhì)來壓縮,而在圖形程序中打開時(shí)會自動(dòng)解壓。JPEG全部名稱為:Jointphotographicexptrsgroup。盡管它是一種主流格式,但在需要輸出高質(zhì)量圖像時(shí)不使用JPG而應(yīng)選EPS格式或TIF格式,特別是在以JPG格式進(jìn)行圖形編輯時(shí),不要經(jīng)常進(jìn)行保存操作。8.TIFTIF格式是工業(yè)標(biāo)準(zhǔn)格式,支持所有圖像類型。文件分成壓縮和非壓縮兩大類。非壓縮的TIF文件是獨(dú)立于軟硬件的,但壓縮文件較復(fù)雜。壓縮方法有好幾種,且是可擴(kuò)充的。非壓縮的TIF文件具有良好的兼容性,又可選擇壓縮存儲,所以是許多圖像應(yīng)用軟件所支持的主要文件格式之一。6.GIF是一種圖像交換格式,可提供壓縮功能,在各種平臺的各401.4.3聲音文件的基本格式聲音是多媒體系統(tǒng)中不可缺少的內(nèi)容和組成部分。是多媒體技術(shù)研究中的一個(gè)重要內(nèi)容。聲音的種類繁多,如人的話音、樂器聲、動(dòng)物發(fā)出的聲音、機(jī)器產(chǎn)生的聲音以及自然界的雷聲、風(fēng)聲、雨聲、閃電聲等。這些聲音有許多共同的特性,也有它們各自的特性。在用計(jì)算機(jī)處理這些聲音時(shí),既要考慮它們的共性,又要利用它們的各自的特性。多媒體系統(tǒng)中的聲音主要包括視頻圖像的背景音樂和文字介紹錄音等兩種,它們都屬于數(shù)字音頻媒體,是多媒體系統(tǒng)中媒體數(shù)據(jù)處理的重要內(nèi)容。1.聲音的基本知識(1)多媒體中的音頻處理技術(shù)多媒體涉及到多方面的音頻處理技術(shù),如音頻采集、語音編碼/解碼、文語轉(zhuǎn)換、音樂合成、語音識別與理解、音頻數(shù)據(jù)傳輸、音頻視頻同步、音頻效果與編輯等。其中數(shù)字音頻是個(gè)關(guān)鍵的概念,它指的是一個(gè)用來表示聲音強(qiáng)弱的數(shù)據(jù)序列,它是由模擬聲音經(jīng)抽樣(即每隔一個(gè)時(shí)間間隔在模擬聲音波形上取一個(gè)幅度值)量化和編碼(即把聲音數(shù)據(jù)寫成計(jì)算機(jī)的數(shù)據(jù)格式)后得到的。計(jì)算機(jī)數(shù)字CD、數(shù)字磁帶(DAT)中存儲的都是數(shù)字聲音。模擬數(shù)字轉(zhuǎn)換器把模擬聲音變成數(shù)字聲音;數(shù)字模擬轉(zhuǎn)換器可以恢復(fù)出模擬來的聲音。一般來講,實(shí)現(xiàn)計(jì)算機(jī)語音輸出有兩種方法:一是錄音/重放,二是文語轉(zhuǎn)換。第二種方法是基于聲音合成技術(shù)的一種聲音產(chǎn)生技術(shù),它可用于語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產(chǎn)生了應(yīng)用調(diào)頻(FM)音樂合成技術(shù)和波形表(wavetable)音樂合成技術(shù)。1.4.3聲音文件的基本格式聲音是多媒體系統(tǒng)中不可缺少的41(2)樂器數(shù)字接口MIDI的概念現(xiàn)在我們用的最多的音頻名詞之一MIDI(musicalinstrumentdigitalinterface)是作為“樂器數(shù)字接口”的縮寫出現(xiàn)的,并用它來泛指數(shù)字音樂的國際標(biāo)準(zhǔn)。由于它定義了計(jì)算機(jī)音樂程序、合成器及其他電子設(shè)備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標(biāo)準(zhǔn)的多媒體PC平臺能夠通過內(nèi)部合成器或連接到計(jì)算機(jī)MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。至于MIDI文件,是指存放MIDI信息的標(biāo)準(zhǔn)文件格式。MIDI文件中包含音符、定時(shí)和多達(dá)16個(gè)通道的演奏定義。文件包括每個(gè)通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時(shí),鍵達(dá)到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盤空間非常少,并且現(xiàn)裝載MIDI文件比波形文件容易的多。(2)樂器數(shù)字接口MIDI的概念現(xiàn)在我們用的最多的音頻名422.常見的聲音文件格式下面我們逐一認(rèn)識當(dāng)前常見的聲音文件格式:(1)WAVE擴(kuò)展名為WAV,該格式記錄聲音的波形。wave文件作為最經(jīng)典的windows多媒體音頻格式,應(yīng)用非常廣泛,它使用三個(gè)參數(shù)來表示聲音:采樣位數(shù)、采樣頻率和聲道數(shù)。聲道有單聲道和立體聲之分,采樣頻率一般有11025hz(11khz)、22050hz(22khz)和44100hz(44khz)三種。wave文件所占容量=(采樣頻率×采樣位數(shù)×聲道)×?xí)r間/8(1字節(jié)=8bit)。故只要采樣率高、采樣字節(jié)長、機(jī)器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質(zhì)量非常高,但這樣做的代價(jià)是文件太大。(2)MODmod是一種類似波表的音樂格式,但它的結(jié)構(gòu)卻類似midi,使用真實(shí)采樣,體積很小,該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確、音色種類無限等優(yōu)點(diǎn)。在以前的dos年代,mod經(jīng)常被作為游戲的背景音樂。現(xiàn)在的mod可以包含很多音軌,而且格式眾多,如mod、s3m、nst、669、mtm、xm、it、xt和rt等。但它也有一些致命弱點(diǎn),以至于現(xiàn)在已經(jīng)逐漸淘汰,目前只有MOD以及一些游戲程序中尚在使用。(3)MPEG-3擴(kuò)展名MP3:現(xiàn)在最流行的聲音文件格式,因其壓縮率大(將聲音用1∶10甚至1∶12的壓縮率壓縮)。mp3音樂是以數(shù)字方式儲存的音樂,如果要播放,就必須有相應(yīng)的數(shù)字解碼播放系統(tǒng),一般通過專門的軟件進(jìn)行mp3數(shù)字音樂的解碼,再還原成波形聲音信號播放輸出,這種軟件就稱為mp3播放器,如winamp等。2.常見的聲音文件格式下面我們逐一認(rèn)識當(dāng)前常見的聲音文件格43(4)RealAudio擴(kuò)展名RA、ram、rm都是real公司成熟的網(wǎng)絡(luò)音頻格式,這種格式真可謂是網(wǎng)絡(luò)的靈魂,采用了“音頻流”技術(shù),強(qiáng)大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計(jì)的,因此主要目標(biāo)是壓縮比和容錯(cuò)性,其次才是音質(zhì)。在制作時(shí)可以加入版權(quán)、演唱者、制作者、mail和歌曲的title等信息。ra可以稱為互聯(lián)網(wǎng)上多媒體傳播的霸主,適合于網(wǎng)絡(luò)上進(jìn)行實(shí)時(shí)播放,是目前在線收聽網(wǎng)絡(luò)音樂最好的一種格式。(5)CD即cd唱片,擴(kuò)展名CDA,一張cd可以播放74分鐘左右的聲音文件。唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對的純正、HIFI(高保真)。但缺點(diǎn)是無法編輯,文件長度太大。(6)MIDI擴(kuò)展名MID,目前最成熟的音樂格式,實(shí)際上已經(jīng)成為一種產(chǎn)業(yè)標(biāo)準(zhǔn),其科學(xué)性、兼容性、復(fù)雜程度等各方面當(dāng)然遠(yuǎn)遠(yuǎn)超過本文前面介紹的所有標(biāo)準(zhǔn)(除交響樂CD、UnplugCD外,其它CD往往都是利用MIDI制作出來的),它的GeneralMIDI就是最常見的通行標(biāo)準(zhǔn)。作為音樂工業(yè)的數(shù)據(jù)通信標(biāo)準(zhǔn),MIDI能指揮各音樂設(shè)備的運(yùn)轉(zhuǎn),而且具有統(tǒng)一的標(biāo)準(zhǔn)格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。總之,如果有專業(yè)的音源設(shè)備,那么要鑒別同一首曲子的HIFI(高保真)程度,依次是:原聲樂器演奏>MIDI>CD唱片>MOD>所謂聲卡上的MIDI>CMF,而MP3及RA要看它的節(jié)目源是采用MIDI、CD還是MOD了。(4)RealAudio擴(kuò)展名RA、ram、rm都是re44(7)VQFvqf是一種音頻壓縮技術(shù)。它的音頻壓縮率比標(biāo)準(zhǔn)的mpeg音頻壓縮率高出近一倍,可以達(dá)到1∶18左右,甚至更高。而像mp3、ra這些廣為流行的壓縮格式一般只有1∶12左右,但仍然不會影響音質(zhì)。(8)WMAwindowsmediaaudio的縮寫,微軟在開發(fā)自己的網(wǎng)絡(luò)多媒體服務(wù)平臺上主推asf(audiosteamingformat),這是一個(gè)開放支持在各種各樣的網(wǎng)絡(luò)和協(xié)議上的數(shù)據(jù)傳輸?shù)臉?biāo)準(zhǔn)。它支持音頻、視頻以及其他一系列的多媒體類型。而wma相當(dāng)于只包含音頻的asf文件。wma文件在80kbps、44khz的模式下壓縮比可達(dá)1∶18,基本上和vqf相同。而且壓縮速度比mp3提高一倍。所以它應(yīng)該比vqf更具有競爭力。其它音頻格式:AIF/AIFF蘋果公司開發(fā)的一種聲音文件格式,支持MAC平臺,支持16位44.1kHz立體聲。AUSUN的AU壓縮聲音文件格式,只支持8位的聲音,是互連網(wǎng)上常用到的聲音文件格式,多由SUN工作站創(chuàng)建。CDACD音軌文件。CMFCREATIVE公司開發(fā)的一種類似MIDI的聲音文件。DSPDigitalSignalProcessing(數(shù)字信號處理)的簡稱。通過提高信號處理方法,音質(zhì)會極大地改善,歌曲會更悅耳動(dòng)聽。S3UMP3播放文件列表。RMIMIDI樂器序列。(7)VQFvqf是一種音頻壓縮技術(shù)。它的音頻壓縮率比標(biāo)準(zhǔn)451.4.4動(dòng)畫文件的基本格式1.動(dòng)畫的基礎(chǔ)知識(1)動(dòng)畫定義所謂動(dòng)畫,就是通過以每秒15到20幀的速度(相當(dāng)接近于全運(yùn)動(dòng)視頻幀速)順序地播放靜止圖像幀以產(chǎn)生運(yùn)動(dòng)的錯(cuò)覺。因?yàn)檠劬δ茏銐蜷L時(shí)間地保留圖像以允許大腦以連續(xù)的序列把幀連接起來,所以能夠產(chǎn)生運(yùn)動(dòng)的錯(cuò)覺。我們可以通過在顯示時(shí)改變圖像來生成簡單的動(dòng)畫。最簡單的方法是在兩個(gè)不同幀之間的反復(fù)。這種方法對于指示“是”或“不是”的情況來說是很好的解決方法。另一種制作動(dòng)畫的方法是以循環(huán)的形式播放幾個(gè)圖像幀以生成旋轉(zhuǎn)的效果,并且可以依靠計(jì)算時(shí)間來獲得較好的回放,或用記時(shí)器來控制動(dòng)畫。動(dòng)畫提供了靜態(tài)圖形缺少的瞬間交叉的運(yùn)動(dòng)景象,它是一種可感覺到運(yùn)動(dòng)相對時(shí)間、位置、方向和速度的動(dòng)態(tài)媒體。計(jì)算機(jī)動(dòng)畫已有了30多年的歷史,早期的創(chuàng)作方法是基于數(shù)學(xué)公式的,由某種算法產(chǎn)生的一系列作品。目前主要通過計(jì)算機(jī)軟件為動(dòng)畫創(chuàng)作提供一個(gè)人機(jī)交互的環(huán)境。本質(zhì)上,動(dòng)畫創(chuàng)作是一種形象思維活動(dòng),對形象思維研究將從理論上為創(chuàng)作提供清晰的模型,因此動(dòng)畫建模是動(dòng)畫創(chuàng)作工具的基礎(chǔ)。目前,基于知識的動(dòng)畫創(chuàng)作系統(tǒng)已問世,它能代替人的部分低層次的有規(guī)律的思維。(2)計(jì)算機(jī)動(dòng)畫的基本硬件環(huán)境配置高性能計(jì)算機(jī)(配有加速圖形卡等部件的計(jì)算機(jī))。輸入設(shè)備:掃描儀、攝像機(jī)等。輸出設(shè)備:錄像、光盤、軟盤等載體。(3)計(jì)算機(jī)動(dòng)畫的基本軟件環(huán)境配置現(xiàn)有的常見動(dòng)畫制作工具有:MacromindDirector,二維動(dòng)畫創(chuàng)作軟件AnimatorProFlash,Authorware,三維動(dòng)畫創(chuàng)作軟件有3DMAX,Poser3等。1.4.4動(dòng)畫文件的基本格式46(4)計(jì)算機(jī)動(dòng)畫分類計(jì)算機(jī)動(dòng)畫按生成的方法可以分為逐幀動(dòng)畫、關(guān)鍵幀動(dòng)畫和造型動(dòng)畫等幾大類。逐幀動(dòng)畫是由一幅幅內(nèi)容相關(guān)的位圖組成的連續(xù)畫面,就象電影膠片或卡通畫面一樣,要分別設(shè)計(jì)每屏要顯示的幀畫面。關(guān)鍵幀動(dòng)畫這種動(dòng)畫生成方式和普通動(dòng)畫的制作方式比較類似,所不同的是,在關(guān)鍵幀創(chuàng)作出來后,中間幀不再需要人來畫,而是由計(jì)算機(jī)“計(jì)算”出來的。通常我們所見到的Flash動(dòng)畫就是關(guān)鍵幀動(dòng)畫。造型動(dòng)畫是單獨(dú)設(shè)計(jì)畫像中的運(yùn)動(dòng)物體(也稱動(dòng)元或角色),為每個(gè)動(dòng)元設(shè)計(jì)其位置、形狀、大小及顏色等,然后由動(dòng)元構(gòu)成完整的每一張畫面。每張畫面中的動(dòng)元可以是圖像、聲音、文字和色調(diào),而控制動(dòng)元表演和行為的腳本,叫做制作表。動(dòng)元要根據(jù)制作表中的規(guī)定在動(dòng)畫中扮演自己的角色。2.常見的動(dòng)畫文件格式(1)GIFGIF是圖形交換格式(GraphicsInterchangeFormat)的英文縮寫,是由CompuServe公司于80年代推出的一種高壓縮比的彩色圖像文件格式。CompuServe公司是一家著名的美國在線信息服務(wù)機(jī)構(gòu),針對當(dāng)時(shí)網(wǎng)絡(luò)傳輸帶寬的限制,CompuServe公司采用無損數(shù)據(jù)壓縮方法中壓縮效率較高的LZW(LempelZiv&Welch)算法,推出了GIF圖像格式,主要用于圖像文件的網(wǎng)絡(luò)傳輸,鑒于GIF圖像文件的尺寸通常比其他圖像文件(如PCX)小好幾倍,這種圖像格式迅速得到了廣泛的應(yīng)用??紤]到網(wǎng)絡(luò)傳輸中的實(shí)際情況,GIF圖像格式除了一般的逐行顯示方式之外,還增加了漸顯方式,也就是說,在圖像傳輸過程中,用戶可以先看到圖像的大致輪廓,然后隨著傳輸過程的繼續(xù)而逐漸看清圖像的細(xì)節(jié)部分,從而適應(yīng)了用戶的觀賞心理,這種方式以后也被其他圖像格式所采用,如JPEG/JPG等。最初,GIF只是用來存儲單幅靜止圖像,稱GIF87a,后來,又進(jìn)一步發(fā)展成為GIF89a,可以同時(shí)存儲若干幅靜止圖像并進(jìn)而形成連續(xù)的動(dòng)畫,目前Internet上大量采用的彩色動(dòng)畫文件多為這種格式的GIF文件。(4)計(jì)算機(jī)動(dòng)畫分類計(jì)算機(jī)動(dòng)畫按生成的方法可以分為逐幀動(dòng)畫47(2)Flic文件擴(kuò)展名為.FLI/.FLC。Flic文件是Autodesk公司在其出品的AutodeskAnimator/AnimatorPro/3DStudio等2D/3D動(dòng)畫制作軟件中采用的彩色動(dòng)畫文件格式,其中,.FLI是最初的基于320×200分辨率的動(dòng)畫文件格式,而.FLC則是.FLI的進(jìn)一步擴(kuò)展,采用了更高效的數(shù)據(jù)壓縮技術(shù),其分辨率也不再局限于320×200。Flic文件采用行程編碼(RLE)算法和Delta算法進(jìn)行無損的數(shù)據(jù)壓縮,首先壓縮并保存整個(gè)動(dòng)畫序列中的第一幅圖像,然后逐幀計(jì)算前后兩幅相鄰圖像的差異或改變部分,并對這部分?jǐn)?shù)據(jù)進(jìn)行RLE壓縮,由于動(dòng)畫序列中前后相鄰圖像的差別通常不大,因此采用行程編碼可以得到相當(dāng)高的數(shù)據(jù)壓縮率。GIF和Flic文件,通常用來表示由計(jì)算機(jī)生成的動(dòng)畫序列,其圖像相對而言比較簡單,因此可以得到比較高的無損壓縮率,文件尺寸也不大。然而,對于來自外部世界的真實(shí)而復(fù)雜的影像信息而言,無損壓縮便顯得無能為力,而且,即使采用了高效的有損壓縮算法,影像文件的尺寸也仍然相當(dāng)龐大。(3)FLI是由AutoDesk公司開發(fā)的,只支持320×200×256色模式,它是FLC的老祖宗。(4)FIC是AutoDesk公司開發(fā)的,與FLI相比是青出于藍(lán)勝于藍(lán)的產(chǎn)物:文件的分辨率和顏色數(shù)都有所提高,它與FLI在Windows中播放需要專用MCI驅(qū)動(dòng)和相應(yīng)的播放程序APPlay。(5)MMM是MacroMind公司著名多媒體寫作軟件Director生成的,一般集成在完整的應(yīng)用程序中,單獨(dú)出現(xiàn)的文件很少。(2)Flic文件擴(kuò)展名為.FLI/.FLC。Flic文件481.4.5視頻文件的基本格式視頻就是利用人的視覺暫留特性產(chǎn)生動(dòng)感的可視媒體。連續(xù)的圖像變化每秒超過24幀(frame)畫面以上時(shí),人眼無法辨別每付單獨(dú)的靜態(tài)畫面,看上去是平滑連續(xù)的視覺效果。這樣的連續(xù)畫面叫視頻。動(dòng)畫速度低于每秒25幅畫面都不叫視頻。例如動(dòng)畫文件(屬性為GIF)的文件,就是動(dòng)畫而不叫視頻,一些稱之為閃畫之類的FLASH屬性的文件也不是視頻。電影、電視和錄像已屬于較為傳統(tǒng)視聽媒體,隨著計(jì)算機(jī)網(wǎng)絡(luò)和多媒體(multimedia)技術(shù)的發(fā)展,視頻信息技術(shù)已經(jīng)成為我們生活中不可或缺的組成部分,滲透到工作、學(xué)習(xí)、娛樂各個(gè)方面。1.4.5視頻文件的基本格式491.視頻基礎(chǔ)知識(1)視頻文件專門包含有視頻內(nèi)容的文件,我們叫視頻文件。視頻文件在網(wǎng)絡(luò)上有許多種,它的區(qū)別就在于文件的尾綴不同。例如一個(gè)XX的視頻文件,取名為XX.rm這個(gè)點(diǎn)后面的英文我們叫文件的尾綴,也叫文件的屬性,而RM就是一種視頻文件的屬性。(2)非線性編輯簡單地說就是使用計(jì)算機(jī)對視頻進(jìn)行處理通常稱為非線性編輯,指應(yīng)用計(jì)算機(jī)圖形、圖像技術(shù),在計(jì)算機(jī)中對各種原始素材進(jìn)行各種編輯操作,并將最終結(jié)果輸出到計(jì)算機(jī)硬盤、光盤等記錄設(shè)備上這一系列完整的工藝過程。現(xiàn)有的非線性編輯系統(tǒng)已經(jīng)完全實(shí)現(xiàn)了數(shù)字化以及與模擬視頻信號的高度兼容,并廣泛應(yīng)用在電影、電視、廣播、網(wǎng)絡(luò)等傳播領(lǐng)域。目前基于PC平臺的非線性編輯軟件有AdobePremiere等。(3)彩色電視的三種制式NTSC制(美國,加拿大,日本等)。PAL制(歐洲,中國等)。SECAM制(法國等)。(4)時(shí)間碼視頻素材的長度和它的開始幀、結(jié)束幀是由時(shí)間碼單位和地址來度量的。小時(shí):分鐘:秒:幀的形式確定每一幀的地址。PAL制采納的是25幀/秒的標(biāo)準(zhǔn)。NTSC制采納的是29.97/幀秒的標(biāo)準(zhǔn)。早期的黑白電視使用的是30幀/秒的標(biāo)準(zhǔn)。1.視頻基礎(chǔ)知識(1)視頻文件50(5)掃描把二維的圖像信號轉(zhuǎn)換為一維的電信號。NTSC制每幀掃描525行,每秒掃描30幀;PAL制每幀掃描625行,每秒掃描25幀。每行掃描完成后的返回過程稱為水平消隱。每幀掃描完成后的返回過程稱為垂直消隱。掃描方式分為隔行掃描和逐行掃描。隔行掃描就是用一次以上的垂直掃描再現(xiàn)一幅完整的圖像。在電視系統(tǒng)中,采用兩個(gè)垂直掃描場表示一幀。(6)幀、幀速率視頻是由一系列的單獨(dú)圖像,稱之為幀。典型的幀速率范圍是24~30幀/秒。2.常見的視頻文件格式(1)AVI格式它的英文全稱為AudioVideoInterleaved,即音頻視頻交錯(cuò)格式。它于1992年被Microsoft公司推出,隨Windows3.1一起被人們所認(rèn)識和熟知。所謂“音頻視頻交錯(cuò)”,就是可以將視頻和音頻交織在一起進(jìn)行同步播放。這種視頻格式的優(yōu)點(diǎn)是圖像質(zhì)量好,可以跨多個(gè)平臺使用,但是其缺點(diǎn)是體積過于龐大,而且更加糟糕的是壓縮標(biāo)準(zhǔn)不統(tǒng)一,因此經(jīng)常會遇到高版本W(wǎng)indows媒體播放器播放不了采用早期編碼編輯的AVI格式視頻,而低版本W(wǎng)indows媒體播放器又播放不了采用最新編碼編輯的AVI格式視頻。其實(shí)解決的方法也非常簡單,我們將在后面的視頻轉(zhuǎn)換、視頻修復(fù)部分中給出解決的方案。(5)掃描把二維的圖像信號轉(zhuǎn)換為一維的電信號。NTSC制每51(2)DV-AVI格式DV的英文全稱是DigitalVideoFormat,是由索尼、松下、JVC等多家廠商聯(lián)合提出的一種家用數(shù)字視頻格式。目前非常流行的數(shù)碼攝像機(jī)就是使用這種格式記錄視頻數(shù)據(jù)的。它可以通過電腦的IEEE1394端口傳輸視頻數(shù)據(jù)到電腦,也可以將電腦中編輯好的的視頻數(shù)據(jù)回錄到數(shù)碼攝像機(jī)中。這種視頻格式的文件擴(kuò)展名一般也是.avi,所以我們習(xí)慣地叫它為DV-AVI格式。(3)MPEG格式它的英文全稱為MovingPictureExpertGroup,即運(yùn)動(dòng)圖像專家組格式,家里??吹腣CD、SVCD、DVD就是這種格式。MPEG文件格式是運(yùn)動(dòng)圖像壓縮算法的國際標(biāo)準(zhǔn),它采用了有損壓縮方法從而減少運(yùn)動(dòng)圖像中的冗余信息。MPEG的壓縮方法說的更加深入一點(diǎn)就是保留相鄰兩幅畫面絕大多數(shù)相同的部分,而把后續(xù)圖像中和前面圖像有冗余的部分去除,從而達(dá)到壓縮的目的。目前MPEG格式有三個(gè)壓縮標(biāo)準(zhǔn),分別是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7與MPEG-21仍處在研發(fā)階段。MPEG-1:制定于1992年,它是針對1.5Mbps以下數(shù)據(jù)傳輸率的數(shù)字存儲媒體運(yùn)動(dòng)圖像及其伴音編碼而設(shè)計(jì)的國際標(biāo)準(zhǔn)。也就是我們通常所見到的VCD制作格式。這種視頻格式的文件擴(kuò)展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盤中的.dat文件等。MPEG-2:制定于1994年,設(shè)計(jì)目標(biāo)為高級工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率。這種格式主要應(yīng)用在DVD/SVCD的制作(壓縮)方面,同時(shí)在一些HDTV(高清晰電視廣播)和一些高要求視頻編輯、處理上面也有相當(dāng)?shù)膽?yīng)用。這種視頻格式的文件擴(kuò)展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盤上的.vob文件等。MPEG-4:制定于1998年,MPEG-4是為了播放流式媒體的高質(zhì)量視頻而專門設(shè)計(jì)的,它可利用很窄的帶度,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求使用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。MPEG-4最有吸引力的地方在于它能夠保存接近于DVD畫質(zhì)的小體積視頻文件。這種視頻格式的文件擴(kuò)展名包括.asf、.mov和.DivX、.AVI等。(2)DV-AVI格式DV的英文全稱是DigitalV52(4)DivX格式這是由MPEG-4衍生出的另一種視頻編碼(壓縮)標(biāo)準(zhǔn),即我們通常所說的DVDrip格式,它采用了MPEG4的壓縮算法同時(shí)又綜合了MPEG-4與MP3各方面的技術(shù),說白了就是使用DivX壓縮技術(shù)對DVD盤片的視頻圖像進(jìn)行高質(zhì)量壓縮,同時(shí)用MP3或AC3對音頻進(jìn)行壓縮,然后再將視頻與音頻合成并加上相應(yīng)的外掛字幕文件而形成的視頻格式。其畫質(zhì)直逼DVD并且體積只有DVD的數(shù)分之一。(5)MOV格式美國Apple公司開發(fā)的一種視頻格式,默認(rèn)的播放器是蘋果的QuickTimePlayer。具有較高的壓縮比率和較完美的視頻清晰度等特點(diǎn),QuickTime文件格式支持25位彩色,支持RLE、JPEG等領(lǐng)先的集成壓縮技術(shù),提供150多種視頻效果,并配有提供了200多種MIDI兼容音響和設(shè)備的聲音裝置。新版的QuickTime進(jìn)一步擴(kuò)展了原有功能,包含了基于Internet應(yīng)用的關(guān)鍵特性,能夠通過Internet提供實(shí)時(shí)的數(shù)字化信息流、工作流與文件回放功能。此外,QuickTime還采用了一種稱為QuickTimeVR(簡作QTVR)技術(shù)的虛擬現(xiàn)實(shí)(VirtualReality,VR)技術(shù),用戶通過鼠標(biāo)或鍵盤的交互式控制,可以觀察某一地點(diǎn)周圍360度的景像,或者從空間任何角度觀察某一物體。QuickTime文件還有跨平臺性,即不僅能支持MacOS,同樣也能支持Windows系列。(4)DivX格式這是由MPEG-4衍生出的另一種視頻編53(6)ASF格式它的英文全稱為AdvancedStreamingformat,是微軟為了和現(xiàn)在的RealPlayer競爭而推出的一種視頻格式,用戶可以直接使用Windows自帶的WindowsMediaPlayer對其進(jìn)行播放。由于它使用了MPEG-4的壓縮算法,所以壓縮率和圖像的質(zhì)量都很不錯(cuò)。(7)WMF格式它的英文全稱為WindowsMediaVideo,也是微軟推出的一種采用獨(dú)立編碼方式并且可以直接在網(wǎng)上實(shí)時(shí)觀看視頻節(jié)目的文件壓縮格式。WMV格式的主要優(yōu)點(diǎn)包括:本地或網(wǎng)絡(luò)回放、可擴(kuò)充的媒體類型、可伸縮的媒體類型、多語言支持、環(huán)境獨(dú)立性、豐富的流間關(guān)系以及擴(kuò)展性等。(8)RM格式Networks公司所制定的音頻視頻壓縮規(guī)范稱之為RealMedia,用戶可以使用RealPlayer或RealOnePlayer對符合RealMedia技術(shù)規(guī)范的網(wǎng)絡(luò)音頻/視頻資源進(jìn)行實(shí)況轉(zhuǎn)播,并且RealMedia還可以根據(jù)不同的網(wǎng)絡(luò)傳輸速率制定出不同的壓縮比率,從而實(shí)現(xiàn)在低速率的網(wǎng)絡(luò)上進(jìn)行影像數(shù)據(jù)實(shí)時(shí)傳送和播放。這種格式的另一個(gè)特點(diǎn)是用戶使用RealPlayer或RealOnePlayer播放器可以在不下載音頻/視頻內(nèi)容的條件下實(shí)現(xiàn)在線播放。(6)ASF格式它的英文全稱為AdvancedStre54(9)RMVB格式這是一種由RM視頻格式升級延伸出的新視頻格式,它的先進(jìn)之處在于RMVB視頻格式打破了原先RM格式那種平均壓縮采樣的方式,在保證平均壓縮比的基礎(chǔ)上合理利用比特率資源,就是說靜止和動(dòng)作場面少的畫面場景采用較低的編碼速率,這樣可以留出更多的帶寬空間,而這些帶寬會在出現(xiàn)快速運(yùn)動(dòng)的畫面場景時(shí)被利用。這樣在保證了靜止畫面質(zhì)量的前提下,大幅地提高了運(yùn)動(dòng)圖像的畫面質(zhì)量,從而圖像質(zhì)量和文件大小之間就達(dá)到了微妙的平衡。(10)DAT格式它是VideoCD(VCD)或KaraokeCD(卡拉OKCD)基于MPEG壓縮方法的一種,注意它同數(shù)據(jù)文件同名。DAT是是數(shù)據(jù)流格式,即我們非常熟悉的VCD。用電腦打開VCD光盤,可到有個(gè)MPEGAV目錄,里面便是類似MUSIC01.DAT或AVSEQ01.DAT命名的文件。DAT文件也是MPG格式的,是VCD刻錄軟件將符合VCD標(biāo)準(zhǔn)的MPEG-1文件自動(dòng)轉(zhuǎn)換生成的。(9)RMVB格式這是一種由RM視頻格式升級延伸出的新視551.5本章小結(jié)本章介紹媒體、多媒體與多媒體技術(shù)的基本概念、多媒體的技術(shù)特性、多媒體系統(tǒng)的分類及多媒體系統(tǒng)的層次結(jié)構(gòu)的同時(shí),又介紹了多媒體的關(guān)鍵技術(shù),多媒體技術(shù)的應(yīng)用及其發(fā)展趨勢,重點(diǎn)闡述了多媒體信息的計(jì)算機(jī)表示。1.6習(xí)題1.什么是媒體和多媒體?媒體可分為哪幾類?2.多媒體具有哪些技術(shù)特性?3.多媒體系統(tǒng)分為哪幾類?4.多媒體系統(tǒng)層次結(jié)構(gòu)主要有哪些?各有什么作用?5.多媒體計(jì)算機(jī)的主要關(guān)鍵技術(shù)有哪些?6.簡述多媒體技術(shù)的應(yīng)用及多媒體技術(shù)的發(fā)展趨勢。7.通常多媒體信息的計(jì)算機(jī)表示有哪幾類?指出一些常用的相應(yīng)文件格式。1.5本章小結(jié)56第2章多媒體計(jì)算機(jī)系統(tǒng)2.1多媒體計(jì)算機(jī)的硬件設(shè)備2.1.1CD-ROM驅(qū)動(dòng)器與刻錄機(jī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論