版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2/22/2023第6章多媒體技術(shù)基礎(chǔ)目錄26.1多媒體技術(shù)概述6.4數(shù)字音頻與應(yīng)用6.2計算機中的數(shù)值表示6.3文本表示與應(yīng)用6.5數(shù)字圖像與應(yīng)用6.6數(shù)字視頻與應(yīng)用6.7數(shù)據(jù)壓縮技術(shù)及壓縮軟件的使用26.1多媒體技術(shù)概述媒體的常見形式數(shù)值:整數(shù)、實數(shù)。文本:按指定的編碼成為二進制后存儲在計算機。圖形:用計算機語言或者專軟件生成的矢量圖,本質(zhì)上一組描述點、線、面、圖形大小、形狀、位置、維度的指令集合,顯示時指令被轉(zhuǎn)換為屏幕上的形狀和顏色。圖像:用數(shù)碼相機、掃描儀等設(shè)備產(chǎn)生的影像,由像素點組成。音頻:將人耳可以直接聽到的聲音信號轉(zhuǎn)換為二進制數(shù)據(jù)組成的數(shù)字音頻。視頻:多幅靜止圖像與連續(xù)音頻信息在時間軸上同步運動的混合媒體。動畫:使用動畫制作軟件生成的可以連續(xù)播放的動態(tài)畫面,本質(zhì)上是一種視頻。36.1多媒體技術(shù)概述多媒體及其的特點集成性:多種媒體信息的集成,以及處理這些媒體的軟硬件技術(shù)及其設(shè)備和系統(tǒng)的集成。交互性:與傳統(tǒng)媒體不同之處,通過交互人們可以按照自己意愿對信息進行主動選擇和控制。實時性:在人的感官系統(tǒng)允許的情況下進行多媒體交互,圖像、聲音等各種媒體在時間上都是同步、連續(xù)的。數(shù)據(jù)量大:圖像、音頻、視頻等多媒體數(shù)據(jù)所需的存儲空間很大。編碼方式多樣:多國文字產(chǎn)生多種文本編碼;圖像、音頻、視頻等數(shù)據(jù)豐富的壓縮算法產(chǎn)生了多種編碼方式。4目錄56.1多媒體技術(shù)概述6.4數(shù)字音頻與應(yīng)用6.2計算機中的數(shù)值表示6.3文本表示與應(yīng)用6.5數(shù)字圖像與應(yīng)用6.6數(shù)字視頻與應(yīng)用6.7數(shù)據(jù)壓縮技術(shù)及壓縮軟件的使用6.2計算機中的數(shù)值表示整數(shù)值在計算機中的表示將一個數(shù)的最高位定義為符號位,用0表示正,1表示負(fù),稱為數(shù)符,其余位表示數(shù)值。
(+28)10=
(
)2在機器內(nèi)存放的正、負(fù)數(shù)碼化的數(shù)稱為機器數(shù)把機器外部由“+”“-”號表示的數(shù)稱為真值(-37)10=
(10100101)200011100真值機器數(shù)66.2計算機中的數(shù)值表示直接使用機器數(shù)進行運算時,會遇到問題同號數(shù)值相減異號數(shù)值相加00011100(+28)+)10
100101(-37)11000001(-65)76.2計算機中的數(shù)值表示8+5-7時鐘的周期是125+|-7|=125是-7對12的補數(shù)問題:將時鐘由3點撥到8點。順時針前進5個小時逆時針前進7個小時將減法運算變?yōu)榧臃ㄟ\算6.2計算機中的數(shù)值表示9正整數(shù)的原碼、反碼和補碼相同負(fù)整數(shù)原碼(機器數(shù)):符號位為1,數(shù)值位為對應(yīng)的二進制數(shù)
[-37]原=10100101反碼:將原碼除符號位外,逐位取反。
[-37]反=
11011010補碼:將反碼末位加1。
[-37]補=110110116.2計算機中的數(shù)值表示使用補碼進行運算00011100(+28補碼)+)11011011(-37補碼)11110111補碼負(fù)數(shù):取反加1->原碼-9總結(jié)正數(shù)的原碼和補碼相同,負(fù)數(shù)的補碼是其原碼取反加1,負(fù)數(shù)的原碼是其補碼取反加1。負(fù)數(shù)的原碼、補碼計算過程中符號位始終為1,保持不變。計算結(jié)果為負(fù)數(shù)時,需將補碼轉(zhuǎn)換為原碼讀取真值。106.2計算機中的數(shù)值表示實數(shù)值在計算機中的表示
浮點數(shù)表示法:類似科學(xué)計數(shù)法的形式,不固定小數(shù)點的位置N=(-1)S×M×2E決定正負(fù)號指數(shù)整數(shù)部分只有一個1的實數(shù),代表浮點數(shù)的尾數(shù)(103.1416)10=(1100111.0010010001)2=(-1)0×(1.1001110010010001)2×2611目錄126.1多媒體技術(shù)概述6.4數(shù)字音頻與應(yīng)用6.2計算機中的數(shù)值表示6.3文本表示與應(yīng)用6.5數(shù)字圖像與應(yīng)用6.6數(shù)字視頻與應(yīng)用6.7數(shù)據(jù)壓縮技術(shù)及壓縮軟件的使用126.3文本表示與應(yīng)用ASCII碼(AmericanStandardCodeforInformationInterchange)美國標(biāo)準(zhǔn)信息交換碼用1個字節(jié)(8位二進制數(shù))表示1個字符的編碼130余下的7位可給出128個二進制編碼即00000000-01111111可以表示128個字符最高位取“0”000000010010001101000101011001110000NULDLESPACE0@P`p0001SOHDC1!1AQaq0010STXDC2"2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt0101ENQANK%5EUeu0110ACKSYN&6FVfv0111BELETB'7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LFSUB*:JZjz1011VTESC+;K[k{1100FFFS,<L\l|1101CRGS-=M]m}1110SORS.>N^n~1111SIUS/?O_oDEL高4位低4位編碼字符0到32控制字符(33個)48到5710個數(shù)字65到9026個大寫字母97到12226個小寫字母其余標(biāo)點符號運算符號等第127控制字符(1個)146.3文本表示與應(yīng)用漢字處理過程15輸入碼信息交換碼機內(nèi)碼字形碼漢字輸入漢字輸出漢字編碼及處理6.3文本表示與應(yīng)用信息交換碼GB2312-1980,也稱國標(biāo)碼雙字節(jié)編碼,共收錄7445個漢字及圖形符號1600國中101011010100000001110011111010005650H397AH6.3文本表示與應(yīng)用機內(nèi)碼在計算機中實現(xiàn)國標(biāo)碼存儲的漢字編碼方案17編碼標(biāo)準(zhǔn)具體實現(xiàn)(存儲/傳輸)1100國標(biāo)碼機內(nèi)碼國標(biāo)碼=機內(nèi)碼-8080H機內(nèi)碼=國標(biāo)碼+8080H
6.3文本表示與應(yīng)用字形碼以點陣的形式表示出漢字的圖形漢字的點陣有很多規(guī)格,如16
16、24
24、32
32、48
48等,點陣越大,分辨率就越高,輸出的字形也就越清晰美觀24
24點陣:每個漢字要占用72個字節(jié)(24
24/8)的存儲空間186.3文本表示與應(yīng)用Unicode編碼文本的國際化表示,為世界上的各種文字的每一個字符指定唯一編碼(碼點),實現(xiàn)了跨語種、跨平臺的應(yīng)用unicode作為編碼標(biāo)準(zhǔn)只規(guī)定了碼位值,并沒有規(guī)定如何保存、傳輸編碼UTF-8是unicode字符集常見編碼實現(xiàn)19編碼標(biāo)準(zhǔn)具體實現(xiàn)(存儲/傳輸)unicodeUTF-86.3文本表示與應(yīng)用UTF-8編碼20字節(jié)數(shù)
UTF-8編碼(二進制)特點1
0xxxxxxx向ASCII碼兼容2
110xxxxx10xxxxxx首字節(jié)以110開頭3
1110xxxx10xxxxxx10xxxxxx首字節(jié)以1110開頭對應(yīng)大多數(shù)的漢字4
11110xxx10xxxxxx10xxxxxx10xxxxxx首字節(jié)以11110開頭6.3文本表示與應(yīng)用UTF-8編碼中:Unicode碼點4E2D
01001110001011011110xxxx10xxxxxx10xxxxxx4660100111000101101111001001011100010101101E4B8AD216.3文本表示與應(yīng)用PDF文檔(PortableDocumentFormat)
可攜帶文檔格式:具有紙版書的質(zhì)感和閱讀效果,可以“逼真地”展現(xiàn)原書的原貌。
PDF文檔支持多平臺,在打印機上保證精確的顏色和準(zhǔn)確的打印效果
是互聯(lián)網(wǎng)上進行電子文檔發(fā)行和數(shù)字化信息傳播的理想格式226.3文本表示與應(yīng)用PDF文檔(PortableDocumentFormat)23目錄246.1多媒體技術(shù)概述6.4數(shù)字音頻與應(yīng)用6.2計算機中的數(shù)值表示6.3文本表示與應(yīng)用6.5數(shù)字圖像與應(yīng)用6.6數(shù)字視頻與應(yīng)用6.7數(shù)據(jù)壓縮技術(shù)及壓縮軟件的使用246.4數(shù)字音頻與應(yīng)用聲音信號與數(shù)字化過程25tu(t)周期振幅采樣量化編碼模擬音頻信號數(shù)字音頻信號000001010011100101110111tu(t)6.4數(shù)字音頻與應(yīng)用常見的數(shù)字音頻格式WAV:基于PCM編碼編制而成,真實記錄自然聲波形,文件擴展名為.wavMP3:MPEG標(biāo)準(zhǔn)的音頻部分,壓縮犧牲了12kHz~16kHz高頻部分人耳最不敏感的聲波的質(zhì)量,文件擴展名為.mp3M4A:MPEG-4標(biāo)準(zhǔn)中的音頻部分,文件擴展名為.m4a,有損壓縮音頻格式WMA:微軟推出的音頻格式,文件擴展名為.wma,是有損壓縮的音頻格式MIDI:世界主要樂器制造廠商建立起來的數(shù)字音樂國際標(biāo)準(zhǔn),文件記錄的是一系列描述樂曲的符號指令266.4數(shù)字音頻與應(yīng)用計算機語音處理的應(yīng)用隨著人工智能技術(shù)的不斷發(fā)展和成熟,語音處理的性能顯著提升,并得以廣泛應(yīng)用語音識別:通過識別和理解的過程把人類的語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。例如:手機的語音輸入、實時語音轉(zhuǎn)寫、智能對話機器人、視頻字幕的自動生成、海量音視頻的快速質(zhì)檢審核。語音合成:將文字信息轉(zhuǎn)化為產(chǎn)生高清晰度、高自然度的連續(xù)語音,讓計算機像人一樣開口說話。例如:地圖導(dǎo)航軟件中的語音播報,有聲朗讀軟件,公交、地鐵、高鐵、打車軟件等場景的播報。27目錄286.1多媒體技術(shù)概述6.4數(shù)字音頻與應(yīng)用6.2計算機中的數(shù)值表示6.3文本表示與應(yīng)用6.5數(shù)字圖像與應(yīng)用6.6數(shù)字視頻與應(yīng)用6.7數(shù)據(jù)壓縮技術(shù)及壓縮軟件的使用286.5數(shù)字圖像與應(yīng)用圖像的數(shù)字化過程29人眼中的圖像計算機中的圖像6.5數(shù)字圖像與應(yīng)用圖像的數(shù)字化過程30采樣量化編碼模擬圖像數(shù)字圖像M×N個像素像素深度為1位
像素深度為8位
像素深度為24位
二值圖
灰度圖
彩色圖6.5數(shù)字圖像與應(yīng)用常見的圖像格式BMP:按照采樣、量化過程通過對每個像素的編碼實現(xiàn)圖像的數(shù)字化JPEG:Internet上的主流圖像格式,圖像有損壓縮格式GIF:
網(wǎng)絡(luò)圖像標(biāo)準(zhǔn)之一,無損壓縮格式
PNG:支持透明背景,無損壓縮格式TIFF:除存儲圖像數(shù)據(jù)之外,還保存額外的格式信息,圖像信息的存放靈活多變。在各種地理信息系統(tǒng)、遙感領(lǐng)域廣泛應(yīng)用。PSD:Photoshop中自建的標(biāo)準(zhǔn)文件格式316.5數(shù)字圖像與應(yīng)用常用的圖像處理軟件32圖像格式轉(zhuǎn)換6.5數(shù)字圖像與應(yīng)用常用的圖像處理軟件33圖像大小調(diào)整6.5數(shù)字圖像與應(yīng)用圖像處理的應(yīng)用基于圖像處理的各種人工智能應(yīng)用推進著人類世界的智能化水平和自動化進程文字識別:對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息。例如:卡證文字識別、隨手拍掃描、紙質(zhì)文檔電子化。人臉識別:包括五官定位、人臉檢測分析、人臉比對等過程。例如:在線身份認(rèn)證、人臉閘機、人臉考勤等。圖像識別:識別以圖像的方式存在的物體信息,例如:車牌識別、植物識別、果蔬識別、貨幣識別、品牌logo識別、紅酒識別、搜索引擎圖片搜索。34目錄356.1多媒體技術(shù)概述6.4數(shù)字音頻與應(yīng)用6.2計算機中的數(shù)值表示6.3文本表示與應(yīng)用6.5數(shù)字圖像與應(yīng)用6.6數(shù)字視頻與應(yīng)用6.7數(shù)據(jù)壓縮技術(shù)及壓縮軟件的使用356.6數(shù)字視頻與應(yīng)用數(shù)字視頻的基本概念視頻:內(nèi)容隨時間變化的一種動態(tài)圖像。數(shù)字視頻:通過對模擬視頻信號進行采樣、量化和編碼獲得,更適合長時間存儲,可以更方便的進行編輯、分類、檢索等視頻分辨率480P:720×480720P:1280×7201080P(2K):1920×10804K(2160P):3840×21608K(4320P):7680*4320366.6數(shù)字視頻與應(yīng)用常見的數(shù)字視頻文件格式AVI格式:將視頻和音頻交織在一起進行同步播放的格式,文件擴展名為.avi。它支持多種壓縮算法,特點是圖像和聲音的質(zhì)量好,但文件體積較大。MPEG格式:MPEG-4實現(xiàn)了很高的壓縮率,它所對應(yīng)的文件擴展名為.mp4,為視頻格式,但也包含有可以分離出來的音頻信息,將.mp4文件的擴展名修改為.m4a即可得到該視頻對應(yīng)的音頻文件。MOV格式:Apple公司開發(fā)的一種視頻格式,不僅可以存儲媒體內(nèi)容(視頻幀和音頻采樣數(shù)據(jù)),而且還能保存對該媒體的完整描述,是不同系統(tǒng)的應(yīng)用程序間交換數(shù)據(jù)的理想格式。
WMV格式:Microsoft公司發(fā)布的視頻文件格式,壓縮率和畫面質(zhì)量都很好,其文件擴展名為.wmv。376.6數(shù)字視頻與應(yīng)用數(shù)字視頻處理的應(yīng)用在人工智能技術(shù)的推動下,圍繞數(shù)字視頻應(yīng)用的各種行業(yè),如電視臺、短視頻平臺等在視頻生成、視頻內(nèi)容安全檢查、視頻內(nèi)容分析等方面都有了深入的應(yīng)用。視頻二次剪輯的自動化生成:視頻內(nèi)容生產(chǎn)制作過程中,結(jié)合智能場記標(biāo)注或者節(jié)目標(biāo)簽分類,人工智能就能根據(jù)識別到的元素進行不同主題的視頻縮編。電影預(yù)告自動生成:使用人工智能基于人臉識別、物體識別、視頻內(nèi)容理解等功能對電影內(nèi)容進行解析和理解,自動剪切和精選視頻素材為電影生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年粵教版共同必修2物理上冊月考試卷
- 2024版單位臨時工雇傭合同
- 2025年人教新起點七年級化學(xué)上冊階段測試試卷含答案
- 二零二五年度高新技術(shù)產(chǎn)業(yè)股權(quán)激勵與回購協(xié)議3篇
- 2025年粵教版六年級英語下冊月考試卷
- 2025年冀教版必修2化學(xué)下冊階段測試試卷
- 2025年岳麓版九年級物理下冊階段測試試卷
- 2025年新科版選擇性必修3生物上冊月考試卷含答案
- 2025年外研銜接版六年級語文上冊階段測試試卷含答案
- 2025年北師大版七年級化學(xué)上冊階段測試試卷含答案
- 舞臺機械管理制度
- 內(nèi)科疾病的門診管理和科室建設(shè)
- 員工安全行為激勵機制的設(shè)計與實施方案解析
- 泌尿外科膀胱鏡檢查技術(shù)操作規(guī)范
- 分子生物學(xué)在感染診斷中的應(yīng)用
- 供應(yīng)商年度評價內(nèi)容及評分表
- 山東省濟南市市中區(qū)2023-2024學(xué)年二年級上學(xué)期期中數(shù)學(xué)試卷
- 培訓(xùn)機構(gòu)入駐合作協(xié)議
- 新產(chǎn)品可行性評估表
- 分布式光伏 承諾書范本
- T-HFS 001-2023 商業(yè)銀行外部數(shù)據(jù)價值評估指南
評論
0/150
提交評論