版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
高技術(shù)輸入輸出設(shè)備30-1數(shù)碼相機(jī)一、數(shù)碼相機(jī)的定義
數(shù)碼相機(jī)又稱(chēng)為數(shù)字相機(jī),簡(jiǎn)稱(chēng)DCS(DigitalStillCamera)。其實(shí)質(zhì)是一種非膠片相機(jī),它采用CCD(電荷藕合器件)或CMOS(互補(bǔ)金屬氧化物半導(dǎo)體)作為光電轉(zhuǎn)換器件,將被攝物體以數(shù)字形式記錄在存儲(chǔ)器中。二、數(shù)碼相機(jī)特性
數(shù)碼相機(jī)是集光學(xué)、機(jī)械、電子于一體的的現(xiàn)代高技術(shù)產(chǎn)品,它集成了影像信息的轉(zhuǎn)換、存儲(chǔ)和傳輸?shù)榷喾N部件,具有數(shù)字化存取模式、與計(jì)算機(jī)交互處理和實(shí)時(shí)拍攝的特點(diǎn)。因此數(shù)碼相機(jī)有如下之特性:
1.立即成像:數(shù)碼相機(jī)屬電子取像,可立即在液晶顯示器、計(jì)算機(jī)顯示器或電視上顯示,可實(shí)時(shí)監(jiān)視影像效果,也可隨時(shí)刪除不理想的圖片。
2.與計(jì)算機(jī)兼容:數(shù)碼相機(jī)存儲(chǔ)器里的圖像輸送到計(jì)算機(jī)后通過(guò)影像處理軟件,可從事剪切,編輯、打印等,并可將影像存儲(chǔ)在計(jì)算機(jī)中。
3.電信傳送:數(shù)碼相機(jī)可將圖像信號(hào)轉(zhuǎn)換為電子信號(hào),經(jīng)電信傳輸網(wǎng)或內(nèi)部網(wǎng)進(jìn)行傳輸。三、數(shù)碼相機(jī)的基本結(jié)構(gòu)
數(shù)碼相機(jī)與傳統(tǒng)的膠片相機(jī)兩者最大的區(qū)別是在它們各自的內(nèi)部結(jié)構(gòu)和原理上。它們的共同點(diǎn)是均由光學(xué)鏡頭、取景器、對(duì)焦系統(tǒng)、快門(mén)、光圈、內(nèi)置電子閃光燈等組成,有的數(shù)碼相機(jī)既有取景器還有液晶顯示器LCD。但數(shù)碼相機(jī)還有其特殊的結(jié)構(gòu),如CCD或CMOS、仿真信號(hào)處理器、A/D模數(shù)轉(zhuǎn)換器、DSP數(shù)字信號(hào)處理器、圖像處理器、圖像存儲(chǔ)器和輸出控制單元等。
以下是數(shù)碼相機(jī)主要部件的主要功能:
1)鏡頭主要功能:把光線會(huì)聚到CCD或CMOS圖像傳感器上,起到調(diào)整焦距的作用。對(duì)于定焦數(shù)碼相機(jī),鏡頭、物體和聚焦平面間的理想距離被精確計(jì)算,從而固定了鏡頭和光圈的位置。對(duì)于ZOOM數(shù)碼相機(jī),有一個(gè)機(jī)械裝置,可以帶動(dòng)鏡頭組前后運(yùn)動(dòng),一直讓鏡頭保持在聚焦平面中央,能夠捕捉到距離鏡頭的遠(yuǎn)近的物體。
2)CCD(CMOS)圖像傳感器主要功能:把鏡頭傳來(lái)的圖像信號(hào)轉(zhuǎn)變?yōu)榉抡骐娦盘?hào)。
3)A/D轉(zhuǎn)換器主要功能:數(shù)碼相機(jī)利用A/D轉(zhuǎn)換器將CCD產(chǎn)生的仿真電信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),并傳輸?shù)綀D像處理單元。4)數(shù)字信號(hào)處理器主要功能:數(shù)字信號(hào)處理器主要功能是通過(guò)一系列復(fù)雜的數(shù)學(xué)運(yùn)算法,如加、減、乘、除、積分等,對(duì)數(shù)字圖像信號(hào)進(jìn)行優(yōu)化處理(包括:白平衡、彩色平衡、伽瑪校正與邊緣校正等)。
5)圖像壓縮主要功能:數(shù)碼相機(jī)的圖像處理包括數(shù)據(jù)壓縮,圖像壓縮的目的是為了節(jié)省存儲(chǔ)空間,利用JPEG編碼器把得到的圖像轉(zhuǎn)換為靜止壓縮的圖像(JPEG格式)。6)總體控制電路主要功能:主控程序芯片(MCU)能協(xié)調(diào)和控制測(cè)光、運(yùn)算、曝光、閃光控制及拍攝邏輯控制。當(dāng)電源開(kāi)啟時(shí),MCU則開(kāi)始距檢查各功能是否正常,若正常,相機(jī)處于準(zhǔn)備狀態(tài)。四、數(shù)碼相機(jī)的工作原理
數(shù)碼相機(jī)在使用過(guò)程中,半按快門(mén)對(duì)準(zhǔn)被攝的景物(快門(mén)ON狀態(tài),與膠片相機(jī)相反),從鏡頭傳來(lái)的光圖像經(jīng)過(guò)光電轉(zhuǎn)換器(CCD或CMOS)感應(yīng)將光信號(hào)轉(zhuǎn)換成為一一對(duì)應(yīng)的仿真信號(hào),再經(jīng)A/D模數(shù)轉(zhuǎn)換器轉(zhuǎn)換,把仿真電信號(hào)變成數(shù)字信號(hào),最后經(jīng)過(guò)圖像處理器DSP(DigitalSignalProcessor)和主控程序芯片(MCU)按照指定的文件格式,把圖像以二進(jìn)制數(shù)碼的形式顯示在LCD上,如按下快門(mén),則把圖像存入存儲(chǔ)器中。數(shù)碼相機(jī)的工作步驟大致分如下:
1開(kāi)機(jī)準(zhǔn)備:當(dāng)打開(kāi)相機(jī)的電源時(shí),其內(nèi)部的主控程序就開(kāi)始檢測(cè)各部件是否正常。如某一部件有異常,內(nèi)部的蜂鳴器就會(huì)發(fā)出警報(bào)或在LCD上提示錯(cuò)誤信息并停止工作。如一切正常,就進(jìn)入準(zhǔn)備狀態(tài)。
2聚焦及測(cè)光:數(shù)碼相機(jī)一般都有自動(dòng)聚焦和測(cè)光功能。當(dāng)打開(kāi)DSC電源時(shí),相機(jī)內(nèi)部的主控程序芯片(MCU)立即進(jìn)行測(cè)光運(yùn)算,曝光控制和閃光控制及拍攝邏輯控制。當(dāng)對(duì)準(zhǔn)物體并把快門(mén)按下一半時(shí),MCU開(kāi)始工作,圖像信號(hào)經(jīng)過(guò)鏡頭測(cè)光(TTL測(cè)光方式)傳到CCD或CMOS上并直接以CCD或CMOS輸出的電壓信號(hào)作為對(duì)焦信號(hào),經(jīng)過(guò)MCU的運(yùn)算、比較再進(jìn)行計(jì)算、確定對(duì)焦的距離和快門(mén)速度及光圈的大小,驅(qū)動(dòng)鏡頭組的AF和AE裝置進(jìn)行聚焦。3圖像捕捉:在聚焦及測(cè)光完成后再按下快門(mén),攝像器件(CCD或CMOS)就把從被攝景物上反射的光進(jìn)行捕捉并以紅、綠、藍(lán)三種像素(顏色)存儲(chǔ)。
4圖像處理:就是把捕捉的圖像進(jìn)行A/D轉(zhuǎn)換、圖像處理、白平衡處理、色彩較正等,再到存儲(chǔ)區(qū)合成在一起形成一幅完整的數(shù)字圖像,在圖像出來(lái)后再經(jīng)過(guò)DSP單元進(jìn)行壓縮轉(zhuǎn)換為JPEG格式(靜止圖像壓縮方式),以便節(jié)省空間。5圖像存儲(chǔ):在圖像處理單元壓縮的圖像送到存儲(chǔ)器中進(jìn)行保存。
6圖像的輸出:存儲(chǔ)在數(shù)碼相機(jī)存儲(chǔ)器的圖像通過(guò)輸出端口可以輸出送到計(jì)算機(jī),可在計(jì)算機(jī)里通過(guò)圖像處理程序(軟件)進(jìn)行圖形編輯、處理、打印或網(wǎng)上傳輸?shù)取?/p>
在中高級(jí)的數(shù)碼相機(jī)中,一般都含有AE功能和AF功能
1)AE功能
當(dāng)DSC相機(jī)對(duì)準(zhǔn)被攝物體時(shí),CCD根據(jù)鏡頭傳來(lái)的圖像亮度的強(qiáng)弱,轉(zhuǎn)變?yōu)镃CD數(shù)字電壓信號(hào),DSP再根據(jù)CCD數(shù)字電壓信號(hào)進(jìn)行運(yùn)算處理,再把運(yùn)算結(jié)果傳輸給MCU迅速找到合適的快門(mén)速度和鏡頭光圈的大小最佳值,由MCU控制AE機(jī)構(gòu)進(jìn)行自動(dòng)曝光。2)AF功能
直接利用CCD輸出的數(shù)字電壓信號(hào)作為對(duì)焦信號(hào),經(jīng)過(guò)MCU的運(yùn)算比較進(jìn)行驅(qū)動(dòng)鏡頭AF機(jī)構(gòu)前后運(yùn)動(dòng)。五、數(shù)碼相機(jī)的分類(lèi)
目前數(shù)碼相機(jī)的分類(lèi)很多,如果按圖像傳感器來(lái)分,可分為CCD數(shù)碼相機(jī)和CMOS數(shù)碼相機(jī)。
CCD數(shù)碼相機(jī)
CCD數(shù)碼相機(jī)是指數(shù)碼相機(jī)使用CCD圖像傳感器來(lái)記錄圖像,屬中高檔相機(jī)。CCD本身是不能分辨各種顏色的光,要用不同顏色的濾色片配合使用,因此CCD數(shù)碼相機(jī)有以下兩種工作方式:
1利用透鏡和分光鏡將光圖像信號(hào)分成R、G、B三種顏色,并分別作用在三片CCD上,這三種顏色的光經(jīng)CCD轉(zhuǎn)換為仿真電信號(hào),然后經(jīng)A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號(hào),再經(jīng)DSP數(shù)字信號(hào)處理器處理后存儲(chǔ)到存儲(chǔ)器中。
2在每個(gè)像素點(diǎn)的位置上有三個(gè)分別加上R、G、B三種顏色濾色片的CCD,經(jīng)過(guò)透鏡后的光圖像信號(hào)被分別作用在不同的傳感器上,并將它們轉(zhuǎn)換為仿真電信號(hào),然后經(jīng)A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號(hào),再經(jīng)DSP數(shù)字信號(hào)處理器處理后存儲(chǔ)到內(nèi)存中。CMOS數(shù)碼相機(jī)
CMOS數(shù)碼相機(jī)是指數(shù)碼相機(jī)使用CMOS圖像傳感器來(lái)記錄圖像。其工作方式與CCD數(shù)碼相機(jī)相似,目前屬低檔相機(jī)。
CCD圖像傳感器與CMOS圖像傳感器比較:
CMOS圖像傳感器易與A/D電路、數(shù)字信號(hào)處理器DSP電路等集成在一起。CCD圖像傳感器只能單一的鎖存到成千上萬(wàn)的采樣點(diǎn)上的光線的狀態(tài),CMOS則可以完成其它的許多功能,如A/D轉(zhuǎn)換,負(fù)載信號(hào)處理、白平衡處理及相機(jī)控制(白平衡調(diào)調(diào)整就是通過(guò)圖像調(diào)整,使在各種光線條件下拍的照片色彩與人眼看到的景物色彩一樣)。另外,CMOS圖像傳感器還有耗電小的優(yōu)點(diǎn),其耗電量約為CCD圖像傳感器的1/10。但目前CMOS圖像傳感器在解析力和色彩上還不如CCD圖像傳感器,圖像有噪音、準(zhǔn)確捕捉動(dòng)態(tài)圖像的能力還不強(qiáng)。六、數(shù)碼相機(jī)的聚焦
聚焦是清晰成像的前提,數(shù)碼相機(jī)一般都有自動(dòng)聚焦功能。數(shù)碼相機(jī)的自動(dòng)聚焦功能與傳統(tǒng)的膠片相機(jī)類(lèi)似,也有主動(dòng)式和被動(dòng)式兩種形式。
主動(dòng)式就是相機(jī)主動(dòng)發(fā)射紅外線(或超聲波),根據(jù)目標(biāo)的反射進(jìn)行聚焦。數(shù)碼相機(jī)的技術(shù)缺陷
快門(mén)延時(shí):對(duì)于傳統(tǒng)相機(jī)而言,從按下快門(mén)鍵至快門(mén)釋放這段延遲時(shí)間是可以被忽視的。而數(shù)碼相機(jī)就不行,因?yàn)橛幸粋€(gè)快門(mén)時(shí)滯的問(wèn)題,也就是說(shuō)你按下快門(mén)后,CCD并沒(méi)有馬上捕捉光線,而是過(guò)一些時(shí)間后才開(kāi)始工作。不同數(shù)碼相機(jī)的快門(mén)時(shí)滯是不一樣的,價(jià)格低廉的數(shù)碼相機(jī)反應(yīng)速度比較慢。這使得數(shù)碼相機(jī)在拍攝運(yùn)動(dòng)物體時(shí)顯得力不從心,隨著技術(shù)的進(jìn)步,快門(mén)延滯時(shí)間將會(huì)越來(lái)越少。
長(zhǎng)時(shí)間曝光:許多數(shù)碼相機(jī)經(jīng)過(guò)長(zhǎng)時(shí)間曝光后的圖像質(zhì)量會(huì)有所下降,具體表現(xiàn)是:噪點(diǎn)比較多,色彩還原不自然,容易出現(xiàn)色斑和雜色,低端數(shù)碼相機(jī)在這方面更為突出。
ISO值的設(shè)置:一般來(lái)說(shuō),數(shù)碼相機(jī)制造商都采用膠卷感光度的標(biāo)準(zhǔn)來(lái)對(duì)CCD的感光度進(jìn)行劃分,因此一臺(tái)ISO80數(shù)碼相機(jī)的感光度與普通相機(jī)使用ISO80膠卷時(shí)是相同的。一些價(jià)格昂貴的高檔數(shù)碼相機(jī)ISO設(shè)置可調(diào)節(jié),可增大到ISO200、400、800。這使得攝影師們拍攝高速運(yùn)動(dòng)的物體或處在弱光下的景物成為可能。雖然現(xiàn)在已經(jīng)有ISO3200的專(zhuān)業(yè)數(shù)碼相機(jī),但民用級(jí)數(shù)碼相機(jī)所使用的CCD感光度還很低,一般都不會(huì)ISO400、不低于ISO50,如深受行業(yè)人士看好的柯達(dá)ProBack感光度也只ISO100。
電池的使用時(shí)間:電池使用時(shí)間太短至今仍是讓數(shù)碼相機(jī)使用者和制造者頭痛的事,各大數(shù)碼相機(jī)生產(chǎn)廠家都在電池研制上花了不少功夫,相信這個(gè)問(wèn)題會(huì)逐漸得到解決。
此外,在數(shù)碼相機(jī)與傳統(tǒng)相機(jī)的區(qū)別方面,還值得一提的是攝影觀念上的差別。不同的操作必然會(huì)造成觀念上的差異,而且這個(gè)差異將直接影響到數(shù)碼相機(jī)的定位和發(fā)展。
全球定位系統(tǒng)1.1基本原理GPS系統(tǒng)是由美國(guó)國(guó)防部的陸??杖娫?0年代聯(lián)合研制的新型衛(wèi)星導(dǎo)航系統(tǒng)它的英文名稱(chēng)是“NavigationSatelliteTimingAndRanging/GlobalPositioningSystem”其意為“衛(wèi)星測(cè)時(shí)測(cè)距導(dǎo)航全球定位系統(tǒng)”簡(jiǎn)稱(chēng)GPS系統(tǒng)GPS的定位原理實(shí)質(zhì)上就是測(cè)量學(xué)的空間測(cè)距定位,利用在平均20200km高空均勻分布在6個(gè)軌道上的24顆衛(wèi)星發(fā)射測(cè)距信號(hào)碼和載波,用戶(hù)通過(guò)接收機(jī)接收這些信號(hào)測(cè)量衛(wèi)星至接收機(jī)之距,通過(guò)一系列方程演算便可知地面點(diǎn)位坐標(biāo)。1.2GPS的組成GPS由三部分組成GPS空間部分地基監(jiān)控站和GPS用戶(hù)接收機(jī)部分1.2.1GPS空間部分GPS空間部分由24顆分布在6個(gè)等間隔軌道上的衛(wèi)星組成,衛(wèi)星分布可保證全球任何地區(qū)任何時(shí)刻都不少于4顆衛(wèi)星供觀測(cè),24顆衛(wèi)星中3顆做為備份每個(gè)軌道平面上有4顆衛(wèi)星它們按與地球成55度的相同方向運(yùn)行空間間隔約為90度。1、空間部分
由21顆工作衛(wèi)星
和3顆備用衛(wèi)星。每個(gè)GPS衛(wèi)星都對(duì)應(yīng)一組編號(hào)它們有多種編號(hào)一般采用PRN(衛(wèi)星所采用的偽隨機(jī)噪聲碼)編號(hào),GPS定位精度高低關(guān)鍵在于高穩(wěn)定度的頻率標(biāo)準(zhǔn),為此每顆GPS衛(wèi)星都設(shè)有兩臺(tái)銣原子鐘和兩臺(tái)銫原子鐘。1.2.2地基監(jiān)控站地基部分地基監(jiān)控站由一個(gè)主控站和四個(gè)監(jiān)控站組成,主控站設(shè)置在美國(guó)大陸,四個(gè)監(jiān)控站分別設(shè)在大西洋太平洋和印度洋訴島嶼上。Coloradosprings55HawaiiAscencionDiegoGarciakwajalein1個(gè)主控站:Coloradosprings(科羅拉多.斯平士)。3個(gè)注入站:Ascencion(阿森松群島)、DiegoGarcia(迭哥伽西亞)、kwajalein(卡瓦加蘭)。5個(gè)監(jiān)控站:以上主控站、注入站及Hawaii(夏威夷)。1.2.3GPS用戶(hù)接收機(jī)用戶(hù)接收機(jī)通過(guò)接收多顆衛(wèi)星的信號(hào)來(lái)解算出自身的位置以實(shí)現(xiàn)定位和導(dǎo)航,GPS接收機(jī)按使用環(huán)境可分為中低動(dòng)態(tài)接收機(jī)和高動(dòng)態(tài)接收機(jī),按所收信號(hào)可分為單頻C/A碼接收機(jī)和雙頻P碼和Y碼接收機(jī)。手持型GPS機(jī)車(chē)載型GPS機(jī)單頻機(jī)雙頻機(jī)GPS提供2種水平的導(dǎo)航服務(wù)—精密定位服務(wù)PPS和標(biāo)準(zhǔn)定位服務(wù)SPS,PPS主要供美國(guó)及其盟國(guó)的軍用和特殊許可部門(mén),對(duì)一般用戶(hù)只能使用單頻C/A碼定位。由于美國(guó)的GPS政策所定使用單頻C/A碼還要受到SA的影響,即為降低精度而人為加入的一些干擾。因此一般單機(jī)定位精度為二維100米左右,對(duì)要求高的場(chǎng)合則需采用DGPS差分工作方式,精度可提高到10米,軍用可到毫米級(jí)。3.1GPS傳輸信號(hào)分類(lèi)被傳輸?shù)男盘?hào)包含2不同的信息第一種是頻率為10.23MHz的軍用P碼,美國(guó)政府禁止把該碼提供給民用用戶(hù)。第二種是C/A碼頻率為1.023MHz,用戶(hù)用該碼可以得到基本的定位信息。一、語(yǔ)音識(shí)別技術(shù)簡(jiǎn)介計(jì)算機(jī)語(yǔ)音識(shí)別是一個(gè)模式識(shí)別匹配的過(guò)程。在這個(gè)過(guò)程中,計(jì)算機(jī)首先要根據(jù)人的語(yǔ)音特點(diǎn)建立語(yǔ)音模型,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析,并抽取所需的特征,在此基礎(chǔ)上建立語(yǔ)音識(shí)別所需的模板。而計(jì)算機(jī)在識(shí)別過(guò)程中要根據(jù)語(yǔ)音識(shí)別的整體模型,將計(jì)算機(jī)中存放的語(yǔ)音模板與輸入的語(yǔ)音信號(hào)的特征進(jìn)行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入的語(yǔ)音匹配的模板。然后,據(jù)此模板的定義,通過(guò)查表就可以給出計(jì)算機(jī)的識(shí)別結(jié)果。顯然,這種最優(yōu)的結(jié)果與特征的選擇、語(yǔ)音模型和語(yǔ)言模型的好壞、模板是否準(zhǔn)確等都有直接的關(guān)系。
語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科。語(yǔ)音識(shí)別過(guò)程實(shí)際上是一種認(rèn)識(shí)過(guò)程,該過(guò)程與人對(duì)語(yǔ)音的識(shí)別處理過(guò)程基本上是一致的。目前主流的語(yǔ)音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論,一個(gè)完整的語(yǔ)音識(shí)別系統(tǒng)可大致分為三部分:(1)語(yǔ)音特征提?。翰僮鲉T發(fā)出的語(yǔ)聲波先由話筒接收并轉(zhuǎn)換為電信號(hào)再進(jìn)入自動(dòng)識(shí)別系統(tǒng),經(jīng)過(guò)特征分析,把言語(yǔ)劃分成一段段具有一定時(shí)間長(zhǎng)度的音段序列,每一個(gè)音段的特征可以經(jīng)編寫(xiě)組合成便于存儲(chǔ)和便于比較的圖形,語(yǔ)音特征提取就是從語(yǔ)音波形中提取出隨時(shí)間變化的語(yǔ)音特征序列。(2)聲學(xué)模型與模式匹配:聲學(xué)模型通常將獲取的語(yǔ)音特征通過(guò)學(xué)習(xí)算法產(chǎn)生,它是識(shí)別系統(tǒng)的底層模型,并且是語(yǔ)音識(shí)別系統(tǒng)中最關(guān)鍵的一部分。聲學(xué)模型的目的是提供一種有效的方法,計(jì)算語(yǔ)音的特征矢量序列和每個(gè)發(fā)音模板之間的距離。另外,聲學(xué)模型的設(shè)計(jì)和語(yǔ)言發(fā)音特點(diǎn)密切相關(guān),必須根據(jù)不同語(yǔ)言的特點(diǎn)、識(shí)別系統(tǒng)詞匯量的大小決定識(shí)別單元的大小,在識(shí)別時(shí)將輸入的語(yǔ)音特征同聲學(xué)模型進(jìn)行匹配與比較,得到最佳的識(shí)別結(jié)果。(3)語(yǔ)言模型與語(yǔ)言處理:語(yǔ)言模型包括由識(shí)別語(yǔ)音命令構(gòu)成的語(yǔ)法網(wǎng)絡(luò)或由統(tǒng)計(jì)方法構(gòu)成的語(yǔ)言模型,語(yǔ)言處理可以進(jìn)行語(yǔ)法、語(yǔ)義分析。就像人們聽(tīng)語(yǔ)音時(shí),并不把語(yǔ)音和語(yǔ)言的語(yǔ)法結(jié)構(gòu)、語(yǔ)義結(jié)構(gòu)分開(kāi)來(lái),因?yàn)楫?dāng)語(yǔ)音發(fā)音模糊時(shí)人們可以用這些知識(shí)來(lái)指導(dǎo)對(duì)語(yǔ)言的理解過(guò)程,對(duì)機(jī)器來(lái)說(shuō),識(shí)別系統(tǒng)也要利用這些方面的知識(shí)。語(yǔ)言模型對(duì)中、大詞匯量的語(yǔ)音識(shí)別系統(tǒng)特別重要。當(dāng)分類(lèi)發(fā)生錯(cuò)誤時(shí)可以根據(jù)語(yǔ)言學(xué)模型、語(yǔ)法結(jié)構(gòu)、語(yǔ)義學(xué)進(jìn)行判斷糾正,特別是一些同音字則必須通過(guò)上下文結(jié)構(gòu)才能確定詞義。語(yǔ)音識(shí)別原理BillGates在97年世界計(jì)算機(jī)博覽會(huì)(COMDEX)主題演講會(huì)上描繪IT事業(yè)的發(fā)展宏圖時(shí),率先指出:下一代操作系統(tǒng)和應(yīng)用程序的用戶(hù)界面將是語(yǔ)音識(shí)別。工業(yè)界應(yīng)對(duì)語(yǔ)音識(shí)別領(lǐng)域的重大突破做好充分準(zhǔn)備,因?yàn)槟菍⑹且粓?chǎng)席卷全球的另一次熱潮。1998年11月5日,微軟中國(guó)研究院在北京成立。該中心的任務(wù)是重點(diǎn)研究計(jì)算機(jī)在中文環(huán)境下的易用性。
IBM公司潛心研究語(yǔ)音識(shí)別技術(shù)迄今已達(dá)30年之久,投資超過(guò)2億美元。IBM公司于1995年在北京成立了中國(guó)研究中心,中文語(yǔ)音信息處理成了該中心三大研究領(lǐng)域之一,并于1997年9月4日,在北京推出了中文連續(xù)語(yǔ)音識(shí)別產(chǎn)品ViaVoice。
1998年,英特爾公司也宣布致力于推廣語(yǔ)音識(shí)別技術(shù),除了在北京舉辦首屆語(yǔ)音技術(shù)國(guó)際論壇之外,還在北京、上海、成都、廣州等地展開(kāi)了“基于英特爾框架的語(yǔ)音識(shí)別技術(shù)”的宣傳活動(dòng)。聯(lián)合了七家世界著名學(xué)術(shù)機(jī)構(gòu)(中科院自動(dòng)化所、清華大學(xué)、香港科技大學(xué)、香港中文大學(xué)、麻省理工學(xué)院、俄勒崗研究院、WATERLLOO大學(xué))成立了“國(guó)際語(yǔ)音技術(shù)研究組織”,致力于計(jì)算機(jī)語(yǔ)音技術(shù)的基礎(chǔ)研究,以加速中文語(yǔ)音識(shí)別技術(shù)的發(fā)展。
發(fā)音的生理機(jī)構(gòu)肺活量
聲帶(聲門(mén))咽腔軟腭鼻腔口腔氣管及支氣管鼻音口音主聲道:聲門(mén)以上,經(jīng)咽喉、口腔的管道。鼻道:經(jīng)小舌和鼻的管道稱(chēng)為鼻道。次聲門(mén)系統(tǒng):經(jīng)肺、氣管和支氣管的管道。語(yǔ)音的產(chǎn)生過(guò)程音源產(chǎn)生聲道調(diào)音向外輻射音源:聲帶音源、非聲帶音源
-聲帶振動(dòng)周期:T(F0=1/T:基本頻率)聲道調(diào)音:對(duì)聲道形狀進(jìn)行調(diào)整。
-聲道共振頻率:語(yǔ)音分類(lèi):
-濁音:由聲帶振動(dòng)并激勵(lì)聲道而得到的語(yǔ)音。
-清音:由氣流高速?zèng)_過(guò)某處收縮的聲道所產(chǎn)生的語(yǔ)音。·構(gòu)詞規(guī)則·同音字判決·語(yǔ)法語(yǔ)義·背景知識(shí)預(yù)處理聲學(xué)參數(shù)分析測(cè)度估計(jì)失真測(cè)度語(yǔ)音庫(kù)判決專(zhuān)家知識(shí)庫(kù)訓(xùn)練識(shí)別結(jié)果·反混疊失真濾波器·預(yù)加重器·端點(diǎn)檢測(cè)·噪聲濾波器·歐氏距離·似然比測(cè)度○語(yǔ)音信號(hào)輸入訓(xùn)練(Training):預(yù)先分析出語(yǔ)音特征參數(shù),制作語(yǔ)音模板(Template)并存放在語(yǔ)音參數(shù)庫(kù)中。識(shí)別(Recognition):待識(shí)語(yǔ)音經(jīng)過(guò)與訓(xùn)練時(shí)相同的分析,得到語(yǔ)音參數(shù),將它與庫(kù)中的參考模板一一比較,并采用判決的方法找出最接近語(yǔ)音特征的模板,得出識(shí)別結(jié)果。失真測(cè)度(DistortionMeasures):在進(jìn)行比較時(shí)要有個(gè)標(biāo)準(zhǔn),這就是計(jì)量語(yǔ)音特征參數(shù)矢量之間的“失真測(cè)度”。主要識(shí)別框架:基于模式匹配的動(dòng)態(tài)時(shí)間規(guī)整法(DTW:Dynamic
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小班班級(jí)安全工作總結(jié)
- 小班美術(shù)粘土活動(dòng)毛毛蟲(chóng)
- 兒科護(hù)理專(zhuān)業(yè)知識(shí)
- 卡通游泳安全知識(shí)
- 工作管理表現(xiàn)好的評(píng)語(yǔ)
- 2025期房買(mǎi)賣(mài)定金合同示例
- 2025關(guān)于勞動(dòng)合同與勞務(wù)合同的區(qū)別介紹
- 2025辦公用品耗材購(gòu)銷(xiāo)合同
- 2025年空調(diào)維修合同樣本
- 2025門(mén)窗制作承包合同
- 產(chǎn)鉗助產(chǎn)護(hù)理查房
- 《中國(guó)潰瘍性結(jié)腸炎診治指南(2023年)》解讀
- (完整版)小學(xué)生24點(diǎn)習(xí)題大全(含答案)
- DB-T29-74-2018天津市城市道路工程施工及驗(yàn)收標(biāo)準(zhǔn)
- 小學(xué)一年級(jí)20以?xún)?nèi)加減法混合運(yùn)算3000題(已排版)
- 智慧工廠數(shù)字孿生解決方案
- 病機(jī)-基本病機(jī) 邪正盛衰講解
- 品管圈知識(shí) 課件
- 非誠(chéng)不找小品臺(tái)詞
- 2024年3月江蘇省考公務(wù)員面試題(B類(lèi))及參考答案
- 患者信息保密法律法規(guī)解讀
評(píng)論
0/150
提交評(píng)論