![語音芯片AI人工智能解決方案_第1頁](http://file4.renrendoc.com/view/3bae0023da5d8ad13160e3a16d47508c/3bae0023da5d8ad13160e3a16d47508c1.gif)
![語音芯片AI人工智能解決方案_第2頁](http://file4.renrendoc.com/view/3bae0023da5d8ad13160e3a16d47508c/3bae0023da5d8ad13160e3a16d47508c2.gif)
![語音芯片AI人工智能解決方案_第3頁](http://file4.renrendoc.com/view/3bae0023da5d8ad13160e3a16d47508c/3bae0023da5d8ad13160e3a16d47508c3.gif)
![語音芯片AI人工智能解決方案_第4頁](http://file4.renrendoc.com/view/3bae0023da5d8ad13160e3a16d47508c/3bae0023da5d8ad13160e3a16d47508c4.gif)
![語音芯片AI人工智能解決方案_第5頁](http://file4.renrendoc.com/view/3bae0023da5d8ad13160e3a16d47508c/3bae0023da5d8ad13160e3a16d47508c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Voice Trigger芯片及處理方案語音應(yīng)用崛起之年最具競(jìng)爭(zhēng)力VT處理方案姜 黎 (Jeffrey Jiang),湯健-7-30第1頁語音芯片介紹02AP方案經(jīng)典介紹03面向手機(jī)市場(chǎng)第一代語音介紹04面向手機(jī)市場(chǎng)第二代語音介紹05CONTENT競(jìng)爭(zhēng)對(duì)手情況06我方產(chǎn)品介紹A語音交互趨勢(shì)01第2頁1語音交互趨勢(shì)PART ONE語音時(shí)代到來第3頁語音交互趨勢(shì),戰(zhàn)國時(shí)代第一年第4頁2語音芯片介紹PART TWO語音作為人機(jī)交互伎倆時(shí)代將到來第5頁語言芯片方案介紹,戰(zhàn)國時(shí)代第一年預(yù)測(cè):MTK等AP廠商集成音響方向高集成度趨勢(shì)國芯全志炬芯MTK白電方向開始有方案啟英泰倫長虹投資背景單麥克 10米手機(jī)
2、平臺(tái)集成旗艦平臺(tái)高通,海思旗艦平臺(tái)音響方向作為領(lǐng)頭羊,集中了眾多競(jìng)爭(zhēng),逐步往VT+AP+Soundbar高集成度方向,對(duì)功耗敏感要求低(詳細(xì)分析詳見AP方案介紹)白電方向剛開始,不過已經(jīng)表達(dá)出價(jià)格高度敏感,芯片算法二合一趨勢(shì)(詳細(xì)分析詳見對(duì)手分析2)手機(jī)旗艦平臺(tái)部分支持近場(chǎng)喚醒第6頁語音芯片介紹AP+Codec應(yīng)用通用芯片:在智能語音設(shè)備早期階段(-),因?yàn)樾酒邪l(fā)周期漫長(18-24個(gè)月),研發(fā)投入高昂,在終端銷量難以支撐芯片規(guī)模暴發(fā)情況下,市場(chǎng)均采取通用芯片。是AP芯片/平板芯片等+Codec芯片/DSP芯片等組合方式,由Codec芯片進(jìn)行數(shù)模信號(hào)轉(zhuǎn)換,DSP對(duì)數(shù)字信號(hào)進(jìn)行處理,包含回聲消
3、除、噪聲抑制、語音降噪/增強(qiáng)等,最終加入云端計(jì)算支持。代表芯片是聯(lián)發(fā)科MT8563和全志R16。專用芯片:是語音芯片發(fā)展第二個(gè)階段,其采取適合做語音處理CPU,加上多通道麥克風(fēng)陣列接口,在語音算法上支持回聲消除、噪聲抑制、聲源定位、語音增強(qiáng)等技術(shù),并兼具運(yùn)算能力和低功耗考量。代表芯片有聯(lián)發(fā)科MT8516、科勝訊CX20924、晶晨半導(dǎo)體A113、瑞芯微RK3036和北京君正X1000。這類芯片未內(nèi)置神經(jīng)網(wǎng)絡(luò)加速器,AI多借助云端實(shí)現(xiàn)。(當(dāng)前主流智能音箱方案)AI語音芯片:是語音芯片發(fā)展第三個(gè)階段。恰好處理了這些問題:(1)集成了專用AI處理器模塊(NPU),用以對(duì)當(dāng)?shù)貦C(jī)器學(xué)習(xí)算法進(jìn)行加速;(2
4、)語音AI芯片不但集成CPU、NPU,還集成DSP信號(hào)處理、Wi-Fi/藍(lán)牙等模塊;(3)能夠?qū)崿F(xiàn)“端側(cè)”智能,將慣用功效由云端轉(zhuǎn)換到當(dāng)?shù)?,可離線操作并處理用戶數(shù)據(jù)隱私問題。代表芯片是杭州國芯GX8010。當(dāng)前大多數(shù)算法企業(yè)都有第三類芯片研發(fā)計(jì)劃,主要市場(chǎng)還是面向智能音箱市場(chǎng)。同期,通用芯片/專用芯片廠商開始升級(jí)支持LCD/攝像頭等,面向未來智能相框市場(chǎng)。第7頁3AP方案介紹PART THREE第8頁AP方案經(jīng)典介紹:杭州國芯GX8010AP+Codec應(yīng)用集成了國芯gxNPU,ARM Cortex A7 CPU,Hifi-4 DSP等多個(gè)處理器,其中DSP負(fù)責(zé)語音信號(hào)處理增強(qiáng)、NPU負(fù)責(zé)深度
5、學(xué)習(xí)計(jì)算、CPU負(fù)責(zé)軟件運(yùn)行和應(yīng)用決議控制等。支持8通道麥克風(fēng)接口,支持1080P攝像頭輸入,圖像預(yù)處理,MJPEG編碼等模塊。功耗0.7W 該方案僅針對(duì)智能音箱市場(chǎng),無法覆蓋低功耗市場(chǎng)(智能手機(jī)、智能耳機(jī))及對(duì)AP無需求應(yīng)用市場(chǎng)(臺(tái)燈,燈泡,兒童玩具,白電)第9頁4面向手機(jī)市場(chǎng)第一代語音介紹PART FOUR處理語音有與沒有問題第10頁面向手機(jī)市場(chǎng)第一代語音介紹處理語音有與沒有問題方案特點(diǎn)為: (僅旗艦平臺(tái)支持語音方案)1.手機(jī)平臺(tái)本身限制性:針對(duì)每一個(gè)功效需要單獨(dú)收取研發(fā)授權(quán)費(fèi)(5萬$以上),同時(shí)需要收取整機(jī)銷售額5%整機(jī)授權(quán)費(fèi)及小批量試產(chǎn)生產(chǎn)授權(quán)費(fèi)。限制了客戶在其平臺(tái)上做差異化可能性。2
6、.耗電:整機(jī)待機(jī)時(shí)間通常為5毫安時(shí),采取Codec常開偵聽,會(huì)增加3倍功耗,降低待機(jī)時(shí)間。普通會(huì)在終端上設(shè)置快捷鍵來開啟喚醒功效3.近場(chǎng)喚醒,不支持遠(yuǎn)場(chǎng)喚醒。4.以云端為中心。5.平臺(tái)迭代周期如(通用芯片),研發(fā)周期普通需要24個(gè)月。終端代表:小米8,華為mate10高通旗艦平臺(tái)codec海思旗艦平臺(tái)codec第11頁聯(lián)想手機(jī)語音識(shí)別進(jìn)化(-6-6)新款A(yù)irPods耳機(jī)將支持“HeySiri”語音激活功效,用戶無須觸碰耳機(jī),只需隔空呼叫“HeySiri”,即可喚醒語音助手并與之實(shí)現(xiàn)交互。 平臺(tái)入口需求第12頁華為手機(jī)語音識(shí)別進(jìn)化(-6-19)新款A(yù)irPods耳機(jī)將支持“HeySiri”語音
7、激活功效,用戶無須觸碰耳機(jī),只需隔空呼叫“HeySiri”,即可喚醒語音助手并與之實(shí)現(xiàn)交互。 平臺(tái)入口需求第13頁5面向手機(jī)市場(chǎng)第二代語音介紹PART FIVE開啟語音專用芯片時(shí)代第14頁面向手機(jī)市場(chǎng)第二代語音介紹處理性能好與壞問題方案特點(diǎn)為:1.打破了平臺(tái)不足,能夠應(yīng)用到更廣市場(chǎng)范圍2.整體方案比較省電。能夠支持熄屏喚醒。3.以終端為中心,可實(shí)現(xiàn)離線識(shí)別。4. 本公司方案支持近/遠(yuǎn)場(chǎng)喚醒。終端代表:三星S9+, VIVO NEX,小米6X。第15頁三星手機(jī)VT進(jìn)化(-3-6)低功耗需求第16頁小米手機(jī)VT進(jìn)化(-4-22)新款A(yù)irPods耳機(jī)將支持“HeySiri”語音激活功效,用戶無須觸
8、碰耳機(jī),只需隔空呼叫“HeySiri”,即可喚醒語音助手并與之實(shí)現(xiàn)交互。 低功耗需求第17頁VIVO手機(jī)VT進(jìn)化(-6-12)新款A(yù)irPods耳機(jī)將支持“HeySiri”語音激活功效,用戶無須觸碰耳機(jī),只需隔空呼叫“HeySiri”,即可喚醒語音助手并與之實(shí)現(xiàn)交互。 低功耗、個(gè)性化定制需求第18頁6對(duì)手分析PART SIX低功耗市場(chǎng)及白電第19頁面向手機(jī)等低功耗市場(chǎng)友商,戰(zhàn)國時(shí)代第一年DSPG企業(yè)VT芯片特點(diǎn):1. 外部MIC電源控制上,沒有考慮功耗問題。外部成本較高。 僅支持一個(gè)模擬MIC接口(AMIC),而且DMIC沒有到平臺(tái)CodecDMIC接口通路,這在使用上是不方便,需要增加額外電
9、路成本,而且這部分成本價(jià)格偏貴。算法靈活度不夠。 算法合作方為美國Sensory企業(yè),Sensory企業(yè)算法精簡(jiǎn),DSPG能夠放得下,國內(nèi)其它企業(yè)算法就放不進(jìn)去。算法企業(yè)收取額外Royalty,價(jià)格非常貴(1.5USD)。4. 整體上不是為遠(yuǎn)場(chǎng)設(shè)計(jì)。 選取是CEVA TL1 DSP, 性能偏弱 不利于后續(xù)擴(kuò)展。該芯片是當(dāng)前唯一僅能滿足手機(jī)環(huán)境量產(chǎn)芯片,客戶當(dāng)前沒有選擇余地。第20頁面向白電市場(chǎng)友商,戰(zhàn)國時(shí)代第一年啟英泰倫VT芯片:內(nèi)嵌ARM M4F核跑降噪,AEC等算法。 對(duì)于算法生態(tài)缺乏了解,當(dāng)前音頻相關(guān)算法多數(shù)是和Tensilica HiFi DSP,CEVA DSP相互結(jié)合。對(duì)第三方算法
10、企業(yè)兼容性較弱芯片面積較大9x9mm,功耗沒有優(yōu)勢(shì)。AEM M4F內(nèi)核架構(gòu),與終端設(shè)備上現(xiàn)有CPU功效重合,不過又無法取代現(xiàn)有終端設(shè)備CPU/MCU,如機(jī)器人,玩具,智能家居,空調(diào)等;同時(shí)也會(huì)對(duì)部分市場(chǎng)造成功效浪費(fèi),如照明,汽車電子等。 該芯片尺寸和功耗無法面向手機(jī)/藍(lán)牙耳機(jī)/遙控器等市場(chǎng)。 對(duì)于臺(tái)燈、燈泡等市場(chǎng)該芯片功效太過富裕,造成功效和成本浪費(fèi)。第21頁A我方產(chǎn)品介紹Appendix處理功耗問題和離線問題第22頁產(chǎn)品路標(biāo)及目標(biāo)-2022手機(jī)&Wearable市場(chǎng)1mW Trigger功耗支持4 模擬MIC支持遠(yuǎn)場(chǎng)應(yīng)用WLCSP-25 2.0 x2.02022手機(jī)&Wearable市場(chǎng)0.
11、5mW Trigger功耗更強(qiáng)降噪性能支持4 模擬MIC支持遠(yuǎn)場(chǎng)應(yīng)用手機(jī)&Wearable市場(chǎng)0.5mW Trigger功耗更強(qiáng)降噪性能支持4 模擬MIC支持遠(yuǎn)場(chǎng)應(yīng)用低功耗硬件AI語音識(shí)別核支持80%離線識(shí)別應(yīng)用方案能夠?qū)τ趹?yīng)用95%場(chǎng)景滿足Trigger識(shí)別功效應(yīng)用方案能夠?qū)τ趹?yīng)用98%場(chǎng)景滿足Trigger識(shí)別功效應(yīng)用方案能夠?qū)τ趹?yīng)用99%場(chǎng)景滿足Trigger識(shí)別功效對(duì)于客戶交互提供極高客戶感受第23頁產(chǎn)品開發(fā)準(zhǔn)期進(jìn)行110月1112月121月13月MPW芯片測(cè)試完成完成第一輪產(chǎn)品批量出貨MPW芯片Alpha客戶導(dǎo)入,F(xiàn)ull Mask TO, 針對(duì)四大行業(yè)方案人力準(zhǔn)備完成,銷售團(tuán)體到位FPGA及算法能夠DemoMPW芯片TO第24頁專利情況風(fēng)口機(jī)會(huì)只有一次序號(hào)申請(qǐng)?zhí)柮Q狀態(tài)類型110369009.8一個(gè)用于變送器調(diào)理芯片通信系統(tǒng)及方法初審合格創(chuàng)造2208743491 一個(gè)含有語音喚醒功效裝置遞交實(shí)用新型已經(jīng)申請(qǐng)專利計(jì)劃申請(qǐng)專利明細(xì)序號(hào)申請(qǐng)?zhí)柮Q狀態(tài)類型1VAD低功耗偵聽方法計(jì)劃創(chuàng)造2VAD降噪方法計(jì)劃創(chuàng)造3VAD喚醒詞SNR增強(qiáng)方法計(jì)劃創(chuàng)造4低功耗Voice ADC設(shè)計(jì)計(jì)劃創(chuàng)造5集成電路版圖版權(quán)計(jì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 德國坦克聲卡行業(yè)行業(yè)發(fā)展趨勢(shì)及投資戰(zhàn)略研究分析報(bào)告
- 2025年可壓縮糖項(xiàng)目投資可行性研究分析報(bào)告
- 高助精粉行業(yè)市場(chǎng)發(fā)展及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 2025年度工礦產(chǎn)品購銷合同工業(yè)互聯(lián)網(wǎng)應(yīng)用合同
- 2025年度鋼結(jié)構(gòu)工程預(yù)決算審核合同
- 2025年度航空貨運(yùn)代理服務(wù)合同標(biāo)準(zhǔn)范本
- 2025年度農(nóng)業(yè)科技項(xiàng)目合作研發(fā)合同范本
- 2025年度房地產(chǎn)營銷居間服務(wù)合同標(biāo)準(zhǔn)文本
- 2025年度特色民宿室內(nèi)外裝修改造合同
- 2025年度護(hù)坡工程勞務(wù)合同檔案管理范本
- 2025年度高端商務(wù)車輛聘用司機(jī)勞動(dòng)合同模板(專業(yè)版)4篇
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- 2025長江航道工程局招聘101人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年黑龍江哈爾濱市面向社會(huì)招聘社區(qū)工作者1598人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 執(zhí)行總經(jīng)理崗位職責(zé)
- 《妊娠期惡心嘔吐及妊娠劇吐管理指南(2024年)》解讀
- 《黑神話:悟空》跨文化傳播策略與路徑研究
- 《古希臘文明》課件
- 居家養(yǎng)老上門服務(wù)投標(biāo)文件
- 長沙市公安局交通警察支隊(duì)招聘普通雇員筆試真題2023
- 2025年高考語文作文滿分范文6篇
評(píng)論
0/150
提交評(píng)論