深度解析:看科技巨頭如何搶灘語音識(shí)別技術(shù)_第1頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、摘要:AI語音交互產(chǎn)業(yè)的風(fēng)口已至?引言 在過去的半個(gè)月中,國內(nèi)人工智能領(lǐng)域的融資消息幾乎被AI語音交互搶占,智能語音交互系統(tǒng)研發(fā)商蛙聲科技獲得天使輪融資,遠(yuǎn)望資本投資;圖靈機(jī)器人完成3.5億元B+輪融資,投資方為中一資本、前海梧桐并購基金;語音技術(shù)提供商思必馳宣布完成D輪5億元融資,由元禾控股、中國民生投資集團(tuán)領(lǐng)投,深創(chuàng)投、富士康、聯(lián)發(fā)科跟投。這是否意味著繼亞馬遜、谷歌、蘋果等國際科技巨頭在AI語音交互戰(zhàn)略熱潮后,國內(nèi)以中文為基礎(chǔ)的AI語音交互產(chǎn)業(yè)的風(fēng)口已經(jīng)到來?智能語音技術(shù)成果顯著,商業(yè)化落地初具規(guī)模、市場潛力如何?AI語音交互技術(shù)的落地需要有扎實(shí)的語音識(shí)別技術(shù)、強(qiáng)大的語言處理能力及準(zhǔn)確的數(shù)

2、據(jù)支撐。搭載了語音交互系統(tǒng)的智能硬件,便是物聯(lián)網(wǎng)時(shí)代呈現(xiàn),而智能硬件生態(tài)圈的布局也是實(shí)現(xiàn)場景化應(yīng)用的重要因素。繼Siri、 GoogleNow、Cortana及Alexa的智能語音逐步達(dá)到成熟的應(yīng)用階段后,智能語音正在以最自然的交互方式潛移默化地改變著我們的生活。 隨著AI技術(shù)的不斷深入,智能語音的應(yīng)用范圍也在不斷拓展。無論是教育、醫(yī)療、客服、電信等傳統(tǒng)行業(yè),還是智能家居、移動(dòng)互聯(lián)網(wǎng)、汽車電子終端、智能機(jī)器人、智能客服等新興領(lǐng)域,智能語音早已成為百搭標(biāo)配,語音功能也幾乎成為了“智能”的代名詞。在巨大的潛在市場面前,國內(nèi)企業(yè)諸如科大訊飛、思必馳、云知聲、捷通華聲、百度等公司在智能家居、智能車載、

3、智能可穿戴等領(lǐng)域都已積極入局。AI加持下的語音交互技術(shù)現(xiàn)有水平到底怎樣?在智能語音進(jìn)階的過程中,“先讓機(jī)器聽到、聽懂、反饋,再讓機(jī)器思考、溝通、決策”是諸多智能語音企業(yè)的愿景,而技術(shù)實(shí)力則是實(shí)現(xiàn)該愿景的第一話語權(quán)。方象知產(chǎn)研究院基于AI語音交互技術(shù)現(xiàn)有水平進(jìn)行分析歸納總結(jié)(見表一),對(duì)表中的關(guān)鍵核心技術(shù)進(jìn)行分析發(fā)現(xiàn),就技術(shù)通路而言,AI語音交互技術(shù)囊括了一條完整的人工智能路徑。一套完整的AI語音交互系統(tǒng)需要不同層次的技術(shù)支撐,除了需要具備AI大腦感知、AI大腦認(rèn)知及AI大腦決策三個(gè)層面,還要具備語音識(shí)別、自然語言處理及語音合成三大模塊,其中蘊(yùn)含著語音識(shí)別(ASR)、語義理解(NLU)、自然語言

4、生成(NLG)及語音合成(TTS)四項(xiàng)關(guān)鍵核心技術(shù)。表一:AI語音交互技術(shù)現(xiàn)狀解析方象知產(chǎn)研究院整理 據(jù)統(tǒng)計(jì),語音識(shí)別技術(shù)、自然語言處理技術(shù)及語音合成技術(shù)的全球?qū)@暾埩砍手鹉晟仙厔荨?017年各項(xiàng)技術(shù)的全球申請量分別約為400項(xiàng)、130項(xiàng)及22項(xiàng),其中申請主體主要集中在蘋果、微軟、谷歌及百度等公司。在產(chǎn)業(yè)化過程中,感知、認(rèn)知和智能決策是三個(gè)不斷深化發(fā)展的過程,目前AI語音交互技術(shù)正在經(jīng)歷從感知智能、向認(rèn)知智能的飛躍。技術(shù)價(jià)值角度解析技術(shù)前景、發(fā)展趨勢及投資分散點(diǎn)在哪里?AI語音交互能夠完成怎樣的獨(dú)有任務(wù)并體現(xiàn)其價(jià)值呢?基于上述分析,方象知產(chǎn)研究院認(rèn)為,持續(xù)的數(shù)據(jù)積累與技術(shù)升級(jí)是AI語音交互

5、未來發(fā)展的趨勢,更加智能與流暢的技術(shù)實(shí)現(xiàn)、快速便捷地達(dá)成指令、隱私安全性的保障等都是尚需突破的技術(shù)關(guān)鍵點(diǎn)。 AI語音交互需要在具體的應(yīng)用場景中高效、便捷地解決人機(jī)交互需求才能產(chǎn)生價(jià)值,合適的語音入口是關(guān)鍵。智能音箱、智能電視、家庭機(jī)器人、車載場景、可穿戴設(shè)備等都有可能成為AI語音交互技術(shù)的關(guān)鍵應(yīng)用場景,也會(huì)是當(dāng)前積極布局AI語音交互的科技巨頭們的必爭之地。END聲 明本文由方象知產(chǎn)研究院原創(chuàng),申請轉(zhuǎn)載請關(guān)注我院獲取聯(lián)系方式,我院保留追究侵權(quán)行為的權(quán)利。本文僅以學(xué)術(shù)交流目的對(duì)特定問題進(jìn)行探討,分析結(jié)論不代表對(duì)特定主體的消極評(píng)價(jià)。任何行業(yè)的發(fā)展走勢均受到多重復(fù)雜因素影響,本文對(duì)特定行業(yè)的發(fā)展預(yù)測不應(yīng)視為對(duì)具體投資行為的指引。感謝您關(guān)注方象知產(chǎn)研究院,在這里,我們將用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論