




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
智能語音行業(yè)分析研究報告 5 82.1中國智能語音行 8 8 8 8 92.2.4自然語言理解技術(shù) 9 9 3.2.1深度學(xué)習(xí) 3.2.2云計算 4中國智能語音行業(yè)制約因素 4.1行業(yè)基礎(chǔ)層技 214.2技術(shù)瓶頸限 21 4.2.2自然語言處理技術(shù)尚不成熟 22 23 25 25 25 27 27 27 28 28 28 28 29 29 29 7.5.3競爭優(yōu)勢 7.6.1企業(yè)簡介 7.6.3競爭優(yōu)勢 圖表目錄圖2-1中國智能語音行業(yè)市場規(guī)模,2014年-2023年預(yù)測 圖2-2中國智能語音行業(yè)產(chǎn)業(yè)鏈 圖4-1中國智能語音行業(yè)國家性政策 >GUI——GraphicalUserI>算法——基于特定的計算模型,旨在解決某一信息處理問題而設(shè)計的一個指令序列。算力——計算機(jī)計算哈希函數(shù)輸出的速度。>定制化芯片——通過定制化半導(dǎo)體解決方案,面向特定領(lǐng)域提供的定制化芯片。類腦類芯片——仿照人類大腦的信息處理方式所制造的芯片,該類芯片可實(shí)現(xiàn)數(shù)據(jù)并HMM模型——HiddenMarkovModel,隱性馬爾可夫統(tǒng)計模型,用來描述一個含有>API接口——ApplicationProgrammingInterface,應(yīng)用程序編程接口。語音芯片——具備語音交互功能的專用集成電路。>嵌入式語音軟件——滿足資源和運(yùn)算受限環(huán)境下的各種嵌入式應(yīng)用需求的語音軟件語音識別技術(shù)——將人類語音中的詞匯內(nèi)容轉(zhuǎn)換成計算機(jī)可以處理的輸入語料,最終聲紋識別技術(shù)——通過語音信號提取說話人獨(dú)有的聲門開合頻率、口腔大小形狀及聲>語音去噪技術(shù)——控制語音通信過程中的語音質(zhì)量,提高系統(tǒng)對于語音理解的準(zhǔn)確性,>驀然認(rèn)知——一家以認(rèn)知計算、自然語言理解技術(shù)為核心的人工智能>思必馳———家專注于人性化智能語音交互技術(shù)的智能語音服>云知聲——一家專注于物聯(lián)網(wǎng)人工智能服務(wù)的智能語音識別服>地平線——中國人工智能芯片和算法軟件服是以語音為研究對象對語音語義進(jìn)行識別、理解以及生成,使機(jī)器具備自然語言處理能力,語音合成技術(shù)是通過計算機(jī)將外部輸入的文字信息轉(zhuǎn)變成自然流暢的語言,賦予機(jī)器語音識別技術(shù)是將人類語音中的詞匯內(nèi)容轉(zhuǎn)換成計算機(jī)可以處理的音識別技術(shù)通過將用戶輸入的指令進(jìn)行特征提取,形成特征數(shù)據(jù)流,然后與系統(tǒng)中已有的語音模型進(jìn)行比對,尋找系統(tǒng)中最為接近的語音內(nèi)容。實(shí)現(xiàn)語音識別的過程主要分為四步(1)確定識別對象為單詞、音節(jié)或音素;(2)提取特征參數(shù),從語音波形中提取出重要的反應(yīng)語音特征的相關(guān)信息;(3)建立聲學(xué)模型和語言模型,進(jìn)行訓(xùn)練和識別;(4)是后期的處理,身份。聲紋識別技術(shù)的作用主要包括兩方面:(1)發(fā)聲者辨認(rèn),主要用于在從某一語音材料的若干發(fā)聲者中尋找指定發(fā)聲者;(2)發(fā)聲者確認(rèn),主要用于確認(rèn)某一語料是否由指定發(fā)聲語音去噪技術(shù)通過控制語音通信過程中的語音質(zhì)量,提高系統(tǒng)對于語音理解的準(zhǔn)確性,型。有效的回聲消除算法需要持續(xù)的在一顆DSP芯片上運(yùn)行,但有限的DS據(jù)沙利文數(shù)據(jù)統(tǒng)計,2014年中國智能語音行業(yè)市場規(guī)模僅有28.7億元(見圖2-1),得益于政策環(huán)境和技術(shù)實(shí)力的支持,中國智能語音行業(yè)得以快速發(fā)展。2018年中國智能語音行業(yè)的市場規(guī)模增長至157.9億元,2014年至2018年中國智能語音行業(yè)的年復(fù)合增長率達(dá)到53.2%。面的利好政策頻出,為智能語音產(chǎn)業(yè)的發(fā)展創(chuàng)造了良好的政策環(huán)境《新一代人工智能發(fā)展規(guī)劃》以及《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020年》中,政府均將推動智能制造行業(yè)上升為國家戰(zhàn)略,積極推動智能產(chǎn)品在各場景的集成應(yīng)用。尤其在《行動規(guī)劃》中,政府的發(fā)展重點(diǎn)覆蓋智能語音行業(yè)的基礎(chǔ)層至應(yīng)用層,發(fā)展。其次,語音識別、自然語言識別等核心技術(shù)的發(fā)展推動智能語音產(chǎn)品的商業(yè)化落地,目前,中國智能語音行業(yè)處于快速發(fā)展階段,各場景智能語音產(chǎn)品的商業(yè)化應(yīng)用逐漸走向成熟。人工智能、語音識別技術(shù)等核心技術(shù)的快速發(fā)展推動下游各領(lǐng)域?qū)χ悄苷Z音的應(yīng)用需求不斷擴(kuò)大,吸引政府、資本的持續(xù)關(guān)注。互聯(lián)網(wǎng)企業(yè)、智能語音技術(shù)企業(yè)以及智能語音初創(chuàng)企業(yè)紛紛布局中國智能語音市場,推動智能語音行業(yè)市場規(guī)模持續(xù)擴(kuò)容。沙利文預(yù)測,2023年中國智能語音行業(yè)市場規(guī)模將達(dá)到655.1億元。2.4中國智能語音行業(yè)產(chǎn)業(yè)鏈分析中國智能語音產(chǎn)業(yè)鏈的上游參與者分為基礎(chǔ)硬件供應(yīng)商和軟件服務(wù)商兩類?;A(chǔ)硬件供應(yīng)商主要為智能語音行業(yè)的上游提供人工智能芯片、傳感器等智能硬件。軟件服務(wù)商主要包括數(shù)據(jù)服務(wù)平臺服務(wù)商、云計算服務(wù)商等參與主體。行業(yè)中游的主要參與者主要包括智能語音科技企業(yè)、互聯(lián)網(wǎng)企業(yè)等參與主體。中國智能語音產(chǎn)業(yè)下游為智能語音產(chǎn)品及服務(wù)所覆蓋的應(yīng)用領(lǐng)域,主要包括家居、醫(yī)療、教育等場景?;A(chǔ)硬件芯片其他軟件服務(wù)數(shù)據(jù)服務(wù)平臺云計算服務(wù)算法其他技術(shù)支持語音識別技術(shù)自然語言處理技術(shù)智能語音服務(wù)商智能語音科技企業(yè)互聯(lián)網(wǎng)企業(yè)其他智能家居智能可穿戴設(shè)備智能安防智能教育智能醫(yī)療智能客服上游:基礎(chǔ)設(shè)施供應(yīng)商中游:智能語音服務(wù)商下游:應(yīng)用領(lǐng)域來源:沙利文研究院繪制2.4.1中國智能語音行業(yè)產(chǎn)業(yè)鏈上游中國智能語音產(chǎn)業(yè)鏈上游基礎(chǔ)層主要為智能語音設(shè)備的運(yùn)行提供計算力。上游的基礎(chǔ)設(shè)施供應(yīng)商分為基礎(chǔ)硬件供應(yīng)商和軟件服務(wù)商兩類。基礎(chǔ)硬件供應(yīng)商為行業(yè)上游提供人工智能人工智能芯片作為智能語音產(chǎn)業(yè)的核心,芯片的技術(shù)成熟度將影響智能語音設(shè)備的性能。人工智能芯片行業(yè)的技術(shù)門檻較高,海外廠商技術(shù)領(lǐng)先,中國人工智能芯片較依賴進(jìn)口,導(dǎo)致智能語音服務(wù)商的制造成本居高不下,壓縮企業(yè)利潤空間。人工智能芯片按照不同應(yīng)用場景可分為通用類AI芯片、云端AI芯片、終端AI芯片。在通用類AI芯片領(lǐng)域,美國英偉達(dá)的GPU芯片占據(jù)主導(dǎo)地位,中國AI芯片企業(yè)人工智能基礎(chǔ)層建設(shè)實(shí)力較薄弱,缺乏國際競爭力。在云端AI芯片領(lǐng)域,英特爾、亞馬遜等海外企業(yè)占據(jù)較大的市場份額,部分中國企業(yè)陸續(xù)布局云端推斷市場,但競爭實(shí)力較弱。在終端AI芯片領(lǐng)域,中國企業(yè)取得了較大的突破,代表企業(yè)包括寒武紀(jì)、地平線和深鑒科技等優(yōu)質(zhì)廠商。伴隨定制化芯片和類腦芯片的發(fā)展,中國人工智能芯片將逐漸打破海外芯片企業(yè)對中國市場的壟斷。>軟件服務(wù)巨頭占據(jù)算法行業(yè)較大的市場份額,中國僅有少數(shù)幾(2)云計算服務(wù)云計算服務(wù)為智能語音設(shè)備提供強(qiáng)大的運(yùn)算能力和資源整合能力,提高了智能語音后臺技術(shù)>智能語音科技企業(yè)行業(yè)發(fā)展前期,智能語音科技企業(yè)以研發(fā)單一的智能語音技術(shù)為主企業(yè)收益。近年來,伴隨智能語音行業(yè)的發(fā)展,深度學(xué)習(xí)技術(shù)的應(yīng)用、的積累、以及計算機(jī)算力的提升,使智能語音技術(shù)的調(diào)用得以簡化,技術(shù)門檻逐漸降低,導(dǎo)致智能語音科技企業(yè)的技術(shù)優(yōu)勢逐漸被削弱,智能語音科技術(shù)商轉(zhuǎn)型為全方位人工智能技術(shù)服務(wù)商。智能語音科技企業(yè)依托其下游各應(yīng)用場景,通過為下游應(yīng)用領(lǐng)域提供高端定制化>互聯(lián)網(wǎng)企業(yè)基于智能語音領(lǐng)域較好的發(fā)展前景,以BAT為代表的互聯(lián)網(wǎng)巨頭開始布局中國智能語的產(chǎn)品中,并利用其C端優(yōu)勢推動產(chǎn)品在下游各應(yīng)用場景的落地?;ヂ?lián)網(wǎng)巨頭用戶流量優(yōu)>智能家居智能語音在醫(yī)療行業(yè)的應(yīng)用主要體現(xiàn)在兩個方面:(1)利用智能語音技術(shù)實(shí)現(xiàn)病人電子電子病例系統(tǒng)下載完整的診療過程和病歷;(2)伴隨語音病歷的積累,醫(yī)院可以利用大數(shù)據(jù)>車載語音網(wǎng)系統(tǒng)。>智能教育 "平臺+內(nèi)容+終端+應(yīng)用"的完整教育教學(xué)生態(tài)體系,推動教育信息化產(chǎn)業(yè)的快速發(fā)展。近準(zhǔn)化輸出,且滿足24小時全天候在線服務(wù)。此外,智能客服的應(yīng)用將最大程度上保障客戶智能語音領(lǐng)域的商業(yè)化應(yīng)用較為廣泛,核心技術(shù)的發(fā)展推動各應(yīng)用領(lǐng)域智能語音產(chǎn)品的落在語音合成技術(shù)中,最具代表性的語音合成方法為HMM模型,可以在不受人工干預(yù)深度學(xué)習(xí)是推動智能語音行業(yè)發(fā)展的關(guān)鍵性技術(shù),基于深度神經(jīng)網(wǎng)絡(luò)的語音識別技術(shù)和3.2.2云計算云計算服務(wù)為智能語音設(shè)備提供強(qiáng)大的運(yùn)算能力和資源整合能力,提高智能語音后臺技術(shù)的智能化水平,使終端設(shè)備獲得云端服務(wù)器級別的運(yùn)算能力,進(jìn)一步提高語音識別能力,推動智能語音技術(shù)應(yīng)用逐步落地。各智能語音服務(wù)商可以在傳統(tǒng)云計算結(jié)構(gòu)上建立新的服務(wù)層,提高智能語音設(shè)備在語音識別、自然語言處理等方面的核心能力。3.2.3大數(shù)據(jù)大數(shù)據(jù)技術(shù)的發(fā)展為智能語音后端數(shù)據(jù)存儲提供支持。大數(shù)據(jù)技術(shù)特有的分布式存儲技術(shù)能夠?qū)我惑w量巨大的語音數(shù)據(jù)文件切分成不同模塊,使其能夠存放于多臺計算機(jī)所建構(gòu)的集群中。多臺計算機(jī)之間通過相互通信將集群內(nèi)的存儲空間進(jìn)行資源整合、數(shù)據(jù)虛擬化,并向外提供文件訪問服務(wù)的文件系統(tǒng)。大數(shù)據(jù)技術(shù)在智能語音領(lǐng)域的應(yīng)用極大的降低了數(shù)據(jù)存儲所需的硬件成本。大數(shù)據(jù)技術(shù)可以對單一體量的數(shù)據(jù)進(jìn)行切分、存儲、再整合,語音語料的數(shù)據(jù)存儲只需多個性能基本達(dá)標(biāo)的存儲硬件,不再受限于計算機(jī)硬件的性能。大數(shù)據(jù)技術(shù)的應(yīng)用可以保證所存儲數(shù)據(jù)的安全,由于大數(shù)據(jù)技術(shù)可以將單條語音數(shù)據(jù)重復(fù)分配至集群中的多個計算機(jī)中。當(dāng)數(shù)據(jù)不慎丟失或破壞時,系統(tǒng)可以在集群中提取到完整大數(shù)據(jù)技術(shù)在智能語音領(lǐng)域降低了海量數(shù)據(jù)存儲的難度,同時替代了高性能存儲硬件的使用,為日益增長的進(jìn)量數(shù)據(jù)以及原始數(shù)據(jù)的存儲提供技術(shù)支持。3.3語音交互的便利性優(yōu)勢語音交互技術(shù)的發(fā)展幫助用戶實(shí)現(xiàn)了本能表達(dá),解放消費(fèi)者感官的占用,優(yōu)化用戶的消語言交互是利用語言信息進(jìn)行交互的技術(shù),在空間上打破了用戶與智能設(shè)備的距離限制。智能語音芯片等核心基礎(chǔ)元器件從投入到規(guī)模間所需資金投入較大且回報周期長,致力于基礎(chǔ)層核心元器件研發(fā)的企業(yè)需面臨較大的資金壓力。近年來,智能語音行業(yè)較好的發(fā)展前景吸引資本涌入,中國國內(nèi)資本持續(xù)加碼智能語智能語音基礎(chǔ)層核心元器件的技術(shù)瓶頸導(dǎo)致企業(yè)的國際競爭力不足。中國近90%的芯集地點(diǎn)變更導(dǎo)致的環(huán)境及背景噪音差異、語音信號傳輸載體方式多樣導(dǎo)致的傳輸信道差異,備無法保障智能語音系統(tǒng)對于用戶需求識別的準(zhǔn)確率。自然語言處理(NLP)技術(shù)主要包含國務(wù)院國務(wù)院來源:沙利文研究院繪制2017年,政府為推動人工智能與實(shí)體經(jīng)濟(jì)的深度融合,積極落實(shí)“中國制造2025”和展三年行動計劃(2018-2020年》按照“系統(tǒng)布局、重點(diǎn)突破、協(xié)同創(chuàng)新、開放有序”的原則,為人工智能行業(yè)的發(fā)展提出了多方面的任務(wù):(1)重點(diǎn)培育和發(fā)展車網(wǎng)聯(lián)汽車、智能經(jīng)濟(jì)社會的集成應(yīng)用;(2)重點(diǎn)發(fā)展智能傳感器、神經(jīng)網(wǎng)絡(luò)芯片等關(guān)鍵環(huán)節(jié),夯實(shí)人工智能度日益增強(qiáng)。在《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020年》中,政府展。截至目前,中國已有逾20個省市出臺了人工智能產(chǎn)業(yè)鼓勵政策,其中江蘇、上海、廣6.1行業(yè)將大力發(fā)展深度集成語音AI芯片大的數(shù)據(jù)和運(yùn)算量導(dǎo)致設(shè)備運(yùn)行成本和功耗居高不下,且易出現(xiàn)語音交互“時延”的問題,影響用戶的消費(fèi)體驗(yàn)。AI芯片的算力決定了智能語音處理的速度以及語音交互的便利性,深度集成語音AI芯片利用主要算法和芯片架構(gòu)深度集成,將芯片和語音識別算法技術(shù)深度集成語音AI芯片擁有較大的數(shù)據(jù)存儲空間,無需將語音語料上傳至云端進(jìn)行計算,保護(hù)信息安全性。深度集成語音AI芯片降低了設(shè)備的數(shù)據(jù)運(yùn)算量及功耗,在節(jié)約設(shè)備運(yùn)行成目前,中國智能語音行業(yè)進(jìn)入快速成長期,語音技術(shù)在各下游場景的商業(yè)化應(yīng)用日益廣泛,推動智能語音產(chǎn)業(yè)分工的細(xì)化以及科學(xué)技術(shù)的密集化。落地的智能語音產(chǎn)品會涉及眾多專利技術(shù),且分屬于不同所有者,眾多的專利請求、復(fù)雜的專利授權(quán)、以及高額的專利侵權(quán)賠償?shù)葐栴}將阻礙智能語音新技術(shù)的實(shí)踐運(yùn)用。因此,中國智能語音行業(yè)有望建立智能語音專利池,引導(dǎo)和促進(jìn)智能語音技術(shù)跨行業(yè)的實(shí)施和應(yīng)用,推動語音相關(guān)產(chǎn)業(yè)的發(fā)智能語音專利池的建立可以有效降低交易成業(yè)間的專利糾紛、有利于專利技術(shù)的推廣應(yīng)用。專利權(quán)人可以向智能語音專利池貢獻(xiàn)自己的核心專利,同時享有免費(fèi)使用其他專利人專利的權(quán)利,免去了專利權(quán)相互交叉許可的交易成本。專利的有效管理消除了專利實(shí)施中重復(fù)授權(quán)的障礙,有效降低了專利許可中的交構(gòu)建智能語音專利池可以促進(jìn)專利權(quán)人的相互合作,形成專利權(quán)人的共同開發(fā)研究智能語音產(chǎn)業(yè)的新型技術(shù),保持智能語音專利化。此外,智能語音專利池的建立將提高智能語音企業(yè)的國際競目前,中國國內(nèi)智能語音服務(wù)商共分為三類:(1)以百度為代表的互聯(lián)網(wǎng)巨頭;(2)以科大訊飛為代表的智能語音服務(wù)商;(3)以云知聲、圖靈機(jī)器為代表的深耕于垂直領(lǐng)域和細(xì)以科大訊飛為代表的中國國內(nèi)智能語音科技企業(yè)擁有較強(qiáng)的技術(shù)優(yōu)勢,該類型企業(yè)憑借頭為市場驅(qū)動型企業(yè),擁有較強(qiáng)的C端優(yōu)勢?;ヂ?lián)網(wǎng)企業(yè)利用其C端產(chǎn)品經(jīng)驗(yàn)及用戶數(shù)據(jù)北京驀然認(rèn)知科技有限公司成立于2016年5月,是以認(rèn)知計算、自然語言理解技術(shù)為語音交互技術(shù)。企業(yè)的對話應(yīng)用、對話式車機(jī)OS、智能語音座艙等核心產(chǎn)品主要應(yīng)用于智>對話應(yīng)用對話應(yīng)用是企業(yè)打造車聯(lián)網(wǎng)應(yīng)用生態(tài)的入口,企業(yè)致力于打造去APP化的語音代理,融合"VUI+GUI"的綜合性功能,以語音對流為軸心,實(shí)現(xiàn)跨場景融合,跨設(shè)備調(diào)用,連接>對話式車機(jī)OS圖像、大數(shù)據(jù)技術(shù)打造的車聯(lián)網(wǎng)場景一體化。對話式車機(jī)O
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度企業(yè)年會短視頻拍攝制作合同
- 二零二五年度戶外廣告發(fā)布合作合同
- 二零二五年度草原雇傭放羊與生態(tài)補(bǔ)償協(xié)議
- 二零二五年度資質(zhì)借用及資源共享協(xié)議
- 2025年度施工安全協(xié)議個人責(zé)任履行細(xì)則
- 二零二五年度房地產(chǎn)項(xiàng)目銷售代理與節(jié)能環(huán)保技術(shù)合作合同
- 二零二五年度休閑度假村包租合作合同
- 二零二五年度醫(yī)療行業(yè)勞動合同管理規(guī)范與醫(yī)護(hù)人員保障措施
- 掛靠證件合同模板(2025年度)適用于文化創(chuàng)意產(chǎn)業(yè)
- 二零二五年度電子商務(wù)借款居間服務(wù)合同協(xié)議
- 社會救助公共基礎(chǔ)知識題庫及答案
- 《論文所用框架圖》課件
- 人教版三年級下冊說課標(biāo)、說教材
- 2022版《義務(wù)教育科學(xué)課程標(biāo)準(zhǔn)》試題及答案
- 《民法典》背景下違約精神損害賠償制度適用問題
- 松下機(jī)器人操作手冊
- 數(shù)字電路邏輯設(shè)計(第3版)PPT全套完整教學(xué)課件
- 境外道路貨物運(yùn)輸應(yīng)急預(yù)案
- 管理學(xué)-北京師范大學(xué)中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- 2023年司法鑒定程序通則
- 網(wǎng)店運(yùn)營PPT全套完整教學(xué)課件
評論
0/150
提交評論