版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
探討AIGC行業(yè)應(yīng)用與創(chuàng)新場景方向AI技術(shù)熱潮的到來既帶來了機遇,也為業(yè)內(nèi)人士帶來了更多挑戰(zhàn)。在這樣的背景下,9月9日~10日,「人人都是產(chǎn)品經(jīng)理」聯(lián)合「騰訊大講堂」于北京舉辦了產(chǎn)品經(jīng)理大會,聚焦于“AI、數(shù)字化轉(zhuǎn)型、業(yè)務(wù)增長”,共同探討AIGC的商業(yè)化可能與落地實踐。其中在9日晚上,「人人都是產(chǎn)品經(jīng)理」還聯(lián)合「聲網(wǎng)」聯(lián)合舉辦了一場閉門研討會,聲網(wǎng)AIGC產(chǎn)品負(fù)責(zé)人杜浦帶來了“AIGC加持下,APP體驗場景創(chuàng)新哪些玩法值得期待?”的主題演講,并分享了聲網(wǎng)在實時互動+AIGC探索上的最新成果?,F(xiàn)場回顧AI技術(shù)促進(jìn)了各行業(yè)內(nèi)容生產(chǎn)方式的革新,比如文字生成、代碼輔助開發(fā)、圖片繪制、視頻處理等。在閉門會上,聲網(wǎng)分享嘉賓杜浦主要圍繞AIGC與音視頻的結(jié)合應(yīng)用進(jìn)行探討。AIGC的音視頻應(yīng)用場景有許多,比如數(shù)字人虛擬主播、AI虛擬戀人等。而這個過程里,產(chǎn)品體驗的需求GAP亟待滿足:文本互動效果差:不擅長語?處理,只能實現(xiàn)?本互動,?法提供實時語?、視頻互動;AI交互的響應(yīng)延遲較?,?戶體驗差;場景開發(fā)上線難:缺少AIGC所需的開發(fā)經(jīng)驗和能?儲備,期望能夠接?整體解決?案;?暇進(jìn)?場景調(diào)研和玩法設(shè)計,應(yīng)?可玩性不?,需要快速上線參考;語音合成效果差:?戶的語?識別(STT)不夠準(zhǔn)確,AI語?合成效果(TTS)過于機械不夠真實,?戶體驗差;AI模型訓(xùn)練難:應(yīng)?設(shè)計的場景對AI模型的prompt調(diào)優(yōu)訓(xùn)練要求較?,整體場景流暢運?的實現(xiàn)難度較?。面對這些問題,聲網(wǎng)提出了
AIGC一站式音視頻解決方案,這一方案擁有三大核心優(yōu)勢:音視頻互動更具沉浸感:相比傳統(tǒng)的通過IM文字聊天與AI角色實現(xiàn)交互的方案,聲網(wǎng)提供的實時音視頻+實時消息+虛擬形象方案能夠帶來更真實自然的互動體驗,更好地表達(dá)情感和傳達(dá)用戶的個性化意圖。同時,實時音視頻互動相比輸入文字,操作更加便捷,且能夠與其它多模態(tài)互動方式結(jié)合,進(jìn)一步提升用戶體驗。響應(yīng)延時低至1.9秒內(nèi):聲網(wǎng)作為實時互動云服務(wù)的開創(chuàng)者,在音視頻領(lǐng)域積累了深厚的技術(shù)優(yōu)勢,針對目前市面上大多數(shù)AI生成式對話響應(yīng)慢的問題,聲網(wǎng)的研發(fā)團隊對AIGC場景下音視頻互動的延時做了很多技術(shù)優(yōu)化,可以將對話響應(yīng)延時控制在1.9秒內(nèi),也就意味著當(dāng)用戶對AI角色語音提問結(jié)束后,到AI開始說話的時間間隔,聲網(wǎng)可以做到1.9秒以內(nèi),相比市場上絕大部分AI互動延遲在6-7s的方案要低很多。易開發(fā),3h快速上線場景:在場景開發(fā)層面,有些企業(yè)缺少AIGC所需的開發(fā)經(jīng)驗和能力儲備,期望能夠接入整體解決方案,對此聲網(wǎng)提供封裝完整的SDK,包含實時音視頻、實時消息、語音轉(zhuǎn)文字(STT)/文字轉(zhuǎn)語音(TTS)、語音驅(qū)動虛擬人嘴型等多種能力,并支持API快速調(diào)用,提供開箱即用的場景化Demo,最快3h即可實現(xiàn)方案快速驗證。尤其對于想快速驗證新場景的企業(yè)與開發(fā)者而言,可以節(jié)省很多開發(fā)時間。再進(jìn)一步拆解,聲網(wǎng)AIGC解決方案的一站式產(chǎn)品能力還包括這些能力:模型能力:大語言模型是整個AIGC解決方案最核心的部分,在大模型能力方面,聲網(wǎng)也跟很多熱門的國內(nèi)外大模型進(jìn)行了合作,根據(jù)業(yè)務(wù)場景集成測試了多個大模型的能力,以及支持開源大模型的私有化部署和模型Fine-tune,支持企業(yè)根據(jù)自身需求進(jìn)行靈活切換。聲網(wǎng)會根據(jù)客戶的場景選擇合適的大模型,根據(jù)不同的場景做特定的模型數(shù)據(jù)庫和Prompt,同時結(jié)合聲網(wǎng)RTC的低延時特性,讓用戶交互延遲達(dá)到最優(yōu),模型輸出更符合真實場景。此外,聲網(wǎng)在開源大模型層面也有在嘗試做私有化部署,以滿足部分企業(yè)對數(shù)據(jù)安全及網(wǎng)絡(luò)的要求。語音能力:聲網(wǎng)憑借在音頻處理領(lǐng)域的經(jīng)驗,對語言轉(zhuǎn)文字(STT)+文字轉(zhuǎn)語音(TTS)模型精細(xì)化調(diào)優(yōu),實現(xiàn)人聲分離,斷句優(yōu)化,讓整個語言體驗更加流暢。此外,聲網(wǎng)還支持AI實時變聲、定制化聲音克隆,讓聲音聽起來更具真實感。例如定制化聲音克隆可以復(fù)刻現(xiàn)實中學(xué)生老師的聲音,學(xué)生在下課后可以更加真實地與老師的虛擬形象進(jìn)行語音互動。場景人設(shè)定制:聲網(wǎng)在1V1語音聊天等場景還對AI角色進(jìn)行了人設(shè)定制,通過Prompt的方式設(shè)置AI角色的名字、職業(yè)、性格等豐富的人設(shè)屬性并支持定制形象與聲音。在場景玩法層面,聲網(wǎng)也嘗試了多人語音場景的驗證,例如在誰是臥底、狼人殺等多人游戲的場景中,AI可以作為一個玩家參與到游戲中,真正的與用戶一起玩游戲。交互體驗升級:圍繞語音大模型的交互體驗,聲網(wǎng)也做了一些嘗試,例如長期對話記憶,在一些對話場景中,用戶在進(jìn)行多輪文字互動后,有可能大模型記不住用戶之前說的內(nèi)容,影響對話體驗。對此,聲網(wǎng)通過實現(xiàn)多輪對話記憶,可以更好的應(yīng)用在AI情感陪聊、智能辦公助手等場景。對于需要AI精準(zhǔn)回答特定行業(yè)知識、企業(yè)專業(yè)知識、多維度知識的客戶,聲網(wǎng)AIGC方案支持公域、私域VectorDB接入的能力,可以解決各種類型的數(shù)據(jù)分析和相關(guān)任務(wù),特別是那些涉及到高維向量數(shù)據(jù)的應(yīng)用場景。比如近似搜索、推薦系統(tǒng)、圖像識別、語音識別、時許分析、社交網(wǎng)絡(luò)分析、圖像/視頻和文本的關(guān)聯(lián)等。在杜浦的分享結(jié)束后,參會者根據(jù)分享內(nèi)容和自身的業(yè)務(wù)背景進(jìn)行互動問答,并隨后就“AIGC行業(yè)應(yīng)用分享與創(chuàng)新場景方向探討”這一話題開啟了分組研討與小組間的內(nèi)容分享。此外,部分與會者還在現(xiàn)場體驗了聲網(wǎng)AIGC
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個性化視頻制作委托合同書(2024年版)版B版
- 2025年環(huán)保型打印紙張品研發(fā)與認(rèn)證合同4篇
- 2025年度文化創(chuàng)意產(chǎn)業(yè)承包經(jīng)營合同賠償與創(chuàng)意成果轉(zhuǎn)化3篇
- 二零二五版房產(chǎn)維修基金管理合同3篇
- 2025年綠色建筑彩板房采購協(xié)議3篇
- 2025年度商業(yè)地產(chǎn)項目租賃協(xié)議范本4篇
- 二零二五年度美容師客戶滿意度調(diào)查與反饋協(xié)議4篇
- 2024年銷售合同風(fēng)險評估3篇
- 2025版合伙企業(yè)個人退伙權(quán)益保障協(xié)議書3篇
- 2025年度數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)承包協(xié)議8篇
- 2025年度公務(wù)車輛私人使用管理與責(zé)任協(xié)議書3篇
- 售后工程師述職報告
- 綠化養(yǎng)護難點要點分析及技術(shù)措施
- 2024年河北省高考?xì)v史試卷(含答案解析)
- 車位款抵扣工程款合同
- 小學(xué)六年級數(shù)學(xué)奧數(shù)題100題附答案(完整版)
- 高中綜評項目活動設(shè)計范文
- 英漢互譯單詞練習(xí)打印紙
- 2023湖北武漢華中科技大學(xué)招聘實驗技術(shù)人員24人筆試參考題庫(共500題)答案詳解版
- 一氯二氟甲烷安全技術(shù)說明書MSDS
- 物流簽收回執(zhí)單
評論
0/150
提交評論