聽見智能會議系統建設方案一體機

上傳人：z*** IP屬地：天津上傳時間：2023-01-06 格式：DOCX 頁數：15 大小：321.08KB 積分：18 舉報 版權申訴

免費預覽已結束，剩余10頁可下載查看

 下載本文檔

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

聽見智能會議系統

建設方案安徽聽見科技2016年10月目錄項目概述錯誤!未定義書簽。.建設背景錯誤！未定義書簽。.建設重要性錯誤！未定義書簽。建設內容及目標錯誤!未定義書簽。產品施工條件錯誤!未定義書簽。系統連線圖錯誤！未定義書簽。建設方案錯誤！未定義書簽。.系統概述錯誤！未定義書簽。.軟件詳細配置錯誤！未定義書簽。中文語音轉寫引擎錯誤!未定義書簽。應用系統大體功能錯誤!未定義書簽。用戶治理錯誤！未定義書簽。音頻搜集處置錯誤！未定義書簽。實時語音轉寫錯誤！未定義書簽。歷史語音轉寫錯誤！未定義書簽。內容編輯錯誤！未定義書簽。成效優(yōu)化錯誤！未定義書簽。內容展現錯誤！未定義書簽。內容治理錯誤！未定義書簽。全文檢索錯誤！未定義書簽。.硬件設備配置錯誤！未定義書簽。一體式智能會議主機錯誤!未定義書簽。應用端主控電腦錯誤!未定義書簽。項目報價錯誤!未定義書簽。.項目概述建設背景隨著信息時期的到來，海量語音的獲取和存儲能力愈發(fā)壯大，基于會議辦公的實際場景，會存在需要大量的人力投入、工作效率不高的情形、語音技術在會議場景中的應用質量和成效不高。因此，結合會議會務場景對語音技術的實際應用需求，開展了基于會議場景下的語音技術應用關鍵技術研究，沖破語音合成、語音識別、語音轉寫等核心技術，提升語音技術在會議會務場景中的應用水平，切實提升日常會議辦公的工作效率和成效。建設重要性語音識別(SpeechRecognize)技術，是讓機械通過識別和明白得進程使之聽懂人類語言的技術。語音識別技術是信息技術中人機交互的關鍵技術，目前已經在呼喚中心、電信增值業(yè)務、企業(yè)信息化系統中有了普遍的應用。隨著語音識別在語音搜索、語音操縱等全新應用領域的深切應用，語音識別技術被業(yè)界權威人士譽為有可能引發(fā)人機界面領域革命的關鍵技術。最近幾年來，語音識別技術取得了長足的進步。智能會議系統是基于語音識別技術所研發(fā)，可知足會議演講、會議研討、溝通交流、大型會議等一系列需要進行實時文字轉寫的場景。此部份項目的實施要緊解決會議記要整理時刻長、會議中心思想因記錄人員的明白得而可能顯現的誤差、會議錄音及關鍵點難以查找等問題。項目建成后當天即可完成所有相關會議記要的整理工作，同時，每一個人的發(fā)言都可記錄在記要當中，可有效減少因不同緣故造成的會議中心內容明白得的誤差，提升記要整理的效率。.建設內容及目標本項目打算選取1個會議室別離部署單機版聽見智能會議系統，進行基于會議場景下的新型語音轉寫技術的應用，實現會議進程中音頻實時轉寫成文字，輔助會議記錄人員進行記要的整理與校正，實現快速成稿，在整體上打造樣板化智能語音轉寫會議室。.產品施工條件環(huán)境要求單機版智能會議系統采納專業(yè)定制一體機的硬件形態(tài)，一體機的安裝機柜需要6U空間，安裝于正常室外室內即可，設備深度為500MM,系統本身局域網組建自帶，網絡帶寬在100M以上，主控PC需要連接局域網下利用，整套設備局域網下運行即可。同時需要電源。音視頻需求該系統是基于音頻基礎上實現語音轉寫，麥克風等音響設備利用會議室現有環(huán)境。為實現對現場音頻的搜集，需要現場音響設備（調音臺或相關音頻設備）提供會議話筒音頻供轉寫，同時設備接口支持卡儂公、大三芯（）、雙蓮花輸入；如需單獨外接顯示，支持接口為HDMI或VGA。如有展板上屏需求，需要會議室內配有投影儀或電視機，且具有VGA或HDMI接口任意一種，展板通過連接投影儀或電視機進行投屏展現。.系統連線圖本項目擬購的一體式智能會議系統，其硬件形態(tài)為：通過國家CCC認證和專業(yè)定制一體機+編輯段主控電腦。教室現場的發(fā)言音頻輸出給一體機，同時如需顯示，一體機支持顯示輸出，主控電腦通過網線與一體機連接，整套產品即可利用。一體機整體外觀圖示意如下：

B或IE一體機機械后面板及接口圖示意如下:參數說明:口(IntelI210AT),1*RS232,GPIO,Watchdog,VGA->切換器；USBB或IE一體機機械后面板及接口圖示意如下:參數說明:口(IntelI210AT),1*RS232,GPIO,Watchdog,VGA->切換器；USB:6*USB(前置1*+后置(2*USB2*USB);兆網口(Intel82579V),1*RS232,1*VGA1*PS2,外接：DVI轉HDMI;坦克聲卡：一個麥克風輸入并自帶音量增益旋鈕，XLR/混合式接頭一個樂器輸入并自帶音量增益旋鈕，接頭4個模擬輸入（RCA妾頭）一組唱盤輸入并內建RIAA等化放大及自帶音量增益旋鈕6個模擬輸出（RCA妾頭）一個耳機才孔接頭）并自帶音量增益旋整機電源：AC100-240V700W;效勞器節(jié)點：XEON20M2020P8CORE,E5-2620V3*2;32GDDR4REG/ECC;接口2*千網應用節(jié)點：CORE6M1151P4COREI5-6500;8GDDR4,2*千兆網口(Intel82579V)1*千河卷?「以林口Hi"]uea七二和已鈕一個光纖數字輸出/輸入一個同軸數字輸出/輸入一組MIDII/O連線說明：本產品為一體機形態(tài)，只需要接通一根電源線、一根音頻線、一根視頻線，并通過一根網線連接主控，就可利用。上閏接口:支持上閏接口:支持DV1或hdmf電.建設方案系統概述聽見智能會議系統由軟件、硬件一起組成，實此刻會議場景下的實時音頻或錄音搜集，并通過語音識別技術實時轉化為文字。用戶能夠通過系統提供延時播放、按句回聽、重點標記等功能方便快速整理出會議材料；而且通過系統提供的語氣詞過濾、自動分段等功能自動優(yōu)化文字結果；同時，用戶能夠利用全文檢索功能方便檢索歷史音頻。系統具有會議音頻治理、即時校對編輯、靈敏詞屏蔽、轉寫文字實時直播等大體功能

麥克風一體機主控電腦實時字幕系統整體配置清單如下:類別描述數量單位軟件語音識別轉寫引擎智能中文連續(xù)語音識別轉寫引擎，實現對普通話連續(xù)語音的實時轉寫，并提供對已轉寫文字的后處理及字音同步對齊能力1套會議管理系統智能會議管理系統應用軟件，實現歷史音頻轉寫、實時編輯、自動分段、關鍵詞優(yōu)化、禁忌詞屏蔽、語氣詞過濾、全文檢索、重點內容標記、按句回聽、用戶權限管理、會議信息管理、內容導出等功能1套硬件一體機專業(yè)定制一體式會議主機。NODE1:2*E5-2620V332G/800G*3SATA10Krpm+raid5/1*USBkey+3*1000MNIC；NODE2:IntelCorei5/8G內存/500GSATA7200rpm/VGA+HDMI\DVI\DP/3*1000MNIC;DMX6FireUSB\FastTrackUltra8RUSBe接口Route：3*LAN接口+1*WAN1臺應用端主控電腦華碩PRO453U,Intel?Core?i5-6200U8GB/Intel500GBSATA/Intel?HDGraphics520集顯+NvidiaGeForce920M2GB獨顯1臺服務1、提供首次上門安裝、調試；2、提供系統使用培訓；3、兩次通過軟件升級的方式提供效果優(yōu)化；4、提供大會服務和移機安裝服務。1年/套軟件詳細配置中文語音轉寫引擎聽見智能會議系統需要解決語音轉換成文字的問題。機械語音識別技術是一種實現從“聲音”到“文字”轉換的技術，通過將人的語音直接轉換成相應的文本。語音識別技術的研究工作開始于上世紀五十年代。Bell實驗室的研究人員利用模擬元器件提取了語音信號元音共振峰頻率轉變的信息，有史以來第一次實現了識別十個英文數字的語音識別系統-Audry系統。八十年代，Bell實驗室的Rabiner等科學家將本來艱澀難懂的隱馬爾科夫模型(HiddenMarkovModel-HMM)理論工程化，形成了較為完善的概率統計模型體系，識別性能也取得了專門大的提高。2006年以來DeepLearning理論和技術成了模式識別領域的一個熱點研究方向，G.E.Hinton等深切研究了深度置信網絡(DeepBeliefNetwork-DBN)和深度神經網絡(DeepNeuralNetwork-DNN)等模型結構，微軟通過與Hinton合作率先將DNN應用于語音識別任務，識別性能取得了顯著提升。爾后谷歌、蒙特利爾，和IBM又將循環(huán)神經網絡(RecurrentNeuralNetwok-RNN)成功應用于語音識別領域，專門是長短時經歷(Long-ShortTermMemory)神經網絡結構，取得超級超卓的語音識別性能。加上目前圖形處置器(GPU)計算能力的提升，和互聯網時期大規(guī)模標注數據獲取成為可能，基于深度學習的語音識別技術已經在多個領域達到有效水平。傳統的語音識別技術要緊用于解決人與機械的交互問題。而在會議場景需要需要轉成文字的音頻內容是人與人之間交互，聽見智能會議系統需要基于機械語音識別技術構建語音轉寫引擎。聽見智能會議系統構建的語音轉寫引擎需要能夠實時、高效的把人與人之間交流的語音轉換為文字的能力，具體包括中文語音轉寫引擎與英文語音轉寫引擎，本系統需要完成中文語音轉寫引擎的建設。應用系統大體功能聽見智能會議系統，能夠實此刻會議、教學、演講等場景下的實時音頻或錄音搜集，并通過語音識別技術實時轉化為文字。用戶能夠通過系統提供延時播放、按句回聽、重點標記等功能方便快速整理出會議材料；而且通過系統提供的語氣詞過濾、自動分段等功能自動優(yōu)化文字結果，可人工進行角色分離；同時，用戶能夠利用全文檢索功能方便檢索歷史音頻。用戶治理聽見智能會議系統采納賬號密碼登錄，在提升用戶平安部驗的同時，分賬號進行治理；系統可依照需要配置提供治理員賬號和一般賬號，治理員賬號可查看全數列表內容，一般賬號僅支持查看當前賬號下的內容。不同賬號間的數據進行邏輯和物理隔離，保證數據平安性和私密性；知足用戶不同用戶、不同權限的治理需求。音頻搜集處置聽見智能會議系統需要通過對實時音頻流信號的處置完成從信號獲取、轉換、處置、識別、輸出、展現等一整套流程動作，需要由壯大的音頻搜集處置模塊。系統講通過利用特定的錄音效勞，通過麥克風搜集后，送達后臺效勞端完成編碼工作，實時上傳到系統，供后續(xù)的轉寫文字等功能利用，同時保留到內容治理模塊中。實時語音轉寫系統通過專業(yè)麥克風對會議全程進行高保真錄音，并針對持續(xù)中文語流進行實時語音轉寫識別，并持續(xù)進行轉寫結果文本內容的輸出。歷史語音轉寫相較于實時語音轉寫模塊，歷史語音轉寫模塊提供關于已經錄制好的歷史音頻需要轉寫情形下的解決能力；用戶能夠通過系統提供的功能按鈕，導入歷史音頻并實現快速離線轉寫；支持音頻批量導入。-h-wM,?H-K*>部\:1|i卜**斗++件"*i?A?3，0teiiff'9.iumpfisMMIB1?Q■■劉富物?閂E：?—不即"吐素〒mia?ftFlw盅■雨蟀—1?￡w藩工fwiS的亍甲―；??早析,E與于*i!W考■=七隹通代事，fliSTflM任星三器曹1』曰***｛毗擊:應*?."■?!和"知二為一士—M1E國*十一通耳』OKI'IflAW!及冉耳里建同—1■?*yfiW-,!"*丁。鳥鼻丁口n4昆餐南E月WI」KWLrM?9M.二BtHirc-圖：歷史音頻轉寫編輯成效圖內容編輯在實時語音轉寫進程頂用戶能夠實時對轉寫出的文本結果進行編輯，并進行重點內容標記。在實時編輯的進程中采納延時播放的策略，用戶能夠在查看到轉寫文本以后及時依照聽到的音頻進行文本校對編輯。用戶也可不戴耳機直接聽現場的實時音頻。支持選擇查看原始結果，對照修改，方便快捷，會議終止后即可直接成稿，并依照重點內容，整理導出會議記要。具體功能包括：延時播放：在實時語音轉寫進程中，識別結果展現以后再開始持續(xù)播放音頻，即用戶在看到轉寫文本的時候，同步聽到對應的音頻，使得校對和編輯加倍便利。重點內容標記：在實時語音轉寫進程中或暫停和終止時，用戶均能夠選中文本來進行重點內容的標記，已標記的文本也能夠進行修改和標記取消，方便整理會議記要，會議終止會后即可或直接成稿。音字對照：在實時語音轉寫暫停的時候，用戶若是關于有些內容沒有聽消，關于文本內容不確信的情形下，雙擊原始結果即可聽到文本對應的音頻，方便用戶對寫結果進行編輯，尤其是不警惕誤刪除編輯文本，能夠通過回聽原始結果來進行回溯。實時語音轉寫終止狀態(tài)時，原始結果及編輯結果都可雙擊進行音頻回聽。成效優(yōu)化在實時語音轉寫進程中，聽見智能會議系統通過提供語氣詞過濾、自動分段等功能自動優(yōu)化文字轉寫和顯示結果。具體包括：自動分段：在會議內容實時語音轉寫成文字的進程中，為了方便用戶編輯何查看，系統提供依照VAD+固定字數和VAD+固定關鍵詞兩種自動分段方式。系統提供最正確的默許自動分段方式，用戶也可依如實際情形進行設置。語氣詞過濾：用戶能夠在實時語音轉寫開始前或進行文稿整理時能夠依照需要選擇是不是開啟語氣詞過濾按鈕，假設開啟按鈕可將語氣詞和多余的辭匯去除，以保證文稿的規(guī)整。語氣詞過濾只針對新轉寫的結果，已經修悔改的內容不支持過濾。關鍵詞優(yōu)化：用戶可通過關鍵詞優(yōu)化功能將這次會議相關的關鍵詞進行添加，能有效提升該關鍵詞的識別準確率。實時轉寫進程頂用戶也可添加關鍵詞，而且能夠實時生效，后續(xù)識別結果可取得有效優(yōu)化。內容展現系統通過提供展板上屏等形式進行實時語音轉寫結果的展現。具體功能包括：實時上屏：通過展板上屏展現中實時語音轉寫結果。而且，字體顏色和展板背景顏色能夠依如實際情形需要進行調整。次達到自就5音轉寫超過專業(yè)速球員水平次達到自就5音轉寫超過專業(yè)速球員水平率可達95%以上,并在業(yè)界圖：展板成效圖上屏后臺修改：若是在實時轉寫進程中利用了實時上屏功能，希望保障上屏成效，那么能夠利用上屏后臺修改功能進行展板端的結果糾正。在開始時點擊展板按鈕，調出展板，現在該展板端會同步顯現識別文字。若是在轉寫進程中顯現明顯錯誤或不適宜展現的詞語，那么能夠在主控端進行展板編輯，能夠修改或刪除，修改以后按Enter鍵那么修改的內容會同步到現場的投影屏幕上。內容治理所有通過聽見智能會議系統轉寫的實時錄制的音頻文本數據和本地上傳的音頻文本數據系統都會以列表形式進行治理，后臺通過散布式存儲集群實現高效平安存儲，整個進程用戶無感知。用戶能夠通過內容治理模塊隨時查看和編輯，而且能夠依照名稱等信息快速檢索。另外，編輯后的全文本、重點文本和音頻、某一角色的文本，用戶都能夠快速導出，方便快捷。全文檢索系統通過自然語言明白得、語音識別和語義分析技術明白得用戶用意，執(zhí)行用戶的檢索指令（包括語音、文本等），實現資源文本內容的語音搜索效勞能力，不僅能檢索文本資源，也能依照文件名對音視頻內容進行搜索。該效勞在傳統的文字輸入搜索方式基礎上，不僅能支持搜索語音時的相對自由表述，也應當能夠支持傳統文字檢索時的相對自由表述。硬件設備配置聽見智能會議系統的配套硬件設備，具體包括：一體式智能會議主機、應用端主控電腦。一體式智能會議主機專業(yè)定制一體式智能會議主機，提供4U設備形態(tài)，集成了包括效勞節(jié)點、應用節(jié)點、聲卡、顯示器、路由器等部件。產品型號：訊飛聽見產品參數：NODE1:2*E5-2620V332G/800G*3SATA10Krpm+raid5/1*USBkey+3*1000MNIC;NODE2:IntelCorei5/8G內存/500GSATA7200rpm/VGA+HDMI\DVI\DP/3*1000MNIC;DMX6FireUSB\FastTrackUltra8RUSB音頻接口Route：3*LAN接D+1*WAN產品尺寸：整機箱尺寸：426mm*mm*177mm鍵盤托架尺寸：426mm*480mm*47mm產品圖片：應用端主控電腦與一體機配合展現轉寫結果，接收主控臺的音頻轉寫結果，通過投影儀將轉寫結果展現在大屏幕上，提供實時及離線會議語音轉寫功能。產品型號：華

人人文庫> 全部分類> 應用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

聽見智能會議系統建設方案一體機

文檔簡介

溫馨提示

最新文檔

評論

聽見智能會議系統建設方案一體機

文檔簡介

溫馨提示

最新文檔

評論

相關文檔