版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
荔枝云-第九包媒體內(nèi)容分析——深化設(shè)計文檔(V1.0)江蘇省廣播電視總臺北京天馬網(wǎng)視科技有限公司2015年7月
目錄第1章系統(tǒng)概述 3第1節(jié)項目背景 3第2節(jié)設(shè)計目標(biāo)及原則 41.2.1設(shè)計目標(biāo) 41.2.2設(shè)計原則 5第2章系統(tǒng)總體設(shè)計 6第1節(jié)系統(tǒng)業(yè)務(wù)范圍 6第2節(jié)總體業(yè)務(wù)框架 11第3節(jié)系統(tǒng)應(yīng)用架構(gòu) 12第4節(jié)系統(tǒng)拓?fù)浼軜?gòu) 13第3章系統(tǒng)業(yè)務(wù)模型詳細(xì)設(shè)計 13第1節(jié)內(nèi)容準(zhǔn)備 133.1.1通聯(lián)數(shù)據(jù) 143.1.2互聯(lián)數(shù)據(jù) 15第2節(jié)智能搜索引擎 153.2.1基本搜索 153.2.2高級搜索 163.2.3參數(shù)搜索 17第3節(jié)智能分類 183.3.1業(yè)務(wù)場景描述 183.3.2業(yè)務(wù)模型設(shè)計 18第4節(jié)信息聚類 203.4.1生成光譜分析數(shù)據(jù) 213.4.2每日熱點匯聚 223.4.3聚類結(jié)果 23第5節(jié)情感分析 243.5.1業(yè)務(wù)場景描述 253.5.2業(yè)務(wù)模型設(shè)計 25第6節(jié)視頻分析 253.6.1業(yè)務(wù)場景描述 253.6.2業(yè)務(wù)模型設(shè)計 29第7節(jié)個性化訂閱 383.7.1訂閱 383.7.2個性化推薦 39第4章與PaaS平臺對接 40第1節(jié)用戶統(tǒng)一管理 404.1.1用戶同步 404.1.2單點登錄 40第2節(jié)服務(wù)注冊 404.2.1搜索接口 404.2.2高級檢索 404.2.3內(nèi)容快照訪問 404.2.4用戶行為分析推薦內(nèi)容(基于檢索) 404.2.5智能分類結(jié)果 414.2.6視頻分析(特定欄目需定制) 454.2.7視頻分析結(jié)果回調(diào)(接口在的添加分析任務(wù)里) 48
系統(tǒng)概述項目背景荔枝云新聞平臺將打破時空限制,電視、廣播、新媒體、記者站、赴臺駐點等不同部門的記者無需集中辦公,不管何時、身處何地,只要登錄云平臺,選題策劃、采訪部署、資源調(diào)度、素材采集、編輯制作、傳輸發(fā)布等都能在云平臺統(tǒng)籌完成,新聞資源真正共享,實現(xiàn)異地、遠(yuǎn)程、多平臺同步協(xié)作,快速發(fā)布。為方便記者從海量的互聯(lián)網(wǎng)新聞中挖掘出有價值的熱點新聞,充分利用多年的電視節(jié)目資料形成了大量的數(shù)據(jù),引入對全媒體內(nèi)容庫進(jìn)行內(nèi)容大數(shù)據(jù)分析與深度挖掘的媒體內(nèi)容分析系統(tǒng)是必要的。通過該系統(tǒng)可以更方便的、更快速的挖掘出當(dāng)前最新最熱的新聞資源產(chǎn)品,以及與新聞相關(guān)的臺內(nèi)媒體資源庫中已有的資源供總臺全媒體節(jié)目生產(chǎn)使用。設(shè)計目標(biāo)及原則設(shè)計目標(biāo)擬建的江蘇廣播電視臺全媒體內(nèi)容分析平臺項目目標(biāo)是構(gòu)建以云計算為基礎(chǔ)支撐架構(gòu),包容廣域網(wǎng)、局域網(wǎng)應(yīng)用場景、以資源匯聚為主線,以內(nèi)容生產(chǎn)服務(wù)為核心的一體化全媒體平臺,因此它應(yīng)具備以下特性:智能化:利用智能化處理技術(shù)對音視頻內(nèi)容進(jìn)行音視頻特征提?。ㄕZ音識別、字幕識別、人像識別等),通過大數(shù)據(jù)引擎對標(biāo)引數(shù)據(jù)自動聚類、分類等一系列運算,從海量數(shù)據(jù)中挖掘出有價值的資源內(nèi)容,并結(jié)合當(dāng)前社會熱點事件進(jìn)行歷史內(nèi)容的映射,為節(jié)目再生產(chǎn)及新聞融合提供有力支撐。熱點匯聚:結(jié)合大數(shù)據(jù)計算,實時監(jiān)控網(wǎng)絡(luò)上最快、最新的資訊信息。并將實時熱點數(shù)據(jù)與媒資庫內(nèi)歷史數(shù)據(jù)進(jìn)行關(guān)聯(lián),使節(jié)目編輯人員做特色且深度的熱點報道。統(tǒng)一發(fā)布:媒體內(nèi)容分析將為全媒體內(nèi)容庫聯(lián)合檢索發(fā)布提供技術(shù)支撐,通過全臺統(tǒng)一發(fā)布平臺實現(xiàn)臺內(nèi)有價資源、網(wǎng)絡(luò)內(nèi)容的融合性發(fā)布。統(tǒng)一檢索平臺中具備多種的檢索交互手段,包括檢索用戶之間的交互手段和后臺業(yè)務(wù)管理人員與檢索用戶之間的交互手段,通過各種交互手段的提高用戶的參與度,豐富資料的描述角度,提高用戶的檢索體驗和檢索效率。設(shè)計原則整個系統(tǒng)采用模塊化的方式,前期以實現(xiàn)功能為主,但系統(tǒng)模塊要有規(guī)范的接口標(biāo)準(zhǔn),良好的擴容性,便于以后業(yè)務(wù)的擴展。系統(tǒng)設(shè)計遵循的原則:經(jīng)濟性:充分利用現(xiàn)有的技術(shù)設(shè)備,將每一個已有的技術(shù)平臺梳理、整合,融入新建的全媒體技術(shù)架構(gòu)。貼近節(jié)目生產(chǎn)部門使用習(xí)慣和流程,對合理并已成熟應(yīng)用的業(yè)務(wù)流程不做或少做變更,人性化設(shè)計,達(dá)到提升節(jié)目人員使用體驗,提高工作效率的目的。高管控:建立全流程、多系統(tǒng)的一體化智能監(jiān)控系統(tǒng)和集中監(jiān)控處理平臺,實現(xiàn)對硬件資源、軟件資源、系統(tǒng)信號、任務(wù)流程、內(nèi)容資源的監(jiān)控管理。安全性:在網(wǎng)絡(luò)化建設(shè)中把安全性放在首要位置,在系統(tǒng)安全和隔離設(shè)計上需要充分考慮,建立完善的安全防范體系,運用多種技術(shù)手段來保證網(wǎng)絡(luò)化制播的安全性。高質(zhì)量:通過選擇合適的視音頻文件格式、減少轉(zhuǎn)碼環(huán)節(jié)、降低轉(zhuǎn)碼帶來的質(zhì)量損失,建立完善的質(zhì)量控制體系,對采集、制作、存儲、播出各個節(jié)點的技術(shù)質(zhì)量進(jìn)行控制,保證技術(shù)質(zhì)量。可靠性:滿足長時間安全運行要求,軟件操作簡便、安全可靠;系統(tǒng)的核心設(shè)備有完善的冗余備份和應(yīng)急機制,保證系統(tǒng)長期、安全、穩(wěn)定運行。開放性:系統(tǒng)設(shè)計應(yīng)采用開放技術(shù)、開放結(jié)構(gòu)、開放系統(tǒng)組件和開放用戶接口,不同廠家、不同時期、不同技術(shù)平臺的各個子系統(tǒng)之間能夠互聯(lián)互通,協(xié)調(diào)工作。擴展性:采用松散耦合、彈性的系統(tǒng)技術(shù)架構(gòu),便于將來更多站點、更大容量、更高負(fù)載、更多子系統(tǒng)的接入,滿足未來事業(yè)發(fā)展、產(chǎn)業(yè)運營及技術(shù)發(fā)展的需求。成熟性:雖然內(nèi)容分析平臺的建設(shè)對我們來說是一個全新的課題,整個業(yè)界都處在探索階段。必須在進(jìn)行技術(shù)系統(tǒng)架構(gòu)設(shè)計上,對于網(wǎng)絡(luò)技術(shù)、存儲技術(shù)、系統(tǒng)架構(gòu)、軟件體系結(jié)構(gòu)、異構(gòu)系統(tǒng)互連互通、壓縮編碼、文件格式、數(shù)據(jù)庫平臺的選擇等,都要進(jìn)行充分的調(diào)研,采用主流的、先進(jìn)的、實用的技術(shù)平臺,提高系統(tǒng)的生命周期。智能化:作為一個全臺媒體內(nèi)容分析管理系統(tǒng),各類數(shù)據(jù)信息將十分繁多,如果不整理分類為各系統(tǒng)自動適配,集中在一起的數(shù)據(jù)是不方便使用的,需要一些智能化系統(tǒng)來完成這些任務(wù),如新聞的自動拆條,相關(guān)新聞智能搜索,文字圖片視音頻的智能抓取,直播流自動去廣告等,在不增加人員的同時大大提高全媒體生產(chǎn)和發(fā)布的效率。系統(tǒng)總體設(shè)計系統(tǒng)業(yè)務(wù)范圍根據(jù)本項目的標(biāo)書要求,以及結(jié)合本系統(tǒng)的需求分析,本系統(tǒng)所需完成的業(yè)務(wù)內(nèi)容構(gòu)成如下。全媒體內(nèi)容進(jìn)入媒體分析平臺在信息化建設(shè)過程中,臺內(nèi)必然會積累各類海量節(jié)目素材數(shù)據(jù),其中即包括結(jié)構(gòu)化數(shù)據(jù),也包括非結(jié)構(gòu)化數(shù)據(jù)等很多獨有的資源(珍貴歷史資料、自辦欄目等),然而,這些信息以各種不同的存在形式分布于各個獨立的應(yīng)用系統(tǒng)中,導(dǎo)致大量的有價內(nèi)容無法盤活,這樣并沒有真正體現(xiàn)出這些獨有資源本身的價值所在。為了盤活這些獨有資源,使這些獨有資源能為臺內(nèi)創(chuàng)造更大的價值,本系統(tǒng)接收由全媒體內(nèi)容匯聚平臺推送來的需要分析的內(nèi)容,完成獨有資源的分析工作。構(gòu)建智能的搜索引擎從目前各類檢索界面的使用情況看,傳統(tǒng)的、單純的基于關(guān)鍵詞匹配的檢索方式已經(jīng)不能滿足當(dāng)今用戶的使用需求。所以需要在傳統(tǒng)通過關(guān)鍵詞匹配加以字段權(quán)重進(jìn)行檢索的基礎(chǔ)上,對檢索的關(guān)鍵詞和結(jié)果進(jìn)行智能的分析,實現(xiàn)基本的語義分析和匹配度查詢,使得檢索的方式和邏輯進(jìn)一步貼近自然人的思維習(xí)慣,提高用戶的使用體驗和檢索的準(zhǔn)確性。關(guān)鍵字搜索關(guān)鍵字搜索具備關(guān)鍵詞功能,布爾邏輯表達(dá)式以及精確搜索的輕量級搜索功能,例如:關(guān)鍵詞邏輯表達(dá)式組合,包括AND、OR、NOT、NEAR、DNEAR、SOUNDEX、FUZZY、RANGE等等。關(guān)鍵字搜索具備定義多個元數(shù)據(jù)字段,通過參數(shù)挑選搜索結(jié)果,按按照日期,相關(guān)度以及其他字段組合的排序功能。并且具備搜索關(guān)鍵詞的權(quán)重,多個元數(shù)據(jù)字段的權(quán)重組合搜索等。關(guān)鍵字搜索還具備搜索訓(xùn)練的機制,能夠完全滿足對用戶搜索偏好和結(jié)果擬合度的選擇進(jìn)行學(xué)習(xí),以此深化對用戶搜索內(nèi)容的理解,找到更準(zhǔn)確的結(jié)果。標(biāo)準(zhǔn)搜索標(biāo)準(zhǔn)搜索包含關(guān)鍵詞搜索,并在其基礎(chǔ)之上,提供概念檢索。用戶可以輸入一個詞、一句話或一段文字甚至是一整篇文章,系統(tǒng)就能分析用戶檢索條件的內(nèi)容概念,然后從概念的相關(guān)度上來找出用戶關(guān)心的結(jié)果。高級搜索高級搜索除了包含關(guān)鍵詞搜索和標(biāo)準(zhǔn)搜索兩項基本功能外,還應(yīng)該具備深入的搜索應(yīng)用,包括模糊搜索、同音搜索與字段標(biāo)簽搜索。模糊搜索:當(dāng)編輯人員不清楚需要查詢的內(nèi)容如何拼寫時,可以通過模糊搜索功能進(jìn)行查詢,系統(tǒng)除了返回相應(yīng)的搜索結(jié)果外,還應(yīng)返回與輸入字符串相近的其他詞匯,從而讓編輯人員發(fā)現(xiàn)相關(guān)的其他結(jié)果。同音搜索:當(dāng)編輯人員只知道搜索詞匯的類似讀音,那么可以通過同音搜索功能,利用語音探測運算法則,將類似同音的其他詞匯搜索結(jié)果也返回過來,方便編輯人員查看。字段標(biāo)簽搜索:字段標(biāo)簽搜索是通過建立索引文本的標(biāo)簽字段,編輯人員可以針對性的選擇標(biāo)簽組合,從而返回相應(yīng)的限定結(jié)果。參數(shù)搜索系統(tǒng)具備參數(shù)搜索功能,可以實現(xiàn)各元數(shù)據(jù)的統(tǒng)計和分析,并可以輸出數(shù)據(jù)成為多種圖形形式,如柱狀圖,餅圖,線圖等,從而使用戶實時了解搜索對象的數(shù)量特征,更深入的得到內(nèi)容信息。智能分類現(xiàn)今純手工對文檔和海量數(shù)據(jù)進(jìn)行分類和標(biāo)記已經(jīng)無法適應(yīng)當(dāng)今這個信息爆炸時代的要求。為了跟隨這個時代的潮流,系統(tǒng)應(yīng)能夠自動對信息進(jìn)行分類,并且不需要任何手工輸入,可以精確地根據(jù)非結(jié)構(gòu)化文本中的概念進(jìn)行分類。分類管理能夠發(fā)現(xiàn)文檔或海量數(shù)據(jù)內(nèi)容里的概念,使用戶得到更加準(zhǔn)確的分類類別,確保所有的數(shù)據(jù)最大限度的精確歸類和正確的理解。自動歸類支持根據(jù)不同的分類主題,建立了分類節(jié)點,前臺的用戶以及管理員就可以點擊相關(guān)的分類樹節(jié)點,查看相關(guān)分類的結(jié)果。分類推薦建立了分類體系之后,系統(tǒng)中的用戶可以進(jìn)行分類查看。但是,如果分類樹過于龐大,或者用戶沒有時間逐級點擊分類節(jié)點,系統(tǒng)應(yīng)該支持分類推薦功能,根據(jù)每個用戶的隱含個性需求,來推送給用戶需要查看的分類節(jié)點。信息聚類基本聚類系統(tǒng)支持自動聚類功能,它能夠自動地分析采集過來的所有信息內(nèi)容,根據(jù)內(nèi)容概念來把相似的文檔聚類到一起,同時完全自動化的生成類別的標(biāo)題,并提供自動的熱點生成和自動的熱點趨勢分析。聚類信息展示根據(jù)某個時刻的信息聚類結(jié)果,自動聚類出新聞熱點,新聞熱點的熱度以及聚類主體之間的關(guān)聯(lián)性能夠通過圖形化直觀展示。情感分析系統(tǒng)允許依照詞匯的褒貶義和文字基調(diào)進(jìn)行高級的分類操作,并且能夠分析語言的結(jié)構(gòu)和含義,判定每段信息的正面或負(fù)面特征,進(jìn)而創(chuàng)建相應(yīng)的分類系統(tǒng)。除此之外,管理員還可以利用多種標(biāo)記功能和閾值設(shè)定來配置信息正負(fù)面分析的敏感程度。正負(fù)面分析使用多種強大的技術(shù)提取這些文章和談話中的含義,并且自動執(zhí)行詳細(xì)的統(tǒng)計分析以找出信息中所表現(xiàn)出的趨勢,以及它對人、企業(yè)和產(chǎn)品的正負(fù)面產(chǎn)生的影響。正負(fù)面分析技術(shù)涵蓋了各種傳統(tǒng)和新型的媒體,其中包括報紙、電話、博客、論壇、討論版和在線社區(qū),為宣傳項目提供助力。能夠理解俚語、行業(yè)術(shù)語、諷刺用語以及替代拼寫方式,也能夠適應(yīng)語言的多變性。其自動而深入的分析可實現(xiàn)主動式的回應(yīng),確保不會忽略越來越重要的大眾觀點。視頻分析可以自動給視頻建立索引,并同時控制多重格式和位數(shù)率的視頻編碼。通過這種方法制作的視頻索引可以搜索,與編碼格式在時間上同步對應(yīng),可用于各種程序中。它的主要功能包括:自動編目系統(tǒng)支持接入模擬信號或數(shù)據(jù)信號并將其存儲為視頻文件,并在視頻信號進(jìn)入系統(tǒng)的同時建立信息豐富的視頻數(shù)據(jù)庫或索引,可以方便的對索引信息及各種元數(shù)據(jù)進(jìn)行存儲和搜索,從而實現(xiàn)自動編目功能。自動拆條系統(tǒng)可以根據(jù)視頻分析中的語音轉(zhuǎn)文字內(nèi)容以及視頻畫面轉(zhuǎn)換的結(jié)果自動對大段或連續(xù)的視頻材料進(jìn)行分割。關(guān)鍵楨分析系統(tǒng)可以根據(jù)視頻畫面轉(zhuǎn)換的場景自動生成并保存關(guān)鍵幀并記錄每一幀對應(yīng)的時間點,從而實現(xiàn)點擊具體幀圖片時定位到該時間點進(jìn)行視頻播放。此外,系統(tǒng)支持設(shè)置視頻播放時間間隔的方式自動生成并保存關(guān)鍵楨。人臉識別系統(tǒng)支持通過一張或多張圖片進(jìn)行人臉庫訓(xùn)練。在視頻處理時可以和其他視頻分析任務(wù)(如語音識別)一起進(jìn)行實時分析。人臉識別可以設(shè)置相關(guān)度匹配閥值在控制識別結(jié)果。個性化訂閱自主訂閱系統(tǒng)支持用戶自主訂閱,用戶可以設(shè)置一個或多個自定感興趣的主題和條件,當(dāng)系統(tǒng)發(fā)現(xiàn)有符合條件的數(shù)據(jù)時自動為用戶進(jìn)行內(nèi)容推送。自動提示系統(tǒng)根據(jù)用戶主動訂閱或者系統(tǒng)自動分析用戶使用行為的特征,發(fā)現(xiàn)有新的內(nèi)容與其相關(guān)的時候,自動的通過電子郵件或者短消息來提示的功能。顯性個性推送在顯性個性推送中,用戶可以描述他的興趣或者職責(zé)角色,大數(shù)據(jù)引擎可以不斷的訓(xùn)練理解用戶的顯性個性特征,用戶能夠獲得更需要的相應(yīng)內(nèi)容。推送服務(wù)的手段可借助網(wǎng)頁、短信、郵件、PDA、傳真等方式來實現(xiàn)。隱性個性推送具備個性化跟蹤服務(wù),除了用戶自己顯性維護的內(nèi)容主題之外,系統(tǒng)還應(yīng)具備隱性個性推送,即在后臺自動監(jiān)控用戶的行為與瀏覽的文檔,從文本內(nèi)容上分析用戶的興趣與目的,用戶的需求變化(例如工作內(nèi)容的轉(zhuǎn)變),同時自動產(chǎn)生個性化的隱性內(nèi)容檔案,實現(xiàn)動態(tài)的智能內(nèi)容信息推送服務(wù)。社區(qū)和協(xié)作系統(tǒng)可以自動保存對組織員工個性化信息的準(zhǔn)確、多面理解,自動建立一個組織協(xié)作網(wǎng)絡(luò)系統(tǒng),將那些具有共同關(guān)注點的員工、有相似個性化特征的員工,或工作流程中按特定項目劃分的用戶匹配在一起,形成組織的內(nèi)容社區(qū)??傮w業(yè)務(wù)框架基于以上需求,智能分析系統(tǒng)必須具備能夠?qū)⑵髽I(yè)結(jié)構(gòu)化和非結(jié)構(gòu)化信息的管理、應(yīng)用和處理過程自動化,能通過概念和上下文的語義關(guān)聯(lián)來實現(xiàn)對信息的理解。具備多渠道內(nèi)容匯聚、多媒體內(nèi)容智能處理、多渠道調(diào)用等功能。整個智能分析系統(tǒng)在生產(chǎn)環(huán)節(jié)中通過對視頻和音頻的自動編碼和編引及數(shù)據(jù)存儲,向內(nèi)容庫提供數(shù)據(jù)分析功能、內(nèi)容編輯及訪問控制。該平臺能夠在企業(yè)范圍內(nèi)有效地采集、管理及發(fā)布視、音頻和其他的豐富媒體。及邏輯結(jié)構(gòu)如下圖所示:通過對于內(nèi)容的智能分析可以使企業(yè)全面了解隱藏的信息價值并對其及時做出反應(yīng)和對策。系統(tǒng)應(yīng)用架構(gòu)應(yīng)用系統(tǒng)架構(gòu)如上圖,各部分的作用如下所示:系統(tǒng)模塊作用描述大數(shù)據(jù)內(nèi)容融合引擎模塊針對來自于全媒體內(nèi)容匯聚庫的內(nèi)容進(jìn)行智能分析服務(wù),完成信息的自動分類、聚類等,供融合生產(chǎn)平臺提取有價值的信息。視頻分析服務(wù)模塊包括自動編目、自動拆條、關(guān)鍵楨分析、人臉識別等,通過此四項業(yè)務(wù)對全媒體內(nèi)容匯聚庫提供的視頻文件進(jìn)行智能處理,供融合生產(chǎn)平臺提取有價值的信息。系統(tǒng)拓?fù)浼軜?gòu)根據(jù)與其他系統(tǒng)的對接方式及工作原理,系統(tǒng)拓?fù)浼軜?gòu)如下:系統(tǒng)業(yè)務(wù)模型詳細(xì)設(shè)計內(nèi)容準(zhǔn)備本業(yè)務(wù)用于將第四包內(nèi)容匯聚與內(nèi)容庫中的媒體資源入庫到IDOL系統(tǒng)進(jìn)行數(shù)據(jù)分析。按照第四包匯聚內(nèi)容存儲方式的不同分兩部分處理,一部分是存儲在數(shù)據(jù)庫中的通聯(lián)數(shù)據(jù)、全臺網(wǎng)數(shù)據(jù),另一部分是從互聯(lián)網(wǎng)抓取的互聯(lián)數(shù)據(jù)。通聯(lián)數(shù)據(jù)業(yè)務(wù)場景圖Repository:數(shù)據(jù)視圖Connector:數(shù)據(jù)庫采集器ConnectorFrameworkServer:采集器框架服務(wù)器IDOL:智能數(shù)據(jù)操作層業(yè)務(wù)場景描述由第四包提供數(shù)據(jù)視圖,第九包通過ODBCConnector增量爬取視圖中的數(shù)據(jù)。需要在視圖中提供最后修改時間和刪除狀態(tài)。最后修改時間作為增量抓取內(nèi)容增量的依據(jù),刪除狀態(tài)作為刪除數(shù)據(jù)的依據(jù)?;ヂ?lián)數(shù)據(jù)業(yè)務(wù)場景圖暫無業(yè)務(wù)場景描述需要索貝公司根據(jù)網(wǎng)絡(luò)抓取數(shù)據(jù)結(jié)構(gòu)及我方數(shù)據(jù)入庫方式評估最終的入庫方式。智能搜索引擎結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)經(jīng)過系統(tǒng)預(yù)處理入庫后,平臺能夠在集合數(shù)據(jù)中實現(xiàn)跨數(shù)據(jù)庫、跨語言、跨文件類型的信息檢索,并提供一致性的返回結(jié)果?;舅阉飨到y(tǒng)完全支持關(guān)鍵詞、布爾邏輯表達(dá)式以及精確搜索的輕量級搜索功能,例如:關(guān)鍵詞邏輯表達(dá)式組合,包括AND,OR,NOT,NEAR,DNEAR,SOUNDEX,FUZZY,RANGE等等;通過多個標(biāo)簽字段組合的邏輯“與或非”限定搜索;定義多個元數(shù)據(jù)字段,通過參數(shù)挑選搜索結(jié)果;支持按照數(shù)據(jù)源、日期、相關(guān)度以及其他字段組合的排序功能;提供搜索關(guān)鍵詞的權(quán)重,多個元數(shù)據(jù)字段的權(quán)重組合搜索等;提供搜索訓(xùn)練的機制,能夠完全滿足對用戶搜索偏好和結(jié)果擬合度的選擇進(jìn)行學(xué)習(xí),以此深化對用戶搜索內(nèi)容的理解,找到更準(zhǔn)確的結(jié)果。高級搜索高級搜索除了包含關(guān)鍵詞搜索和標(biāo)準(zhǔn)搜索功能外,同時進(jìn)一步提供了深入的搜索應(yīng)用:搜索導(dǎo)航用戶通過關(guān)鍵字獲取搜索結(jié)果后,系統(tǒng)根據(jù)結(jié)果自動返回與關(guān)鍵字匹配的相關(guān)詞組,以便引導(dǎo)用戶做更加精確檢索。高亮顯示搜索字詞在搜索結(jié)果列表或結(jié)果頁面中,對標(biāo)題、摘要正文中出現(xiàn)的搜索詞進(jìn)行高亮顯示,方便用戶根據(jù)高亮顯示的搜索詞跳躍瀏覽。近義詞搜索系統(tǒng)不僅僅支持關(guān)鍵字匹配功能,還支持同義詞搜索功能,更精準(zhǔn)的返回想要的搜索結(jié)果。比方說,搜索“電腦”或“計算機”返回相同的結(jié)果。支持用戶自定義近義詞。搜索結(jié)果過濾如關(guān)鍵字搜索一樣,系統(tǒng)支持在搜索結(jié)果集中進(jìn)行二次搜索,做更進(jìn)一步的數(shù)據(jù)篩選。參數(shù)搜索通過在系統(tǒng)中設(shè)置指定字段為參數(shù)字段后,即可通過GetTagValues和GetQueryTagValues操作,執(zhí)行參數(shù)搜索。參數(shù)搜索支持按特征(特定字段中的值)、按條件搜索項目。在參數(shù)字段中提供固定值時,參數(shù)搜索將返回指定固定參數(shù)字段的不同值。例如,可以在數(shù)據(jù)庫中搜索某一特定字段的不同值有哪些。智能分類業(yè)務(wù)場景描述為了使用戶可以通過精心設(shè)計和邏輯組織的樹形分類來快速訪問大量的信息。分類在很多產(chǎn)業(yè)領(lǐng)域都很有廣泛的使用。分類作為搜索的一種補充,提供了“直接導(dǎo)航”提供了知識的直觀度。而智能分類解決方案減少了組織必須依靠手工來處理信息。智能分類的靈活性又確保了用戶使用非結(jié)構(gòu)化文本中查找到概念來獲取精確的分類。確保所有的數(shù)據(jù)被最大限度的分配到正確的分類中。除了搜索導(dǎo)航,智能分類還有以下應(yīng)用:過濾結(jié)果列表,譬如,你搜索一個硬件可能會返回“電腦硬件”和硬件存儲和五金店。你可以使用分類(電腦或家用)來過濾你想要的結(jié)果。使用分類導(dǎo)航查詢更多指定的文檔。例如,你可以創(chuàng)建分類來把學(xué)術(shù)文檔分類成更易理解的分類便于以后查詢。提高索引文檔的質(zhì)量。你可以指定一個垃圾郵件分類來標(biāo)示你不想要的文檔。使idol避免索引這些文檔。標(biāo)識指定分類文檔的變化趨勢。例如,一個特定分類的文檔數(shù)量的突然增加則預(yù)示著一個特殊的事件。業(yè)務(wù)模型設(shè)計IDOL分類流程:創(chuàng)建一個樹形的分類對各個分類進(jìn)行訓(xùn)練使用關(guān)鍵詞訓(xùn)練分類,可以指定多個關(guān)鍵詞,每個關(guān)鍵詞可以設(shè)置權(quán)重??梢詫Ω鶕?jù)關(guān)鍵詞分類出的結(jié)果進(jìn)行二次訓(xùn)練。使用文檔ID訓(xùn)練分類,可以對搜索結(jié)果或者聚類結(jié)果直接進(jìn)行訓(xùn)練建新的分類。分類標(biāo)題為聚類標(biāo)題或自定義。對數(shù)據(jù)分類分類、索引工作將有IDOL自動完成。使用分類導(dǎo)航查詢分類完成后,就可以調(diào)用分類的結(jié)果執(zhí)行導(dǎo)航查詢了。信息聚類IDOLserver可以自動將信息聚類,幫助您查看信息中的趨勢和發(fā)展變化。聚類是提取海量非結(jié)構(gòu)化數(shù)據(jù)并自動將數(shù)據(jù)分區(qū)、從而使類似信息聚類的過程。每個聚類都均表示知識庫內(nèi)的一個概念區(qū)域,包含具有一組相同屬性的項目。聚類的基礎(chǔ)是對IDOL存儲的數(shù)據(jù)生成快照,之后才可以對快照內(nèi)的數(shù)據(jù)進(jìn)行各種各樣的聚類??煺毡硎緮?shù)據(jù)索引在某個特定時間的內(nèi)容,支持生成聚類信息和光譜分析,即使數(shù)據(jù)索引已更改亦是如此。使用單一快照同時生成聚類信息和光譜分析數(shù)據(jù),從而縮短進(jìn)程時間。理想情況下,拍攝快照的IDOLserver數(shù)據(jù)索引必須至少包含幾千份優(yōu)質(zhì)文檔。生成光譜分析數(shù)據(jù)系統(tǒng)會根據(jù)上面描述中提到的拍攝的快照生成光譜分析圖:每個光譜分析數(shù)據(jù)集均會從不同的時間段內(nèi)提取連續(xù)聚類,計算這些天的聚類類似性衡量標(biāo)準(zhǔn),然后應(yīng)用圖論匹配算法。IDOLserver將計算聚類的概念分布及其一般質(zhì)量。光譜分析使用線條表示聚類的大小(即:聚類中的文檔數(shù))和質(zhì)量。光譜分析的線條越亮,聚類包含的文檔就越多;線條越密,聚類的質(zhì)量就越高。技術(shù)架構(gòu)如下圖所示。通過快照數(shù)據(jù)生成光譜圖數(shù)據(jù),光譜圖數(shù)據(jù)由兩部分組成,一是光譜圖,一是圖對應(yīng)的數(shù)據(jù)。每日熱點匯聚為提高記者每天獲取新聞線索的效率,系統(tǒng)會自動將當(dāng)天最熱的內(nèi)容聚類到一起以二維地圖的方式進(jìn)行展現(xiàn)。熱度圖信息是系統(tǒng)在快照中識別的、可用于聚類的最相關(guān)信息。它可以隨著時間的推移跟蹤特定新聞項目的發(fā)展情況。二維熱力圖以可視化的形式說明不同聚類的類似性和差異。IDOL使用降低維度算法維護聚類之間的相似性衡量標(biāo)準(zhǔn),確保相似的聚類彼此靠近,不相似的聚類則彼此不靠近。由此可以使用文檔在空間內(nèi)的分布以及非線性重新映射創(chuàng)建形貌圖。聚類結(jié)果在執(zhí)行查詢操作時,則可以對查詢生成的結(jié)果進(jìn)行聚類。IDOL將為每個結(jié)果返回<autn:cluster>字段,其中包含結(jié)果已分組到的聚類的ID。ID1將指定給最相關(guān)的結(jié)果文檔構(gòu)成的聚類。此聚類構(gòu)成后,剩余結(jié)果中最相關(guān)的結(jié)果文檔將構(gòu)成ID為2的聚類,以此類推??梢耘渲脜?shù)設(shè)置結(jié)果彼此之間必須具有的百分比相關(guān)性,以便將其分組到同一聚類中。情感分析系統(tǒng)在情感關(guān)鍵詞抽取結(jié)果的基礎(chǔ)上,可利用獨特的技術(shù)依照詞匯的褒貶義和文字基調(diào)進(jìn)行情感分析,判定每段信息的正面、負(fù)面或中性特征。系統(tǒng)支持基于搜索人物、產(chǎn)品、新聞事件等主題后返回結(jié)果的情感統(tǒng)計分析,計算情感分布和影響力。業(yè)務(wù)場景描述依據(jù)該功能,可實現(xiàn)對某一事件進(jìn)行持續(xù)跟蹤報道,了解輿論變化,以便針對重要趨勢做出回應(yīng)。業(yè)務(wù)模型設(shè)計系統(tǒng)支持情感分析優(yōu)化,允許用戶自定義正面、負(fù)面、中性的名詞、形容詞、動詞,并可以定義程度副詞以及所有詞匯的權(quán)重。正負(fù)面分析技術(shù)涵蓋了各種傳統(tǒng)和新型的媒體,其中包括報紙、電話、博客、論壇、討論版和在線社區(qū),為宣傳項目提供助力。能夠理解俚語、行業(yè)術(shù)語、諷刺用語以及替代拼寫方式,也能夠適應(yīng)語言的多變性。其自動而深入的分析可實現(xiàn)主動式的回應(yīng),確保不會忽略越來越重要的大眾觀點。視頻分析業(yè)務(wù)場景描述自動編目系統(tǒng)將模擬信號或數(shù)字信號存儲為視頻文件,通過字幕識別、語音識別、人像識別等多種處理引擎對視頻建立索引信息,實現(xiàn)自動編目。智能分段:按系統(tǒng)指定的方式將視頻進(jìn)行智能分段,獲取每段的入點和出點,并標(biāo)示出段的主題。數(shù)據(jù)存儲在數(shù)據(jù)庫中,后期編審系統(tǒng)可編輯校準(zhǔn)分段數(shù)據(jù)。通過智能分段保存的信息可以定位視頻播放位置。OCR識別:自動識別出視頻畫面中出現(xiàn)的文本字幕,并得到字幕的入點和出點,存儲在xml中,后期編審系統(tǒng)可對這個xml的數(shù)據(jù)進(jìn)行編輯校準(zhǔn)。通過OCR識別出的字幕相關(guān)信息可以定位視頻播放位置。語音識別:自動識別出視頻中的語音信息,轉(zhuǎn)換為文本格式,與語音的入點和出點時間一起存儲在xml文件中,后期編審系統(tǒng)可對這個xml數(shù)據(jù)進(jìn)行編輯校準(zhǔn)。通過語音識別保存的信息可以定位視頻播放位置。關(guān)鍵幀抽?。喊聪到y(tǒng)指定的方式抽取關(guān)鍵幀,獲取關(guān)鍵幀的入點時間,將時間和關(guān)鍵幀圖像路徑存儲在xml文件中,后期編審系統(tǒng)可對xml文件進(jìn)行編輯校準(zhǔn)。通過關(guān)鍵幀抽取獲取的信息可以定位視頻播放位置。廣告識別:每個節(jié)目片段都有自己唯一的視頻和音頻特征,將這些特征編碼保存在數(shù)據(jù)庫中形成節(jié)目片段的指紋。當(dāng)這個節(jié)目再次出現(xiàn)時,分析引擎提取節(jié)目指紋,在庫中能檢索到相對應(yīng)的節(jié)目片段,從而識別輸入節(jié)目的廣告內(nèi)容。為保證視頻資料的可查性和可使用性,需要對視頻進(jìn)行分類編輯和碎片化處理,并在編輯和處理過程中通過智能化識別和遠(yuǎn)程人工輔助制作出節(jié)目編目信息。在無需人工干預(yù)的情況下,能夠進(jìn)行節(jié)目內(nèi)容的一次發(fā)布工作(非精確編目信息)??赏ㄟ^后期快編完成系統(tǒng)節(jié)目內(nèi)容的二次發(fā)布工作(精確編目信息)。人工編審人工編審可以添加需要進(jìn)行自動編目的視頻文件,并指定需要進(jìn)行哪些種類的視頻分析及設(shè)置需不需要對視頻文件進(jìn)行分割,還可以查詢自動編目的結(jié)果,對其進(jìn)行校正。整體界面設(shè)計整體界面包括四個區(qū)域:播放器區(qū): 播放視頻任務(wù)管理區(qū): 軟件注冊、添加任務(wù)、查詢?nèi)蝿?wù)、設(shè)置編輯區(qū): 編輯基本信息、校正自動編目的結(jié)果時間尺區(qū): 更精準(zhǔn)地控制播放,精確到幀添加任務(wù)查詢?nèi)蝿?wù)校正自動編目的結(jié)果業(yè)務(wù)場景描述(圖)業(yè)務(wù)模型設(shè)計Web接口服務(wù)http的服務(wù)主要是用于接受http的參數(shù)來添加任務(wù)和返回結(jié)果集,這個服務(wù)不操作業(yè)務(wù)邏輯和體文件。調(diào)用邏輯模塊 主要是完成任務(wù)和引擎之間的關(guān)系,完成了引擎的注冊,管理引擎,分配引擎任務(wù)。引擎接口服務(wù) 引擎的http的服務(wù)主要用于接受調(diào)度的任務(wù)和調(diào)度的操作命令(注冊,執(zhí)行任務(wù),返回信息,返回結(jié)果)引擎實體 在引擎接口下,實際處理文件的實體。每個引擎都各自獨立,根據(jù)需要選擇調(diào)用那些引擎,后續(xù)也可以很方便的擴展引擎種類。包括智能分段引擎、關(guān)鍵幀抽取引擎、視頻文字檢測引擎、OCR引擎、語音識別引擎、人像識別引擎等。智能分段引擎智能化段引擎是把實時的視頻切片文件邏輯上劃分為若干個以事件為單位的段落,并把段落的詳細(xì)信息記錄到數(shù)據(jù)庫中的操作過程。目前智能分段的劃分方式有以下三種:根據(jù)圖像特征分析、臺本數(shù)據(jù)元分析、聲音空場分析技術(shù)手段進(jìn)行智能化的拆條。建立圖像特征學(xué)習(xí)庫,特征庫包括學(xué)習(xí)識別模型素材庫和模型庫:識別模型素材庫學(xué)習(xí)模型庫依據(jù)圖像特征庫中的特征先從視頻中抽取出一張關(guān)鍵畫面,然后由一系列算法判定該幀畫面是否為事件出入點時的畫面來確定分段的時間點。視頻畫面分析圖像處理識別:找到模型匹配的視頻圖像畫面依據(jù)文稿分段就是按臺本給出的事件出入點時間來確定分段時間。文稿原始內(nèi)容:依據(jù)聲音空場的分段則是按視頻中語音的停頓時間長短來確定分段的時間點。通過上面三種方式進(jìn)行智能分段,都會生成統(tǒng)一格式的分段索引表:其中包括:時間名稱、入點時間、出點時間、關(guān)鍵詞等信息。關(guān)鍵幀抽取引擎關(guān)鍵幀抽取引擎是系統(tǒng)從實時的視頻切片文件中取出若干張能展示事件內(nèi)容的關(guān)鍵性畫面,同時把關(guān)鍵幀的圖片路徑、名稱、在視頻中出現(xiàn)的位置等信息寫入到一個XML文件中的過程。它可以按照指定時間周期、智能分段的入點時間、還要可以按特定的場景等多種方式來抽取關(guān)鍵幀畫面。按時間周期提取關(guān)鍵幀:接事件入點時間關(guān)鍵幀:按視頻畫面變化閥值抽取關(guān)鍵幀:視頻文字檢測在字幕檢測方面,結(jié)合漢字和字幕圖像的特點,利用字幕時序信息和空間信息進(jìn)行字幕檢測。在字幕圖像處理方面,提出針對字幕圖像的一系列有效的處理方法,從很大程度上降低了背景變化和噪聲的干擾,為提取有效的識別特征打下良好的基礎(chǔ)。在特征抽取方面,借鑒了對于漢字識別非常行之有效的Gabor濾波器組進(jìn)行特征提取。在字幕識別方面,本系統(tǒng)使用隱馬爾可夫模型對字符進(jìn)行建模,有效規(guī)避了傳統(tǒng)方法中字符切割的部分無法識別的問題,同時針對解碼得到的字網(wǎng),加入統(tǒng)計語言模型的得分,極大提高了識別率。整個系統(tǒng)框架可以由檢測和識別兩個過程組成,系統(tǒng)的基本處理流程如下所示:文字檢測定位提取文字圖片OCR識別引擎識別結(jié)果“國妯鉭濟專豉與逝重談”。識別結(jié)果“國務(wù)院經(jīng)濟專冢與迦幣企哩亙座談”。識別結(jié)果“國務(wù)院經(jīng)濟專家與湖南企業(yè)家座談”,正確率可達(dá)到90%以上。文字圖片經(jīng)過引擎自動顏色處理可以達(dá)到更好的識別效果語音識別通過識別說話者音調(diào)、音色等特征,并與用戶給定樣本特征進(jìn)行學(xué)習(xí)、比較,確定人物身份,給出姓名,并可通過姓名定位到相應(yīng)視頻幀。在經(jīng)過學(xué)習(xí)語音模型和語言庫的學(xué)習(xí)識別率可以達(dá)到90%以上的識別結(jié)果。節(jié)目節(jié)目(視頻)結(jié)構(gòu)化標(biāo)注腳本字、詞、短語,命名實體起始時間、結(jié)束時間置信度語音識別(解碼器)聲學(xué)模型語言模型發(fā)音詞典音頻提取特征提取從視頻文檔中提取音頻信息(16KHz,16bit)。從音頻文檔中采用美標(biāo)度倒譜系數(shù)(MFCC)特征提取語音內(nèi)容的特征。利用語音識別解碼器,融合聲學(xué)模型、語言模型和發(fā)音詞典將聲學(xué)特征序列識別為文本序列。其中,聲學(xué)模型描述了發(fā)音單元的統(tǒng)計模型;語言模型描述語言現(xiàn)象,利用已知詞來估計后續(xù)銜接詞的概率;發(fā)音詞典描述詞的發(fā)音組成。利用自然語言處理技術(shù)對識別結(jié)果進(jìn)行標(biāo)注,可以標(biāo)注命名實體(如人名、地名、機構(gòu)名等)。并將識別結(jié)果中的時間標(biāo)注信息(詞的起始時間、結(jié)束時間)和詞的置信度信息(聲學(xué)模型得分、語言模型得分)整理成結(jié)構(gòu)化標(biāo)注腳本(XML格式)。人像識別引擎人像識別又叫做人臉識別,指利用分析比較人臉視覺特征信息進(jìn)行身份鑒別的計算機技術(shù)。智能化媒資系統(tǒng)采用人像識別技術(shù)從視頻文件中查找指定的人物,如主持人或電視臺、省市、國家領(lǐng)導(dǎo)人。人像識別技術(shù)分為人像定位和人像身份識別,首先需要截取具體人物的多個不同視角的頭像,進(jìn)行模型訓(xùn)練;采用訓(xùn)練好的模型,對從視頻中截取到的頭像進(jìn)行分析,判斷是否是模型中的人物。對于樣本庫較全的人物模型,正確識別率可達(dá)到90%以上。人工校正由人工校正智能分析的結(jié)果。用來處理媒體采集系統(tǒng)采集到的視頻信息,為后續(xù)系統(tǒng)中的視頻檢索、視頻分段下載提供依據(jù)。其功能:可以選擇任意視頻文件或網(wǎng)絡(luò)視頻進(jìn)行編審可以對編審?fù)瓿傻臄?shù)據(jù)提交拆合為物理視頻入庫可以多人合作編審業(yè)務(wù)模型設(shè)計圖個性化訂閱訂閱系統(tǒng)支持用戶自主訂閱,用戶可以設(shè)置一個或多個自定義感興趣的主題和條件,一旦發(fā)現(xiàn)有新的符合用戶要求的信息時,系統(tǒng)會自動為用戶進(jìn)行內(nèi)容推送。個性訂閱能夠自動根據(jù)數(shù)據(jù)源變化實時更新文檔,省去用戶大量時間,每次使用內(nèi)容主題都能夠看到最新的跟自己工作密切相關(guān)或者對自己有用的信息。系統(tǒng)可通過代理方式完成訂閱功能。例如,對足球和園藝感興趣的用戶可創(chuàng)建RealMadrid代理和PestControl代理。創(chuàng)建代理時,要為其提供訓(xùn)練文本。此訓(xùn)練可為代理必須查找的文本類型提供示例,因此代理僅返回與其訓(xùn)練在概念上匹配的文檔、檔案、分類或其他代理。例如,創(chuàng)建了一個Mortgage代理,然后使用類似于希望此代理返回的結(jié)果類型的文本對其進(jìn)行訓(xùn)練。也可以使用自己鍵入的文本或使用文檔訓(xùn)練代理。完成代理培訓(xùn)并指定此代理的詳細(xì)信息(如代理可返回的最大結(jié)果數(shù),結(jié)果的最小概念類似性等)后,就可以運行此代理。并且可以隨時編輯或再訓(xùn)練代理以對其進(jìn)行調(diào)整。個性化推薦系統(tǒng)可實現(xiàn)用戶個人行為軌跡分析,可以通過對用戶以搜索、收藏、上傳等動作產(chǎn)生的文檔瀏覽后,進(jìn)行行為收集、記錄,自身完成學(xué)習(xí)和分析后,將與之行為相關(guān)的知識推送給用戶。與PaaS平臺對接用戶統(tǒng)一管理用戶同步通過PaaS平臺《用戶管理規(guī)范》中獲取指定應(yīng)用的用戶信息接口獲取所有允許訪問智能分析平臺的用戶。單點登錄采用PaaS平臺《用戶管理規(guī)范》單點登錄中的規(guī)范實現(xiàn)客戶端。服務(wù)注冊搜索接口整理中高級檢索整理中內(nèi)容快照訪問整理中用戶行為分析推薦內(nèi)容(基于檢索)整理中智能分類結(jié)果任務(wù)查詢接口描述:方便用戶進(jìn)行查看任務(wù)狀態(tài)。接口:/Query/Task/Info參數(shù):參數(shù)分為兩種模式1.是使用指定日期進(jìn)行查詢2.使用指定id進(jìn)行查詢使用日期進(jìn)行查詢的參數(shù)屬性含義類型說明必填StartTime任務(wù)開始日期String任務(wù)的開始日期e.g.2105/06/30是EndTime任務(wù)結(jié)束日期String任務(wù)結(jié)束日期e.g.2105/06/30是ResultType返回格式string默認(rèn)是json可以指定xml否使用id進(jìn)行查詢的參數(shù)屬性含義類型說明必填I(lǐng)D任務(wù)IDString在添加任務(wù)返回的id是ResultType返回格式string默認(rèn)是json可以指定xml否請求實例:POST/Query/Task/InfoUser-Agent:curl/7.12.1(x86_64-redhat-linux-gnu)libcurl/7.12.1OpenSSL/0.9.7azlib/libidn/0.5.6Pragma:no-cacheAccept:*/*Host:域名Content-Type:application/x-www-form-urlencodedContent-Length:XXXXID=201507091146返回結(jié)果:{"State":0,"Desc":"OK","Date":[{"TaskID":"20150714","TaskCreate":"2015/07/14","TaskURL":"/a.mp4","TaskProCode":15,"TaskFalg":"cctv","TaskCallback":"http://localhost:8080/c/e","EngineState":[{"OCR":0,"FACE":0,"AUDIO":0}]},{"TaskID":"201507141","TaskCreate":"2015/07/14","TaskURL":"/a.mp4","TaskProCode":15,"TaskFalg":"cctv","TaskCallback":"http://localhost:8080/c/e","EngineState":[{"OCR":0,"FACE":0,"AUDIO":0}]}]}查詢結(jié)果接口描述:方便用戶進(jìn)行任務(wù)結(jié)果查詢。接口:/Query/Task/Results參數(shù):分為三種查詢模式1.按照時間2.按照id3.按照類型+(id/時間)按照時間為參數(shù)屬性含義類型說明必填StartTime開始日期String任務(wù)的開始日期e.g.2105/06/30是EndTime結(jié)束日期String任務(wù)結(jié)束日期e.g.2105/06/30是ResultType返回格式string默認(rèn)是json可以指定xml否按照id為參數(shù)屬性含義類型說明必填I(lǐng)D任務(wù)IDString在添加任務(wù)返回的id是ResultType返回格式string默認(rèn)是json可以指定xml否按照類型+(id/時間)屬性含義類型說明必填StartTime開始日期String任務(wù)的開始日期e.g.2105/06/30是EndTime結(jié)束日期String任務(wù)結(jié)束日期e.g.2105/06/30是ID任務(wù)idString任務(wù)id和(開始日期,結(jié)束日期)二選一是EngType引擎類型stringe.gOCR(文字識別)AUDIO(語音識別)FACE(人像識別)EDIT(人工編審)是ResultType返回格式string默認(rèn)是json可以指定xml否請求實例:POST/Query/Task/ResultsUser-Agent:curl/7.12.1(x86_64-redhat-linux-gnu)libcurl/7.12.1OpenSSL/0.9.7azlib/libidn/0.5.6Pragma:no-cacheAccept:*/*Host:域名Content-Type:application/x-www-form-urlencodedContent-Length:XXXXStartTime=2015/06/30&EndTime=2015/07/5&EngType=OCR,Audio返回結(jié)果:{"State":0,"Desc":"OK","Date":[{"TaskState":0,"TaskDesc":"OK","ResultDate":{"Id":201507091146,"VideoPath":"51:8888/test.mp4","Time":"2015-07-0911:48:00.000","Code":15,"OcrData":[{"Ocr":"俄故機組團北約美媒·戰(zhàn)爭報拉響","Time":150000},{"Ocr":"俄故機組團北約美媒·戰(zhàn)爭報拉響","Time":200000}],"AudioData":[{"Word":"北約","BeginTime":150000,"EndTime":200000},{
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國內(nèi)擔(dān)保貸款合同示范
- 企業(yè)承包經(jīng)營合同的環(huán)保要求
- 2024公眾號搭建合同
- 2024融資服務(wù)合同范文
- 集體土地上房屋拆遷補償標(biāo)準(zhǔn)
- 2024終止合同協(xié)議書
- 2024水馬購買協(xié)議合同
- 建筑項目施工管理協(xié)議書
- 2024年企業(yè)知識產(chǎn)權(quán)歸屬協(xié)議書
- 資金管理與賬戶監(jiān)督合同
- 2021年大唐集團招聘筆試試題及答案
- DBJ53/T-39-2020 云南省民用建筑節(jié)能設(shè)計標(biāo)準(zhǔn)
- 2022版義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)解讀課件PPT模板
- 實驗五 PCR擴增課件
- 馬拉松運動醫(yī)療支援培訓(xùn)課件
- 中醫(yī)藥宣傳手冊
- 不良資產(chǎn)處置盡職指引
- 人教部編版七年級歷史上冊第19課 北魏政治和北方民族大交融課件(23張PPT)
- 機械設(shè)備定期檢查維修保養(yǎng)使用臺賬
- 麗聲北極星分級繪本第四級上 Stop!Everyone Stop!教學(xué)設(shè)計
- 小學(xué)科學(xué)教育科學(xué)三年級上冊天氣《認(rèn)識氣溫計》教學(xué)設(shè)計
評論
0/150
提交評論