T-BIA 17-2024 數(shù)字人指標(biāo)要求及評(píng)估方法 第1部分:平臺(tái)基礎(chǔ)能力_第1頁
T-BIA 17-2024 數(shù)字人指標(biāo)要求及評(píng)估方法 第1部分:平臺(tái)基礎(chǔ)能力_第2頁
T-BIA 17-2024 數(shù)字人指標(biāo)要求及評(píng)估方法 第1部分:平臺(tái)基礎(chǔ)能力_第3頁
T-BIA 17-2024 數(shù)字人指標(biāo)要求及評(píng)估方法 第1部分:平臺(tái)基礎(chǔ)能力_第4頁
T-BIA 17-2024 數(shù)字人指標(biāo)要求及評(píng)估方法 第1部分:平臺(tái)基礎(chǔ)能力_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

IICS33.160TechnicalrequirementsandtestmethodsfordigitalhumanPart1:Platformbasiccompetency北京信息化協(xié)會(huì) I 12規(guī)范性引用文件 13術(shù)語、定義和縮略語 13.1術(shù)語和定義 13.2縮略語 24概述 25基礎(chǔ)技術(shù)能力 25.1能力要求 35.2評(píng)估方法 66基礎(chǔ)工程化能力 66.1能力要求 66.2評(píng)估方法 87基礎(chǔ)安全保障能力 87.1能力要求 87.2評(píng)估方法 9 10I本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)則起請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。《數(shù)字人指標(biāo)要求及評(píng)估方法》分為以下部分:第1部分:平臺(tái)基礎(chǔ)能力;第2部分:平臺(tái)性能分級(jí);第3部分:平臺(tái)安全可信;第4部分:動(dòng)作捕捉技術(shù);第5部分:終端一體機(jī);第6部分:金融場景應(yīng)用;第7部分:營銷場景應(yīng)用;本文件為第1部分。本文件由北京信息化協(xié)會(huì)提出并歸口。本文件起草單位:中國信息通信研究院、北京信息化協(xié)會(huì)元宇宙創(chuàng)新發(fā)展工作委員、中國移動(dòng)通信集團(tuán)北京有限公司、北京藍(lán)色光標(biāo)數(shù)據(jù)科技股份有限公司、中興通訊股份有限公司、北京數(shù)智云科信息科技有限公司、凌宇科技(北京)有限公司、北京飛天云動(dòng)科技有限公司、數(shù)字栩生(北京)科技有限公司、北京海百川科技有限公司、深圳傳音控股有限公司、南京硅基智能科技有限公司、深圳市閃剪智能科技有限公司、北京蔚領(lǐng)時(shí)代科技有限公司、湖南芒果融創(chuàng)科技有限公司、馬上消費(fèi)金融股份有限公司、科大訊飛股份有限公司、北京黑鏡次元科技有限公司、北京中科深智科技有限公司、北京聚力維度科技有限公司、北京摩登天空文化發(fā)展有限公司、北京靈芒科技文化有限公司、愛化身科技(北京)有限公司、北京元客方舟科技有限公司、北京五一視界數(shù)字孿生科技股份有限公司、北京元宇宙文化有限公司、浙江君同智能科技有限責(zé)任公司、蘇州次源科技服務(wù)有限公司、杭州趣看科技有限公司、九度數(shù)字科技(蘇州)有限公司、中傳景創(chuàng)(北京)文化旅游有限公司、寧波菊風(fēng)系統(tǒng)軟件有限公司。本文件主要起草人:顏媚、石霖、和婕、馮昊宇、凌玲、紀(jì)菁、翁冬冬、任春霞、李志強(qiáng)、郭曉喆、蔣耀琳、呂海兵、劉彥賓、李松、趙明睿、張佳寧、李金蘭、汪磊、周世晟、宋震、孫博、趙晶、朱峰結(jié)、湯本來、司馬華鵬、毛麗艷、唐向陽、高宏剛、費(fèi)元華、于淼、張亦弛、吳紅、馮月、曾定衡、郜靜文、張一凡、吳松城、張培養(yǎng)、宋健、羅志文、趙天奇、渠源、沈玥、張逸娟、張晶、朱金晨、涂政、郭林、耿放、熊偉、吳亞光、曹振、王國林、邢琳、韓蒙、林昶廷、張廣亮、李小滿、錢代友、賀波、陳乾、栗蘭賀、楊茂森、劉奕宏、錢曉炯、蔣瑩凱、龔任嬌子、盛琳子。1T/BIA17-2024數(shù)字人指標(biāo)要求及評(píng)估方法第1部分:平臺(tái)基礎(chǔ)能力本文件面向數(shù)字人平臺(tái),從基礎(chǔ)技術(shù)能力、基礎(chǔ)工程化能力、基礎(chǔ)安全保障能力三個(gè)維度規(guī)定了數(shù)字人平臺(tái)基礎(chǔ)能力要求及評(píng)估方法。本文件適用于指導(dǎo)對(duì)數(shù)字人平臺(tái)基礎(chǔ)能力的設(shè)計(jì)、研發(fā)、評(píng)估、驗(yàn)收等工作。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。ITU/TF.748.15數(shù)字人應(yīng)用系統(tǒng)基礎(chǔ)框架和評(píng)測指標(biāo)(Frameworkandmetricsfordigitalhumanapplicationsystems)3術(shù)語、定義和縮略語3.1術(shù)語和定義ITU/TF.748.15界定的以及下列術(shù)語和定義適用于本文件。3.1.1虛擬數(shù)字人digitalhuman簡稱數(shù)字人或虛擬人,是指基于現(xiàn)實(shí)世界設(shè)計(jì)或通過計(jì)算機(jī)虛擬生成,再借助真人或計(jì)算驅(qū)動(dòng),在多模態(tài)輸出設(shè)備呈現(xiàn)的擬人化的虛擬形象或虛擬人物,是集計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、智能語音、人工智能和自然語言處理技術(shù)于一體的計(jì)算機(jī)應(yīng)用,可用于數(shù)字內(nèi)容生成和人機(jī)交互,幫助提高內(nèi)容生產(chǎn)效率和用戶體驗(yàn)。[來源:ITU/TF.748.15,3.2.1,有修改]3.1.2文本驅(qū)動(dòng)text-driven是指支持不同類型的文本到最終數(shù)字人視頻(包括語音和畫面)的驅(qū)動(dòng)方式。3.1.3音頻驅(qū)動(dòng)audio-driven是指支持語音輸入以及音樂輸入,實(shí)現(xiàn)對(duì)數(shù)字人表情及動(dòng)作的控制的驅(qū)動(dòng)方式。3.1.4視頻驅(qū)動(dòng)video-driven是指基于計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)等技術(shù),通過攝像頭對(duì)真人的動(dòng)作捕捉,實(shí)現(xiàn)對(duì)數(shù)字人表情及動(dòng)作的控制的驅(qū)動(dòng)方式。2T/BIA17-20243.1.5動(dòng)作捕捉設(shè)備驅(qū)動(dòng)motioncapturedevicedriven是指通過動(dòng)作捕捉設(shè)備對(duì)真人的動(dòng)作捕捉,實(shí)現(xiàn)對(duì)數(shù)字人表情及動(dòng)作的控制的驅(qū)動(dòng)方式。3.2縮略語下列縮略語適用于本文件。2D二維3D三維API應(yīng)用程序接口CG計(jì)算機(jī)圖形學(xué)CPU中央處理器GPU圖形處理器SaaS軟件即服務(wù)SDK軟件開發(fā)工具4概述2-Dimensional3-DimensionalApplicationProgrammingInterfaceComputerGraphicsCentralProcessingUnitGraphicsProcessingUnitSoftwareasaServiceSoftwareDevelopmentKit數(shù)字人平臺(tái)基礎(chǔ)能力如圖1所示,主要涵蓋以下三個(gè)方面的內(nèi)容:(1)基礎(chǔ)技術(shù)能力,即數(shù)字人平臺(tái)的基礎(chǔ)功能是否能夠滿足用戶普遍的使用需求,主要從形象技術(shù)能力、語音技術(shù)能力、驅(qū)動(dòng)技術(shù)能力、交互技術(shù)能力、內(nèi)容供給能力、人設(shè)定制能力等維度進(jìn)行評(píng)估。(2)基礎(chǔ)工程化能力,即數(shù)字人平臺(tái)的非功能性能力是否能夠支撐業(yè)務(wù)應(yīng)用落地,主要從標(biāo)準(zhǔn)資源配置、可移植性、易用性、可擴(kuò)展性、兼容性、時(shí)效性、可靠性等方面進(jìn)行評(píng)估。(3)基礎(chǔ)安全保障能力,即數(shù)字人平臺(tái)是否能夠滿足現(xiàn)有合規(guī)要求,主要從形象版權(quán)保障、內(nèi)容追溯能力、內(nèi)容風(fēng)險(xiǎn)控制等方面進(jìn)行評(píng)估。圖1數(shù)字人基礎(chǔ)能力評(píng)估框架5基礎(chǔ)技術(shù)能力3T/BIA17-20245.1能力要求5.1.1概述數(shù)字人基礎(chǔ)技術(shù)能力可從形象技術(shù)能力、語音技術(shù)能力、驅(qū)動(dòng)技術(shù)能力、交互技術(shù)能力、內(nèi)容供給能力、人設(shè)定制能力等維度進(jìn)行評(píng)估,具體評(píng)估指標(biāo)及查驗(yàn)內(nèi)容如表1所示。表1基礎(chǔ)技術(shù)能力評(píng)估指標(biāo)及查驗(yàn)內(nèi)容指標(biāo)類別指標(biāo)項(xiàng)查驗(yàn)內(nèi)容必選/可選基礎(chǔ)技術(shù)能力形象技術(shù)能力支持的形象類型必選支持的形象精細(xì)度必選形象生成方式支持情況必選形象裝扮更換支持情況必選位移支持情況必選語音技術(shù)能力語音合成能力必選語音編輯能力可選語音轉(zhuǎn)換能力可選語音定制能力可選驅(qū)動(dòng)技術(shù)能力支持的驅(qū)動(dòng)方式必選驅(qū)動(dòng)范圍必選交互技術(shù)能力支持的交互方式可選語音識(shí)別能力可選交互自主性可選支持的交互能力類型可選情感化表現(xiàn)可選富媒體展示能力可選喚醒能力可選內(nèi)容供給能力內(nèi)容構(gòu)建方式必選人設(shè)定制能力人設(shè)定制能力必選風(fēng)格一致性必選5.1.2形象技術(shù)能力5.1.2.1形象類型支持一種或多種數(shù)字人形象類型,如2D卡通形象(含動(dòng)物、擬人化設(shè)計(jì)物)、2D真人形象、3D卡通形象(含動(dòng)物、擬人化設(shè)計(jì)物)、3D半寫實(shí)形象、3D寫實(shí)形象等;男、女;著裝可分為偏禮儀服裝、專業(yè)制服、主題服裝、休閑服裝、民族服裝等;妝容風(fēng)格可分為正式妝5.1.2.2形象精細(xì)度支持一種或多種數(shù)字人形象精細(xì)度。若是2D真人形象類數(shù)字人,應(yīng)披露支持的分辨率;若是3D數(shù)字人應(yīng)披露數(shù)字人頭部、身體、毛發(fā)、服裝等部位的模型面數(shù)、光照效果等,詳情4T/BIA17-2024見附錄A;類型的小屏場景、一體機(jī)以及會(huì)場大屏的大屏場景等)支持不同分辨率的調(diào)節(jié)能力,如支持480p、720p、注2:3D虛擬數(shù)字人的建模精細(xì)度決定了最終的呈現(xiàn)效果以及處理的效率,根據(jù)模型的面數(shù)可以將3D虛擬數(shù)字人的精細(xì)程度劃分成四個(gè)等級(jí):普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)5.1.2.3形象生成方式支持一種及以上的數(shù)字人形象生成方式,供用戶定制數(shù)字人形象。其中,生成2D卡通、3D寫實(shí)形象、3D半寫實(shí)形象、3D卡通形象(含動(dòng)物、擬人化設(shè)計(jì)物)的方式包括但不限于:1)根據(jù)用戶提供的需求,利用CG技術(shù)進(jìn)行生成數(shù)字人;2)提供模塊化數(shù)字人定制,系統(tǒng)定義數(shù)字人身體各部位參數(shù),供用戶選擇搭配;3)提供深度數(shù)字人定制,用戶可完全自主定義數(shù)字人身體各部位的參數(shù)。生成2D真人形象的方式包括但不限于:1)用戶輸入照片,由系統(tǒng)根據(jù)照片參數(shù)生成數(shù)字人形象。2)用戶輸入視頻,利用人工智能算法處理視頻生成數(shù)字人形象。a)輸入大量視頻數(shù)據(jù),生成高清真人數(shù)字人形象;b)輸入微量視頻數(shù)據(jù),生成低成本,可即時(shí)任意替換的真人數(shù)字人形象。5.1.2.4形象裝扮更換支持?jǐn)?shù)字人形象裝扮更換,可供用戶定制不同的數(shù)字人的裝扮。更換內(nèi)容包括但不限于發(fā)型、服飾、配飾等;5.1.2.5位移支持情況披露數(shù)字人的位移支持情況,包括在視頻畫面中不同位置的展現(xiàn),以及數(shù)字人在場景中移動(dòng)的能力,如全身移動(dòng)、全場景變換等;感受到整個(gè)空間所有元素相對(duì)位置的變化,數(shù)字人能與道具、環(huán)境進(jìn)行自然的互動(dòng)(位移、抓舉、改變形5.1.3語音技術(shù)能力應(yīng)包含以下基本功能:——支持語音合成能力,并披露對(duì)于多情感、多語種、多方言、唱歌、變聲等語音合成能力的支持情況;牙語等語種合成能力;多方言是指除普通話外,還支持粵語、四川話等方言的處理能力;唱歌是指合成歌——披露支持的語音編輯能力,支持如下一項(xiàng)或幾項(xiàng):語速、音色、音量、情感、發(fā)音編輯等;5T/BIA17-2024注2:發(fā)音編輯是指編輯文本中多音字、符號(hào)等的發(fā)音,——支持語音轉(zhuǎn)換能力,即讓數(shù)字人按照語音編輯設(shè)置好的參數(shù)將音頻實(shí)時(shí)轉(zhuǎn)換成數(shù)字人的語音的能力,并披露語音轉(zhuǎn)換實(shí)時(shí)率;——支持語音定制能力,如支持錄音棚錄音的常規(guī)定制或小樣本數(shù)據(jù)的語音定制(應(yīng)披露樣本數(shù)據(jù)時(shí)長)等;5.1.4驅(qū)動(dòng)技術(shù)能力應(yīng)包含以下基本功能:——支持一種或多種驅(qū)動(dòng)方式,如文本驅(qū)動(dòng)、語音驅(qū)動(dòng)、視頻驅(qū)動(dòng)、動(dòng)作捕捉設(shè)備驅(qū)動(dòng)、其他驅(qū)動(dòng)等。注:動(dòng)作捕捉設(shè)備包括光學(xué)動(dòng)作捕捉、慣性動(dòng)——披露支持的驅(qū)動(dòng)范圍,如口型、面部表情、肢體(半身或全身)、手指、背景內(nèi)容素材等(不同驅(qū)動(dòng)范圍說明驅(qū)動(dòng)的方式);5.1.5交互技術(shù)能力應(yīng)包含以下基本功能:——支持一種或多種交互方式,如單輪、多輪對(duì)話、全雙工等語音交互,手語、肢體動(dòng)作、視線等視覺交互,點(diǎn)擊等觸屏交互、多模態(tài)交互等;——披露在某一業(yè)務(wù)場景下某一語種或方言的語音識(shí)別率,以及語音識(shí)別所支持的領(lǐng)域場景,如金融,電力,電信等;景下,8k電話信道的識(shí)別率可達(dá)到88%以上,16k網(wǎng)絡(luò)信道——支持主動(dòng)交互或被動(dòng)交互。主動(dòng)交互是指根據(jù)時(shí)間、地點(diǎn)、用戶狀態(tài),在恰當(dāng)?shù)臅r(shí)機(jī)主動(dòng)發(fā)起交互行為,可以是語音交互,視覺信息展示等;被動(dòng)交互能力如:人工輸入文字、語音或視頻進(jìn)行驅(qū)動(dòng)交互,或者通過動(dòng)捕設(shè)備驅(qū)動(dòng)數(shù)字人交互;——披露支持的交互能力類型,如業(yè)務(wù)處理、常識(shí)性智能問答、閑聊等;——支持情感化表現(xiàn),如喜、怒、哀、樂等情感;——支持交互過程中的富媒體展示能力,如圖表、視頻、虛擬物品等;——披露支持的喚醒方式,如基于傳感器、點(diǎn)擊、視覺、語音等。5.1.6內(nèi)容供給能力應(yīng)包含以下基本功能:——支持一種或多種內(nèi)容構(gòu)建方式,如手工構(gòu)建、SaaS化工具構(gòu)建、智能生成等;注2:SaaS化工具構(gòu)建指提供工具化的軟件,播劇本編輯工具、知識(shí)編輯等。用戶創(chuàng)建或修改完成后可以注3:智能生成是指通過算法或大數(shù)據(jù)挖掘,系統(tǒng)自動(dòng)化5.1.7人設(shè)定制能力數(shù)字人人設(shè)應(yīng)包括形象、服飾、表達(dá)、聲音等方面。數(shù)字人人設(shè)定制應(yīng)包含以下基本功——披露對(duì)數(shù)字人人設(shè)的定制能力,且數(shù)字人的人設(shè)應(yīng)當(dāng)與使用場景、目標(biāo)用戶通識(shí)認(rèn)6T/BIA17-2024知保持一致。如在服務(wù)行業(yè)場景,數(shù)字人被普遍認(rèn)為應(yīng)當(dāng)熱情體貼,而在司法場景,數(shù)字人被——支持風(fēng)格一致性,即在輸出數(shù)字人技術(shù)時(shí)需保持人設(shè)的統(tǒng)一性、自洽性、一貫性,包括但不限于:數(shù)字人身份、性格、形象、聲音、表達(dá)等。5.2評(píng)估方法對(duì)于基礎(chǔ)技術(shù)能力的評(píng)估主要采取現(xiàn)場服務(wù)功能核驗(yàn)的方式,對(duì)參評(píng)服務(wù)的基礎(chǔ)功能完備性進(jìn)行驗(yàn)證和評(píng)估。通過準(zhǔn)則是標(biāo)準(zhǔn)中涉及的必選功能指標(biāo)都通過驗(yàn)證??蛇x功能指標(biāo)可根據(jù)參評(píng)企業(yè)實(shí)際情況進(jìn)行技術(shù)測試。6基礎(chǔ)工程化能力6.1能力要求6.1.1概述數(shù)字人基礎(chǔ)工程化能力可從標(biāo)準(zhǔn)資源配置、可移植性、易用性、可擴(kuò)展性、兼容性、時(shí)效性、可靠性等方面進(jìn)行評(píng)估,具體評(píng)估指標(biāo)及查驗(yàn)內(nèi)容如表2所示。表2基礎(chǔ)工程化能力評(píng)估指標(biāo)及查驗(yàn)內(nèi)容指標(biāo)類別指標(biāo)項(xiàng)查驗(yàn)內(nèi)容必選/可選基礎(chǔ)工程化能力標(biāo)準(zhǔn)資源配置披露客戶端環(huán)境必選服務(wù)端標(biāo)準(zhǔn)軟硬件配置必選標(biāo)準(zhǔn)網(wǎng)絡(luò)環(huán)境必選可移植性適應(yīng)性必選易用性易操作性必選用戶界面舒適性必選易學(xué)性必選可擴(kuò)展性功能擴(kuò)展必選性能擴(kuò)展必選個(gè)性化擴(kuò)展可選兼容性渲染方案支持情況必選多渠道接入能力必選云端渲染SDK支持情況可選終端渲染SDK支持情況可選與已有AI能力集成能力可選與已有業(yè)務(wù)系統(tǒng)集成能力可選可兼容適配的軟硬件必選人工接管支持情況可選時(shí)效性生產(chǎn)周期必選實(shí)時(shí)響應(yīng)速度必選可靠性成熟性必選7T/BIA17-2024易恢復(fù)性必選交互質(zhì)檢功能可選6.1.2標(biāo)準(zhǔn)資源配置披露應(yīng)對(duì)各類型數(shù)字人運(yùn)行需要的標(biāo)準(zhǔn)資源配置進(jìn)行披露,包括以下信息的披露:——客戶端的環(huán)境要求;——服務(wù)端的標(biāo)準(zhǔn)軟硬件配置,軟件環(huán)境信息包括系統(tǒng)、數(shù)據(jù)庫等,硬件環(huán)境包括CPU、GPU、內(nèi)存、磁盤等;——標(biāo)準(zhǔn)的網(wǎng)絡(luò)環(huán)境要求,單向播報(bào)類數(shù)字人應(yīng)披露進(jìn)行流暢操作所需的帶寬要求,雙向交互類數(shù)字人應(yīng)披露每路并發(fā)所需的帶寬要求;6.1.3可移植性應(yīng)包含以下基本功能:——支持提供SaaS化服務(wù),企業(yè)無需私有化本地部署,可快捷接入業(yè)務(wù)提供標(biāo)準(zhǔn)服務(wù);——支持企業(yè)私有化本地/云端獨(dú)立部署,保障數(shù)據(jù)私密安全;6.1.4易用性應(yīng)包含以下基本功能:——具備易操作性,產(chǎn)品或系統(tǒng)易于操作和控制?!邆溆脩艚缑媸孢m性,人機(jī)界面簡潔、直觀;——具備易學(xué)性,產(chǎn)品或系統(tǒng)無需培訓(xùn)學(xué)習(xí),理解應(yīng)用成本低;——提供完整的用戶操作手冊(cè);6.1.5可擴(kuò)展性應(yīng)包含以下基本功能:——支持功能擴(kuò)展,具有良好可擴(kuò)展性的系統(tǒng)設(shè)計(jì),支持添加新功能或修改完善現(xiàn)有功——支持性能擴(kuò)展,支持橫向擴(kuò)展增加服務(wù)器提高系統(tǒng)性能,支持縱向擴(kuò)展增加服務(wù)器的內(nèi)存或者CPU提高系統(tǒng)性能;——具有良好的定制擴(kuò)展能力,允許基于開放的API/SDK進(jìn)行二次開發(fā)和系統(tǒng)集成;6.1.6兼容性應(yīng)包含以下基本功能:——支持云端渲染、本地終端渲染能力;注2:本地終端渲染是指依托終端硬件設(shè)備算力,不依賴云端服務(wù)器和網(wǎng)絡(luò)流量,在本地進(jìn)行數(shù)字人——支持多渠道接入能力,如App、Web/H5、小程序、VTM、大屏設(shè)備、VoLTE等渠道終端;——支持云端渲染方式的標(biāo)準(zhǔn)化SDK,如WebSDK、AndroidSDK、iOSSDK;——支持終端渲染方式的標(biāo)準(zhǔn)化SDK,如AndroidSDK、iOSSDK、WindowsSDK、LinuxSDK;——支持與第三方廠商/客戶業(yè)務(wù)已有AI能力集成,如語音識(shí)別、語音合成、自然語8T/BIA17-2024言處理、計(jì)算機(jī)視覺等能力;——支持與客戶已有業(yè)務(wù)系統(tǒng)定制化集成對(duì)接,如音視頻平臺(tái)、呼叫中心系統(tǒng)等;——披露支持的可兼容適配的操作系統(tǒng)和硬件;——披露人工接管的支持情況,如文本接管、語音接管、視頻接管、動(dòng)作捕捉設(shè)備接管6.1.7時(shí)效性應(yīng)包含以下基本功能:——應(yīng)披露各類型(不同形象類型、驅(qū)動(dòng)類型、交互類型等)數(shù)字人的生產(chǎn)周期;——應(yīng)披露各類型數(shù)字人在標(biāo)準(zhǔn)資源配置下的實(shí)時(shí)響應(yīng)速度。對(duì)于單向播報(bào)類數(shù)字人,指的是合成不同分辨率及碼率視頻的視頻合成實(shí)時(shí)率;對(duì)于雙向交互的數(shù)字人,指的是端到端耗時(shí)或首幀延遲時(shí)間。6.1.8可靠性應(yīng)包含以下基本功能:——支持滿負(fù)荷狀態(tài)下(硬件支持的最大并發(fā)路數(shù)),穩(wěn)定運(yùn)行7*24小時(shí),無內(nèi)存/顯存泄漏和CPU/GPU異?,F(xiàn)象,穩(wěn)定運(yùn)行無崩潰、無數(shù)據(jù)卡死現(xiàn)象;——針對(duì)數(shù)字人引擎、服務(wù)等遇到異常退出時(shí),擁有進(jìn)程守護(hù)機(jī)制,可以進(jìn)行拉起,恢復(fù)引擎和服務(wù)的正常運(yùn)行,保障服務(wù)的整體穩(wěn)定性;——支持交互質(zhì)檢功能,即支持將人機(jī)交互的過程轉(zhuǎn)寫記錄下來,通過分析失敗、未達(dá)成目標(biāo)的交互,改進(jìn)交互流程從而提升數(shù)字人交互質(zhì)量。6.2評(píng)估方法對(duì)于工程化能力的評(píng)估主要采用材料審查和現(xiàn)場演示的方式,對(duì)參評(píng)業(yè)務(wù)的標(biāo)準(zhǔn)資源配置、可移植性、易用性、可擴(kuò)展性、兼容性等方面的進(jìn)行驗(yàn)證。通過的準(zhǔn)則是參評(píng)企業(yè)提交的基本信息材料應(yīng)真實(shí)可信,所有必選項(xiàng)應(yīng)全部通過。7基礎(chǔ)安全保障能力7.1能力要求7.1.1概述數(shù)字人基礎(chǔ)安全保障能力可從形象版權(quán)保障、內(nèi)容回溯能力、內(nèi)容安全保障等方面進(jìn)行評(píng)估,具體評(píng)估指標(biāo)及查驗(yàn)內(nèi)容如表3所示。表3基礎(chǔ)安全保障能力評(píng)估指標(biāo)及查驗(yàn)內(nèi)容指標(biāo)類別指標(biāo)項(xiàng)查驗(yàn)內(nèi)容必選/可選基礎(chǔ)安全保障能力形象版權(quán)保障肖像權(quán)、著作權(quán)等可選內(nèi)容回溯能力數(shù)字水印支持情況可選內(nèi)容風(fēng)險(xiǎn)控制內(nèi)容風(fēng)險(xiǎn)控制機(jī)制可選顯著標(biāo)識(shí)顯著標(biāo)識(shí)支持情況必選7.1.2形象版權(quán)保障9T/BIA17-2024數(shù)字人技術(shù)和業(yè)務(wù)提供方可提供數(shù)字人形象版權(quán)相關(guān)法律授權(quán)文件,確保數(shù)字人形象不涉及侵權(quán)問題。應(yīng)包含以下基本功能:——若涉及真人授權(quán),需要肖像權(quán)等授權(quán)文件;——若涉及創(chuàng)作作品,需有設(shè)計(jì)著作權(quán)等證明文件?!獙?duì)數(shù)字人除形象之外的聲音、音樂、背景等素材應(yīng)獲得相應(yīng)場景的版權(quán)許可。7.1.3內(nèi)容回溯能力內(nèi)容回溯需支持從技術(shù)上提供不影響數(shù)字人效果的安全水印,支持添加、修改、刪除、獲取能力。給數(shù)字人增加數(shù)字水印技術(shù)是加在音頻或者圖像上,其具備不直接可見性和魯棒7.1.4內(nèi)容風(fēng)險(xiǎn)控制內(nèi)容風(fēng)險(xiǎn)審核支持機(jī)器審核、人工審核,并根據(jù)不同的使用場景提供不同的組合模式,同時(shí)保障服務(wù)可用性。7.1.5顯著標(biāo)識(shí)數(shù)字人技術(shù)和業(yè)務(wù)提供方應(yīng)當(dāng)向數(shù)字人服務(wù)使用者提供對(duì)數(shù)字人信息內(nèi)容進(jìn)行顯著標(biāo)識(shí)的功能,并提示數(shù)字人服務(wù)使用者可以對(duì)深度合成信息內(nèi)容進(jìn)行顯著標(biāo)識(shí)。7.2評(píng)估方法對(duì)于安全保障能力的評(píng)估主要對(duì)數(shù)字人形象版權(quán)保障、內(nèi)容回溯能力、內(nèi)容風(fēng)險(xiǎn)控制、顯著標(biāo)識(shí)四個(gè)方面進(jìn)行評(píng)估,考察數(shù)字人平臺(tái)的基礎(chǔ)安全保障能力。參評(píng)企業(yè)應(yīng)通過提供商務(wù)合同或服務(wù)協(xié)議等資料,以及現(xiàn)場操作演示等方式作出承諾或說明。通過的準(zhǔn)則是提供的合同或協(xié)議等資料真實(shí)可信。所有必選項(xiàng)應(yīng)全部通過。T/BIA17-2024附錄A(資料性)A.13D數(shù)字人形象建模質(zhì)量分類分級(jí)總體說明3D數(shù)字人形象建模質(zhì)量分類分級(jí)是作為考察區(qū)分3D數(shù)字人精細(xì)度的一個(gè)參考。以3D數(shù)字人美術(shù)風(fēng)格為分類,從頭部模型、表情驅(qū)動(dòng)、毛發(fā)系統(tǒng)、身體建模、服裝模型等五個(gè)維度評(píng)價(jià)3D數(shù)字人形象建模質(zhì)量,共分為普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量四個(gè)級(jí)別,精細(xì)度依次增高。3D數(shù)字人形象質(zhì)量分類分級(jí)參考架構(gòu)如圖A-1所示。圖A-13D數(shù)字人形象質(zhì)量分類分級(jí)參考架構(gòu)A.2數(shù)字人美術(shù)風(fēng)格分類用于表述數(shù)字人渲染的美術(shù)風(fēng)格,與真人的相似程度進(jìn)行分類。分類為:卡通、半寫實(shí)、寫實(shí)。不同類型的數(shù)字人的分級(jí)要求不一樣,不能用統(tǒng)一的尺子來衡量分類分類標(biāo)準(zhǔn)卡通臉型、眼睛形狀與位置、嘴唇形狀與位置、眼球形狀等參數(shù)脫離真人比例。半寫實(shí)臉型、眼睛形狀與位置、嘴唇形狀與位置、眼球形狀等參數(shù)基本參照真人比例,臉部無皮膚細(xì)節(jié)。寫實(shí)臉型、眼睛形狀與位置、嘴唇形狀與位置、眼球形狀等參數(shù)嚴(yán)格參照真人比例,并可在特寫狀態(tài)下觀察到絨毛、皮膚毛孔等仿真細(xì)節(jié)。A.3頭部模型質(zhì)量分級(jí)用來描述數(shù)字人頭部模型的質(zhì)量。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。T/BIA17-2024分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量所有頭部模型質(zhì)量子指標(biāo)達(dá)到普通質(zhì)量及以上中級(jí)質(zhì)量所有頭部模型質(zhì)量子指標(biāo)達(dá)到中級(jí)質(zhì)量及以上高級(jí)質(zhì)量所有頭部模型質(zhì)量子指標(biāo)達(dá)到高級(jí)質(zhì)量及以上超高級(jí)質(zhì)量所有頭部模型質(zhì)量子指標(biāo)達(dá)到超高級(jí)質(zhì)量及以上A.3.1頭部模型面數(shù)描述構(gòu)成頭部模型的頂點(diǎn)數(shù)量。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量[0,10000)中級(jí)質(zhì)量[10000,20000)高級(jí)質(zhì)量[20000,40000)超高級(jí)質(zhì)量[40000,+∞)A.3.2頭部模型完備度描述頭部模型組成是否完整,是否用分離的子模型表達(dá)了頭部的重要組成部分。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量頭部模型由一個(gè)整體網(wǎng)格構(gòu)成沒有獨(dú)立眼睛和口腔等部分。中級(jí)質(zhì)量頭部模型包含面部網(wǎng)格和獨(dú)立的口腔或舌頭網(wǎng)格,獨(dú)立的眼球結(jié)構(gòu)高級(jí)質(zhì)量頭部模型包含面部網(wǎng)、獨(dú)立的口腔網(wǎng)格、上下牙網(wǎng)格、舌頭網(wǎng)格、獨(dú)立的左右眼球網(wǎng)格,并且有皮膚紋理的雕刻超高級(jí)質(zhì)量頭部模型包含面部網(wǎng)、獨(dú)立的口腔網(wǎng)格、上下牙網(wǎng)格、舌頭網(wǎng)格、獨(dú)立的左右眼球網(wǎng)格以及眼瞼網(wǎng)格、淚腺網(wǎng)格等細(xì)節(jié)子模型,并且有細(xì)致的皮膚紋理雕刻A.3.3頭部紋理質(zhì)量描述頭部紋理尺寸和精細(xì)程度,以面部紋理有效區(qū)域尺寸進(jìn)行分類。面部紋理有效區(qū)域定義為:頭部模型上四點(diǎn)(左右耳外輪廓最外側(cè)點(diǎn),下巴最低處點(diǎn),額頭中心點(diǎn))所對(duì)應(yīng)紋理坐標(biāo)圍成的,四邊平行于圖像邊界的圖像區(qū)域。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、T/BIA17-2024超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量面部紋理有效區(qū)域面積小于等于2K中級(jí)質(zhì)量面部紋理有效區(qū)域面積為4K高級(jí)質(zhì)量面部紋理有效區(qū)域面積為8K量面部紋理有效區(qū)域面積大于8K以上,并且使用多象限UVA.3.4頭部紋理完備度描述頭部紋理的種類是否能夠充分滿足渲染需求,以資產(chǎn)是否包含對(duì)應(yīng)的紋理種類進(jìn)行分級(jí)。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量僅包含漫反射紋理中級(jí)質(zhì)量包含漫反射紋理、法線紋理、置換紋理高級(jí)質(zhì)量包含漫反射紋理、法線紋理、置換紋理、高光紋理、次表面散射紋理量包含漫反射紋理、法線紋理、置換紋理、高光紋理、粗糙度紋理、次表面散射紋理(曲率紋理)A.4表情驅(qū)動(dòng)質(zhì)量分級(jí)描述資產(chǎn)能夠呈現(xiàn)表情的精細(xì)程度,以動(dòng)態(tài)驅(qū)動(dòng)過程中構(gòu)成表情的所使用基礎(chǔ)表情數(shù)量作為評(píng)價(jià)和分級(jí)標(biāo)準(zhǔn),分為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量無中級(jí)質(zhì)量基礎(chǔ)表情數(shù)量100個(gè)以下高級(jí)質(zhì)量基礎(chǔ)表情數(shù)量100-400個(gè)超高級(jí)質(zhì)量基礎(chǔ)表情數(shù)量400個(gè)以上T/BIA17-2024A.5毛發(fā)系統(tǒng)質(zhì)量分級(jí)描述資產(chǎn)中毛發(fā)系統(tǒng)的質(zhì)量,以構(gòu)建毛發(fā)所使用的技術(shù)手段進(jìn)行分級(jí)。分為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量使用非透明紋理的整體網(wǎng)格構(gòu)成頭發(fā),并進(jìn)行著色和渲染中級(jí)質(zhì)量使用分片網(wǎng)格和半透明紋理構(gòu)成頭發(fā)及睫毛,并進(jìn)行著色和渲染高級(jí)質(zhì)量使基于引導(dǎo)線的毛發(fā)系統(tǒng),結(jié)合各向異性材質(zhì)構(gòu)成頭發(fā)及睫毛,并進(jìn)行著色和渲染。超高級(jí)質(zhì)量使基于引導(dǎo)線的毛發(fā)系統(tǒng),結(jié)合各向異性材質(zhì)構(gòu)成頭發(fā)及睫毛,同時(shí)包含細(xì)節(jié)臉部絨毛,并進(jìn)行著色和渲染,包含深度紋理和切線紋理。A.6身體模型質(zhì)量分級(jí)用來描述數(shù)字人身體模型的質(zhì)量。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量所有身體模型質(zhì)量子指標(biāo)達(dá)到普通質(zhì)量及以上中級(jí)質(zhì)量所有身體模型質(zhì)量子指標(biāo)達(dá)到中級(jí)質(zhì)量及以上高級(jí)質(zhì)量所有身體模型質(zhì)量子指標(biāo)達(dá)到高級(jí)質(zhì)量及以上超高級(jí)質(zhì)量所有身體模型質(zhì)量子指標(biāo)達(dá)到超高級(jí)質(zhì)量及以上A.6.1身體模型面數(shù)描述構(gòu)成身體模型的頂點(diǎn)數(shù)量。分級(jí)為:普通質(zhì)量、中級(jí)質(zhì)量、高級(jí)質(zhì)量、超高級(jí)質(zhì)量。分級(jí)分級(jí)標(biāo)準(zhǔn)普通質(zhì)量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論