![《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》_第1頁(yè)](http://file4.renrendoc.com/view14/M0B/01/3C/wKhkGWdmQ2KALaugAADZQ-ayT90774.jpg)
![《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》_第2頁(yè)](http://file4.renrendoc.com/view14/M0B/01/3C/wKhkGWdmQ2KALaugAADZQ-ayT907742.jpg)
![《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》_第3頁(yè)](http://file4.renrendoc.com/view14/M0B/01/3C/wKhkGWdmQ2KALaugAADZQ-ayT907743.jpg)
![《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》_第4頁(yè)](http://file4.renrendoc.com/view14/M0B/01/3C/wKhkGWdmQ2KALaugAADZQ-ayT907744.jpg)
![《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》_第5頁(yè)](http://file4.renrendoc.com/view14/M0B/01/3C/wKhkGWdmQ2KALaugAADZQ-ayT907745.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS國(guó)際標(biāo)準(zhǔn)分類號(hào)
CCS中國(guó)標(biāo)準(zhǔn)文獻(xiàn)分類號(hào)
團(tuán)體標(biāo)準(zhǔn)
T/CESXXX-XXXX
電力人工智能感存算一體化系統(tǒng)測(cè)試方法
TestmethodofpowerAIsystemswithintegratedcapabilitiesofsensing,data
storage,andprocessing
(征求意見(jiàn)稿)
XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施
中國(guó)電工技術(shù)學(xué)會(huì)發(fā)布
T/CESXXX—XXXX
電力人工智能感存算一體化系統(tǒng)測(cè)試方法
1范圍
本文件規(guī)定了面向輸電、變電、配電等電力領(lǐng)域的人工智能感存算一體化系統(tǒng)測(cè)試方法,可對(duì)
基于人工智能的系統(tǒng)功能、典型應(yīng)用場(chǎng)景性能進(jìn)行評(píng)估,評(píng)測(cè)場(chǎng)景包括圖像分類、目標(biāo)檢測(cè)、目標(biāo)
分割、目標(biāo)識(shí)別、目標(biāo)跟蹤、語(yǔ)音識(shí)別、文字識(shí)別、本地語(yǔ)音喚醒、負(fù)荷辨識(shí)等。
本文件適用于生產(chǎn)廠商、研究機(jī)構(gòu)、應(yīng)用廠商及第三方機(jī)構(gòu)對(duì)具備感存算一體化系統(tǒng)進(jìn)行測(cè)試
評(píng)估,也適用于生產(chǎn)廠商對(duì)感存算一體化系統(tǒng)的設(shè)計(jì)。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本
文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T1.1-2020標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:基本術(shù)語(yǔ)
GB/T9813.2-2016計(jì)算機(jī)通用規(guī)范第2部分:便攜式微型計(jì)算機(jī)
GB/T9813.3-2017計(jì)算機(jī)通用規(guī)范第3部分:服務(wù)器
GB/T5271.28-2001信息技術(shù)詞匯第28部分:人工智能基本概念與專家系統(tǒng)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
GB/T25000.51-2016系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)(SQuaRE)第51部分:就緒
可用軟件產(chǎn)品(RUSP)的質(zhì)量要求和測(cè)試細(xì)則
GB/T36572-2018電力監(jiān)控系統(tǒng)網(wǎng)絡(luò)安全防護(hù)導(dǎo)則
GB/T26866-2022電力時(shí)間同步系統(tǒng)檢測(cè)規(guī)范
T/CES128-2022電力人工智能平臺(tái)總體架構(gòu)及技術(shù)要求
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本文件。
3.1
神經(jīng)網(wǎng)絡(luò)模型neuralnetworkmodel
神經(jīng)網(wǎng)絡(luò)的抽象模型,它能用軟件來(lái)模擬或作為神經(jīng)計(jì)算機(jī)加以實(shí)現(xiàn)。
[來(lái)源:GB/T5271.34-2006,34.01.10]
3.2
訓(xùn)練training
教會(huì)神經(jīng)網(wǎng)絡(luò)在輸入值的樣本和正確輸出值之間做出結(jié)合的步驟。
[來(lái)源:GB/T5271.34-2006,34.03.18]
3.3
推理inference
從已知前提導(dǎo)出結(jié)論的推理方法。
注1:在人工智能領(lǐng)域,前提是事實(shí)或者規(guī)則。
注2:術(shù)語(yǔ)“推理”既指過(guò)程也指結(jié)果。
[來(lái)源:GB/T5271.28-2001,28.03.01]
3.4
訓(xùn)練集trainingset
數(shù)據(jù)集的子集,用于訓(xùn)練模型。
3.5
1
T/CESXXX—XXXX
測(cè)試集testset
數(shù)據(jù)集的子集,用于在模型經(jīng)由驗(yàn)證集的初步驗(yàn)證之后測(cè)試模型。
3.6
批次batch
模型訓(xùn)練的一次迭代(即一次梯度更新)中使用的樣本集。
3.7
批次大小batchsize
一個(gè)批次中的樣本數(shù)。批次大小在訓(xùn)練和推理期間通常是固定的。
3.8
輪次epoch
使用訓(xùn)練集的全部數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行一次完整的訓(xùn)練,被稱之為一代訓(xùn)練。
3.9
作業(yè)到達(dá)workload
一組被一同送入訓(xùn)練或推理系統(tǒng)的N個(gè)樣本,N為正整數(shù)。
4符號(hào)、代號(hào)和縮略語(yǔ)
下列符號(hào)、代號(hào)和縮略語(yǔ)適用于本文件。
SUT:被測(cè)系統(tǒng)(SystemUnderTest)
mAP:平均精度均值(MeanAveragePrecision)
mIoU:平均交并比(MeanIntersectionOverUnion)
FPS:每秒幀率(FramePerSecond)
FAR:誤識(shí)率(FalseAcceptRate)
FRR:拒識(shí)率(FalseRejectRate)
IR:識(shí)別正確率(IdentificationRate)
WER:詞錯(cuò)誤率(WordErrorRate)
SER:句錯(cuò)誤率(SentenceErrorRate)
NNM神經(jīng)網(wǎng)絡(luò)模型(NeuralNetworkModel)
Training:訓(xùn)練
Inference:推理
5測(cè)試說(shuō)明
5.1測(cè)試對(duì)象
本文件的測(cè)試對(duì)象具體形式有以下兩種:
a)含有計(jì)算機(jī)視覺(jué)感存算一體化系統(tǒng)的控制主機(jī),指以卡/棒等形態(tài)進(jìn)行使用的感存算一體智
能系統(tǒng),如GPU、FPGA、ASIC等感存算一體模塊,可通過(guò)PCIE、USB等接口與測(cè)試主機(jī)連接;
b)搭載人工智能處理器的感存算一體模塊。
5.2測(cè)試內(nèi)容
感存算一體化系統(tǒng)的測(cè)評(píng)指標(biāo),主要包括基本技術(shù)規(guī)格、功能、性能、電力應(yīng)用場(chǎng)景測(cè)試等部
分,在依據(jù)本文件進(jìn)行測(cè)試的過(guò)程中:
a)涉及功能、性能、電力應(yīng)用場(chǎng)景等相關(guān)指標(biāo)將通過(guò)第三方測(cè)試工具進(jìn)行評(píng)測(cè);
b)涉及基本技術(shù)規(guī)格的指標(biāo)將采信被測(cè)對(duì)象標(biāo)稱值及其他技術(shù)信息,作為先進(jìn)性的參考。
5.3環(huán)境要求
除另有規(guī)定外,環(huán)境應(yīng)滿足GB/T9813.2-2016或GB/T9813.3-2017中大氣條件的規(guī)定,其
中:
a)溫度:5℃~35℃或15℃~35℃;
2
T/CESXXX—XXXX
b)相對(duì)數(shù)度濕度:25%~75%;
c)大氣壓:86kPa~106kPa。
此外,若送測(cè)方有更為嚴(yán)苛的要求,應(yīng)滿足送測(cè)方提出的溫度、濕度等。
5.3基本要求
基本要求包括且不限于下述內(nèi)容:
a)應(yīng)支持至少一種存算一體技術(shù),包括但不限于查存計(jì)算、近存計(jì)算、存內(nèi)計(jì)算、存內(nèi)邏輯
等;
b)支持主流的人工智能框架:TensorFlow、Pytorch、Caffe/Caffe2、Mxnet、ONNX、
MindSpore(昇思)或PaddlePaddle(飛槳)等;
c)模型精度:FP64、FP32、FP16、INT4、INT8、INT16、BP16或混合精度等。其中,訓(xùn)練場(chǎng)
景精度應(yīng)支持FP16、FP32、FP64,推理場(chǎng)景下精度應(yīng)支持INT8、FP16;
d)應(yīng)支持以下至少1種自主可控加速器,包括但不限于昇騰、智芯等;ASIC類的加速器,如
NPU等;FPGA類型的加速器;GPU類型的加速器;
e)控制主機(jī)處理器架構(gòu):X86架構(gòu)、ARM、RISC-V或MIPS等架構(gòu);
f)電力人工智能模型應(yīng)滿足電力業(yè)務(wù)應(yīng)用場(chǎng)景所需的計(jì)算、算力資源等;
g)測(cè)試用儀器設(shè)備均應(yīng)經(jīng)過(guò)計(jì)量部門(mén)檢定合格,并在有效期內(nèi),專用測(cè)試設(shè)備必須經(jīng)過(guò)嚴(yán)格
標(biāo)定,并在標(biāo)定有效期內(nèi)使用。
5.4測(cè)試過(guò)程
測(cè)試過(guò)程包括:
a)測(cè)試申請(qǐng):由送測(cè)單位提供測(cè)試委托書(shū),申請(qǐng)對(duì)樣品進(jìn)行測(cè)試;
b)制定測(cè)試大綱:依據(jù)本文件與實(shí)際測(cè)試需求制定測(cè)試方案,確定測(cè)試內(nèi)容,各項(xiàng)測(cè)試的進(jìn)
度安排,資源要求,測(cè)試資料,測(cè)試工具,系統(tǒng)的配置方式,回歸測(cè)試的規(guī)定等以及評(píng)價(jià)標(biāo)準(zhǔn),如
果無(wú)法構(gòu)建出要求相同的測(cè)試環(huán)境,后續(xù)需進(jìn)一步分析由于測(cè)試環(huán)境與使用環(huán)境不一致所帶來(lái)對(duì)測(cè)
試結(jié)果的影響,形成測(cè)試大綱;
c)樣品送測(cè):由送測(cè)單位送測(cè)樣品;
d)測(cè)試環(huán)境部署:根據(jù)送測(cè)樣品部署相應(yīng)測(cè)試環(huán)境;
e)測(cè)試類型:
功能測(cè)試。在構(gòu)建的測(cè)試環(huán)境下,對(duì)樣品覆蓋的功能進(jìn)行測(cè)試,檢驗(yàn)各測(cè)試項(xiàng)目是否實(shí)現(xiàn)、是
否正確實(shí)現(xiàn)。
性能測(cè)試。在構(gòu)建的測(cè)試環(huán)境下,進(jìn)行實(shí)時(shí)監(jiān)測(cè)和數(shù)據(jù)收集,利用準(zhǔn)備好的測(cè)試數(shù)據(jù)集對(duì)被測(cè)
系統(tǒng)進(jìn)行各測(cè)試項(xiàng)目測(cè)試,分為正常情況、人為設(shè)置的系統(tǒng)資源緊缺異常情況、人為設(shè)置的高負(fù)載
高負(fù)荷情況,即將測(cè)試數(shù)據(jù)集一次輸入被測(cè)系統(tǒng),并按照被測(cè)系統(tǒng)的使用方法開(kāi)展測(cè)試活動(dòng),檢驗(yàn)
各測(cè)試項(xiàng)是否達(dá)標(biāo)、是否能夠保持;
回歸測(cè)試。定期、不定期測(cè)試進(jìn)行回歸測(cè)試,對(duì)被測(cè)系統(tǒng)進(jìn)行重新功能和性能測(cè)試,確認(rèn)每次
更新和迭代修改后的系統(tǒng)仍滿足規(guī)定的要求。
f)出具報(bào)告:完成測(cè)試后,收集整合測(cè)試數(shù)據(jù),對(duì)測(cè)試結(jié)果進(jìn)行匯總、深入分析和綜合評(píng)
價(jià),形成測(cè)試報(bào)告。
5.5場(chǎng)景信息
電力人工智能測(cè)試場(chǎng)景包括:
a)典型電力人工智能應(yīng)用場(chǎng)景:計(jì)算機(jī)視覺(jué)任務(wù),包括圖像分類、目標(biāo)檢測(cè)、目標(biāo)分割、目
標(biāo)識(shí)別、目標(biāo)跟蹤、文字識(shí)別等,語(yǔ)音識(shí)別、本地語(yǔ)音喚醒等任務(wù),電力專用應(yīng)用負(fù)荷辨識(shí)等任
務(wù),與其對(duì)應(yīng)電力生產(chǎn)環(huán)節(jié)見(jiàn)電力人工智能感存算一體化系統(tǒng)設(shè)計(jì)規(guī)范附表A.1;
b)數(shù)據(jù)集:公開(kāi)數(shù)據(jù)集或真實(shí)電力應(yīng)用場(chǎng)景數(shù)據(jù)集;
c)模型:經(jīng)典神經(jīng)網(wǎng)絡(luò)模型或自定義神經(jīng)網(wǎng)絡(luò)模型。
5.6作業(yè)到達(dá)
電力應(yīng)用場(chǎng)景作業(yè)到達(dá)的方式包含以下幾種模式:
3
T/CESXXX—XXXX
a)單路模式:測(cè)試主機(jī)向被測(cè)系統(tǒng)串行發(fā)送作業(yè)請(qǐng)求,單次作業(yè)請(qǐng)求包含1個(gè)樣本,被測(cè)系
統(tǒng)完成單次作業(yè)運(yùn)算返回結(jié)果得到測(cè)試主機(jī)確認(rèn)之后,測(cè)試主機(jī)再向被測(cè)系統(tǒng)發(fā)送下一條作業(yè)請(qǐng)
求,并以此循環(huán);
b)測(cè)試主機(jī)發(fā)送新的作業(yè):如果被測(cè)系統(tǒng)已經(jīng)及時(shí)完成上一次的作業(yè)運(yùn)算并返回結(jié)果,則被
測(cè)主機(jī)按照限定延遲間隔發(fā)送一個(gè)新的作業(yè)請(qǐng)求。如果被測(cè)系統(tǒng)未能及時(shí)完成,則新的請(qǐng)求被丟棄
并被記為一次作業(yè)超時(shí)。
c)云服務(wù)模式:作業(yè)到達(dá)被測(cè)系統(tǒng)服從泊松分布:
λke?λ
Pk(,λ)=
k!
其中,k表示在某單位時(shí)間內(nèi)到達(dá)的作業(yè)數(shù),λ表示單位時(shí)間內(nèi)平均作業(yè)平均到達(dá)次數(shù)。每次
作業(yè)可含有多個(gè)樣本,每次含有的樣本數(shù)量Y,Y服從正態(tài)分布:
2
YN(,μσ)
其中,μ為樣本數(shù)量均值,σ實(shí)際到達(dá)樣本數(shù)量的離散程度。
d)本地模式:所有作業(yè)一次性全部到達(dá)被測(cè)系統(tǒng)。
6功能測(cè)試
6.1接入管理測(cè)試
驗(yàn)證感存算一體化系統(tǒng)的接入管理能力:
a)檢查感存算一體化系統(tǒng)支持RS485、RS232等串口通信接口以及模擬量、開(kāi)關(guān)量、數(shù)字量等
信號(hào)接口各類馮·諾依曼架構(gòu)設(shè)備、感存算一體化設(shè)備通過(guò)串口、以太網(wǎng)接入。
b)檢查感存算一體化系統(tǒng)支持至少一種視頻、圖像、語(yǔ)音、文本等類型感知數(shù)據(jù)接入。
c)檢查感存算一體化系統(tǒng)支持通過(guò)GB/T28181、ONVIF、RTSP等接入不同廠商的視頻監(jiān)控?cái)z像
機(jī)。
d)檢查感存算一體化系統(tǒng)支持H264/H265等主流編解碼協(xié)議,支持存儲(chǔ)視頻調(diào)閱回看等功能。
e)檢查感存算一體化系統(tǒng)支持NSA、SA的5G全頻段接入(含大網(wǎng)及專網(wǎng))。
6.2網(wǎng)絡(luò)測(cè)試
a)感存算一體化系統(tǒng)解析藍(lán)牙、Zigbee、Wifi、LoRa、NFC、RFID等無(wú)線或有線一種或多種傳
輸協(xié)議,滿足各網(wǎng)絡(luò)協(xié)議接入要求。
b)具備數(shù)據(jù)轉(zhuǎn)發(fā)功能的感存算一體化系統(tǒng),測(cè)試主機(jī)通過(guò)被測(cè)系統(tǒng)進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā),數(shù)據(jù)應(yīng)能被
正確轉(zhuǎn)發(fā)到指定通信接口。
c)感存算一體化系通過(guò)協(xié)議傳輸數(shù)據(jù),檢查支持MQTT、HTTP/HTTPS、DL/T698.45、CoAP、
DL/T645、IEC60870-5-104、IEC61850等多種通信協(xié)議。
d)感存算一體化系接入SDN、TSN等新型網(wǎng)絡(luò)設(shè)備/系統(tǒng),檢查是否支持SDN、TSN等新型網(wǎng)
絡(luò)。
6.3計(jì)算及存儲(chǔ)測(cè)試
計(jì)算及存儲(chǔ)測(cè)試見(jiàn)表1。
表1計(jì)算存儲(chǔ)測(cè)試
序號(hào)測(cè)試項(xiàng)目測(cè)試內(nèi)容測(cè)試準(zhǔn)則
查看被測(cè)系統(tǒng)軟件清單中的異構(gòu)
計(jì)算架構(gòu)支持情況,與真實(shí)情況
人工智能感存算一體化系統(tǒng)
1異構(gòu)計(jì)算架構(gòu)符合。
對(duì)異構(gòu)計(jì)算架構(gòu)的支持
如果支持則通過(guò),否則為不通
過(guò)。
4
T/CESXXX—XXXX
查看被測(cè)系統(tǒng)軟件清單中的存算
一體技術(shù)支持情況,與真實(shí)情況
人工智能感存算一體化系統(tǒng)
2存算一體技術(shù)符合。
對(duì)存算一體技術(shù)的支持
如果支持則通過(guò),否則為不通
過(guò)。
被測(cè)系統(tǒng)連接測(cè)試儀表,驗(yàn)證具
3本地化存儲(chǔ)本地化存儲(chǔ)能力
備本地化存儲(chǔ)能力。
在被測(cè)系統(tǒng)接入其他設(shè)備感知數(shù)
據(jù),添加數(shù)據(jù)規(guī)則引擎,判斷處
多類型數(shù)據(jù)存儲(chǔ)和多類型數(shù)據(jù)存儲(chǔ)和結(jié)構(gòu)化、
4理后的結(jié)果和預(yù)設(shè)相符。
處理能力非結(jié)構(gòu)化數(shù)據(jù)處理能力
如果相符則通過(guò),否則為不通
過(guò)。
查看被測(cè)系統(tǒng)軟件清單以及代碼
的不同類型指令集和不同體系架
不同類型指令集和不同體系
指令集和計(jì)算單元構(gòu)計(jì)算單元協(xié)同技術(shù)支持情況,
5架構(gòu)計(jì)算單元協(xié)同技術(shù)的支
協(xié)同技術(shù)與真實(shí)情況符合。
持
如果支持則通過(guò),否則為不通
過(guò)。
查看被測(cè)系統(tǒng)軟件清單以及代碼
的多種AI訓(xùn)練和推理平臺(tái),兼容
多類型人工智能平開(kāi)放集成多種AI訓(xùn)練和推理多廠商計(jì)算單元的支持情況,與
6
臺(tái)平臺(tái),兼容多廠商計(jì)算單元真實(shí)情況符合。
如果支持則通過(guò),否則為不通
過(guò)。
6.4AI能力測(cè)試
AI能力測(cè)試見(jiàn)下表,對(duì)模型推理性能測(cè)試描述詳見(jiàn)7AI模型推理測(cè)試。
表2AI能力測(cè)試
序號(hào)測(cè)試項(xiàng)目測(cè)試內(nèi)容測(cè)試準(zhǔn)則
人工智能感存算一體化系統(tǒng)對(duì)
1處理器查看被測(cè)系統(tǒng)硬件清單中的設(shè)備基
處理器類型的支持
本信息,包括支持的處理器類型、
人工智能感存算一體化系統(tǒng)對(duì)
2加速器加速器類型以及精度支持情況,與
加速器類型的支持
真實(shí)情況符合。
人工智能感存算一體化系統(tǒng)對(duì)
3精度類型如果支持則通過(guò),否則為不通過(guò)。
精度類型的支持
登錄測(cè)試系統(tǒng),部署AI模型,通過(guò)
人工智能感存算一體化系統(tǒng)對(duì)
4AI模型部署在線測(cè)試方式驗(yàn)證AI模型可提供正
部署AI模型的支持
常AI服務(wù),驗(yàn)證AI模型功能。
登錄測(cè)試系統(tǒng),選擇一個(gè)正在運(yùn)行
人工智能感存算一體化系統(tǒng)對(duì)
5AI服務(wù)管理的AI服務(wù),執(zhí)行查看和停止操作,
部署AI服務(wù)管理的支持
驗(yàn)證AI服務(wù)可管理功能。
登錄測(cè)試系統(tǒng),執(zhí)行AI模型導(dǎo)入和
人工智能感存算一體化系統(tǒng)對(duì)
6AI模型庫(kù)管理刪除操作,驗(yàn)證AI模型庫(kù)管理功
AI模型庫(kù)管理的支持
能。
查看受測(cè)設(shè)備軟件清單中的人工智
人工智能感存算一體化系統(tǒng)對(duì)
7人工智能框架能支持情況,與現(xiàn)實(shí)信息符合。
人工智能框架的支持
如果支持則通過(guò),否則為不通過(guò)。
5
T/CESXXX—XXXX
使用的人工智能框架中模型訓(xùn)
8模型訓(xùn)練查看被測(cè)系統(tǒng)支持的人工智能框架
練支持功能
技術(shù)規(guī)格書(shū)或開(kāi)源網(wǎng)站。
使用的人工智能框架中模型推
9模型推理如果支持則通過(guò),否則為不通過(guò)。
理支持功能
6.5模型推理測(cè)試
模型推理測(cè)試詳情見(jiàn)“7.AI模型推理測(cè)試”。
6.6遠(yuǎn)程維護(hù)測(cè)試
a)驗(yàn)證時(shí)間同步符合GB/T26866-2022的要求。
b)登錄測(cè)試系統(tǒng),執(zhí)行被測(cè)系統(tǒng)軟件安裝,驗(yàn)證是否支持軟件安裝功能。
c)登錄測(cè)試系統(tǒng),執(zhí)行被測(cè)系統(tǒng)遠(yuǎn)程固件升級(jí),驗(yàn)證是否支持遠(yuǎn)程固件升級(jí)。
d)檢查日志,如果日志中記錄了日志類型、登錄時(shí)間、登錄地址、登錄用戶名、開(kāi)啟或停止服
務(wù)等遠(yuǎn)程維護(hù)操作則評(píng)測(cè)通過(guò),否則評(píng)測(cè)不通過(guò)。
6.7自治能力測(cè)試
a)登錄測(cè)試系統(tǒng),模擬感存算一體化系統(tǒng)外部網(wǎng)絡(luò)故障,驗(yàn)證故障不會(huì)影響電力應(yīng)用提供服
務(wù)。
b)登錄測(cè)試系統(tǒng),恢復(fù)感存算一體化系統(tǒng)外部網(wǎng)絡(luò)故障,驗(yàn)證故障恢復(fù)不會(huì)影響電力應(yīng)用提供
服務(wù)。
6.8可擴(kuò)展性測(cè)試
a)驗(yàn)證感存算一體化系統(tǒng)支持提供對(duì)DAS、NAS(CIFS,NFS)的訪問(wèn);
b)驗(yàn)證感存算一體化系統(tǒng)支持對(duì)主流CentOS、Ubuntu等Linux、windows平臺(tái)的訪問(wèn);
c)擴(kuò)展存儲(chǔ)空間,驗(yàn)證感存算一體化系統(tǒng)支持存儲(chǔ)空間動(dòng)態(tài)擴(kuò)展。
6.9安全性測(cè)試
a)驗(yàn)證信息安全符合GB/T36572-2018的要求。
b)驗(yàn)證數(shù)據(jù)部分符合《中華人民共和國(guó)數(shù)據(jù)安全法》的規(guī)定。
7AI模型推理測(cè)試
7.1測(cè)試指標(biāo)
主要測(cè)試指標(biāo)見(jiàn)表3:
表3典型電力應(yīng)用場(chǎng)景測(cè)試指標(biāo)
類型測(cè)試指標(biāo)
訓(xùn)練時(shí)間
訓(xùn)練指標(biāo)(非必需)
訓(xùn)練能耗
最大吞吐性能
平均前向推理速率
感存算一體化系統(tǒng)
前向推理時(shí)延
推理指標(biāo)
功耗
能效比
模型推理準(zhǔn)確度
6
T/CESXXX—XXXX
7.2測(cè)試指標(biāo)描述
7.2.1訓(xùn)練時(shí)間
在5.3技術(shù)要求規(guī)定下,訓(xùn)練某一神經(jīng)網(wǎng)絡(luò)達(dá)到指定精度所需要的時(shí)間。
7.2.2訓(xùn)練能耗
在5.3技術(shù)要求規(guī)定下,訓(xùn)練某一神經(jīng)網(wǎng)絡(luò)達(dá)到指定精度時(shí)被測(cè)系統(tǒng)的能耗。
7.2.3最大吞吐性能
指被測(cè)系統(tǒng)在訓(xùn)練過(guò)程或前向推理過(guò)程(包括預(yù)處理,后處理)中可同時(shí)處理的最大樣本數(shù)
量。
7.2.4平均前向推理速度
指被測(cè)系統(tǒng)在指定batch下,在單位時(shí)間內(nèi)使用神經(jīng)網(wǎng)絡(luò)模型完成測(cè)試數(shù)據(jù)集運(yùn)算的平均樣本
數(shù)量。
7.2.5前向推理時(shí)延
被測(cè)系統(tǒng)在指定batch下前向推理運(yùn)算過(guò)程(不包括預(yù)處理,后處理)中,根據(jù)作業(yè)到達(dá)中的
方式,計(jì)算從樣本輸入被測(cè)系統(tǒng)完成到計(jì)算結(jié)果由被測(cè)系統(tǒng)開(kāi)始輸出間的時(shí)間間隔。
7.2.6功耗
在5.3技術(shù)要求規(guī)定下,未運(yùn)行推理運(yùn)算時(shí)被測(cè)系統(tǒng)的靜態(tài)功耗;以及進(jìn)行指定模型推理運(yùn)算
過(guò)程中被測(cè)系統(tǒng)的平均功耗??梢詭в锌刂浦鳈C(jī)的功耗。
7.2.7能效比
模型推理過(guò)程中,被測(cè)系統(tǒng)在單位時(shí)間內(nèi)執(zhí)行作業(yè)的次數(shù)與感存算一體化系統(tǒng)功耗之比。
7.2.8模型推理準(zhǔn)確度
指定任務(wù)場(chǎng)景下,被測(cè)系統(tǒng)使用某一神經(jīng)網(wǎng)絡(luò)模型完成測(cè)試后,所得到的平均模型前向推理準(zhǔn)
確度數(shù)值,不同電力應(yīng)用場(chǎng)景下采用的模型推理的評(píng)價(jià)指標(biāo)不同,詳見(jiàn)7測(cè)試場(chǎng)景。
7.3訓(xùn)練測(cè)試方法
訓(xùn)練過(guò)程中,記錄必要的測(cè)評(píng)數(shù)據(jù):
a)訓(xùn)練時(shí)間:不包含訓(xùn)練過(guò)程中使用測(cè)試集,測(cè)量當(dāng)前模型準(zhǔn)確率及準(zhǔn)確率門(mén)限的比較時(shí)間;
b)訓(xùn)練次數(shù):對(duì)同一目標(biāo)模型的訓(xùn)練過(guò)程,重復(fù)訓(xùn)練的次數(shù)計(jì)數(shù);
c)單次訓(xùn)練時(shí)間:記錄單次訓(xùn)練過(guò)程的總體訓(xùn)練時(shí)間(不含每epoch后模型準(zhǔn)確率計(jì)算時(shí)間);
d)單次訓(xùn)練能耗:記錄單次訓(xùn)練過(guò)程的總體訓(xùn)練能耗(不含每epoch后模型準(zhǔn)確率計(jì)算能耗)。
訓(xùn)練結(jié)果數(shù)據(jù)如下:
a)平均訓(xùn)練時(shí)間:平均訓(xùn)練時(shí)間=∑每次訓(xùn)練的時(shí)間/次數(shù);
b)平均訓(xùn)練能耗:平均訓(xùn)練能耗=∑每次訓(xùn)練的能耗/次數(shù);
c)實(shí)際準(zhǔn)確率:模型訓(xùn)練過(guò)程中,在測(cè)試集上的準(zhǔn)確率。
7.4推理測(cè)試方法
7.4.1最大吞吐性能
在前向推理計(jì)算前,通過(guò)不斷調(diào)整batch參數(shù),增加單位時(shí)間內(nèi)輸入樣本的數(shù)量,最終確定被
測(cè)系統(tǒng)的最大吞吐性能。
7.4.2平均前向推理速率
單位:FPS(處理圖像數(shù)量/秒)等。
平均前向推理速率=總測(cè)試樣本數(shù)量/總預(yù)測(cè)時(shí)間
7
T/CESXXX—XXXX
注:
總測(cè)試樣本數(shù)量指測(cè)試數(shù)據(jù)集中樣本的總數(shù)量。
總預(yù)測(cè)時(shí)間指被測(cè)系統(tǒng)使用神經(jīng)網(wǎng)絡(luò)模型時(shí),在測(cè)試數(shù)據(jù)集上完成測(cè)試所使用的總計(jì)算時(shí)間。
7.4.3前向推理時(shí)延
單位:ms(毫秒)。
前向推理時(shí)延=當(dāng)前樣本處理結(jié)果開(kāi)始輸出的時(shí)刻-當(dāng)前樣本輸入完成時(shí)刻
7.4.4功耗
單位:w(瓦)。
a)針對(duì)板卡或棒形態(tài)的被測(cè)系統(tǒng),對(duì)被測(cè)系統(tǒng)在執(zhí)行測(cè)試期間的功耗情況進(jìn)行記錄,最終通過(guò)
計(jì)算得到該硬件的平均功耗情況。
功耗值=基準(zhǔn)電流差X電壓
b)針對(duì)服務(wù)器形態(tài)的被測(cè)系統(tǒng),測(cè)試被測(cè)系統(tǒng)在任務(wù)處理階段總的能耗與所用時(shí)間的比值,得
到平均功率,再測(cè)一個(gè)不進(jìn)行深度學(xué)習(xí)任務(wù)處理的平均功率,計(jì)算兩個(gè)平均功率之差即為被測(cè)系統(tǒng)的
功耗。
7.4.5能效比
單位:FPS/W(處理圖片數(shù)量/秒/瓦特)等。
能效比=平均前向推理速率/功耗
7.4.6模型推理精度
針對(duì)不同電力應(yīng)用場(chǎng)景,包括top-1、top-5算法準(zhǔn)確率、mAP、mIoU、F-Score、FAR、FRR等。
8典型應(yīng)用場(chǎng)景測(cè)試
8.1圖像分類場(chǎng)景
a)模型:ResNet-50、ResNet-101、VGG16、Inception-v3和MobileNetv2;
b)數(shù)據(jù)集:ImageNet;
c)性能評(píng)價(jià)指標(biāo):
Top-1準(zhǔn)確率:圖像分類結(jié)果中排名第一的分類類別與實(shí)際結(jié)果相同的準(zhǔn)確率;
Top-5準(zhǔn)確率:圖像分類結(jié)果中排名前五的分類類別與實(shí)際結(jié)果相同的準(zhǔn)確率。
8.2目標(biāo)檢測(cè)場(chǎng)景
a)模型:兩階段模型(FasterR-CNN、MaskR-CNN)和一階段模型(YOLO、SSD);
b)數(shù)據(jù)集:MicrosoftCOCO、CPLID、OPDL;
c)性能評(píng)價(jià)指標(biāo):
平均精度均值(Meanaverageprecision,mAP):數(shù)據(jù)集中所有類別的平均精度的均值。
平均精度均值=所有類別平均精度值之和/所有類別的數(shù)目。
8.3目標(biāo)分割場(chǎng)景
a)模型:Deeplabv3++、DeepMask、Fast-SCNN;
b)數(shù)據(jù)集:TTPLA、PLD-UAV、VOC2012、CityScapes;
c)性能評(píng)價(jià)指標(biāo):
平均交并比(Meanintersectionoverunion,mIoU):所有類別的交并比IoU的平均值。
每個(gè)類別的交并比IoU為真實(shí)值(groundtruth)和預(yù)測(cè)值(predictedsegmentation)
兩個(gè)集合的交集合并集之比。
交并比(Intersectionoverunion,IoU):檢測(cè)結(jié)果的矩形框與樣本標(biāo)注的矩形框的交
集與并集的比值。
8
T/CESXXX—XXXX
F分?jǐn)?shù):綜合衡量精確率和召回率的指標(biāo)。
Precision×Recall
=
F-Score2
β×Precision+Recall
其中,
精確率(Precision):識(shí)別正確的結(jié)果在所識(shí)別的結(jié)果中所占的比率;
召回率(Recall):識(shí)別正確的結(jié)果占數(shù)據(jù)集中所有要識(shí)別出的總數(shù)的比率。
8.4目標(biāo)識(shí)別場(chǎng)景
a)模型:FaceNet、ObjectRecognition、DeepID3、ArcFace;
b)數(shù)據(jù)集:WebFace、LFW;
c)性能評(píng)價(jià)指標(biāo):
誤識(shí)率(Falseacceptrate,F(xiàn)AR):將其他目標(biāo)誤作指定目標(biāo)的概率;
拒識(shí)率(Falserejectrate,F(xiàn)RR):將指定目標(biāo)誤作其他目標(biāo)的概率;
識(shí)別正確率(Identificationrate):正確識(shí)別目標(biāo)次數(shù)與參與識(shí)別目標(biāo)的總次數(shù)之比。
8.5目標(biāo)跟蹤場(chǎng)景
a)模型:UDT、TADT、UMATracker;
b)數(shù)據(jù)集:MOT16、VOT、OTB;
c)性能評(píng)價(jià)指標(biāo):
準(zhǔn)確率(Accuracy):跟蹤器在單個(gè)測(cè)試序列下的平均重疊率(兩矩形框的相交部分面積
除以兩矩形框的相并部分的面積);
魯棒性(Robustness):?jiǎn)蝹€(gè)測(cè)試序列下的跟蹤器失敗次數(shù),當(dāng)重疊率為0時(shí)即可判定為
失敗;
平均重疊期望(Expectaverageoverlaprate,EAO):對(duì)每個(gè)跟蹤器在一個(gè)短時(shí)圖像序
列上的非重置重疊的期望值;
成功率曲線下面積,單目標(biāo)跟蹤任務(wù)時(shí),模型準(zhǔn)確率為縱軸,1減去準(zhǔn)確率的值為橫軸,
繪制成功率曲線,計(jì)算曲線下面積,為將正樣本判斷為正樣本的可能性大于判斷為負(fù)樣本
的可能性的概率;
多目標(biāo)跟蹤的準(zhǔn)確度(Multipleobjecttrackingaccuracy,MOTA):體現(xiàn)在確定目標(biāo)的
個(gè)數(shù),以及有關(guān)目標(biāo)的相關(guān)屬性方面的準(zhǔn)確度,用于統(tǒng)計(jì)在跟蹤中的誤差積累情況;
多目標(biāo)跟蹤的精確度(Multipleobjecttrackingprecision,MOTP):體現(xiàn)在確定目標(biāo)
位置上的精確度,用于衡量目標(biāo)位置確定的精確程度。
8.6行為檢測(cè)場(chǎng)景
a)模型:TGM、PGCN、SSN、BSN、BMN;
b)數(shù)據(jù)集:ActivityNet、Kinetics、THUMOS14、AVA、CASIA、UCSDPed2、ShanghaiTech;
c)性能評(píng)價(jià)指標(biāo):
視頻幀準(zhǔn)確度平均值:各類標(biāo)記結(jié)果正確的視頻幀數(shù)占標(biāo)記結(jié)果中該類視頻幀總數(shù)的比例
均值,即視頻幀中正確標(biāo)簽的第i類視頻幀數(shù)量與檢測(cè)結(jié)果中第i類視頻幀數(shù)比值的均
值。
視頻片段準(zhǔn)確率均值:各類標(biāo)記結(jié)果正確的視頻片段數(shù)占標(biāo)記結(jié)果中該類視頻總數(shù)的比例
均值,即視頻片段正確標(biāo)簽的第i類視頻片段數(shù)量與檢測(cè)結(jié)果中第i類視頻片段數(shù)比值的
均值。
8.7語(yǔ)音識(shí)別場(chǎng)景
a)模型:DeepSpeech2;
b)數(shù)據(jù)集:AISHELL-2;
c)性能評(píng)價(jià)指標(biāo):
9
T/CESXXX—XXXX
詞錯(cuò)誤率(WER):語(yǔ)音識(shí)別后,識(shí)別詞錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比;
句錯(cuò)誤率(SER):語(yǔ)音識(shí)別后,識(shí)別句子錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比。
8.8文字識(shí)別場(chǎng)景
a)模型:CRNN、CPTN;
b)數(shù)據(jù)集:MJ_LMDB、IIIT5k等;
c)性能評(píng)價(jià)指標(biāo):
F分?jǐn)?shù):綜合衡量精確率和召回率的指標(biāo)。
Precision×Recall
=
F-Score2
β×Precision+Recall
其中,
精確率(Precision):識(shí)別正確的結(jié)果在所識(shí)別的結(jié)果中所占的比率;
召回率(Recall):識(shí)別正確的結(jié)果占數(shù)據(jù)集中所有要識(shí)別出的總數(shù)的比率。
8.9本地語(yǔ)音喚醒場(chǎng)景
a)模型:DFSMN、CNN、DNN;
b)數(shù)據(jù)集:Speechcommandsdataset;
c)性能評(píng)價(jià)指標(biāo):
詞錯(cuò)誤率(WER):語(yǔ)音識(shí)別后,識(shí)別詞錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比;
句錯(cuò)誤率(SER):語(yǔ)音識(shí)別后,識(shí)別句子錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比。
8.10負(fù)荷辨識(shí)場(chǎng)景
a)模型:DAE、ShortSeq2Point、WindowGRU;
b)數(shù)據(jù)集:REDD、BLUED等;
c)性能評(píng)價(jià)指標(biāo):
精確率(Precision):TP/(TP+FP),識(shí)別正確的結(jié)果在所識(shí)別的結(jié)果中所占的比率;
正確率(Accuracy):(TP+TN)/(TP+FP+TN+FN)
Truepositives(TP):被正確劃分為正例的個(gè)數(shù),即實(shí)際為正例且被分類器劃分為正例
的樣本數(shù);
Falsepositives(FP):被錯(cuò)誤劃分為正例的個(gè)數(shù),即實(shí)際為負(fù)例且被分類器劃分為正例
的樣本數(shù);
Falsenegatives(FN):被錯(cuò)誤劃分為負(fù)例的個(gè)數(shù),即實(shí)際為正例且被分類器劃分為負(fù)例
的樣本數(shù);
Truenegatives(TN):被正確劃分為負(fù)例的個(gè)數(shù),即實(shí)際為負(fù)例且被分類器劃分為負(fù)例
的樣本數(shù)。
/
10
T/CESXXX—XXXX
附錄A
(規(guī)范性附錄)
A.1測(cè)試框架
A.1.1推理測(cè)試框架
推理測(cè)試框架見(jiàn)圖A.1。
測(cè)試框架被測(cè)系統(tǒng)
模型
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工現(xiàn)場(chǎng)施工防化學(xué)災(zāi)害制度
- 應(yīng)急物資裝備應(yīng)急預(yù)案
- 醫(yī)療護(hù)理醫(yī)學(xué)培訓(xùn) 吸痰護(hù)理技術(shù)課件
- DB6103T 87-2025企業(yè)簡(jiǎn)易注銷登記服務(wù)規(guī)程
- XX村電排建設(shè)及維護(hù)合同書(shū)2025
- 個(gè)人股權(quán)抵押融資合同樣本
- 臨時(shí)促銷服務(wù)合同
- 中小企業(yè)融資合作合同協(xié)議
- 京東商城代運(yùn)營(yíng)合同模板
- 個(gè)人質(zhì)押貸款合同模板
- 2024電力系統(tǒng)安全規(guī)定
- 脊柱骨折與脊髓損傷護(hù)理課件
- 小學(xué)二年級(jí)語(yǔ)文上冊(cè)閱讀理解專項(xiàng)訓(xùn)練20篇(含答案)
- 科技論文圖表等規(guī)范表達(dá)
- 高考寫(xiě)作指導(dǎo)議論文標(biāo)準(zhǔn)語(yǔ)段寫(xiě)作課件32張
- 2021年普通高等學(xué)校招生全國(guó)英語(yǔ)統(tǒng)一考試模擬演練八省聯(lián)考解析
- 華能火力發(fā)電機(jī)組節(jié)能降耗技術(shù)導(dǎo)則(2023年版)
- 基礎(chǔ)知識(shí)3500個(gè)常用漢字附拼音
- 企業(yè)易制毒化學(xué)品管理培訓(xùn)
- JJF(紡織)072-2018紡織滾筒式烘干機(jī)校準(zhǔn)規(guī)范
- 羊水栓塞的應(yīng)急預(yù)案演練腳本
評(píng)論
0/150
提交評(píng)論