《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》

上傳人：搬*** IP屬地：浙江上傳時(shí)間：2024-12-22 格式：PDF 頁(yè)數(shù)：14 大?。?95.19KB 積分：11 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩9頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICS國(guó)際標(biāo)準(zhǔn)分類號(hào)

CCS中國(guó)標(biāo)準(zhǔn)文獻(xiàn)分類號(hào)

團(tuán)體標(biāo)準(zhǔn)

T/CESXXX-XXXX

電力人工智能感存算一體化系統(tǒng)測(cè)試方法

TestmethodofpowerAIsystemswithintegratedcapabilitiesofsensing,data

storage,andprocessing

（征求意見(jiàn)稿）

XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施

中國(guó)電工技術(shù)學(xué)會(huì)發(fā)布

T/CESXXX—XXXX

電力人工智能感存算一體化系統(tǒng)測(cè)試方法

1范圍

本文件規(guī)定了面向輸電、變電、配電等電力領(lǐng)域的人工智能感存算一體化系統(tǒng)測(cè)試方法，可對(duì)

基于人工智能的系統(tǒng)功能、典型應(yīng)用場(chǎng)景性能進(jìn)行評(píng)估，評(píng)測(cè)場(chǎng)景包括圖像分類、目標(biāo)檢測(cè)、目標(biāo)

分割、目標(biāo)識(shí)別、目標(biāo)跟蹤、語(yǔ)音識(shí)別、文字識(shí)別、本地語(yǔ)音喚醒、負(fù)荷辨識(shí)等。

本文件適用于生產(chǎn)廠商、研究機(jī)構(gòu)、應(yīng)用廠商及第三方機(jī)構(gòu)對(duì)具備感存算一體化系統(tǒng)進(jìn)行測(cè)試

評(píng)估，也適用于生產(chǎn)廠商對(duì)感存算一體化系統(tǒng)的設(shè)計(jì)。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件，僅注日期的版本適用于本

文件。凡是不注日期的引用文件，其最新版本（包括所有的修改單）適用于本文件。

GB/T1.1-2020標(biāo)準(zhǔn)化工作導(dǎo)則第1部分：基本術(shù)語(yǔ)

GB/T9813.2-2016計(jì)算機(jī)通用規(guī)范第2部分：便攜式微型計(jì)算機(jī)

GB/T9813.3-2017計(jì)算機(jī)通用規(guī)范第3部分：服務(wù)器

GB/T5271.28-2001信息技術(shù)詞匯第28部分：人工智能基本概念與專家系統(tǒng)

GB/T5271.34-2006信息技術(shù)詞匯第34部分：人工智能神經(jīng)網(wǎng)絡(luò)

GB/T25000.51-2016系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)（SQuaRE）第51部分:就緒

可用軟件產(chǎn)品(RUSP)的質(zhì)量要求和測(cè)試細(xì)則

GB/T36572-2018電力監(jiān)控系統(tǒng)網(wǎng)絡(luò)安全防護(hù)導(dǎo)則

GB/T26866-2022電力時(shí)間同步系統(tǒng)檢測(cè)規(guī)范

T/CES128-2022電力人工智能平臺(tái)總體架構(gòu)及技術(shù)要求

3術(shù)語(yǔ)和定義

下列術(shù)語(yǔ)和定義適用于本文件。

3.1

神經(jīng)網(wǎng)絡(luò)模型neuralnetworkmodel

神經(jīng)網(wǎng)絡(luò)的抽象模型，它能用軟件來(lái)模擬或作為神經(jīng)計(jì)算機(jī)加以實(shí)現(xiàn)。

[來(lái)源：GB/T5271.34-2006,34.01.10]

3.2

訓(xùn)練training

教會(huì)神經(jīng)網(wǎng)絡(luò)在輸入值的樣本和正確輸出值之間做出結(jié)合的步驟。

[來(lái)源：GB/T5271.34-2006,34.03.18]

3.3

推理inference

從已知前提導(dǎo)出結(jié)論的推理方法。

注1：在人工智能領(lǐng)域，前提是事實(shí)或者規(guī)則。

注2：術(shù)語(yǔ)“推理”既指過(guò)程也指結(jié)果。

[來(lái)源：GB/T5271.28-2001,28.03.01]

3.4

訓(xùn)練集trainingset

數(shù)據(jù)集的子集，用于訓(xùn)練模型。

3.5

T/CESXXX—XXXX

測(cè)試集testset

數(shù)據(jù)集的子集，用于在模型經(jīng)由驗(yàn)證集的初步驗(yàn)證之后測(cè)試模型。

3.6

批次batch

模型訓(xùn)練的一次迭代（即一次梯度更新）中使用的樣本集。

3.7

批次大小batchsize

一個(gè)批次中的樣本數(shù)。批次大小在訓(xùn)練和推理期間通常是固定的。

3.8

輪次epoch

使用訓(xùn)練集的全部數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行一次完整的訓(xùn)練，被稱之為一代訓(xùn)練。

3.9

作業(yè)到達(dá)workload

一組被一同送入訓(xùn)練或推理系統(tǒng)的N個(gè)樣本，N為正整數(shù)。

4符號(hào)、代號(hào)和縮略語(yǔ)

下列符號(hào)、代號(hào)和縮略語(yǔ)適用于本文件。

SUT：被測(cè)系統(tǒng)（SystemUnderTest）

mAP：平均精度均值（MeanAveragePrecision）

mIoU：平均交并比（MeanIntersectionOverUnion）

FPS：每秒幀率（FramePerSecond）

FAR：誤識(shí)率（FalseAcceptRate）

FRR：拒識(shí)率（FalseRejectRate）

IR：識(shí)別正確率（IdentificationRate）

WER：詞錯(cuò)誤率（WordErrorRate）

SER：句錯(cuò)誤率（SentenceErrorRate）

NNM神經(jīng)網(wǎng)絡(luò)模型（NeuralNetworkModel）

Training：訓(xùn)練

Inference：推理

5測(cè)試說(shuō)明

5.1測(cè)試對(duì)象

本文件的測(cè)試對(duì)象具體形式有以下兩種：

a）含有計(jì)算機(jī)視覺(jué)感存算一體化系統(tǒng)的控制主機(jī)，指以卡/棒等形態(tài)進(jìn)行使用的感存算一體智

能系統(tǒng)，如GPU、FPGA、ASIC等感存算一體模塊，可通過(guò)PCIE、USB等接口與測(cè)試主機(jī)連接；

b）搭載人工智能處理器的感存算一體模塊。

5.2測(cè)試內(nèi)容

感存算一體化系統(tǒng)的測(cè)評(píng)指標(biāo)，主要包括基本技術(shù)規(guī)格、功能、性能、電力應(yīng)用場(chǎng)景測(cè)試等部

分，在依據(jù)本文件進(jìn)行測(cè)試的過(guò)程中：

a）涉及功能、性能、電力應(yīng)用場(chǎng)景等相關(guān)指標(biāo)將通過(guò)第三方測(cè)試工具進(jìn)行評(píng)測(cè)；

b）涉及基本技術(shù)規(guī)格的指標(biāo)將采信被測(cè)對(duì)象標(biāo)稱值及其他技術(shù)信息，作為先進(jìn)性的參考。

5.3環(huán)境要求

除另有規(guī)定外，環(huán)境應(yīng)滿足GB/T9813.2-2016或GB/T9813.3-2017中大氣條件的規(guī)定，其

中：

a）溫度：5℃~35℃或15℃~35℃；

T/CESXXX—XXXX

b）相對(duì)數(shù)度濕度：25％~75％；

c）大氣壓：86kPa~106kPa。

此外，若送測(cè)方有更為嚴(yán)苛的要求，應(yīng)滿足送測(cè)方提出的溫度、濕度等。

5.3基本要求

基本要求包括且不限于下述內(nèi)容：

a）應(yīng)支持至少一種存算一體技術(shù)，包括但不限于查存計(jì)算、近存計(jì)算、存內(nèi)計(jì)算、存內(nèi)邏輯

等；

b）支持主流的人工智能框架：TensorFlow、Pytorch、Caffe/Caffe2、Mxnet、ONNX、

MindSpore（昇思）或PaddlePaddle（飛槳）等；

c）模型精度：FP64、FP32、FP16、INT4、INT8、INT16、BP16或混合精度等。其中，訓(xùn)練場(chǎng)

景精度應(yīng)支持FP16、FP32、FP64，推理場(chǎng)景下精度應(yīng)支持INT8、FP16；

d）應(yīng)支持以下至少1種自主可控加速器，包括但不限于昇騰、智芯等；ASIC類的加速器，如

NPU等；FPGA類型的加速器；GPU類型的加速器；

e）控制主機(jī)處理器架構(gòu)：X86架構(gòu)、ARM、RISC-V或MIPS等架構(gòu)；

f）電力人工智能模型應(yīng)滿足電力業(yè)務(wù)應(yīng)用場(chǎng)景所需的計(jì)算、算力資源等；

g）測(cè)試用儀器設(shè)備均應(yīng)經(jīng)過(guò)計(jì)量部門(mén)檢定合格，并在有效期內(nèi)，專用測(cè)試設(shè)備必須經(jīng)過(guò)嚴(yán)格

標(biāo)定，并在標(biāo)定有效期內(nèi)使用。

5.4測(cè)試過(guò)程

測(cè)試過(guò)程包括：

a）測(cè)試申請(qǐng)：由送測(cè)單位提供測(cè)試委托書(shū)，申請(qǐng)對(duì)樣品進(jìn)行測(cè)試；

b）制定測(cè)試大綱：依據(jù)本文件與實(shí)際測(cè)試需求制定測(cè)試方案，確定測(cè)試內(nèi)容，各項(xiàng)測(cè)試的進(jìn)

度安排，資源要求，測(cè)試資料，測(cè)試工具，系統(tǒng)的配置方式，回歸測(cè)試的規(guī)定等以及評(píng)價(jià)標(biāo)準(zhǔn)，如

果無(wú)法構(gòu)建出要求相同的測(cè)試環(huán)境，后續(xù)需進(jìn)一步分析由于測(cè)試環(huán)境與使用環(huán)境不一致所帶來(lái)對(duì)測(cè)

試結(jié)果的影響,形成測(cè)試大綱；

c）樣品送測(cè)：由送測(cè)單位送測(cè)樣品；

d）測(cè)試環(huán)境部署：根據(jù)送測(cè)樣品部署相應(yīng)測(cè)試環(huán)境；

e）測(cè)試類型：

功能測(cè)試。在構(gòu)建的測(cè)試環(huán)境下，對(duì)樣品覆蓋的功能進(jìn)行測(cè)試，檢驗(yàn)各測(cè)試項(xiàng)目是否實(shí)現(xiàn)、是

否正確實(shí)現(xiàn)。

性能測(cè)試。在構(gòu)建的測(cè)試環(huán)境下，進(jìn)行實(shí)時(shí)監(jiān)測(cè)和數(shù)據(jù)收集，利用準(zhǔn)備好的測(cè)試數(shù)據(jù)集對(duì)被測(cè)

系統(tǒng)進(jìn)行各測(cè)試項(xiàng)目測(cè)試，分為正常情況、人為設(shè)置的系統(tǒng)資源緊缺異常情況、人為設(shè)置的高負(fù)載

高負(fù)荷情況，即將測(cè)試數(shù)據(jù)集一次輸入被測(cè)系統(tǒng)，并按照被測(cè)系統(tǒng)的使用方法開(kāi)展測(cè)試活動(dòng)，檢驗(yàn)

各測(cè)試項(xiàng)是否達(dá)標(biāo)、是否能夠保持；

回歸測(cè)試。定期、不定期測(cè)試進(jìn)行回歸測(cè)試，對(duì)被測(cè)系統(tǒng)進(jìn)行重新功能和性能測(cè)試，確認(rèn)每次

更新和迭代修改后的系統(tǒng)仍滿足規(guī)定的要求。

f）出具報(bào)告：完成測(cè)試后，收集整合測(cè)試數(shù)據(jù)，對(duì)測(cè)試結(jié)果進(jìn)行匯總、深入分析和綜合評(píng)

價(jià)，形成測(cè)試報(bào)告。

5.5場(chǎng)景信息

電力人工智能測(cè)試場(chǎng)景包括：

a）典型電力人工智能應(yīng)用場(chǎng)景：計(jì)算機(jī)視覺(jué)任務(wù)，包括圖像分類、目標(biāo)檢測(cè)、目標(biāo)分割、目

標(biāo)識(shí)別、目標(biāo)跟蹤、文字識(shí)別等，語(yǔ)音識(shí)別、本地語(yǔ)音喚醒等任務(wù)，電力專用應(yīng)用負(fù)荷辨識(shí)等任

務(wù)，與其對(duì)應(yīng)電力生產(chǎn)環(huán)節(jié)見(jiàn)電力人工智能感存算一體化系統(tǒng)設(shè)計(jì)規(guī)范附表A.1；

b）數(shù)據(jù)集：公開(kāi)數(shù)據(jù)集或真實(shí)電力應(yīng)用場(chǎng)景數(shù)據(jù)集；

c）模型：經(jīng)典神經(jīng)網(wǎng)絡(luò)模型或自定義神經(jīng)網(wǎng)絡(luò)模型。

5.6作業(yè)到達(dá)

電力應(yīng)用場(chǎng)景作業(yè)到達(dá)的方式包含以下幾種模式：

T/CESXXX—XXXX

a）單路模式：測(cè)試主機(jī)向被測(cè)系統(tǒng)串行發(fā)送作業(yè)請(qǐng)求，單次作業(yè)請(qǐng)求包含1個(gè)樣本，被測(cè)系

統(tǒng)完成單次作業(yè)運(yùn)算返回結(jié)果得到測(cè)試主機(jī)確認(rèn)之后，測(cè)試主機(jī)再向被測(cè)系統(tǒng)發(fā)送下一條作業(yè)請(qǐng)

求，并以此循環(huán)；

b）測(cè)試主機(jī)發(fā)送新的作業(yè)：如果被測(cè)系統(tǒng)已經(jīng)及時(shí)完成上一次的作業(yè)運(yùn)算并返回結(jié)果，則被

測(cè)主機(jī)按照限定延遲間隔發(fā)送一個(gè)新的作業(yè)請(qǐng)求。如果被測(cè)系統(tǒng)未能及時(shí)完成，則新的請(qǐng)求被丟棄

并被記為一次作業(yè)超時(shí)。

c）云服務(wù)模式：作業(yè)到達(dá)被測(cè)系統(tǒng)服從泊松分布：

λke?λ

Pk（,λ）=

其中，k表示在某單位時(shí)間內(nèi)到達(dá)的作業(yè)數(shù)，λ表示單位時(shí)間內(nèi)平均作業(yè)平均到達(dá)次數(shù)。每次

作業(yè)可含有多個(gè)樣本，每次含有的樣本數(shù)量Y，Y服從正態(tài)分布：

YN(,μσ)

其中，μ為樣本數(shù)量均值，σ實(shí)際到達(dá)樣本數(shù)量的離散程度。

d）本地模式：所有作業(yè)一次性全部到達(dá)被測(cè)系統(tǒng)。

6功能測(cè)試

6.1接入管理測(cè)試

驗(yàn)證感存算一體化系統(tǒng)的接入管理能力：

a）檢查感存算一體化系統(tǒng)支持RS485、RS232等串口通信接口以及模擬量、開(kāi)關(guān)量、數(shù)字量等

信號(hào)接口各類馮·諾依曼架構(gòu)設(shè)備、感存算一體化設(shè)備通過(guò)串口、以太網(wǎng)接入。

b）檢查感存算一體化系統(tǒng)支持至少一種視頻、圖像、語(yǔ)音、文本等類型感知數(shù)據(jù)接入。

c）檢查感存算一體化系統(tǒng)支持通過(guò)GB/T28181、ONVIF、RTSP等接入不同廠商的視頻監(jiān)控?cái)z像

機(jī)。

d）檢查感存算一體化系統(tǒng)支持H264/H265等主流編解碼協(xié)議，支持存儲(chǔ)視頻調(diào)閱回看等功能。

e）檢查感存算一體化系統(tǒng)支持NSA、SA的5G全頻段接入（含大網(wǎng)及專網(wǎng)）。

6.2網(wǎng)絡(luò)測(cè)試

a）感存算一體化系統(tǒng)解析藍(lán)牙、Zigbee、Wifi、LoRa、NFC、RFID等無(wú)線或有線一種或多種傳

輸協(xié)議，滿足各網(wǎng)絡(luò)協(xié)議接入要求。

b）具備數(shù)據(jù)轉(zhuǎn)發(fā)功能的感存算一體化系統(tǒng)，測(cè)試主機(jī)通過(guò)被測(cè)系統(tǒng)進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā)，數(shù)據(jù)應(yīng)能被

正確轉(zhuǎn)發(fā)到指定通信接口。

c）感存算一體化系通過(guò)協(xié)議傳輸數(shù)據(jù)，檢查支持MQTT、HTTP/HTTPS、DL/T698.45、CoAP、

DL/T645、IEC60870-5-104、IEC61850等多種通信協(xié)議。

d）感存算一體化系接入SDN、TSN等新型網(wǎng)絡(luò)設(shè)備/系統(tǒng)，檢查是否支持SDN、TSN等新型網(wǎng)

絡(luò)。

6.3計(jì)算及存儲(chǔ)測(cè)試

計(jì)算及存儲(chǔ)測(cè)試見(jiàn)表1。

表1計(jì)算存儲(chǔ)測(cè)試

序號(hào)測(cè)試項(xiàng)目測(cè)試內(nèi)容測(cè)試準(zhǔn)則

查看被測(cè)系統(tǒng)軟件清單中的異構(gòu)

計(jì)算架構(gòu)支持情況，與真實(shí)情況

人工智能感存算一體化系統(tǒng)

1異構(gòu)計(jì)算架構(gòu)符合。

對(duì)異構(gòu)計(jì)算架構(gòu)的支持

如果支持則通過(guò)，否則為不通

過(guò)。

T/CESXXX—XXXX

查看被測(cè)系統(tǒng)軟件清單中的存算

一體技術(shù)支持情況，與真實(shí)情況

人工智能感存算一體化系統(tǒng)

2存算一體技術(shù)符合。

對(duì)存算一體技術(shù)的支持

如果支持則通過(guò)，否則為不通

過(guò)。

被測(cè)系統(tǒng)連接測(cè)試儀表，驗(yàn)證具

3本地化存儲(chǔ)本地化存儲(chǔ)能力

備本地化存儲(chǔ)能力。

在被測(cè)系統(tǒng)接入其他設(shè)備感知數(shù)

據(jù)，添加數(shù)據(jù)規(guī)則引擎，判斷處

多類型數(shù)據(jù)存儲(chǔ)和多類型數(shù)據(jù)存儲(chǔ)和結(jié)構(gòu)化、

4理后的結(jié)果和預(yù)設(shè)相符。

處理能力非結(jié)構(gòu)化數(shù)據(jù)處理能力

如果相符則通過(guò)，否則為不通

過(guò)。

查看被測(cè)系統(tǒng)軟件清單以及代碼

的不同類型指令集和不同體系架

不同類型指令集和不同體系

指令集和計(jì)算單元構(gòu)計(jì)算單元協(xié)同技術(shù)支持情況，

5架構(gòu)計(jì)算單元協(xié)同技術(shù)的支

協(xié)同技術(shù)與真實(shí)情況符合。

持

如果支持則通過(guò)，否則為不通

過(guò)。

查看被測(cè)系統(tǒng)軟件清單以及代碼

的多種AI訓(xùn)練和推理平臺(tái)，兼容

多類型人工智能平開(kāi)放集成多種AI訓(xùn)練和推理多廠商計(jì)算單元的支持情況，與

臺(tái)平臺(tái)，兼容多廠商計(jì)算單元真實(shí)情況符合。

如果支持則通過(guò)，否則為不通

過(guò)。

6.4AI能力測(cè)試

AI能力測(cè)試見(jiàn)下表，對(duì)模型推理性能測(cè)試描述詳見(jiàn)7AI模型推理測(cè)試。

表2AI能力測(cè)試

序號(hào)測(cè)試項(xiàng)目測(cè)試內(nèi)容測(cè)試準(zhǔn)則

人工智能感存算一體化系統(tǒng)對(duì)

1處理器查看被測(cè)系統(tǒng)硬件清單中的設(shè)備基

處理器類型的支持

本信息，包括支持的處理器類型、

人工智能感存算一體化系統(tǒng)對(duì)

2加速器加速器類型以及精度支持情況，與

加速器類型的支持

真實(shí)情況符合。

人工智能感存算一體化系統(tǒng)對(duì)

3精度類型如果支持則通過(guò)，否則為不通過(guò)。

精度類型的支持

登錄測(cè)試系統(tǒng)，部署AI模型，通過(guò)

人工智能感存算一體化系統(tǒng)對(duì)

4AI模型部署在線測(cè)試方式驗(yàn)證AI模型可提供正

部署AI模型的支持

常AI服務(wù)，驗(yàn)證AI模型功能。

登錄測(cè)試系統(tǒng)，選擇一個(gè)正在運(yùn)行

人工智能感存算一體化系統(tǒng)對(duì)

5AI服務(wù)管理的AI服務(wù)，執(zhí)行查看和停止操作，

部署AI服務(wù)管理的支持

驗(yàn)證AI服務(wù)可管理功能。

登錄測(cè)試系統(tǒng)，執(zhí)行AI模型導(dǎo)入和

人工智能感存算一體化系統(tǒng)對(duì)

6AI模型庫(kù)管理刪除操作，驗(yàn)證AI模型庫(kù)管理功

AI模型庫(kù)管理的支持

能。

查看受測(cè)設(shè)備軟件清單中的人工智

人工智能感存算一體化系統(tǒng)對(duì)

7人工智能框架能支持情況，與現(xiàn)實(shí)信息符合。

人工智能框架的支持

如果支持則通過(guò)，否則為不通過(guò)。

T/CESXXX—XXXX

使用的人工智能框架中模型訓(xùn)

8模型訓(xùn)練查看被測(cè)系統(tǒng)支持的人工智能框架

練支持功能

技術(shù)規(guī)格書(shū)或開(kāi)源網(wǎng)站。

使用的人工智能框架中模型推

9模型推理如果支持則通過(guò)，否則為不通過(guò)。

理支持功能

6.5模型推理測(cè)試

模型推理測(cè)試詳情見(jiàn)“7.AI模型推理測(cè)試”。

6.6遠(yuǎn)程維護(hù)測(cè)試

a）驗(yàn)證時(shí)間同步符合GB/T26866-2022的要求。

b）登錄測(cè)試系統(tǒng)，執(zhí)行被測(cè)系統(tǒng)軟件安裝，驗(yàn)證是否支持軟件安裝功能。

c）登錄測(cè)試系統(tǒng)，執(zhí)行被測(cè)系統(tǒng)遠(yuǎn)程固件升級(jí)，驗(yàn)證是否支持遠(yuǎn)程固件升級(jí)。

d）檢查日志，如果日志中記錄了日志類型、登錄時(shí)間、登錄地址、登錄用戶名、開(kāi)啟或停止服

務(wù)等遠(yuǎn)程維護(hù)操作則評(píng)測(cè)通過(guò)，否則評(píng)測(cè)不通過(guò)。

6.7自治能力測(cè)試

a）登錄測(cè)試系統(tǒng)，模擬感存算一體化系統(tǒng)外部網(wǎng)絡(luò)故障，驗(yàn)證故障不會(huì)影響電力應(yīng)用提供服

務(wù)。

b）登錄測(cè)試系統(tǒng)，恢復(fù)感存算一體化系統(tǒng)外部網(wǎng)絡(luò)故障，驗(yàn)證故障恢復(fù)不會(huì)影響電力應(yīng)用提供

服務(wù)。

6.8可擴(kuò)展性測(cè)試

a）驗(yàn)證感存算一體化系統(tǒng)支持提供對(duì)DAS、NAS（CIFS，NFS）的訪問(wèn)；

b）驗(yàn)證感存算一體化系統(tǒng)支持對(duì)主流CentOS、Ubuntu等Linux、windows平臺(tái)的訪問(wèn)；

c）擴(kuò)展存儲(chǔ)空間，驗(yàn)證感存算一體化系統(tǒng)支持存儲(chǔ)空間動(dòng)態(tài)擴(kuò)展。

6.9安全性測(cè)試

a）驗(yàn)證信息安全符合GB/T36572-2018的要求。

b）驗(yàn)證數(shù)據(jù)部分符合《中華人民共和國(guó)數(shù)據(jù)安全法》的規(guī)定。

7AI模型推理測(cè)試

7.1測(cè)試指標(biāo)

主要測(cè)試指標(biāo)見(jiàn)表3：

表3典型電力應(yīng)用場(chǎng)景測(cè)試指標(biāo)

類型測(cè)試指標(biāo)

訓(xùn)練時(shí)間

訓(xùn)練指標(biāo)（非必需）

訓(xùn)練能耗

最大吞吐性能

平均前向推理速率

感存算一體化系統(tǒng)

前向推理時(shí)延

推理指標(biāo)

功耗

能效比

模型推理準(zhǔn)確度

T/CESXXX—XXXX

7.2測(cè)試指標(biāo)描述

7.2.1訓(xùn)練時(shí)間

在5.3技術(shù)要求規(guī)定下，訓(xùn)練某一神經(jīng)網(wǎng)絡(luò)達(dá)到指定精度所需要的時(shí)間。

7.2.2訓(xùn)練能耗

在5.3技術(shù)要求規(guī)定下，訓(xùn)練某一神經(jīng)網(wǎng)絡(luò)達(dá)到指定精度時(shí)被測(cè)系統(tǒng)的能耗。

7.2.3最大吞吐性能

指被測(cè)系統(tǒng)在訓(xùn)練過(guò)程或前向推理過(guò)程（包括預(yù)處理，后處理）中可同時(shí)處理的最大樣本數(shù)

量。

7.2.4平均前向推理速度

指被測(cè)系統(tǒng)在指定batch下，在單位時(shí)間內(nèi)使用神經(jīng)網(wǎng)絡(luò)模型完成測(cè)試數(shù)據(jù)集運(yùn)算的平均樣本

數(shù)量。

7.2.5前向推理時(shí)延

被測(cè)系統(tǒng)在指定batch下前向推理運(yùn)算過(guò)程（不包括預(yù)處理，后處理）中，根據(jù)作業(yè)到達(dá)中的

方式，計(jì)算從樣本輸入被測(cè)系統(tǒng)完成到計(jì)算結(jié)果由被測(cè)系統(tǒng)開(kāi)始輸出間的時(shí)間間隔。

7.2.6功耗

在5.3技術(shù)要求規(guī)定下，未運(yùn)行推理運(yùn)算時(shí)被測(cè)系統(tǒng)的靜態(tài)功耗；以及進(jìn)行指定模型推理運(yùn)算

過(guò)程中被測(cè)系統(tǒng)的平均功耗?？梢詭в锌刂浦鳈C(jī)的功耗。

7.2.7能效比

模型推理過(guò)程中，被測(cè)系統(tǒng)在單位時(shí)間內(nèi)執(zhí)行作業(yè)的次數(shù)與感存算一體化系統(tǒng)功耗之比。

7.2.8模型推理準(zhǔn)確度

指定任務(wù)場(chǎng)景下，被測(cè)系統(tǒng)使用某一神經(jīng)網(wǎng)絡(luò)模型完成測(cè)試后，所得到的平均模型前向推理準(zhǔn)

確度數(shù)值，不同電力應(yīng)用場(chǎng)景下采用的模型推理的評(píng)價(jià)指標(biāo)不同，詳見(jiàn)7測(cè)試場(chǎng)景。

7.3訓(xùn)練測(cè)試方法

訓(xùn)練過(guò)程中，記錄必要的測(cè)評(píng)數(shù)據(jù)：

a）訓(xùn)練時(shí)間：不包含訓(xùn)練過(guò)程中使用測(cè)試集，測(cè)量當(dāng)前模型準(zhǔn)確率及準(zhǔn)確率門(mén)限的比較時(shí)間；

b）訓(xùn)練次數(shù)：對(duì)同一目標(biāo)模型的訓(xùn)練過(guò)程，重復(fù)訓(xùn)練的次數(shù)計(jì)數(shù)；

c）單次訓(xùn)練時(shí)間：記錄單次訓(xùn)練過(guò)程的總體訓(xùn)練時(shí)間（不含每epoch后模型準(zhǔn)確率計(jì)算時(shí)間）；

d）單次訓(xùn)練能耗：記錄單次訓(xùn)練過(guò)程的總體訓(xùn)練能耗（不含每epoch后模型準(zhǔn)確率計(jì)算能耗）。

訓(xùn)練結(jié)果數(shù)據(jù)如下：

a）平均訓(xùn)練時(shí)間：平均訓(xùn)練時(shí)間=∑每次訓(xùn)練的時(shí)間/次數(shù)；

b）平均訓(xùn)練能耗：平均訓(xùn)練能耗=∑每次訓(xùn)練的能耗/次數(shù)；

c）實(shí)際準(zhǔn)確率：模型訓(xùn)練過(guò)程中，在測(cè)試集上的準(zhǔn)確率。

7.4推理測(cè)試方法

7.4.1最大吞吐性能

在前向推理計(jì)算前，通過(guò)不斷調(diào)整batch參數(shù)，增加單位時(shí)間內(nèi)輸入樣本的數(shù)量，最終確定被

測(cè)系統(tǒng)的最大吞吐性能。

7.4.2平均前向推理速率

單位：FPS（處理圖像數(shù)量/秒）等。

平均前向推理速率=總測(cè)試樣本數(shù)量/總預(yù)測(cè)時(shí)間

T/CESXXX—XXXX

注：

總測(cè)試樣本數(shù)量指測(cè)試數(shù)據(jù)集中樣本的總數(shù)量。

總預(yù)測(cè)時(shí)間指被測(cè)系統(tǒng)使用神經(jīng)網(wǎng)絡(luò)模型時(shí)，在測(cè)試數(shù)據(jù)集上完成測(cè)試所使用的總計(jì)算時(shí)間。

7.4.3前向推理時(shí)延

單位：ms（毫秒）。

前向推理時(shí)延=當(dāng)前樣本處理結(jié)果開(kāi)始輸出的時(shí)刻-當(dāng)前樣本輸入完成時(shí)刻

7.4.4功耗

單位：w(瓦)。

a）針對(duì)板卡或棒形態(tài)的被測(cè)系統(tǒng)，對(duì)被測(cè)系統(tǒng)在執(zhí)行測(cè)試期間的功耗情況進(jìn)行記錄，最終通過(guò)

計(jì)算得到該硬件的平均功耗情況。

功耗值=基準(zhǔn)電流差X電壓

b）針對(duì)服務(wù)器形態(tài)的被測(cè)系統(tǒng)，測(cè)試被測(cè)系統(tǒng)在任務(wù)處理階段總的能耗與所用時(shí)間的比值，得

到平均功率，再測(cè)一個(gè)不進(jìn)行深度學(xué)習(xí)任務(wù)處理的平均功率，計(jì)算兩個(gè)平均功率之差即為被測(cè)系統(tǒng)的

功耗。

7.4.5能效比

單位：FPS/W（處理圖片數(shù)量/秒/瓦特）等。

能效比=平均前向推理速率/功耗

7.4.6模型推理精度

針對(duì)不同電力應(yīng)用場(chǎng)景，包括top-1、top-5算法準(zhǔn)確率、mAP、mIoU、F-Score、FAR、FRR等。

8典型應(yīng)用場(chǎng)景測(cè)試

8.1圖像分類場(chǎng)景

a）模型：ResNet-50、ResNet-101、VGG16、Inception-v3和MobileNetv2；

b）數(shù)據(jù)集：ImageNet；

c）性能評(píng)價(jià)指標(biāo)：

Top-1準(zhǔn)確率：圖像分類結(jié)果中排名第一的分類類別與實(shí)際結(jié)果相同的準(zhǔn)確率；

Top-5準(zhǔn)確率：圖像分類結(jié)果中排名前五的分類類別與實(shí)際結(jié)果相同的準(zhǔn)確率。

8.2目標(biāo)檢測(cè)場(chǎng)景

a）模型：兩階段模型（FasterR-CNN、MaskR-CNN）和一階段模型（YOLO、SSD）；

b）數(shù)據(jù)集：MicrosoftCOCO、CPLID、OPDL；

c）性能評(píng)價(jià)指標(biāo)：

平均精度均值（Meanaverageprecision，mAP）：數(shù)據(jù)集中所有類別的平均精度的均值。

平均精度均值=所有類別平均精度值之和/所有類別的數(shù)目。

8.3目標(biāo)分割場(chǎng)景

a）模型：Deeplabv3++、DeepMask、Fast-SCNN；

b）數(shù)據(jù)集：TTPLA、PLD-UAV、VOC2012、CityScapes；

c）性能評(píng)價(jià)指標(biāo)：

平均交并比（Meanintersectionoverunion，mIoU）:所有類別的交并比IoU的平均值。

每個(gè)類別的交并比IoU為真實(shí)值（groundtruth）和預(yù)測(cè)值（predictedsegmentation）

兩個(gè)集合的交集合并集之比。

交并比（Intersectionoverunion，IoU）：檢測(cè)結(jié)果的矩形框與樣本標(biāo)注的矩形框的交

集與并集的比值。

T/CESXXX—XXXX

F分?jǐn)?shù)：綜合衡量精確率和召回率的指標(biāo)。

Precision×Recall

F-Score2

β×Precision+Recall

其中，

精確率（Precision）：識(shí)別正確的結(jié)果在所識(shí)別的結(jié)果中所占的比率；

召回率（Recall）：識(shí)別正確的結(jié)果占數(shù)據(jù)集中所有要識(shí)別出的總數(shù)的比率。

8.4目標(biāo)識(shí)別場(chǎng)景

a）模型：FaceNet、ObjectRecognition、DeepID3、ArcFace；

b）數(shù)據(jù)集：WebFace、LFW；

c）性能評(píng)價(jià)指標(biāo)：

誤識(shí)率（Falseacceptrate，F(xiàn)AR）：將其他目標(biāo)誤作指定目標(biāo)的概率；

拒識(shí)率（Falserejectrate，F(xiàn)RR）：將指定目標(biāo)誤作其他目標(biāo)的概率；

識(shí)別正確率（Identificationrate）：正確識(shí)別目標(biāo)次數(shù)與參與識(shí)別目標(biāo)的總次數(shù)之比。

8.5目標(biāo)跟蹤場(chǎng)景

a）模型：UDT、TADT、UMATracker；

b）數(shù)據(jù)集：MOT16、VOT、OTB；

c）性能評(píng)價(jià)指標(biāo)：

準(zhǔn)確率（Accuracy）：跟蹤器在單個(gè)測(cè)試序列下的平均重疊率（兩矩形框的相交部分面積

除以兩矩形框的相并部分的面積）；

魯棒性（Robustness）：?jiǎn)蝹€(gè)測(cè)試序列下的跟蹤器失敗次數(shù)，當(dāng)重疊率為0時(shí)即可判定為

失敗；

平均重疊期望（Expectaverageoverlaprate，EAO）：對(duì)每個(gè)跟蹤器在一個(gè)短時(shí)圖像序

列上的非重置重疊的期望值；

成功率曲線下面積，單目標(biāo)跟蹤任務(wù)時(shí)，模型準(zhǔn)確率為縱軸，1減去準(zhǔn)確率的值為橫軸，

繪制成功率曲線，計(jì)算曲線下面積，為將正樣本判斷為正樣本的可能性大于判斷為負(fù)樣本

的可能性的概率；

多目標(biāo)跟蹤的準(zhǔn)確度（Multipleobjecttrackingaccuracy，MOTA）：體現(xiàn)在確定目標(biāo)的

個(gè)數(shù)，以及有關(guān)目標(biāo)的相關(guān)屬性方面的準(zhǔn)確度，用于統(tǒng)計(jì)在跟蹤中的誤差積累情況；

多目標(biāo)跟蹤的精確度（Multipleobjecttrackingprecision，MOTP）：體現(xiàn)在確定目標(biāo)

位置上的精確度，用于衡量目標(biāo)位置確定的精確程度。

8.6行為檢測(cè)場(chǎng)景

a）模型：TGM、PGCN、SSN、BSN、BMN；

b）數(shù)據(jù)集：ActivityNet、Kinetics、THUMOS14、AVA、CASIA、UCSDPed2、ShanghaiTech；

c）性能評(píng)價(jià)指標(biāo)：

視頻幀準(zhǔn)確度平均值：各類標(biāo)記結(jié)果正確的視頻幀數(shù)占標(biāo)記結(jié)果中該類視頻幀總數(shù)的比例

均值，即視頻幀中正確標(biāo)簽的第i類視頻幀數(shù)量與檢測(cè)結(jié)果中第i類視頻幀數(shù)比值的均

值。

視頻片段準(zhǔn)確率均值：各類標(biāo)記結(jié)果正確的視頻片段數(shù)占標(biāo)記結(jié)果中該類視頻總數(shù)的比例

均值，即視頻片段正確標(biāo)簽的第i類視頻片段數(shù)量與檢測(cè)結(jié)果中第i類視頻片段數(shù)比值的

均值。

8.7語(yǔ)音識(shí)別場(chǎng)景

a）模型：DeepSpeech2；

b）數(shù)據(jù)集：AISHELL-2；

c）性能評(píng)價(jià)指標(biāo)：

T/CESXXX—XXXX

詞錯(cuò)誤率（WER）：語(yǔ)音識(shí)別后，識(shí)別詞錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比；

句錯(cuò)誤率（SER）：語(yǔ)音識(shí)別后，識(shí)別句子錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比。

8.8文字識(shí)別場(chǎng)景

a）模型：CRNN、CPTN；

b）數(shù)據(jù)集：MJ_LMDB、IIIT5k等；

c）性能評(píng)價(jià)指標(biāo)：

F分?jǐn)?shù)：綜合衡量精確率和召回率的指標(biāo)。

Precision×Recall

F-Score2

β×Precision+Recall

其中，

精確率（Precision）：識(shí)別正確的結(jié)果在所識(shí)別的結(jié)果中所占的比率；

召回率（Recall）：識(shí)別正確的結(jié)果占數(shù)據(jù)集中所有要識(shí)別出的總數(shù)的比率。

8.9本地語(yǔ)音喚醒場(chǎng)景

a）模型：DFSMN、CNN、DNN；

b）數(shù)據(jù)集：Speechcommandsdataset；

c）性能評(píng)價(jià)指標(biāo)：

詞錯(cuò)誤率（WER）：語(yǔ)音識(shí)別后，識(shí)別詞錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比；

句錯(cuò)誤率（SER）：語(yǔ)音識(shí)別后，識(shí)別句子錯(cuò)誤喚醒的次數(shù)占總喚醒的百分比。

8.10負(fù)荷辨識(shí)場(chǎng)景

a）模型：DAE、ShortSeq2Point、WindowGRU；

b）數(shù)據(jù)集：REDD、BLUED等；

c）性能評(píng)價(jià)指標(biāo)：

精確率（Precision）：TP/（TP+FP），識(shí)別正確的結(jié)果在所識(shí)別的結(jié)果中所占的比率；

正確率（Accuracy）：（TP+TN）/（TP+FP+TN+FN）

Truepositives（TP）：被正確劃分為正例的個(gè)數(shù)，即實(shí)際為正例且被分類器劃分為正例

的樣本數(shù)；

Falsepositives（FP）：被錯(cuò)誤劃分為正例的個(gè)數(shù)，即實(shí)際為負(fù)例且被分類器劃分為正例

的樣本數(shù)；

Falsenegatives（FN）：被錯(cuò)誤劃分為負(fù)例的個(gè)數(shù)，即實(shí)際為正例且被分類器劃分為負(fù)例

的樣本數(shù)；

Truenegatives（TN）：被正確劃分為負(fù)例的個(gè)數(shù)，即實(shí)際為負(fù)例且被分類器劃分為負(fù)例

的樣本數(shù)。

T/CESXXX—XXXX

附錄A

（規(guī)范性附錄）

A.1測(cè)試框架

A.1.1推理測(cè)試框架

推理測(cè)試框架見(jiàn)圖A.1。

測(cè)試框架被測(cè)系統(tǒng)

模型

人人文庫(kù)> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《電力人工智能感存算一體化系統(tǒng)測(cè)試方法》

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔