《數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范》_第1頁
《數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范》_第2頁
《數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范》_第3頁
《數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范》_第4頁
《數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范》_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS35.240

CCSA12

團(tuán)體標(biāo)準(zhǔn)

數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范

Dataapplicationservicemanagementspecification

(征求意見稿)

北京電子商會(huì)

20xx-xx-xx發(fā)布20xx-xx-xx實(shí)施

北京電子商會(huì)發(fā)布

數(shù)據(jù)應(yīng)用服務(wù)管理規(guī)范

1.范圍

本文件規(guī)定了數(shù)據(jù)應(yīng)用服務(wù)的規(guī)范性要求,包括數(shù)據(jù)應(yīng)用服務(wù)過程要求、數(shù)據(jù)應(yīng)用服務(wù)

商管理要求、數(shù)據(jù)應(yīng)用服務(wù)商的權(quán)益、數(shù)據(jù)應(yīng)用服務(wù)合規(guī)義務(wù)等內(nèi)容。

本文件適用于:

a)規(guī)范數(shù)據(jù)應(yīng)用服務(wù)商的服務(wù)流程及服務(wù)內(nèi)容;

b)數(shù)據(jù)服務(wù)應(yīng)用方選擇數(shù)據(jù)應(yīng)用服務(wù)商時(shí)的參考依據(jù);

c)數(shù)據(jù)監(jiān)管方在數(shù)據(jù)合規(guī)管理、數(shù)據(jù)監(jiān)管審計(jì)、數(shù)據(jù)分級(jí)管理過程的參考依據(jù);

d)數(shù)據(jù)供給方在數(shù)據(jù)產(chǎn)生及數(shù)據(jù)提供過程中,開展數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理、數(shù)

據(jù)共享開放等工作的參考依據(jù)。

2.規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適

用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T34960.5-2018信息技術(shù)服務(wù)治理第5部分:數(shù)據(jù)治理規(guī)范

GB/T35295-2017大數(shù)據(jù)術(shù)語

GB/T36073-2018數(shù)據(jù)管理能力成熟度評(píng)估模型

GB/T37988-2019信息安全技術(shù)數(shù)據(jù)安全能力成熟度模型

3.術(shù)語和定義

3.1.

數(shù)據(jù)應(yīng)用服務(wù)dataapplicationservices

通過對(duì)數(shù)據(jù)的采集匯聚、傳輸交互、加工處理、分析建模、存儲(chǔ)計(jì)算等,為用戶提供安

全合規(guī)的數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)。

3.2.

數(shù)據(jù)采集匯聚datacollectionandaggregation

將傳感器、監(jiān)測(cè)設(shè)備、信息系統(tǒng)、人工輸入等方式生成的數(shù)據(jù),通過技術(shù)手段獲取并集

中管理的過程。北京電子商會(huì)

3.3.

數(shù)據(jù)傳輸交互datatransmissionandinteraction

不同組織或系統(tǒng)之間通過網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸?shù)倪^程,涉及數(shù)據(jù)的發(fā)送、接收和處理。

3.4.

數(shù)據(jù)加工處理dataprocessing

將原始數(shù)據(jù)轉(zhuǎn)化為可用數(shù)據(jù)的過程,包括數(shù)據(jù)架構(gòu)、數(shù)據(jù)集成、數(shù)據(jù)加工等活動(dòng),提升

數(shù)據(jù)質(zhì)量和規(guī)范化程度,支撐數(shù)據(jù)分析與應(yīng)用。

3.5.

1

數(shù)據(jù)分析建模dataanalysisandmodeling

通過數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、預(yù)測(cè)分析、大數(shù)據(jù)建模等技術(shù)對(duì)組織各項(xiàng)經(jīng)營管理活動(dòng)提供

數(shù)據(jù)決策支持而進(jìn)行的組織內(nèi)外部數(shù)據(jù)分析或挖掘建模的過程。

3.6.

數(shù)據(jù)應(yīng)用dataapplication

為滿足業(yè)務(wù)場(chǎng)景需求,以數(shù)據(jù)為核心,可結(jié)合數(shù)據(jù)模型、畫像、算法,形成信息系統(tǒng)、

應(yīng)用平臺(tái)或數(shù)據(jù)報(bào)告的過程。

3.7.

數(shù)據(jù)安全datasecurity

通過采取必要措施,確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全

狀態(tài)的能力。

3.8.

存力算力datastorageandcomputingpower

支撐數(shù)據(jù)采集與匯聚、傳輸交互、加工處理、分析建模、數(shù)據(jù)服務(wù)過程的存儲(chǔ)和計(jì)算能

力。

3.9.

數(shù)據(jù)資源dataresources

自然人、法人或非法人組織在依法履職或經(jīng)營活動(dòng)中制作或獲取的,以電子或其他方式

記錄、保存的原始數(shù)據(jù)集合。

3.10.

數(shù)據(jù)產(chǎn)品dataproduct

自然人、法人或非法人組織通過對(duì)數(shù)據(jù)資源投入實(shí)質(zhì)性勞動(dòng)形成的數(shù)據(jù)及其衍生產(chǎn)品,

包括但不限于數(shù)據(jù)集、數(shù)據(jù)分析報(bào)告、數(shù)據(jù)可視化產(chǎn)品、數(shù)據(jù)指數(shù)、應(yīng)用程序編程接口(API

數(shù)據(jù))、加密數(shù)據(jù)等。

4.數(shù)據(jù)應(yīng)用服務(wù)過程要求

4.1.采集匯聚

4.1.1.概述

采集與匯聚指將傳感器、監(jiān)測(cè)設(shè)備、信息系統(tǒng)、人工輸入等方式生成的數(shù)據(jù),通過技術(shù)

手段獲取并匯聚的過程。北京電子商會(huì)

4.1.2.技術(shù)要求

4.1.2.1.數(shù)據(jù)采集的來源類型,包括生產(chǎn)庫、中間庫、數(shù)據(jù)接口采集。

a)生產(chǎn)庫,原始數(shù)據(jù)生產(chǎn)端用于存儲(chǔ)和提供源數(shù)據(jù)的數(shù)據(jù)庫或服務(wù)器,主要包括電子

文件、數(shù)據(jù)庫、傳感器、網(wǎng)絡(luò)公開數(shù)據(jù)等形式;

b)中間庫,經(jīng)過一次或多次數(shù)據(jù)遷移或融合等處理后的數(shù)據(jù),主要以各類數(shù)據(jù)庫為載

體進(jìn)行存儲(chǔ);

c)數(shù)據(jù)接口,指通過調(diào)用數(shù)據(jù)接口,獲取所需數(shù)據(jù),主要以治理后的數(shù)據(jù)為主。

4.1.2.2.數(shù)據(jù)采集要求包括但不限于:

2

a)應(yīng)明確數(shù)據(jù)采集源、采集范圍、采集方式、采集周期和頻率;

b)應(yīng)根據(jù)數(shù)據(jù)量和處理需求,選擇合適的采集方式和工具,并可優(yōu)化采集過程和性能;

c)數(shù)據(jù)采集過程中應(yīng)注意數(shù)據(jù)采集的時(shí)效性、數(shù)據(jù)存儲(chǔ)的可擴(kuò)展性;

d)數(shù)據(jù)采集功能包括但不限于:

1)應(yīng)支持結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)采集;

2)應(yīng)支持離線數(shù)據(jù)采集和實(shí)時(shí)數(shù)據(jù)采集;

3)應(yīng)支持全量數(shù)據(jù)采集和增量數(shù)據(jù)采集;

4)可支持分布式數(shù)據(jù)采集,實(shí)現(xiàn)數(shù)據(jù)采集過程的負(fù)載均衡。

4.1.2.3.數(shù)據(jù)匯聚要求包括但不限于:

a)對(duì)于采集后的數(shù)據(jù),應(yīng)根據(jù)數(shù)據(jù)特點(diǎn),選擇適合的數(shù)據(jù)匯聚技術(shù)架構(gòu),如數(shù)據(jù)倉庫、

數(shù)據(jù)湖、湖倉一體等;

b)應(yīng)支持結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一存儲(chǔ);

c)應(yīng)支持結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的集中管理;

d)應(yīng)支持?jǐn)?shù)據(jù)的編目、權(quán)限控制、查詢檢索等便捷使用;

e)應(yīng)制定數(shù)據(jù)備份和恢復(fù)策略,確保數(shù)據(jù)的安全性和可靠性。

4.1.2.4.數(shù)據(jù)供給方在提供數(shù)據(jù)時(shí)應(yīng)符合下列要求:

a)數(shù)據(jù)命名應(yīng)規(guī)范統(tǒng)一,數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)及存儲(chǔ)路徑應(yīng)保持穩(wěn)定,不應(yīng)隨意更改;

b)應(yīng)提供必要的說明文檔,確保數(shù)據(jù)內(nèi)容可被正確理解,如字段說明文檔及對(duì)應(yīng)代碼

表、數(shù)據(jù)接口服務(wù)說明文檔;

c)應(yīng)提供數(shù)據(jù)對(duì)賬表,明確包含的內(nèi)容和數(shù)量等信息;

d)應(yīng)建立異常反饋機(jī)制,通過異常數(shù)據(jù)反饋表及時(shí)解決數(shù)據(jù)問題。

4.1.3.服務(wù)要求

數(shù)據(jù)采集匯聚時(shí),數(shù)據(jù)應(yīng)用服務(wù)商應(yīng)對(duì)數(shù)據(jù)的采集策略進(jìn)行說明。應(yīng)說明的內(nèi)容包括目

標(biāo)數(shù)據(jù)的數(shù)據(jù)生產(chǎn)場(chǎng)景、獲取途徑、分級(jí)分類要求、質(zhì)量標(biāo)準(zhǔn)和推薦應(yīng)用場(chǎng)景等。

采集匯聚過程要求保證數(shù)據(jù)的可信性與可用性。數(shù)據(jù)的可信性包括數(shù)據(jù)的準(zhǔn)確性、完整

性、一致性、有效性、唯一性。數(shù)據(jù)可用性包括時(shí)效性、穩(wěn)定性。

a)準(zhǔn)確性:描述數(shù)據(jù)是否與其對(duì)應(yīng)的客觀實(shí)體的特征相一致;

b)完整性:描述數(shù)據(jù)是否存在缺失記錄或缺失字段;

c)一致性:描述同一實(shí)體的同一屬性的值在不同的系統(tǒng)是否一致;

d)有效性:描述數(shù)據(jù)是否滿足用戶定義的條件或在一定的域值范圍內(nèi);

e)唯一性:描述數(shù)據(jù)是否存在重復(fù)記錄;

f)時(shí)效北京電子商會(huì)性:描述數(shù)據(jù)是當(dāng)前數(shù)據(jù)還是歷史數(shù)據(jù);

g)穩(wěn)定性:描述數(shù)據(jù)更新是否是穩(wěn)定的,是否在其有效期內(nèi)。

4.2.傳輸交互

4.2.1.概述

指不同組織或系統(tǒng)之間進(jìn)行數(shù)據(jù)傳輸?shù)倪^程,涉及數(shù)據(jù)的發(fā)送、接收和處理。

4.2.2.技術(shù)要求

4.2.2.1.傳輸方式

3

應(yīng)根據(jù)數(shù)據(jù)合規(guī)管理要求和數(shù)據(jù)傳輸效率要求,采用適合的數(shù)據(jù)傳輸方式,如網(wǎng)絡(luò)傳輸、

物理介質(zhì)拷貝等。

4.2.2.2.網(wǎng)絡(luò)通信協(xié)議

網(wǎng)絡(luò)傳輸應(yīng)確保網(wǎng)絡(luò)、系統(tǒng)或平臺(tái)之間能夠建立連接,符合數(shù)據(jù)加密、壓縮處理等要求,

能夠進(jìn)行可靠的數(shù)據(jù)傳輸和通信。

4.2.2.3.數(shù)據(jù)加密處理

為保護(hù)數(shù)據(jù)傳輸過程中的機(jī)密性和完整性,應(yīng)使用數(shù)據(jù)加密等技術(shù),并確保技術(shù)可靠性。

如安全驗(yàn)證加密、通信加密、數(shù)據(jù)內(nèi)容加密等。

4.2.2.4.數(shù)據(jù)壓縮處理

為提高數(shù)據(jù)傳輸效率,可使用數(shù)據(jù)壓縮和優(yōu)化技術(shù),并提供相關(guān)技術(shù)說明和參數(shù)。

4.2.2.5.數(shù)據(jù)傳輸和流量控制

為控制數(shù)據(jù)傳輸過程中的流量和負(fù)載,可使用流量控制算法來平衡數(shù)據(jù)的發(fā)送和接收速

度,以避免網(wǎng)絡(luò)擁塞和數(shù)據(jù)丟失。

4.2.2.6.糾錯(cuò)處理

為保證數(shù)據(jù)傳輸?shù)目煽啃?,?yīng)使用校驗(yàn)或循環(huán)冗余檢測(cè)(CRC)來檢測(cè)數(shù)據(jù)傳輸過程中

的錯(cuò)誤,并使用重傳機(jī)制來糾正錯(cuò)誤。

4.2.3.服務(wù)要求

為了保障傳輸交互的順利進(jìn)行,數(shù)據(jù)應(yīng)用服務(wù)商應(yīng)對(duì)傳輸交互過程及要求進(jìn)行說明,說

明內(nèi)容包括但不限于傳輸服務(wù)的基本情況、技術(shù)參數(shù)、操作手冊(cè)等。

a)應(yīng)說明通信和傳輸?shù)幕拘畔ⅲ?/p>

1)傳輸交互的方式,如網(wǎng)絡(luò)傳輸、物理介質(zhì)拷貝等;

2)應(yīng)說明網(wǎng)絡(luò)傳輸?shù)耐ㄐ呕疽匦畔ⅲ↖P、端口、協(xié)議)、通信方式和頻率;

應(yīng)說明傳輸基本信息,包括訪問權(quán)限、數(shù)據(jù)格式和接口規(guī)范、安全認(rèn)證和加密機(jī)制、

錯(cuò)誤處理和重傳機(jī)制、傳輸性能等。

b)應(yīng)確保網(wǎng)絡(luò)傳輸過程中數(shù)據(jù)的完整性、準(zhǔn)確性、及時(shí)性、保密性:

1)完整性:

傳輸時(shí)支持信息完整性校驗(yàn)機(jī)制,實(shí)現(xiàn)管理數(shù)據(jù)、鑒別信息、敏感信息、重要

業(yè)務(wù)數(shù)據(jù)等重要數(shù)據(jù)的傳輸完整性保護(hù)(如:校驗(yàn)碼、消息摘要、數(shù)字簽名等);

北京電子商會(huì)具有通信延時(shí)和中斷處理功能,配合終端進(jìn)行完整性保證。

2)準(zhǔn)確性:在數(shù)據(jù)出現(xiàn)較大不可接受誤差時(shí),有重載機(jī)制保證數(shù)據(jù)正常獲?。?/p>

3)及時(shí)性:應(yīng)對(duì)所接收的歷史數(shù)據(jù)或超出時(shí)限的數(shù)據(jù)進(jìn)行識(shí)別。這要求數(shù)據(jù)來源

與系統(tǒng)采用統(tǒng)一時(shí)間分配/矯正機(jī)制,數(shù)據(jù)中宜包含時(shí)間標(biāo)識(shí);

4)保密性:通過數(shù)據(jù)脫敏、密碼技術(shù)、校驗(yàn)技術(shù)保障數(shù)據(jù)傳輸交互保密性。

4.3.加工處理

4.3.1.概述

加工處理指將原始數(shù)據(jù)轉(zhuǎn)化為可用數(shù)據(jù)的過程,包括數(shù)據(jù)架構(gòu)、數(shù)據(jù)集成、數(shù)據(jù)加工等

活動(dòng),提升數(shù)據(jù)質(zhì)量和規(guī)范化程度,支撐數(shù)據(jù)分析與應(yīng)用。

4

4.3.2.技術(shù)要求

4.3.2.1.數(shù)據(jù)架構(gòu)

數(shù)據(jù)架構(gòu)包括數(shù)據(jù)模型和數(shù)據(jù)流,數(shù)據(jù)模型規(guī)定數(shù)據(jù)的結(jié)構(gòu)和規(guī)范,數(shù)據(jù)流規(guī)定數(shù)據(jù)的

處理流程和方式。

數(shù)據(jù)模型設(shè)計(jì)規(guī)則包括但不限于:

a)數(shù)據(jù)模型應(yīng)包括數(shù)據(jù)實(shí)體、數(shù)據(jù)實(shí)體關(guān)系、關(guān)鍵業(yè)務(wù)規(guī)則和關(guān)鍵屬性;

b)數(shù)據(jù)模型應(yīng)包括通用和特定項(xiàng)目的數(shù)據(jù)模型及其定義、規(guī)范、映射和業(yè)務(wù)規(guī)則;

c)數(shù)據(jù)模型可分為概念模型、邏輯模型、物理數(shù)據(jù)模型;

d)如數(shù)據(jù)模型存在分級(jí),則應(yīng)說明各級(jí)數(shù)據(jù)模型的關(guān)聯(lián)性;

e)可選用適合的模型管理工具,工具應(yīng)支持溯源管理、映射關(guān)系管理、模型變更管理,

可提供模型在線可視化設(shè)計(jì)、模型知識(shí)成果導(dǎo)出、模型復(fù)用、自動(dòng)生成物理模型等功能。

數(shù)據(jù)流設(shè)計(jì)規(guī)則包括但不限于:

a)架構(gòu)層面應(yīng)基于數(shù)據(jù)模型設(shè)計(jì),明確數(shù)據(jù)庫、應(yīng)用系統(tǒng)、平臺(tái)和網(wǎng)絡(luò)之間的設(shè)計(jì)規(guī)

則需求;

b)實(shí)施層面應(yīng)考慮數(shù)據(jù)在業(yè)務(wù)流程、不同存儲(chǔ)位置、業(yè)務(wù)角色和技術(shù)組件之間的流動(dòng),

可以通過二維矩陣或數(shù)據(jù)流圖等方式呈現(xiàn);

c)數(shù)據(jù)流映射層面應(yīng)記錄與以下內(nèi)容的聯(lián)系:

1)業(yè)務(wù)流程中的應(yīng)用;

2)某個(gè)環(huán)境中的數(shù)據(jù)存儲(chǔ)或數(shù)據(jù)庫;

3)網(wǎng)段;

4)業(yè)務(wù)角色。

d)可選用適合的數(shù)據(jù)流管理工具。

4.3.2.2.數(shù)據(jù)集成

數(shù)據(jù)集成對(duì)來自不同數(shù)據(jù)源的數(shù)據(jù)進(jìn)行合并和整合。數(shù)據(jù)集成能力要求包括但不限于:

a)應(yīng)支持全量抽取、增量抽取功能,增量抽取包括時(shí)間戳增量、觸發(fā)器增量;

b)應(yīng)支持?jǐn)?shù)據(jù)庫、文件服務(wù)、對(duì)象存儲(chǔ)服務(wù)、接口、消息中間件等多種類型的數(shù)據(jù)抽

取和加載;

c)應(yīng)支持MD5、CRC32等常見的數(shù)據(jù)校驗(yàn)和生成;

d)應(yīng)支持字段的加減、取整、類型轉(zhuǎn)換等計(jì)算規(guī)則的處理;

e)應(yīng)支持SQL、Java、Python等多種語言腳本;

f)可支持多種數(shù)據(jù)轉(zhuǎn)換組件,如多表聯(lián)合、關(guān)聯(lián)表更新、記錄合并等;

g)可支持分組、排序等處理,如求和、求平均等分組聚合和字段排序等。北京電子商會(huì)

4.3.2.3.數(shù)據(jù)加工

數(shù)據(jù)加工指按照相應(yīng)數(shù)據(jù)標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、格式化、規(guī)范化處置的過程。

4.3.2.3.1.數(shù)據(jù)清洗與轉(zhuǎn)換

數(shù)據(jù)清洗與轉(zhuǎn)換是指對(duì)數(shù)據(jù)進(jìn)行過濾、去重、修正、標(biāo)準(zhǔn)化、轉(zhuǎn)換等操作,以確保數(shù)據(jù)

的準(zhǔn)確性、完整性和一致性。數(shù)據(jù)清洗與轉(zhuǎn)換能力要求包括但不限于:

a)數(shù)據(jù)過濾:初步實(shí)現(xiàn)對(duì)數(shù)據(jù)中不符合應(yīng)用規(guī)則或者無效的數(shù)據(jù)進(jìn)行過濾、篩選操作,

使得數(shù)據(jù)標(biāo)準(zhǔn)或代表內(nèi)容統(tǒng)一;

b)數(shù)據(jù)去重:通過對(duì)數(shù)據(jù)進(jìn)行比較和匹配,去除重復(fù)的數(shù)據(jù);

5

c)數(shù)據(jù)修正:對(duì)于異常數(shù)據(jù),通過刪除、修正、替換等方式進(jìn)行處理,對(duì)于缺失的數(shù)

據(jù),通過差值、平均值、中位數(shù)等方式進(jìn)行填充;

d)數(shù)據(jù)標(biāo)準(zhǔn)化:將數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)格式(如XML、JSON、CSV等),以保證數(shù)據(jù)的一

致性;

e)數(shù)據(jù)轉(zhuǎn)換:指將原始數(shù)據(jù)轉(zhuǎn)換為另一種形式的過程,包括數(shù)據(jù)的類型轉(zhuǎn)換、格式轉(zhuǎn)

換等。

4.3.2.3.2.數(shù)據(jù)標(biāo)注

數(shù)據(jù)標(biāo)注是在服務(wù)理解、分析建模應(yīng)用中對(duì)數(shù)據(jù)添加標(biāo)簽或注釋的過程。數(shù)據(jù)標(biāo)注能力

要求包括但不限于:

a)文本標(biāo)注:為文本添加語義標(biāo)簽,用于命名實(shí)體識(shí)別、情感分析、話題分類等NLP

任務(wù);

b)圖像標(biāo)注:為圖像添加標(biāo)簽,如物體名稱、屬性、關(guān)系等,用于圖像分類、目標(biāo)檢測(cè)、

語義分割等視覺任務(wù);

c)語音標(biāo)注:為語音片段添加對(duì)應(yīng)的文本或標(biāo)注話題詞,用于語音識(shí)別和語音助手等

任務(wù);

d)視頻標(biāo)注:為視頻中的關(guān)鍵幀添加標(biāo)簽,用于行為識(shí)別、目標(biāo)跟蹤等視覺任務(wù);

e)序列標(biāo)注:用于說明時(shí)間序列、空間位置關(guān)系等添加的標(biāo)簽。

4.3.3.服務(wù)要求

服務(wù)要求如下:

a)首先應(yīng)對(duì)加工處理服務(wù)的基本情況進(jìn)行說明,包括基本信息、處理規(guī)則、用途作用、

主要效果、服務(wù)要求等;

b)加工處理過程中,應(yīng)根據(jù)相關(guān)規(guī)則,管控?cái)?shù)據(jù)處理過程,以保證數(shù)據(jù)質(zhì)量和數(shù)據(jù)主

體權(quán)益;

c)涉及敏感的數(shù)據(jù),應(yīng)根據(jù)數(shù)據(jù)處理的要求和規(guī)則清洗、脫敏;

d)應(yīng)可接受評(píng)審機(jī)構(gòu)的檢查、監(jiān)控,可隨時(shí)改進(jìn)、完善數(shù)據(jù)處理過程,以保證數(shù)據(jù)安

全;

e)數(shù)據(jù)加工過程中應(yīng)保持?jǐn)?shù)據(jù)的準(zhǔn)確性、完整性、一致性及可解釋性:

1)準(zhǔn)確性:處理后數(shù)據(jù)應(yīng)繼續(xù)保持與對(duì)應(yīng)客觀實(shí)體特征相一致;

2)完整性:處理后數(shù)據(jù)應(yīng)包含所需要的數(shù)據(jù)項(xiàng)及足夠的記錄條數(shù);

3)一致性:數(shù)據(jù)處理應(yīng)使用相同規(guī)則或規(guī)范,以確保數(shù)據(jù)處理后仍保持一致性及

其關(guān)聯(lián)性;

4)北京電子商會(huì)可解釋性:為支持后續(xù)分析建模,數(shù)據(jù)處理規(guī)則應(yīng)明確、可解釋,保障處理后

數(shù)據(jù)的可用性。

4.4.分析建模

4.4.1.概述

分析建模通過數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、預(yù)測(cè)分析、大數(shù)據(jù)建模等技術(shù)提供數(shù)據(jù)決策支持。

4.4.2.技術(shù)要求

4.4.2.1.分析建模環(huán)境

6

數(shù)據(jù)分析建模環(huán)境要求包括但不限于:

a)應(yīng)支持?jǐn)?shù)據(jù)分析建模的安全環(huán)境,如數(shù)據(jù)專區(qū)、數(shù)據(jù)沙箱、數(shù)據(jù)空間等;

b)應(yīng)基于數(shù)據(jù)分級(jí)規(guī)則,對(duì)不同級(jí)別的敏感樣本數(shù)據(jù)進(jìn)行脫敏處理;

c)應(yīng)對(duì)建模的開發(fā)環(huán)境、測(cè)試環(huán)境、生產(chǎn)環(huán)境進(jìn)行數(shù)據(jù)、存儲(chǔ)、計(jì)算隔離;

d)應(yīng)對(duì)開發(fā)人員做到“數(shù)據(jù)可用不可見”,應(yīng)在開發(fā)環(huán)境對(duì)脫敏后的數(shù)據(jù)進(jìn)行模型開

發(fā),完成模型開發(fā)和測(cè)試后,再將模型發(fā)布至生產(chǎn)環(huán)境;

e)應(yīng)使用生產(chǎn)環(huán)境正式運(yùn)行算法模型,采用數(shù)據(jù)包或數(shù)據(jù)接口形式輸出計(jì)算結(jié)果。

4.4.2.2.數(shù)據(jù)探查

為完成數(shù)據(jù)初步探索分析,可通過數(shù)據(jù)探查對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化掃描和探查。數(shù)據(jù)探查能

力要求包括但不限于:

a)應(yīng)支持對(duì)結(jié)構(gòu)化數(shù)據(jù)源的數(shù)據(jù)探查;

b)應(yīng)支持探查任務(wù)的配置和調(diào)度;應(yīng)支持手動(dòng)、多次執(zhí)行探查任務(wù);

c)應(yīng)支持探查數(shù)據(jù)表的元數(shù)據(jù)信息,如表名稱、字段名稱、字段數(shù)量、數(shù)據(jù)容量、數(shù)

據(jù)記錄條數(shù)、字段類型;

d)應(yīng)支持探查數(shù)值類字段的最大值、最小值、最大列長、最小列長、空值率、樣例數(shù)

據(jù)和字段值的分布情況;

e)應(yīng)支持查看探查任務(wù)的執(zhí)行記錄,并支持查看每次探查執(zhí)行記錄的日志詳情;應(yīng)支

持按照探查任務(wù)將探查結(jié)果生成報(bào)告;

f)應(yīng)支持人工審查探查結(jié)果;

g)可支持靈活配置探查獲取樣例數(shù)據(jù)的規(guī)則,如數(shù)據(jù)表樣例數(shù)據(jù)的條數(shù)、字段樣例數(shù)

據(jù)的條數(shù)等;

h)可支持探查非關(guān)系型數(shù)據(jù)庫數(shù)據(jù)源;

i)可支持靈活配置將探查結(jié)果導(dǎo)出為不同類型數(shù)據(jù)庫的DDL。

4.4.2.3.分析建模的數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是指在進(jìn)行數(shù)據(jù)分析、機(jī)器學(xué)習(xí)或建模之前,對(duì)數(shù)據(jù)進(jìn)行處理和轉(zhuǎn)換的過程。

以提高模型的性能和準(zhǔn)確性,減少模型的過擬合和欠擬合。數(shù)據(jù)預(yù)處理能力要求包括但不限

于:

a)應(yīng)支持?jǐn)?shù)據(jù)清洗:處理數(shù)據(jù)中的噪聲、錯(cuò)誤、缺失值、重復(fù)值等問題,確保數(shù)據(jù)的

準(zhǔn)確性和完整性;

b)應(yīng)支持?jǐn)?shù)據(jù)規(guī)范化:對(duì)數(shù)據(jù)進(jìn)行縮放,使其在相同的尺度范圍內(nèi),如最小-最大規(guī)

范化、Z-score規(guī)范化;

c)應(yīng)支持?jǐn)?shù)據(jù)特征選擇:從數(shù)據(jù)中選擇與建模目標(biāo)相關(guān)的特征,減少特征的數(shù)量,提

高模型的效率和準(zhǔn)確性;北京電子商會(huì)

d)應(yīng)支持?jǐn)?shù)據(jù)特征轉(zhuǎn)換:支持對(duì)數(shù)據(jù)進(jìn)行變換,使其更適合建模,如對(duì)數(shù)變換、指數(shù)

變換、多項(xiàng)式變換等;

e)應(yīng)支持?jǐn)?shù)據(jù)特征降維:減少數(shù)據(jù)的維度,去除冗余的特征,提高模型的效率和準(zhǔn)確

性,如主成分分析(PCA)、線性判別分析(LDA)等降維方法;

f)應(yīng)對(duì)數(shù)據(jù)集進(jìn)行劃分:將原始數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,用于模型的訓(xùn)練和評(píng)估。

4.4.2.4.計(jì)算架構(gòu)

分析建模應(yīng)支持多種模型計(jì)算架構(gòu),如批處理計(jì)算、流處理計(jì)算、批流融合計(jì)算等。

批處理計(jì)算框架是一種基于離線數(shù)據(jù)處理的計(jì)算框架,適用于處理大規(guī)模數(shù)據(jù)集,通過

7

將數(shù)據(jù)分成批次進(jìn)行處理,以實(shí)現(xiàn)高效的數(shù)據(jù)計(jì)算和分析。批處理計(jì)算框架能力要求包括但

不限于:

a)應(yīng)支持離線批量數(shù)據(jù)的處理;

b)應(yīng)支持離線計(jì)算任務(wù)進(jìn)度與狀態(tài)的實(shí)時(shí)上報(bào);

c)應(yīng)支持多節(jié)點(diǎn)離線任務(wù)聯(lián)動(dòng)執(zhí)行;

d)應(yīng)支持作業(yè)調(diào)度;

e)應(yīng)支持分散-聚集的處理方式;

f)應(yīng)支持批處理計(jì)算框架運(yùn)行在分布式資源管理之上;

g)可支持根據(jù)作業(yè)需求動(dòng)態(tài)分配計(jì)算資源,自動(dòng)管理回收資源;

h)可支持持久化存儲(chǔ)能力,可支持對(duì)復(fù)雜任務(wù)的調(diào)度能力。

流處理計(jì)算框架是一種基于實(shí)時(shí)數(shù)據(jù)處理的計(jì)算框架,適用于處理實(shí)時(shí)的數(shù)據(jù)流,通過

連續(xù)地接收、處理和輸出數(shù)據(jù),以實(shí)現(xiàn)實(shí)時(shí)的數(shù)據(jù)計(jì)算和分析。流處理計(jì)算框架能力要求包

括但不限于:

a)應(yīng)支持從數(shù)據(jù)源中獲得實(shí)時(shí)消息數(shù)據(jù),并將結(jié)果輸出到消息隊(duì)列或進(jìn)行持久化;

b)應(yīng)提供用戶級(jí)別的訪問控制功能;

c)應(yīng)支持對(duì)消息處理任務(wù)進(jìn)行創(chuàng)建、瀏覽、中止、激活、去激活等操作;

d)應(yīng)支持采用窗口方式的實(shí)時(shí)分析任務(wù),其時(shí)間窗口大小應(yīng)可調(diào);

e)應(yīng)支持?jǐn)?shù)據(jù)變更捕獲;

f)可根據(jù)作業(yè)需求動(dòng)態(tài)分配計(jì)算資源,自動(dòng)管理回收資源;

g)可支持對(duì)復(fù)雜任務(wù)的調(diào)度能力;

h)可支持各種常見的部署模式。

批流融合計(jì)算框架綜合了批處理和流處理的計(jì)算框架,旨在處理實(shí)時(shí)與離線融合場(chǎng)景,

批流融合計(jì)算框架能力要求包括但不限于:

a)應(yīng)支持批流融合統(tǒng)一查詢SQL語言;

b)應(yīng)支持多種場(chǎng)景下的流式SQL(如位置信息分析等);

c)應(yīng)支持常用時(shí)間窗口(如跳躍窗口、滑動(dòng)窗口等);

d)應(yīng)支持在SQL中使用自定義UDF/UDAF/UDTF;

e)應(yīng)支持交互式執(zhí)行分析作業(yè);

f)可支持基于SQL語言的批、流數(shù)據(jù)的模式識(shí)別;

g)可支持對(duì)復(fù)雜任務(wù)的調(diào)度,如深度學(xué)習(xí)的訓(xùn)練、MPI任務(wù)等;

h)可支持根據(jù)作業(yè)需求動(dòng)態(tài)分配計(jì)算資源,自動(dòng)回收資源等。

4.4.2.5.分析模型

分析模型包括但不限于指標(biāo)體系、指數(shù)體系、降維模型、回歸模型、聚類模型、分類模北京電子商會(huì)

型、關(guān)聯(lián)模型、畫像模型。面向模型的應(yīng)用,數(shù)據(jù)應(yīng)用服務(wù)商應(yīng)該明確以下內(nèi)容:

a)應(yīng)說明模型用途:明確模型的適用人群、場(chǎng)景和用途,指導(dǎo)使用者科學(xué)性認(rèn)識(shí)和依

法安全使用模型;

b)應(yīng)提供模型代碼:模型代碼是實(shí)現(xiàn)模型運(yùn)行的程序,其中包括了模型的算法、訓(xùn)練

和預(yù)測(cè)等核心邏輯。模型代碼在使用時(shí)可被直接調(diào)用;

c)應(yīng)提供數(shù)據(jù)集:為了訓(xùn)練或評(píng)估模型,應(yīng)提供相應(yīng)的數(shù)據(jù)集。數(shù)據(jù)集包含輸入特征

和對(duì)應(yīng)的標(biāo)簽,用于訓(xùn)練和驗(yàn)證模型的準(zhǔn)確性和效果;

d)應(yīng)提供模型參數(shù)規(guī)則:模型調(diào)用時(shí)應(yīng)提供模型參數(shù)規(guī)則,訓(xùn)練模型后的模型參數(shù)或

權(quán)重,可用于對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)測(cè);

e)應(yīng)提供輸入輸出規(guī)范:為了正確地使用模型,應(yīng)提供模型的輸入和輸出規(guī)范。輸入

8

規(guī)范包括需要提供的輸入特征和格式,輸出規(guī)范描述模型預(yù)測(cè)的結(jié)果和格式。幫助模型

使用者正確地輸入數(shù)據(jù)并獲得模型的預(yù)測(cè)結(jié)果;

f)應(yīng)說明運(yùn)行環(huán)境:應(yīng)提供運(yùn)行環(huán)境的相關(guān)信息,包括軟件版本、硬件配置等,以確

保模型在使用者的環(huán)境中可以正確地運(yùn)行和部署。

4.4.3.服務(wù)要求

數(shù)據(jù)應(yīng)用服務(wù)商應(yīng)對(duì)分析建模服務(wù)做總體說明,包括分析建模服務(wù)的基本情況、用途作

用、分析過程、使用方法等。

分析建模過程中,應(yīng)保證模型的可解釋性、準(zhǔn)確性、可重現(xiàn)性、可嵌套性、可擴(kuò)展性等,

并支持對(duì)模型進(jìn)行審計(jì):

a)可解釋性:指對(duì)于模型的輸出結(jié)果能夠理解和解釋其原因或機(jī)制。業(yè)務(wù)模型應(yīng)解釋

業(yè)務(wù)的預(yù)測(cè)或決策的原理,數(shù)據(jù)模型應(yīng)解釋數(shù)據(jù)特征和變量關(guān)系,以便理解模型原理;

b)可重現(xiàn)性:指通過相同的數(shù)據(jù)、代碼和環(huán)境,能夠復(fù)現(xiàn)相同的模型建立和結(jié)果輸出;

c)準(zhǔn)確性:指模型在分類、回歸等預(yù)測(cè)任務(wù)中的正確性。可支持通過準(zhǔn)確率、召回率、

F1值、ROC曲線、AUC等進(jìn)行評(píng)價(jià);

d)可嵌套性:可以作為其他模型或函數(shù)的一部分進(jìn)行調(diào)用和使用;

e)可擴(kuò)展性:面對(duì)不同的需求和場(chǎng)景時(shí)能夠進(jìn)行擴(kuò)展和應(yīng)用(如功能、性能、接口和

數(shù)據(jù)等方面的擴(kuò)展);

f)可審計(jì):為確保模型的可信度、可靠性和公平性,應(yīng)提供可驗(yàn)證的指標(biāo)和方法,支

持對(duì)模型進(jìn)行全面的評(píng)估和驗(yàn)證。模型審計(jì)包括數(shù)據(jù)審計(jì)、算法審計(jì)、解釋性審計(jì)、安

全性審計(jì)等。

4.5.數(shù)據(jù)應(yīng)用

4.5.1.概述

數(shù)據(jù)應(yīng)用指為滿足業(yè)務(wù)場(chǎng)景需求,以應(yīng)用數(shù)據(jù)為核心,結(jié)合數(shù)據(jù)模型、畫像、算法等內(nèi)

容,形成信息系統(tǒng)、應(yīng)用平臺(tái)或數(shù)據(jù)報(bào)告等數(shù)據(jù)產(chǎn)品和服務(wù)的過程。

4.5.2.技術(shù)要求

4.5.2.1.數(shù)據(jù)內(nèi)容服務(wù)

數(shù)據(jù)內(nèi)容服務(wù)是指通過API調(diào)用、數(shù)據(jù)包提供等方式向第三方提供數(shù)據(jù)的一種服務(wù)形

式。數(shù)據(jù)內(nèi)容提供應(yīng)遵循以下規(guī)范:

a)應(yīng)編制數(shù)據(jù)目錄,目錄應(yīng)完整、及時(shí)更新;

b)應(yīng)確保數(shù)據(jù)提供途徑規(guī)范、在線獲取方式穩(wěn)定;

c)應(yīng)確保數(shù)據(jù)目錄及數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn);

d)應(yīng)在數(shù)據(jù)質(zhì)量上確保規(guī)范性、完整性、準(zhǔn)確性、一致性、時(shí)效性和可訪問性。北京電子商會(huì)

4.5.2.2.數(shù)據(jù)呈現(xiàn)服務(wù)

數(shù)據(jù)呈現(xiàn)服務(wù)是指將數(shù)據(jù)通過可視化等方式呈現(xiàn)給用戶,以便用戶更直觀、更易理解地

獲取數(shù)據(jù)信息。

數(shù)據(jù)呈現(xiàn)服務(wù)技術(shù)能力包括不限于:

a)應(yīng)支持?jǐn)?shù)據(jù)可視化圖表展示,包括不限于:

1)應(yīng)支持使用幾何形狀(如點(diǎn)、線、面等)來表示數(shù)據(jù)。如散點(diǎn)圖、折線圖、柱

狀圖等;

2)應(yīng)支持使用圖標(biāo)、符號(hào)或圖形來表示數(shù)據(jù)。如餅圖、雷達(dá)圖、氣泡圖等;

9

3)應(yīng)支持通過像素點(diǎn)的顏色、亮度等屬性來表示數(shù)據(jù)。如熱圖、等高線圖等;

4)應(yīng)支持基于時(shí)間序列展示數(shù)據(jù)隨時(shí)間的變化趨勢(shì)。如折線圖、時(shí)間軸圖等;

5)應(yīng)支持可用于可視化網(wǎng)絡(luò)數(shù)據(jù)的技術(shù),展示節(jié)點(diǎn)和邊的關(guān)系。如網(wǎng)絡(luò)圖、樹狀

圖等;

6)應(yīng)支持展示具有層次結(jié)構(gòu)的數(shù)據(jù),以展示數(shù)據(jù)的組織結(jié)構(gòu)和關(guān)系。如樹狀圖、

旭日?qǐng)D等;

7)應(yīng)支持展示數(shù)據(jù)的分布情況,可以展示數(shù)據(jù)的集中度、離散度等。如直方圖、

箱線圖等;

8)應(yīng)支持以報(bào)表形式表示數(shù)據(jù),如二維表、交叉表等。

b)可支持駕駛艙應(yīng)用:駕駛艙,可依據(jù)不同需求構(gòu)建多維度數(shù)據(jù)“看板”,實(shí)現(xiàn)對(duì)指

標(biāo)和數(shù)據(jù)的關(guān)聯(lián)分析,可以移動(dòng)端、PC端、大屏端等屏幕為視覺入口,形象化、直觀

化、具體化的展示數(shù)據(jù),可實(shí)現(xiàn)業(yè)務(wù)要素、信息的全景呈現(xiàn)和智能分析;

c)可支持知識(shí)圖譜應(yīng)用:知識(shí)圖譜是一種用于表示和描述知識(shí)的圖形化模型,它可將

實(shí)體、概念和它們之間的關(guān)系以圖形化的方式呈現(xiàn);

d)可支持?jǐn)?shù)字孿生應(yīng)用:數(shù)字孿生是一種將物理對(duì)象的信息建模為數(shù)字模型的技術(shù),

可以將物理對(duì)象的運(yùn)行狀態(tài)和行為進(jìn)行模擬和預(yù)測(cè);

e)可支持BIM應(yīng)用:BIM是一種建筑信息建模技術(shù),可以將建筑物的各種信息進(jìn)行數(shù)

字化建模和管理;

f)可支持CIM應(yīng)用:CIM是一種城市信息建模技術(shù),可以將城市的各種信息進(jìn)行數(shù)字

化建模和管理;

g)可支持AR應(yīng)用:AR是一種增強(qiáng)現(xiàn)實(shí)技術(shù),可以將虛擬信息疊加在現(xiàn)實(shí)世界中,使

得用戶可以更加直觀地感受到虛擬環(huán)境;

h)可支持VR應(yīng)用:VR是一種虛擬現(xiàn)實(shí)技術(shù),可以為用戶提供身臨其境的虛擬環(huán)境;

i)可支持MR應(yīng)用:MR是一種混合現(xiàn)實(shí)技術(shù),可以將虛擬信息與現(xiàn)實(shí)世界進(jìn)行交互和

融合;

j)可支持?jǐn)?shù)據(jù)報(bào)告應(yīng)用:數(shù)據(jù)報(bào)告是對(duì)數(shù)據(jù)分析結(jié)果和洞察的呈現(xiàn)和解釋??梢钥梢?/p>

化的方式展示數(shù)據(jù),包括圖表、圖形和文字描述等。數(shù)據(jù)報(bào)告可以幫助用戶理解數(shù)據(jù)的

含義和趨勢(shì),以支持決策和業(yè)務(wù)需求等。

4.5.2.3.數(shù)據(jù)深加工服務(wù)

數(shù)據(jù)深加工服務(wù)是指對(duì)已有的數(shù)據(jù)進(jìn)行更加深入復(fù)雜的處理和分析,進(jìn)而得出更具價(jià)值

的數(shù)據(jù)結(jié)果的過程。

數(shù)據(jù)深加工服務(wù)能力要求包括不限于:

a)應(yīng)支持?jǐn)?shù)據(jù)分析模型:應(yīng)可利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù),對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和建

模,以實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類、預(yù)測(cè)、回歸等功能;北京電子商會(huì)

b)可支持預(yù)測(cè)推理預(yù)警應(yīng)用:可基于模型和數(shù)據(jù)分析,對(duì)未來可能發(fā)生的事件進(jìn)行預(yù)

測(cè)和推理,并提前發(fā)出警報(bào);

c)可支持智能客服機(jī)器人應(yīng)用:利用自然語言處理、機(jī)器學(xué)習(xí)、數(shù)字人等技術(shù),對(duì)用

戶提出的問題進(jìn)行智能回答和解決,并以數(shù)字人的形象進(jìn)行展示,提高客戶服務(wù)效率和

用戶體驗(yàn)。

4.5.3.服務(wù)要求

數(shù)據(jù)應(yīng)用服務(wù)商應(yīng)對(duì)數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)的基本情況進(jìn)行說明,包括數(shù)據(jù)來源、主要功

能、應(yīng)用場(chǎng)景、分析方法以及產(chǎn)品組成元件。

1

對(duì)數(shù)據(jù)應(yīng)用服務(wù)的要求包括:

a)數(shù)據(jù)的準(zhǔn)確性和完整性:報(bào)告或系統(tǒng)的數(shù)據(jù)來源需可靠、數(shù)據(jù)處理分析過程準(zhǔn)確、

數(shù)據(jù)完整不缺失關(guān)鍵數(shù)據(jù);

b)分析方法與技術(shù)適用性:能夠靈活應(yīng)對(duì)多樣化的數(shù)據(jù)分析需求。同時(shí)要求數(shù)據(jù)分析

過程可重現(xiàn),分析結(jié)果準(zhǔn)確可靠,使人們能夠理解分析結(jié)果是如何得出的,以及結(jié)果背

后的原因和邏輯;

c)服務(wù)的可擴(kuò)展性與可持續(xù)性:要充分考慮服務(wù)的可擴(kuò)展性和可持續(xù)性,能夠根據(jù)客

戶需求進(jìn)行快速響應(yīng)和調(diào)整,同時(shí)要求其分析方法可擴(kuò)展、可持續(xù)優(yōu)化更新;

d)用戶體驗(yàn):應(yīng)注重用戶體驗(yàn),提供易于操作、界面友好的數(shù)據(jù)服務(wù)。

4.6.數(shù)據(jù)安全

4.6.1.概述

為支撐數(shù)據(jù)應(yīng)用,在采集與匯聚、傳輸交互、加工處理、分析建模、數(shù)據(jù)服務(wù)過程中,

保護(hù)數(shù)據(jù)不受未經(jīng)授權(quán)的訪問、使用、披露、修改、破壞或丟失,確保數(shù)據(jù)在整個(gè)過程中得

到有效保護(hù)和合法利用。

4.6.2.技術(shù)要求

數(shù)據(jù)安全涉及技術(shù)包括不限于:

4.6.2.1.數(shù)據(jù)資產(chǎn)探查

基于模型算法,自動(dòng)識(shí)別敏感數(shù)據(jù),基于內(nèi)容校驗(yàn)規(guī)則識(shí)別包括身份證、手機(jī)號(hào)、銀行

卡號(hào)、電子郵箱、車牌號(hào)、座機(jī)號(hào)、IP、MAC、姓名、地址、公司名等數(shù)據(jù)字段;或基于數(shù)

據(jù)字典的智能識(shí)別,對(duì)于一些專業(yè)名詞,例如專業(yè)、學(xué)校、藥品、病癥等,可以通過上傳詞

庫的方式來識(shí)別由這些詞組成的字段?;蚧谠獢?shù)據(jù)識(shí)別,通過指定特定的項(xiàng)目,表及字段

來識(shí)別敏感數(shù)據(jù)。

4.6.2.2.數(shù)據(jù)分級(jí)分類

數(shù)據(jù)分級(jí)分類應(yīng)遵從國家數(shù)據(jù)安全分級(jí)分類標(biāo)準(zhǔn)。通過對(duì)敏感數(shù)據(jù)進(jìn)行自動(dòng)化分類分級(jí),

通過元數(shù)據(jù)、數(shù)據(jù)內(nèi)容進(jìn)行識(shí)別,確定不同級(jí)別數(shù)據(jù)的安全管控要求,從而更好地管理好其

核心數(shù)據(jù)。同時(shí)利用處理好的分類分級(jí)用于日常數(shù)據(jù)安全管理。

4.6.2.3.數(shù)據(jù)安全監(jiān)測(cè)

數(shù)據(jù)安全監(jiān)測(cè)包括內(nèi)容監(jiān)測(cè)、操作監(jiān)測(cè):

數(shù)據(jù)內(nèi)容監(jiān)測(cè)可通過數(shù)據(jù)資產(chǎn)發(fā)現(xiàn)、數(shù)據(jù)分類分級(jí)、敏感數(shù)據(jù)識(shí)別等功能,從根本上解北京電子商會(huì)

決數(shù)據(jù)資產(chǎn)不清和數(shù)據(jù)分類分級(jí)缺失的問題。通過編制數(shù)據(jù)資產(chǎn)目錄,清晰地掌握數(shù)據(jù)資產(chǎn)

數(shù)量與分布情況;以業(yè)務(wù)及數(shù)據(jù)本身進(jìn)行數(shù)據(jù)分類分級(jí),為制定詳細(xì)的數(shù)據(jù)安全監(jiān)管方案提

供基礎(chǔ)。

異常操作風(fēng)險(xiǎn)監(jiān)測(cè)可通過多維度關(guān)聯(lián)分析及算法,主動(dòng)發(fā)現(xiàn)風(fēng)險(xiǎn)操作,包括對(duì)數(shù)據(jù)爬取、

異常訪問、跨權(quán)限操作等自動(dòng)風(fēng)險(xiǎn)識(shí)別策略,對(duì)非法操作進(jìn)行識(shí)別預(yù)警,保護(hù)數(shù)據(jù)開發(fā)過程

安全。

4.6.2.4.數(shù)據(jù)脫敏加密

通過數(shù)據(jù)脫敏和數(shù)據(jù)加密技術(shù),可實(shí)現(xiàn)在保證數(shù)據(jù)有效性和真實(shí)性的基礎(chǔ)上,降低數(shù)據(jù)

敏感程度,實(shí)現(xiàn)敏感數(shù)據(jù)匿名化和去標(biāo)識(shí)化。通過采用遮蓋、替換、變換取整等方式對(duì)敏感

1

數(shù)據(jù)進(jìn)行脫敏。數(shù)據(jù)加密系統(tǒng)采用加密算法實(shí)現(xiàn)數(shù)據(jù)加密。通過脫敏與加密的方式,實(shí)現(xiàn)在

數(shù)據(jù)使用過程中的安全防護(hù),降低數(shù)據(jù)泄漏后產(chǎn)生的影響。

4.6.2.5.數(shù)據(jù)水印

通過實(shí)現(xiàn)數(shù)據(jù)水印的嵌入與提取,解決了當(dāng)發(fā)生數(shù)據(jù)泄露時(shí)的溯源問題。通過查看水印

信息,能清晰地查找到數(shù)據(jù)是在哪個(gè)業(yè)務(wù)場(chǎng)景,哪個(gè)環(huán)節(jié)內(nèi),從哪個(gè)人員手里流出。進(jìn)而提

升對(duì)應(yīng)環(huán)節(jié)的數(shù)據(jù)安全防護(hù)策略,完善該環(huán)節(jié)負(fù)責(zé)人員的數(shù)據(jù)安全意識(shí)培訓(xùn),最終做到杜絕

內(nèi)部人員的數(shù)據(jù)泄露行為,保障數(shù)據(jù)安全。

4.6.2.6.隱私計(jì)算

通過實(shí)現(xiàn)多站點(diǎn)間聯(lián)邦學(xué)習(xí)的方式,提供了一種隱私計(jì)算方法。通過各站點(diǎn)間的數(shù)據(jù)資

源共同參與聯(lián)邦學(xué)習(xí)任務(wù),訓(xùn)練計(jì)算模型。做到了原始數(shù)據(jù)不出域,保證了原始數(shù)據(jù)持有權(quán)

不變且不受損,僅讓渡了數(shù)據(jù)使用權(quán),實(shí)現(xiàn)了數(shù)據(jù)的持有權(quán)和使用權(quán)相互分離,保障了數(shù)據(jù)

主體的合法權(quán)益。

4.6.3.服務(wù)要求

4.6.3.1.數(shù)據(jù)應(yīng)用服務(wù)全流程均應(yīng)遵守國家相關(guān)法律法規(guī)對(duì)數(shù)據(jù)安全的要求,包括不限于

《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》、《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例》等要

求。

4.6.3.2.應(yīng)對(duì)數(shù)據(jù)安全保障策略措施、訪問控制和身份驗(yàn)證、數(shù)據(jù)加密和安全傳輸、數(shù)據(jù)

隱私保護(hù)、安全審查和合規(guī)性、服務(wù)要求等層面進(jìn)行說明和描述。

4.6.3.3.數(shù)據(jù)安全服務(wù)要求保障數(shù)據(jù)的合規(guī)性、隱私性、訪問控制、審計(jì)、可溯源:

a)數(shù)據(jù)合規(guī)性:指符合相關(guān)法律法規(guī)和行業(yè)標(biāo)準(zhǔn)的要求,遵守?cái)?shù)據(jù)保護(hù)法規(guī),與第三

方合作伙伴簽訂滿足法律要求的數(shù)據(jù)保護(hù)協(xié)議等;

b)數(shù)據(jù)隱私性:指在數(shù)據(jù)應(yīng)用服務(wù)全過程中采取適當(dāng)?shù)拇胧﹣肀Wo(hù)用戶的個(gè)人隱私和

敏感信息;

c)數(shù)據(jù)訪問控制:指數(shù)據(jù)出口采取適當(dāng)?shù)脑L問控制策略,對(duì)數(shù)據(jù)使用統(tǒng)一審核管理、

監(jiān)控留痕和統(tǒng)一出口管控;

d)安全審計(jì):對(duì)數(shù)據(jù)采集匯聚、加工處理、分析建模、數(shù)據(jù)服務(wù)等環(huán)節(jié)進(jìn)行全流程的

風(fēng)險(xiǎn)分析和探查;

e)監(jiān)測(cè)溯源:通過對(duì)數(shù)據(jù)流量的實(shí)時(shí)監(jiān)測(cè),確保數(shù)據(jù)在使用過程中的來源清晰、去向

明確,并建立對(duì)數(shù)據(jù)血緣關(guān)系的管理和對(duì)數(shù)據(jù)加工、分析鏈路及映射關(guān)系的管理。

4.7.存力算力北京電子商會(huì)

4.7.1.概述

指支撐數(shù)據(jù)采集與匯聚、傳輸交互、加工處理、分析建模、數(shù)據(jù)服務(wù)過程的存儲(chǔ)和計(jì)算

能力。

4.7.2.技術(shù)要求

支撐數(shù)據(jù)采集與匯聚、傳輸交互、加工處理、分析建模、數(shù)據(jù)服務(wù)過程的存力要求包括

但不限于:

a)應(yīng)支持多種存儲(chǔ)能力,如高性能存儲(chǔ)、對(duì)象存儲(chǔ)、塊存儲(chǔ)和文件存儲(chǔ)等;

1

b)可支持容器化存儲(chǔ),確保數(shù)據(jù)隔離、易于管理和遷移;

c)應(yīng)提供數(shù)據(jù)擦寫機(jī)制等數(shù)據(jù)刪除功能;

d)應(yīng)具備業(yè)務(wù)穩(wěn)定性保障相關(guān)的數(shù)據(jù)自動(dòng)遷移、多只讀副本能力、崩潰一致性控制能

力、FailoverFailback能力等;

e)應(yīng)提供數(shù)據(jù)可靠性保障相關(guān)的數(shù)據(jù)一致性校驗(yàn)、糾刪碼(EC)、數(shù)據(jù)備份和恢復(fù)等

功能;

f)應(yīng)支持?jǐn)?shù)據(jù)壓縮、加密(傳輸加密和服務(wù)端加密)和鑒別等安全保護(hù)措施;

g)應(yīng)支持存力的統(tǒng)籌管理;

h)應(yīng)支持多種類型數(shù)據(jù)直接存儲(chǔ);

i)應(yīng)支持離線存儲(chǔ)和低成本的在線存儲(chǔ);

j)應(yīng)支持存算分離架構(gòu),存儲(chǔ)系統(tǒng)支持對(duì)接多類計(jì)算引擎;

k)應(yīng)支持彈性擴(kuò)展,根據(jù)數(shù)據(jù)應(yīng)用對(duì)存儲(chǔ)容量、存儲(chǔ)性能的不同需求,提供擴(kuò)展支持

能力;

l)應(yīng)提供采集數(shù)據(jù)、分析數(shù)據(jù)、線上業(yè)務(wù)數(shù)據(jù)在各業(yè)務(wù)系統(tǒng)間對(duì)接至存儲(chǔ)系統(tǒng)的接口;

m)應(yīng)支持云上云下數(shù)據(jù)互通,支持存儲(chǔ)生命周期策略下的,在多種存儲(chǔ)介質(zhì)的數(shù)據(jù)流

動(dòng);

n)存儲(chǔ)系統(tǒng)可支持檢索能力。

算力規(guī)模(以8*A800算力參考)可分為三類:小算力(8卡-128卡)、中算力(128

卡-512卡)、大算力(大于512卡)。支撐不同的數(shù)據(jù)應(yīng)用服務(wù)場(chǎng)景對(duì)計(jì)算能力的要求包

括但不限于:

a)應(yīng)支持簡單智算能力,為用戶提供通用的CPU、GPU等算力,通過API調(diào)用通用模

型NLP等提供推理服務(wù),支持針對(duì)不同數(shù)據(jù)規(guī)模提供小算力、中算力和大算力的推理服

務(wù),典型場(chǎng)景包括政務(wù)靜態(tài)數(shù)據(jù)匯總、生產(chǎn)過程統(tǒng)計(jì)等;

b)應(yīng)支持中等智算能力,基于通用模型為用戶提供訓(xùn)練和推理服務(wù),以提供中算力服

務(wù)為主,典型場(chǎng)景包括教育科研傳統(tǒng)CV視覺模型訓(xùn)練、精準(zhǔn)排產(chǎn)訓(xùn)練、生產(chǎn)能耗優(yōu)化

訓(xùn)練、制造質(zhì)量分析訓(xùn)練等;

c)可支持大模型智算能力,基于大語言模型為用戶提供通用模型預(yù)訓(xùn)練(大算力)、

行業(yè)模型預(yù)訓(xùn)練(中算力)和場(chǎng)景大模型微調(diào)訓(xùn)練(小算力)等,典型場(chǎng)景包括自動(dòng)駕

駛訓(xùn)練集群、醫(yī)療醫(yī)藥文獻(xiàn)摘要提取訓(xùn)練、保電大模型、政務(wù)對(duì)話式辦事咨詢大模型等。

4.7.3.服務(wù)要求

應(yīng)對(duì)存力算力服務(wù)進(jìn)行基本說明,包括基本能力、服務(wù)方式。

對(duì)存力算力服務(wù)要求包括:

a)可用性:指業(yè)務(wù)的可用性(典型值:北京電子商會(huì)99.995%);

b)可靠性:指系統(tǒng)和設(shè)備的可靠性。包括硬件設(shè)備的穩(wěn)定性、網(wǎng)絡(luò)連接的可靠性、系

統(tǒng)的容錯(cuò)能力等。高可靠性服務(wù)可減少服務(wù)中斷和數(shù)據(jù)丟失的風(fēng)險(xiǎn)。宜提供3AZ榮災(zāi)存

儲(chǔ)架構(gòu),提供12個(gè)9以上的數(shù)據(jù)可靠性,單機(jī)故障零影響;

c)彈性:指存儲(chǔ)容量和計(jì)算資源的可擴(kuò)展性,可根據(jù)需求靈活擴(kuò)展資源,滿足不斷增

長的數(shù)據(jù)處理需求;

d)可管理性:指管理界面的友好性、操作的便捷性、監(jiān)控和管理工具的完備性;

e)可計(jì)量性:能夠?qū)τ脩籼峁┑拇媪λ懔M(jìn)行量化,即能夠準(zhǔn)確地衡量用戶所使用的

存力算力的數(shù)量;

f)可配置性:能夠基于用戶和數(shù)據(jù)應(yīng)用對(duì)存力算力的存儲(chǔ)數(shù)據(jù)規(guī)模、延遲、每秒讀寫

操作次數(shù)(IOPS)、吞吐等方面的要求,動(dòng)態(tài)匹配存力算力。

1

4.8.合規(guī)檢查

4.8.1.概述

指按照《中華人民共和國數(shù)據(jù)安全法》及相關(guān)法律規(guī)定要求,對(duì)數(shù)據(jù)應(yīng)用合規(guī)義務(wù)履行

情況進(jìn)行檢查監(jiān)督,并形成檢查報(bào)告,出具檢查意見的活動(dòng)。

數(shù)據(jù)合規(guī)檢查是保證數(shù)據(jù)合規(guī)性的重要環(huán)節(jié),通過對(duì)數(shù)據(jù)安全性、隱私保護(hù)、正確性、

備份恢復(fù)、訪問控制、存儲(chǔ)傳輸安全、合規(guī)性審計(jì)和安全培訓(xùn)意識(shí)等方面的檢查,可以確保

數(shù)據(jù)符合相關(guān)法律和政策要求,提高數(shù)據(jù)的安全性和可信度。

4.8.2.技術(shù)要求

數(shù)據(jù)應(yīng)用合規(guī)檢查的技術(shù)要求包括但不限于:

a)風(fēng)險(xiǎn)評(píng)估技術(shù):選擇定性評(píng)估、定量評(píng)估、評(píng)分系統(tǒng)、判斷法等風(fēng)險(xiǎn)評(píng)估方法,按

照風(fēng)險(xiǎn)識(shí)別、風(fēng)險(xiǎn)分析、風(fēng)險(xiǎn)評(píng)價(jià)、風(fēng)險(xiǎn)處置等流程開展評(píng)估工作;

b)審計(jì)抽樣技術(shù):針對(duì)時(shí)間及成本均不允許,對(duì)既定總體中的所有交易或事項(xiàng)進(jìn)行全

面審計(jì)的場(chǎng)景,按照抽樣樣本設(shè)計(jì)、選取抽樣樣本、對(duì)抽樣樣本實(shí)施審計(jì)程序等流程開

展審計(jì)抽樣工作;

c)計(jì)算機(jī)輔助檢查技術(shù):包括安全工具、系統(tǒng)運(yùn)行監(jiān)測(cè)工具、系統(tǒng)監(jiān)控檢測(cè)工具、測(cè)

試工具、專家系統(tǒng)等;

d)大數(shù)據(jù)技術(shù):利用大數(shù)據(jù)技術(shù)和大數(shù)據(jù)思維,對(duì)電子化數(shù)據(jù)進(jìn)行綜合、交叉分析,

從抽樣測(cè)試進(jìn)化到全面的數(shù)據(jù)分析,從數(shù)據(jù)間對(duì)應(yīng)關(guān)系的比對(duì)提升到數(shù)據(jù)中業(yè)務(wù)邏輯的

發(fā)掘,從而提升審計(jì)效率和效果;

e)內(nèi)部控制測(cè)評(píng)方法:對(duì)內(nèi)部控制制度進(jìn)行調(diào)查、測(cè)試和評(píng)價(jià)的過程。

4.8.3.服務(wù)要求

包括但不限于以下八個(gè)層面:

a)數(shù)據(jù)安全性檢查:確保數(shù)據(jù)的安全性,包括數(shù)據(jù)的保密性、完整性和可用性。檢查

數(shù)據(jù)是否被非授權(quán)人員訪問、修改或刪除,是否存在數(shù)據(jù)泄露的風(fēng)險(xiǎn);

b)數(shù)據(jù)隱私保護(hù)檢查:確保數(shù)據(jù)的隱私得到保護(hù),符合相關(guān)隱私法規(guī)和政策要求。檢

查數(shù)據(jù)是否包含個(gè)人敏感信息,是否經(jīng)過適當(dāng)?shù)募用芎兔撁籼幚?,是否存在未?jīng)授權(quán)的

數(shù)據(jù)共享行為;

c)數(shù)據(jù)正確性檢查:確保數(shù)據(jù)的準(zhǔn)確性和一致性,避免數(shù)據(jù)錯(cuò)誤和冗余。檢查數(shù)據(jù)是

否符合預(yù)期的格式和結(jié)構(gòu),是否存在數(shù)據(jù)不一致的情況,是否存在重復(fù)、缺失或錯(cuò)誤的

數(shù)據(jù)記錄;

d)數(shù)據(jù)備份和恢復(fù)檢查:確保數(shù)據(jù)有備份和恢復(fù)的能力,以應(yīng)對(duì)數(shù)據(jù)丟失或損壞的風(fēng)

險(xiǎn)。檢查數(shù)據(jù)備份策略和機(jī)制是否合理,是否能夠及時(shí)恢復(fù)數(shù)據(jù),并測(cè)試數(shù)據(jù)恢復(fù)的可北京電子商會(huì)

行性和有效性;

e)數(shù)據(jù)訪問控制檢查:確保數(shù)據(jù)的訪問受到限制,只有合法授權(quán)的人員才能訪問數(shù)據(jù)。

檢查數(shù)據(jù)的訪問權(quán)限設(shè)置是否合理,是否存在未經(jīng)授權(quán)的數(shù)據(jù)訪問行為,是否有足夠的

日志記錄和監(jiān)控機(jī)制;

f)數(shù)據(jù)存儲(chǔ)和傳輸安全檢查:確保數(shù)據(jù)在存儲(chǔ)和傳輸過程中的安全性。檢查數(shù)據(jù)存儲(chǔ)

設(shè)備和環(huán)境的安全性,包括物理安全和網(wǎng)絡(luò)安全;檢查數(shù)據(jù)傳輸通道的加密和認(rèn)證機(jī)制,

確保數(shù)據(jù)在傳輸過程中不被篡改或竊?。?/p>

g)數(shù)據(jù)合規(guī)性審計(jì)檢查:定期進(jìn)行數(shù)據(jù)合規(guī)性審計(jì),評(píng)估數(shù)據(jù)合規(guī)性的有效性和可靠

性。檢查數(shù)據(jù)合規(guī)性審計(jì)的方法和流程是否合理,是否能夠及時(shí)發(fā)現(xiàn)和糾正數(shù)據(jù)合規(guī)性

1

問題;

h)數(shù)據(jù)安全培訓(xùn)和意識(shí)檢查:確保組織內(nèi)部員工對(duì)數(shù)據(jù)安全合規(guī)的重要性有清晰的認(rèn)

識(shí)和理解。檢查是否有進(jìn)行數(shù)據(jù)安全培訓(xùn)和意識(shí)教育的機(jī)制,是否有有效的內(nèi)部溝通和

宣傳,以提高員工的數(shù)據(jù)安全意識(shí)和合規(guī)意識(shí)。

5.數(shù)據(jù)應(yīng)用服務(wù)商管理要求

5.1.基本要求

5.1.1.資質(zhì)信用

a)具有獨(dú)立法人資格,獲得數(shù)據(jù)管理、數(shù)據(jù)安全、數(shù)據(jù)合規(guī)相關(guān)認(rèn)證證書不少于1

個(gè);

b)未被列入企業(yè)經(jīng)營異常名錄、嚴(yán)重違法失信名單(黑名單);

c)不存在嚴(yán)重漏繳、欠繳稅款情況,近兩年未發(fā)生過重大安全、重大質(zhì)量事故或嚴(yán)重

違法行為;

5.1.2.組織建設(shè)要求

a)建立數(shù)據(jù)應(yīng)用服務(wù)組織,建立數(shù)據(jù)體系配套的權(quán)責(zé)明確且內(nèi)部溝通順暢的組織,確

保數(shù)據(jù)規(guī)劃的實(shí)施;

b)崗位設(shè)置,建立數(shù)據(jù)管理所需的崗位,明確崗位的職責(zé),任職要求等;

c)團(tuán)隊(duì)建設(shè),制定團(tuán)隊(duì)培訓(xùn)、能力提升計(jì)劃,通過引入內(nèi)部、外部資源定期開展人員

培訓(xùn),提升團(tuán)隊(duì)人員的數(shù)據(jù)治理技能;

d)數(shù)據(jù)歸口管理,明確數(shù)據(jù)所有人、管理人等相關(guān)角色,以及數(shù)據(jù)的歸口的具體管理

人員;

e)建立績效評(píng)價(jià)體系,根據(jù)團(tuán)隊(duì)人員職責(zé)、管理數(shù)據(jù)范圍的劃分,制定相關(guān)人員的績

效考核體系。

5.1.3.制度規(guī)范要求

5.1.3.1.制定數(shù)據(jù)應(yīng)用服務(wù)制度框架,根據(jù)數(shù)據(jù)職能的層次和授權(quán)決策次序,數(shù)據(jù)制度框

架分為政策、辦法、細(xì)則三個(gè)層次,該框架規(guī)定了數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用的具體領(lǐng)域、各個(gè)數(shù)

據(jù)職能領(lǐng)域內(nèi)的目標(biāo)、遵循的行動(dòng)原則、完成的明確任務(wù)、實(shí)行的工作方式、采取的一般步

驟和具體措施。

a)數(shù)據(jù)政策說明數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用的目的,明確其組織與范圍;

b)數(shù)據(jù)應(yīng)用管理辦法是為數(shù)據(jù)管理和數(shù)據(jù)應(yīng)用各領(lǐng)域內(nèi)活動(dòng)開展而規(guī)定的相關(guān)規(guī)則北京電子商會(huì)

和流程;

c)數(shù)據(jù)應(yīng)用管理細(xì)則是為確保各數(shù)據(jù)方法執(zhí)行落實(shí)而制定的相關(guān)文件。

5.1.3.2.數(shù)據(jù)制度發(fā)布,組織內(nèi)部通過文件、郵件等形式發(fā)布審批通過的數(shù)據(jù)制度。

5.1.3.3.數(shù)據(jù)制度宣貫,定期開展數(shù)據(jù)制度相關(guān)的培訓(xùn)、宣傳工作。

5.1.3.4.數(shù)據(jù)制度實(shí)施,結(jié)合數(shù)據(jù)組織的設(shè)置,推動(dòng)數(shù)據(jù)制度的落地實(shí)施。

5.1.4.技術(shù)創(chuàng)新能力

主要考察企業(yè)標(biāo)準(zhǔn)規(guī)范制定、知識(shí)產(chǎn)權(quán)、研發(fā)投入占比等情況,具體如下:

1

a)參與數(shù)據(jù)治理、數(shù)據(jù)管理、數(shù)據(jù)交換、數(shù)據(jù)交易、數(shù)據(jù)資產(chǎn)、價(jià)值評(píng)估等數(shù)據(jù)相關(guān)

的國家、行業(yè)、地方或團(tuán)體標(biāo)準(zhǔn)制定不少于1項(xiàng);

b)與數(shù)據(jù)應(yīng)用服務(wù)相關(guān)的科研立項(xiàng)、專利、軟件著作權(quán)、著作、獲獎(jiǎng)等情況不少于

10個(gè);

c)上兩個(gè)年度與數(shù)據(jù)業(yè)務(wù)相關(guān)研發(fā)成本占經(jīng)營成本的比重不少于3%。

5.1.5.人員要求

a)建立了數(shù)據(jù)應(yīng)用服務(wù)團(tuán)隊(duì),明確了相關(guān)崗位職責(zé);

b)具有專職負(fù)責(zé)數(shù)據(jù)應(yīng)用服務(wù)管理人員,擁有大數(shù)據(jù)管理應(yīng)用領(lǐng)域相關(guān)從業(yè)證書;

c)設(shè)立首席數(shù)據(jù)官(CDO),明確崗位職責(zé),并與首席信息官(CIO)、首席技術(shù)官(CTO)

等協(xié)同推動(dòng)數(shù)據(jù)應(yīng)用服務(wù)。

5.2.評(píng)價(jià)要求

5.2.1.評(píng)價(jià)維度

5.2.1.1.數(shù)據(jù)應(yīng)用服務(wù)過程

考察企業(yè)數(shù)據(jù)應(yīng)用服務(wù)的深度和廣度,主要數(shù)據(jù)應(yīng)用服務(wù)如下:

a)采集匯聚服務(wù):可根據(jù)數(shù)據(jù)量和處理需求,選擇合適的采集方式、工具、技術(shù)架構(gòu)

進(jìn)行數(shù)據(jù)的采集與匯聚,并保證數(shù)據(jù)的可信性與可用性;

b)傳輸交互服務(wù):能夠根據(jù)實(shí)際需要,選用適合的方式進(jìn)行數(shù)據(jù)傳輸,可通過加密、

壓縮、校驗(yàn)、流量控制等手段保證數(shù)據(jù)傳輸?shù)耐暾?zhǔn)確、及時(shí)和保密;

c)加工處理服務(wù):可實(shí)現(xiàn)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)處理,具有數(shù)據(jù)架構(gòu)、數(shù)據(jù)集成、及

復(fù)雜數(shù)據(jù)加工的能力,具備數(shù)據(jù)質(zhì)量檢查、質(zhì)量分析、質(zhì)量提升的能力;

d)分析建模服務(wù):具備常規(guī)報(bào)表分析、多維分析、動(dòng)態(tài)預(yù)警、趨勢(shì)預(yù)報(bào)中的一種或多

種數(shù)據(jù)分析建模能力;

e)數(shù)據(jù)應(yīng)用服務(wù):提供數(shù)據(jù)應(yīng)用服務(wù)目錄,能夠以數(shù)據(jù)分析結(jié)果、數(shù)據(jù)服務(wù)調(diào)用接口、

數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)平臺(tái)等形式提供服務(wù),可滿足相關(guān)安全、質(zhì)量、監(jiān)控等的要求;

f)數(shù)據(jù)安全:符合國家、行業(yè)等監(jiān)管要求,具有數(shù)據(jù)標(biāo)準(zhǔn)及數(shù)據(jù)安全管理策略,具備

數(shù)據(jù)安全保障技術(shù)能力,能夠保障數(shù)據(jù)的合規(guī)性、隱私性;

g)存力算力:針對(duì)不同數(shù)據(jù)應(yīng)用服務(wù)場(chǎng)景可提供不同規(guī)模的存算能力,存力算力可彈

性擴(kuò)展、可計(jì)量;

h)合規(guī)檢查:通過對(duì)數(shù)據(jù)安全性、隱私保護(hù)、正確性、備份恢復(fù)、訪問控制、存儲(chǔ)傳

輸安全、合規(guī)性審計(jì)和安全培訓(xùn)意識(shí)等方面的檢查,可以確保數(shù)據(jù)符合相關(guān)法律和政策

要求,提高數(shù)據(jù)的安全性和可信度。北京電子商會(huì)

5.2.1.2.數(shù)據(jù)應(yīng)用領(lǐng)域和場(chǎng)景

考察企業(yè)在重點(diǎn)領(lǐng)域的數(shù)據(jù)應(yīng)用情況,以及數(shù)據(jù)應(yīng)用服務(wù)場(chǎng)景情況,具體如下:

a)具有政務(wù)、金融、能源、電信、科研、商貿(mào)、交通、醫(yī)療、教育、工業(yè)等重點(diǎn)領(lǐng)域

數(shù)據(jù)應(yīng)用服務(wù)案例,考察數(shù)據(jù)應(yīng)用領(lǐng)域的覆蓋面;

b)擁有成熟的數(shù)據(jù)應(yīng)用服務(wù)場(chǎng)景,能夠滿足可擴(kuò)展、可移植、可視化的數(shù)據(jù)應(yīng)用服務(wù)

需求,考察數(shù)據(jù)應(yīng)用場(chǎng)景的數(shù)量;

c)企業(yè)提供的數(shù)據(jù)應(yīng)用服務(wù)的跨領(lǐng)域情況。

5.2.1.3.數(shù)據(jù)應(yīng)用量級(jí)

1

考察數(shù)據(jù)應(yīng)用服務(wù)的數(shù)據(jù)量級(jí),以及重要數(shù)據(jù)、內(nèi)外部數(shù)據(jù)的量級(jí)情況,具體如下:

a)能夠保障數(shù)據(jù)應(yīng)用服務(wù)業(yè)務(wù)正常開展的數(shù)據(jù)規(guī)模量級(jí);

b)考察企業(yè)數(shù)據(jù)應(yīng)用服務(wù)場(chǎng)景中所涉及的重要數(shù)據(jù)應(yīng)用量級(jí);

c)考察企業(yè)數(shù)據(jù)應(yīng)用服務(wù)場(chǎng)景中所涉及的內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)應(yīng)用量級(jí)。

5.2.1.4.數(shù)據(jù)應(yīng)用效益

考察數(shù)據(jù)應(yīng)用服務(wù)的社會(huì)效益和經(jīng)濟(jì)效益情況,具體如下:

a)考察企業(yè)數(shù)據(jù)應(yīng)用服務(wù)能夠創(chuàng)造的社會(huì)效益情況;

b)企業(yè)數(shù)據(jù)應(yīng)用服務(wù)能夠創(chuàng)造的經(jīng)濟(jì)效益情況,考察平均年度營業(yè)收入金額。

5.2.1.5.數(shù)據(jù)應(yīng)用保障

考察企業(yè)在日常數(shù)據(jù)應(yīng)用服務(wù)過程中的人員保障、資金投入、技術(shù)環(huán)境等情況,具體如

下:

a)數(shù)據(jù)應(yīng)用服務(wù)投入的相關(guān)高級(jí)管理人員和專職工作人員情況;

b)具有明確、穩(wěn)定的數(shù)據(jù)應(yīng)用服務(wù)保障資金投入;

c)具有與數(shù)據(jù)應(yīng)用服務(wù)相適應(yīng)的場(chǎng)所、軟硬件設(shè)施等技術(shù)和安全支撐環(huán)境。

5.2.2.評(píng)價(jià)等級(jí)

5.2.2.1.一級(jí):初始級(jí)

數(shù)據(jù)應(yīng)用服務(wù)主要是在項(xiàng)目級(jí)體現(xiàn),沒有統(tǒng)一的流程,主要是被動(dòng)式管理,具體特征如

下:

a)企業(yè)在制定決策時(shí),未獲得充分的數(shù)據(jù)應(yīng)用服務(wù)支持;

b)沒有正式的數(shù)據(jù)應(yīng)用制度、數(shù)據(jù)應(yīng)用管理組織和流程等;

c)業(yè)務(wù)部門各自管理自己的數(shù)據(jù)應(yīng)用,各業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)存在不一致現(xiàn)象,企業(yè)

未意識(shí)到數(shù)據(jù)應(yīng)用服務(wù)的重要性。

5.2.2.2.二級(jí):基本級(jí)

企業(yè)已意識(shí)到數(shù)據(jù)應(yīng)用服務(wù)的重要性,根據(jù)管理策略的制定了管理流程,指定了相關(guān)人

員進(jìn)行管理,具體特征如下:

a)意識(shí)到數(shù)據(jù)應(yīng)用服務(wù)的重要性,并制定部分?jǐn)?shù)據(jù)應(yīng)用服務(wù)規(guī)范;

b)企業(yè)內(nèi)部開展了數(shù)據(jù)應(yīng)用服務(wù)工作,設(shè)置了數(shù)據(jù)應(yīng)用服務(wù)相關(guān)崗位;

c)企業(yè)開始進(jìn)行了一些重要數(shù)據(jù)的文檔工作,對(duì)重要數(shù)據(jù)應(yīng)用的安全、風(fēng)險(xiǎn)等方面建

立相關(guān)管理措施;

d)具備對(duì)外提供數(shù)據(jù)應(yīng)用服務(wù)能力,具有自主知識(shí)產(chǎn)權(quán)的數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)。北京電子商會(huì)

5.2.2.3.三級(jí):良好級(jí)

數(shù)據(jù)應(yīng)用服務(wù)已被當(dāng)做實(shí)現(xiàn)企業(yè)績效目標(biāo)的重要業(yè)務(wù),在組織層面制定了系列的標(biāo)準(zhǔn)化

管理流程,促進(jìn)數(shù)據(jù)應(yīng)用服務(wù)管理的規(guī)范化,具體特征如下:

a)在機(jī)構(gòu)內(nèi)部建立了數(shù)據(jù)應(yīng)用服務(wù)管理的規(guī)章制度;

b)數(shù)據(jù)應(yīng)用服務(wù)能結(jié)合企業(yè)的業(yè)務(wù)戰(zhàn)略、經(jīng)營管理需求以及外部監(jiān)管需求;

c)建立了相關(guān)數(shù)據(jù)應(yīng)用服務(wù)組織、管理流程,能推動(dòng)組織內(nèi)各部門按流程開展工作;

d)已具備對(duì)外提供良好數(shù)據(jù)應(yīng)用服務(wù)支撐能力,建立了明確的數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù)目

錄清單,并進(jìn)行合理收費(fèi)。

1

5.2.2.4.四級(jí):優(yōu)秀級(jí)

數(shù)據(jù)應(yīng)用服務(wù)被認(rèn)為是獲取競(jìng)爭優(yōu)勢(shì)的重要方向,數(shù)據(jù)應(yīng)用服務(wù)的效率能量化分析和監(jiān)

控,具體特征如下:

a)在組織層面認(rèn)識(shí)到數(shù)據(jù)應(yīng)用服務(wù)是企業(yè)的戰(zhàn)略方向,了解數(shù)據(jù)應(yīng)用服務(wù)的重要作用,

已列入企業(yè)發(fā)展戰(zhàn)略;

b)在組織層面可測(cè)量數(shù)據(jù)應(yīng)用服務(wù)服務(wù)能力并及時(shí)優(yōu)化;

c)在數(shù)據(jù)應(yīng)用服務(wù)過程中充分借鑒了行業(yè)最佳案例以及國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)等外部資

源,促進(jìn)企業(yè)本身的數(shù)據(jù)應(yīng)用服務(wù)能力的提升。

5.2.2.5.五級(jí):卓越級(jí)

數(shù)據(jù)應(yīng)用服務(wù)被認(rèn)為是企業(yè)發(fā)展的核心,能在行業(yè)內(nèi)進(jìn)行最佳實(shí)踐分享,具體特征如下:

a)企業(yè)將數(shù)據(jù)應(yīng)用服務(wù)作為核心競(jìng)爭力,利用數(shù)據(jù)應(yīng)用服務(wù)創(chuàng)造更多的價(jià)值;

b)能將企業(yè)自身數(shù)據(jù)應(yīng)用服務(wù)能力建設(shè)的經(jīng)驗(yàn)作為行業(yè)最佳案例進(jìn)行推廣。

6.數(shù)據(jù)應(yīng)用服務(wù)商的權(quán)益

6.1.概述

數(shù)據(jù)應(yīng)用服務(wù)商,指面向“采集匯聚、傳輸交互、加工處理、分析建模、數(shù)據(jù)服務(wù)、數(shù)

據(jù)安全、存力算力”等各個(gè)數(shù)據(jù)價(jià)值實(shí)現(xiàn)環(huán)節(jié)提供服務(wù)的市場(chǎng)主體。數(shù)據(jù)應(yīng)用服務(wù)商在遵守

國家相關(guān)法律法規(guī),保證數(shù)據(jù)安全的前提下,對(duì)合法取得的數(shù)據(jù)資源或數(shù)據(jù)產(chǎn)品享有相應(yīng)的

數(shù)據(jù)資源持有、數(shù)據(jù)加工使用和數(shù)據(jù)產(chǎn)品經(jīng)營等相關(guān)權(quán)利。

a)數(shù)據(jù)資源持有權(quán)是指在相關(guān)法律法規(guī)或合同約定下,相關(guān)主體可對(duì)數(shù)據(jù)資源進(jìn)行管

理、使用、收益等行為;

b)數(shù)據(jù)加工使用權(quán)是指在相關(guān)法律法規(guī)或合同約定下,相關(guān)主體以各種方式、技術(shù)手

段對(duì)數(shù)據(jù)進(jìn)行采集、使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論