TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第1頁
TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第2頁
TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第3頁
TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第4頁
TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

T/TAF137—2022

基于差分隱私的用戶個人信息保護技術(shù)要求

1范圍

本文件規(guī)范了基于差分隱私的用戶個人信息保護技術(shù)要求,包括差分隱私系統(tǒng)技術(shù)架構(gòu)、差分隱

私能力要求、差分隱私保護分級、差分隱私保護效果評定。

本文件適用于應(yīng)用在移動智能終端的差分隱私技術(shù),也適用于評估機構(gòu)基于本文件開展差分隱私

產(chǎn)品保護個人信息的評估工作。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文

件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適

用于本文件。

GB/T25069-2022信息安全技術(shù)術(shù)語

GB/T35273-2020信息安全技術(shù)個人信息安全規(guī)范

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

3.1

差分隱私differentialprivacy

一種個人信息的數(shù)據(jù)保護技術(shù),通過隨機響應(yīng)或?qū)υ紨?shù)據(jù)加入噪聲的方式,使得對數(shù)據(jù)集的計

算處理結(jié)果對于具體某個記錄的變化是不敏感的,單個記錄在或不在數(shù)據(jù)集中,對計算結(jié)果的影響微

乎其微,并能保護個人信息不被泄露。

注:差分隱私保護重在提供可度量的數(shù)據(jù)隱私保護方法。

3.2

隱私預(yù)算privacybudget

衡量差分隱私保護效果的參數(shù),在一定程度上給出了隱私保護效果的度量。

注:隱私預(yù)算越小,對數(shù)據(jù)的隱私保護程度越強,但是數(shù)據(jù)的可用性越差;隱私預(yù)算越大,數(shù)據(jù)的可用性越好,

但是隱私保護能力越差。

3.3

本地差分隱私localdifferentialprivacy

不依賴于可信第三方,直接在終端進行數(shù)據(jù)的隱私化處理,處理后的數(shù)據(jù)滿足差分隱私保護要求。

1

T/TAF137—2022

3.4

中心化差分隱私centralizeddifferentialprivacy

將原始終端數(shù)據(jù)集中到一個可信第三方,由第三方對數(shù)據(jù)進行處理,處理后的數(shù)據(jù)滿足差分隱私保

護要求。

3.5

編碼器encoder

智能終端上對原始個人信息進行編碼、加噪等處理的組件。

3.6

數(shù)據(jù)管理器datacurator

對從智能終端接收到的數(shù)據(jù)進行解密、存儲、聚合等操作,并根據(jù)查詢請求進行數(shù)據(jù)處理和添加

噪聲,對查詢進行隱私預(yù)算管理,最終發(fā)布滿足差分隱私要求結(jié)果的組件。

3.7

數(shù)據(jù)信道datachannel

實現(xiàn)數(shù)據(jù)在終端(編碼器)、數(shù)據(jù)管理器和查詢處理器之間流轉(zhuǎn)的組件。

3.8

查詢處理器queryprocessor

發(fā)起數(shù)據(jù)查詢請求并接受結(jié)果的實體。

3.9

數(shù)據(jù)采集者datacollector

在過程中負責(zé)采集數(shù)據(jù)的實體,可以為數(shù)據(jù)管理器或查詢處理器。

4縮略語

下列縮略語適用于本文件。

LDP:本地差分隱私(LocalDifferentialPrivacy)

TLCP:傳輸層密碼協(xié)議(TransportLayerCryptographicProtocol)

TLS:傳輸層安全協(xié)議(TransportLayerSecurity)

5概述

5.1差分隱私用于個人信息保護

2

T/TAF137—2022

數(shù)據(jù)處理是數(shù)字經(jīng)濟社會生產(chǎn)中的重要步驟,數(shù)據(jù)集通常包含大量的個人隱私數(shù)據(jù),企業(yè)在業(yè)務(wù)

中對數(shù)據(jù)處理不當可能會造成個人隱私的泄露?!秱€人信息保護法》等對企業(yè)數(shù)據(jù)處理行為中的個人

信息保護提出了要求,企業(yè)須采取措施確保數(shù)據(jù)處理過程中個人信息不被泄露。

差分隱私是針對數(shù)據(jù)隱私泄露問題提出的一種隱私保護方法。在此定義下,對數(shù)據(jù)集的計算處理

結(jié)果對于某條具體記錄的變化是不敏感的,單條記錄存在或不存在數(shù)據(jù)集中,對計算結(jié)果的影響微乎

其微。所以,一條記錄因其加入到數(shù)據(jù)集中所產(chǎn)生的隱私泄露風(fēng)險被控制在極小的、可接受的范圍內(nèi),

攻擊者無法通過觀察計算結(jié)果而獲取準確的個體信息,從而在數(shù)據(jù)發(fā)布、查詢等過程中保護個體信息

隱私。通常,差分隱私通過在真實數(shù)據(jù)中加入隨機化噪聲擾動的方式來實現(xiàn)保護。

5.2差分隱私的概述

差分隱私技術(shù)可以分為中心化差分隱私和本地化差分隱私。中心化差分隱私定義為假設(shè)有隨機算

法,為所有可能輸出結(jié)果構(gòu)成的集合,表示概率,對于任意兩個差別只有1條記錄的相鄰數(shù)

據(jù)集′,如果滿足:

則稱算法提供(?,)-中心化差分隱私保護,其中?為差分隱私預(yù)算,用來保證數(shù)據(jù)集中增加或

者減少一條記錄,隨機算法M的輸出結(jié)果一致的概率;指算法有的概率不滿足?-DP.

本地化差分隱私與中心化差分隱私不同,用戶之間并不能知道相互之間的記錄,也沒有一個中心

化的數(shù)據(jù)管理器,因此在本地化差分隱私中,我們將兩個相鄰數(shù)據(jù)集替換成兩條來自不同用戶的不同

記錄。本地差分隱私定義為,假設(shè)有隨機算法,t為的任意一個輸出結(jié)果,表示概率,對于

任意兩條記錄′,如果滿足:

則稱算法提供(?,)-本地化差分隱私保護,其中?為差分隱私預(yù)算,用來保證任意兩個用戶的

記錄,隨機算法M的輸出結(jié)果一致的概率;指算法有的概率不滿足?-DP。

在相同數(shù)據(jù)集和使用相同的差分隱私算法的前提下,差分隱私預(yù)算?越小,隱私保護效果越好。

特別地,δ表示大小為常數(shù)的概率擾動,是允許隨機算法在一定程度上不滿足差分隱私嚴格定義

的一個松弛項。具體地,當δ=0時,我們稱(?,δ)-差分隱私為?-差分隱私。當δ>0時,(?,δ)-差分

隱私相對?-差分隱私而言很大可能會存在概率大于0的額外信息泄露。故我們稱?-差分隱私是嚴格的差

分隱私定義,而(?,δ)-差分隱私則是松弛的差分隱私定義。

5.3差分隱私系統(tǒng)的技術(shù)架構(gòu)

5.3.1差分隱私數(shù)據(jù)處理框架

根據(jù)隱私計算框架中的數(shù)據(jù)管理器是否可信,可將移動智能終端個人信息保護的差分隱私數(shù)據(jù)處

理模式可分為兩種框架類型:

a)本地化差分隱私:包含終端與數(shù)據(jù)管理器兩種角色,數(shù)據(jù)管理器不可信。終端個人信息在添

加噪聲后向數(shù)據(jù)管理器發(fā)送,且數(shù)據(jù)管理器無法查看原始個人信息。

b)中心化差分隱私

包含終端與數(shù)據(jù)管理器兩種角色,數(shù)據(jù)管理器可信。終端個人信息直接發(fā)送并存儲于數(shù)據(jù)管

理器中,再由數(shù)據(jù)管理器對查詢結(jié)果添加噪聲??尚诺臄?shù)據(jù)管理器不會直接查看、共享個人

信息,也不會與攻擊者共謀。圖1中的信任邊界表示數(shù)據(jù)管理器是否被用戶終端信任。

3

T/TAF137—2022

圖1兩類差分隱私數(shù)據(jù)處理模式

5.3.2差分隱私系統(tǒng)組成與角色關(guān)系

基于差分隱私的個人信息保護系統(tǒng)常見組成結(jié)構(gòu)如圖1所示。系統(tǒng)的工作流程主要分為:

a)采集:終端對個人信息進行采集操作;

b)編碼:在本地化模式中,終端通過編碼器對個人信息進行編碼、加噪等處理;在中心化模式

中,終端通過編碼器對個人信息進行編碼等處理。

c)匯聚:終端將原始個人信息(中心化模式)或經(jīng)過編碼器加噪的數(shù)據(jù)(本地化模式)發(fā)送給

數(shù)據(jù)管理器;

d)查詢響應(yīng):數(shù)據(jù)管理器針對查詢請求,對從終端接受到的數(shù)據(jù)進行聚合、解碼、加噪等處理

后,輸出滿足差分隱私要求的查詢結(jié)果。在多次查詢場景中,數(shù)據(jù)管理器需進行隱私預(yù)算的

控制。

5.3.3差分隱私系統(tǒng)的分類

用于個人信息保護的差分隱私系統(tǒng)可以按以下維度進行分類:

a)差分隱私的算法分類

根據(jù)差分隱私算法支持的精度、預(yù)算分配合理性等,將算法分類為基礎(chǔ)差分隱私算法和優(yōu)化

差分隱私算法,見表1。

表1差分隱私算法

分類中心化差分隱私本地化差分隱私

基礎(chǔ)差分隱私算法拉普拉斯機制、指數(shù)機制DirectEncoding

優(yōu)化差分隱私算法階梯機制、幾何機制、高斯機制、高精度拉HistogramEncoding,Unary

普拉斯機制、高精度高斯機制、離散拉普拉Encoding,BinaryLocalHashing,

斯機制、離散高斯機制、Base2-指數(shù)機制、OptimalLocalHashing及其他證明

其他證明完備的中心化差分隱私機制完備的本地化差分隱私機制

b)查詢類型的分類

4

T/TAF137—2022

個人信息保護場景常見的差分隱私查詢類型包括:

1)頻數(shù)統(tǒng)計:分為多值頻數(shù)統(tǒng)計以及單值頻數(shù)統(tǒng)計,包括計數(shù)、眾數(shù)、直方圖、列聯(lián)表等

查詢;

2)均值統(tǒng)計:包括平均值等查詢;

3)極值查詢:包括極大值、極小值、Top-K等查詢;

4)數(shù)據(jù)挖掘與機器學(xué)習(xí):包括分類樹、支持向量機、對率回歸、K-均值等;

5)基礎(chǔ)統(tǒng)計估計:計數(shù),求和,平均數(shù),分位數(shù),最小值,最大值,方差等;

6)直方圖發(fā)布:普通直方圖發(fā)布、約束條件直方圖發(fā)布、本地差分隱私直方圖發(fā)布;

7)隱私保護統(tǒng)計問詢:隱私乘法權(quán)重、稀疏向量技術(shù)、合成數(shù)據(jù)集技術(shù);

8)支持靈活統(tǒng)計問詢(如SQL查詢等)。

6差分隱私能力要求

6.1總體要求

差分隱私能力總體要求見圖2,包括基礎(chǔ)能力要求、系統(tǒng)安全要求、算法安全要求、優(yōu)化算法要求、

場景化安全要求五部分,具體要求如下。

a)基礎(chǔ)能力要求包括協(xié)議模式、數(shù)據(jù)輸入、查詢模型、算法支持、數(shù)據(jù)可用性等差分隱私基本

能力要求;

b)系統(tǒng)數(shù)據(jù)安全要求包括數(shù)據(jù)采集安全、數(shù)據(jù)傳輸安全、輸出存儲安全等系統(tǒng)層面數(shù)據(jù)保護要

求;

c)算法安全要求包括參數(shù)安全、查詢安全、計算結(jié)果安全等算法層面安全要求;

d)優(yōu)化算法要求對差分隱私能力提出了進一步的能力要求和安全性要求;

e)場景化安全要求提出了在不同數(shù)據(jù)敏感場景下的安全保護差異化要求。

圖2差分隱私對個人信息保護的總體要求

6.2差分隱私基礎(chǔ)能力要求

6.2.1差分隱私模式

5

T/TAF137—2022

應(yīng)支持5.3.1中的至少一種差分隱私數(shù)據(jù)處理模式。

6.2.2數(shù)據(jù)輸入

數(shù)據(jù)輸入要求包括:

a)應(yīng)支持整數(shù)、小數(shù)、字符串等至少一種基本數(shù)據(jù)類型;

b)對于數(shù)值型數(shù)據(jù)、枚舉型數(shù)據(jù)應(yīng)添加適配于該類型的噪聲。

6.2.3查詢類型

對于支持數(shù)據(jù)查詢的差分隱私系統(tǒng),應(yīng)支持計數(shù)、均值、直方圖、頻率估計等至少一種常見查詢

類型。

6.2.4算法支持

應(yīng)支持5.3.3a)表1中基礎(chǔ)差分隱私算法中的至少一種算法。

6.2.5數(shù)據(jù)可用性要求

數(shù)據(jù)可用性要求包括數(shù)據(jù)一致性和數(shù)據(jù)準確性:

a)數(shù)據(jù)一致性:差分隱私處理后的數(shù)據(jù),不應(yīng)出現(xiàn)語義矛盾的情況,如應(yīng)滿足:計數(shù)問詢的統(tǒng)

計結(jié)果為正整數(shù)(包括0)、頻率估計中各個頻率的和為100%、且未出現(xiàn)不可能出現(xiàn)的枚舉

值、差分隱私機器學(xué)習(xí)輸出模型應(yīng)可直接執(zhí)行預(yù)測算法;

b)數(shù)據(jù)準確性:宜支持對數(shù)據(jù)準確性的評估,能根據(jù)理論給出差分隱私輸出數(shù)據(jù)的方差等統(tǒng)計

型指標,能使用統(tǒng)計性檢測等手段驗證滿足理論準確性結(jié)果。

6.3差分隱私系統(tǒng)數(shù)據(jù)安全要求

6.3.1數(shù)據(jù)采集安全

數(shù)據(jù)采集安全要求包括:

a)采集的數(shù)據(jù)及采集過程應(yīng)嚴格按照GB/T35273-2020執(zhí)行;

b)數(shù)據(jù)采集者收集、使用個人信息,應(yīng)當遵循合法、正當、必要的原則,公開收集、使用規(guī)則,

明示收集、使用信息的方式和范圍;

c)數(shù)據(jù)采集者應(yīng)制定標準的采集模板、數(shù)據(jù)采集方法、策略和規(guī)范,采集策略參數(shù)配置應(yīng)包括

采集周期、有效性、檢測時間、入口地址和采集深度等;

d)對于初次采集的數(shù)據(jù),宜用人工與技術(shù)相結(jié)合的方式根據(jù)其來源、類型或重要程度進行分類;

e)數(shù)據(jù)采集者宜明確數(shù)據(jù)來源、采集方式、采集范圍等內(nèi)容,并記錄存檔;

f)在數(shù)據(jù)采集前后應(yīng)采用校驗技術(shù)對數(shù)據(jù)完整性進行校驗。

g)針對端側(cè)采集經(jīng)過本地差分隱私算法處理后的個人信息的場景,應(yīng)在用戶協(xié)議等文本中對算

法的使用做出說明,滿足透明性要求。

6.3.2數(shù)據(jù)傳輸安全

數(shù)據(jù)傳輸安全要求包括:

a)數(shù)據(jù)傳輸時應(yīng)建立安全的通信信道,使用TLCP或TLSv1.2及以上版本進行通信;

6

T/TAF137—2022

b)應(yīng)采用密碼技術(shù)保證通信中數(shù)據(jù)的機密性和完整性保護,采用的密碼技術(shù)應(yīng)符合國家行業(yè)主

管部門和相應(yīng)國家標準和行業(yè)標準的要求。

6.3.3數(shù)據(jù)存儲安全

數(shù)據(jù)存儲安全要求包括:

a)應(yīng)采用密碼技術(shù)保證敏感個人信息的機密性保護,采用的密碼技術(shù)應(yīng)符合國家行業(yè)主管部門

和相應(yīng)國家標準和行業(yè)標準的要求;

b)應(yīng)設(shè)置合理的存儲期限,應(yīng)為實現(xiàn)個人信息主體授權(quán)使用的目的所必需的最短時間,對超期

數(shù)據(jù)進行刪除或匿名化處理。

6.4差分隱私算法安全要求

6.4.1概述

差分隱私參數(shù)?是差分隱私算法安全的重要參數(shù),但在實際過程中還包括系統(tǒng)設(shè)計、應(yīng)用場景等

多種因素,如擾動函數(shù)、相鄰數(shù)據(jù)集定義、保護粒度、實際使用過程中的查詢損耗、差分隱私計算結(jié)

果的分布情況等。差分隱私參數(shù)?的配置應(yīng)考慮多個因素,針對實際業(yè)務(wù)場景設(shè)置合理的大小。差分

隱私算法安全驗證建議按附錄C提供驗證信息清單,或自主提供完備的驗證方案和過程。本節(jié)給出其

中重要的參數(shù)和查詢、結(jié)果安全的基本要求。

注:差分隱私參數(shù)的配置可在參考文獻[3][6]中查看。

6.4.2參數(shù)安全

在采用?-DP定義的差分隱私應(yīng)用中,差分隱私參數(shù)?宜不大于以下基礎(chǔ)推薦值,以達到基本的

保護效果:

表2差分隱私參數(shù)基礎(chǔ)推薦值

基礎(chǔ)推薦值中心化差分隱私本地化差分隱私

?28

6.4.3查詢安全

在支持多次查詢(或LDP中的數(shù)據(jù)上傳)的場景中,應(yīng)采取措施保證累計查詢的預(yù)算消耗不超過

所聲明的差分隱私預(yù)算總量,如在一定時間內(nèi)合理限制查詢(上傳)次數(shù)。

6.4.4計算結(jié)果安全

計算結(jié)果安全要求包括:

a)應(yīng)確保算法計算過程中,除了計算結(jié)果和其可推導(dǎo)的信息外,不會泄露其他敏感數(shù)據(jù);

b)采用差分隱私保護后的計算結(jié)果的分布測量值,應(yīng)與所采用的差分隱私算法、參數(shù)兩者共同

計算的理論值保持一致。驗證過程建議按附錄B執(zhí)行,或自主提供完備的驗證方案和過程。

6.4.5差分隱私優(yōu)化算法要求

優(yōu)化算法能力要求

7

T/TAF137—2022

宜支持5.3.3a)表1中優(yōu)化差分隱私算法中的至少一種算法。

優(yōu)化算法安全性要求

對于聲明支持的優(yōu)化差分隱私機制及參數(shù),應(yīng)滿足6.4.1,6.4.2,6.4.3,6.4.4差分隱私算法安

全性要求。

6.5差分隱私場景化安全要求

6.5.1算法能力要求

對于不同的業(yè)務(wù)場景,應(yīng)具備能力來配置、優(yōu)化、組合使用已有成熟算法或設(shè)計新的算法,來解

決場景化業(yè)務(wù)問題,并提供報告說明可行性和安全性,報告內(nèi)容宜根據(jù)不同場景給出單獨的算法配置

說明,報告內(nèi)容參考附錄C。

6.5.2參數(shù)安全

對于不同的業(yè)務(wù)場景,應(yīng)根據(jù)不同的安全性要求對參數(shù)進行對應(yīng)的配置。如對于數(shù)據(jù)保護要求更

高的數(shù)據(jù)場景,應(yīng)設(shè)置更嚴格的差分隱私參數(shù)。對于采用-DP定義的差分隱私應(yīng)用,差分隱私參數(shù)

宜不大于以下場景化推薦值來達到差異化的保護強度:

表3差分隱私參數(shù)場景化推薦值

業(yè)務(wù)場景?場景化推薦值場景化推薦值

中心化差分隱私本地化差分隱私

金融0.25210-6

政務(wù)0.5410-5

醫(yī)療0.5410-5

其他1610-4

7差分隱私保護分級

7.1概述

根據(jù)差分隱私系統(tǒng)滿足第五章能力要求的程度,對于差分隱私的保護效果可將差分隱私保護系統(tǒng)

分為由低到高共3級。

表4差分隱私保護分級對應(yīng)表

6.2差分隱私基礎(chǔ)能力要6.3差分隱私系統(tǒng)數(shù)據(jù)安6.4差分隱私算法安6.5差分隱私場景化

求全要求全要求安全要求

1級√√——

2級√√√—

3級√√√√

7.21級

滿足差分隱私基礎(chǔ)能力要求和系統(tǒng)數(shù)據(jù)安全要求,能夠在數(shù)據(jù)采集、傳輸、存儲等過程滿足安全

要求的前提下,對查詢數(shù)據(jù)加入差分隱私噪聲進行擾動。

8

T/TAF137—2022

7.32級

在滿足1級要求的基礎(chǔ)上,滿足差分隱私算法安全要求,對差分隱私算法參數(shù)進行了正確配置,通

過了實驗驗證。驗證過程建議按附錄B執(zhí)行,或自主提供完備的驗證方案和過程。

7.43級

在滿足2級要求的基礎(chǔ)上,滿足差分隱私場景化安全要求,對于不同數(shù)據(jù)敏感程度的場景,提供差

異化的差分隱私保護等級。

8差分隱私保護效果評定

差分隱私保護效果評定流程如圖3所示:

圖3差分隱私保護效果評定流程

9

T/TAF137—2022

附錄A

(資料性)

應(yīng)用場景

在數(shù)據(jù)發(fā)布領(lǐng)域,支持差分隱私的數(shù)據(jù)發(fā)布算法的應(yīng)用包括但不限于社交網(wǎng)絡(luò)、地理位置服務(wù)

(LBS)、推薦系統(tǒng)。

在數(shù)據(jù)挖掘領(lǐng)域,差分隱私一般通過結(jié)合具體的挖掘算法,根據(jù)挖掘結(jié)果的性能指標進行調(diào)整,

以實現(xiàn)數(shù)據(jù)安全性和模型可用性之間的平衡。目前,支持差分隱私的數(shù)據(jù)挖掘算法的應(yīng)用包括:線性

回歸、邏輯回歸、決策樹、深度學(xué)習(xí)、聚類,隱私保護模型預(yù)測,決策樹構(gòu)造、頻繁模式挖掘、和聯(lián)

邦學(xué)習(xí)。

在本地差分隱私保護中,隱私保護數(shù)據(jù)從終端獲得后可以直接用于后續(xù)計算。具體支持以下場景:

a)發(fā)布終端的行為數(shù)據(jù):將用戶使用偏好等數(shù)據(jù)加入噪聲并發(fā)布,用于服務(wù)端統(tǒng)計數(shù)據(jù)分布;

b)發(fā)布終端數(shù)據(jù)統(tǒng)計信息:將終端原始數(shù)據(jù)進行求最大值,均值等統(tǒng)計后發(fā)布統(tǒng)計結(jié)果;

c)發(fā)布基于終端數(shù)據(jù)的預(yù)訓(xùn)練模型:終端上用原始數(shù)據(jù)進行訓(xùn)練得到模型,并將預(yù)訓(xùn)練模型進

行分享和發(fā)布。由于存在通過預(yù)訓(xùn)練模型推斷終端原始數(shù)據(jù)的風(fēng)險,因此需要在預(yù)訓(xùn)練過程

中或?qū)Y(jié)果模型進行隨機擾動以達到對原始數(shù)據(jù)的隱私保護。

在中心化差分隱私保護中,終端數(shù)據(jù)可能具備一定的差分隱私保護(或者沒有任何隱私保護),終

端數(shù)據(jù)通過在可信第三方聚合后進行計算并發(fā)布計算結(jié)果,具體支持以下場景:

a)分享基于眾多終端數(shù)據(jù)的統(tǒng)計信息:將終端原始數(shù)據(jù)安全聚合后進行求最大值,均值等統(tǒng)計

后發(fā)布統(tǒng)計結(jié)果;

b)聯(lián)邦學(xué)習(xí):目標是在保證終端用戶數(shù)據(jù)隱私安全及合法合規(guī)的基礎(chǔ)上,實現(xiàn)利用大量用戶數(shù)

據(jù)共同建模,提升人工智能模型的效果。

10

T/TAF137—2022

附錄B

(資料性)

測試方法

驗證差分隱私算法的執(zhí)行結(jié)果是否符合算法設(shè)置及參數(shù)配置,可參考以下測試過程。對于滿足

5.3.3a)表1的基礎(chǔ)差分隱私算法,宜按以下過程進行測試;對于優(yōu)化差分隱私算法,需給出合理的測

試評估標準和方法。測試內(nèi)容中的符號含義見表B.1。

表B.1符號含義

符號含義

差分隱私參數(shù)

輸入數(shù)據(jù)

輸入數(shù)據(jù)集

測試輪數(shù)

輸出加噪結(jié)果

輸入離散值的枚舉數(shù)量

a)拉普拉斯機制

輸入數(shù)據(jù):;

測試輪數(shù):;

結(jié)果驗證:對輸出的加噪結(jié)果進行統(tǒng)計,須滿足

1)加噪結(jié)果與輸入數(shù)據(jù)的絕對差的均值,與差分隱私參數(shù)的倒數(shù)接近一致,即

2)加噪結(jié)果的均值與輸入數(shù)據(jù)接近一致,即

b)指數(shù)機制

初始化:設(shè)定輸入數(shù)據(jù)有種可能,,原始數(shù)據(jù)集為。設(shè)定查詢函數(shù)

的功能為查詢眾數(shù),的輸出為。為每種輸出可能分別設(shè)定打分函

數(shù),,其中為輸入數(shù)據(jù)集中的元素數(shù)量。

輸入數(shù)據(jù)集:設(shè)定輸入數(shù)據(jù)集=

{1,

2,2,

3,3,3,

4,4,4,4,

5,5,5,5,5,

6,6,6,6,6,6,

7,7,7,7,7,7,7,

8,8,8,8,8,8,8,8,

11

T/TAF137—2022

9,9,9,9,9,9,9,9,9,

10,10,10,10,10,10,10,10,10,10}

測試輪數(shù):

結(jié)果驗證:對輸出的加噪結(jié)果進行統(tǒng)計,應(yīng)滿足

對于所有都成立。

c)DirectEncoding機制

初始化:設(shè)定輸入數(shù)據(jù)有種可能,。

輸入數(shù)據(jù):

測試輪數(shù):

結(jié)果驗證:對輸出的加噪結(jié)果進行統(tǒng)計,須滿足

1)輸出結(jié)果為的比例與理論值應(yīng)接近一致,即

2)輸出任意其他結(jié)果的比例與理論值應(yīng)接近一致,即

對于所有都成立。

12

T/TAF137—2022

附錄C

(資料性)

差分隱私算法安全驗證信息清單

驗證差分隱私算法安全的方案,可提供以下清單。

a)選擇使用的差分隱私模型M,見表C.1。

b)確定需要保護的數(shù)據(jù)類型T,見表C.2。

c)選擇需要進行擾動的查詢函數(shù)F,見表C.3。

d)選擇相鄰數(shù)據(jù)集定義A,見表C.4(可選)。

e)選擇敏感度定義S,見表C.5,及計算公式或上界(可選)。

f)選擇差分隱私定義D,見表C.6。

g)確定噪聲添加機制N,見表C.7。

h)選擇保護粒度G,見表C.8(可選)。

i)確定隱私預(yù)算B:總體的隱私預(yù)算、每個步驟消耗的隱私預(yù)算、使用的組合定理(串行、并

行)、哪些步驟使用了采樣使得隱私預(yù)算降低、哪些步驟因為后處理機制所以不消耗隱私預(yù)

算。

j)確定隱私預(yù)算消耗率R(可選):在多次使用同一數(shù)據(jù)集的情況下,其隱私保護能力會降低。

常用的方式有:限制用戶在多長的單位時間內(nèi)最多貢獻多少次數(shù)據(jù)、每個接口最多詢問請求

數(shù)據(jù)庫多少次。

k)確定數(shù)據(jù)情況(可選):樣本數(shù)量級、樣本屬性維度、樣本分布、數(shù)據(jù)之間的相關(guān)性,IID

或non-IID。

l)確定評估方法E:參考附錄B或自主提供實驗評估方法。

表C.1差分隱私模型(M)示例

差分隱私模型(M)中心化本地化

表C.2保護的數(shù)據(jù)類型(T)示例

數(shù)據(jù)類型(T)連續(xù)型離散型

表C.3擾動的查詢函數(shù)(F)示例

擾動函數(shù)(F)平均數(shù)中位數(shù)求和協(xié)方差直方圖SGD

表C.4相鄰數(shù)據(jù)集定義(A)示例

相鄰數(shù)據(jù)集定義(A)有界無界

注:有界(Bounded):數(shù)據(jù)量不變,等同于替換一條數(shù)據(jù);無界(Unbounded):數(shù)據(jù)量相差1,等同于刪除或

添加一條數(shù)據(jù)。

13

T/TAF137—2022

表C.5敏感度定義(S)示例

敏感度定義(S)全局敏感度局部敏感度

表C.6差分隱私定義(D)示例

差分隱私定義?-DP-DPConcentratedzeroRényiDP

(D)DPConcentrated

DP

表C.7噪聲機制(N)示例

噪聲機制(N)拉普拉斯機制指數(shù)機制高斯機制隨機響應(yīng)

表C.8保護粒度(G)示例

保護粒度(G)樣本級用戶級

注:數(shù)據(jù)集中可能包含了同一用戶在不同時間、不同空間的多條數(shù)據(jù),或數(shù)據(jù)間具有較強的相關(guān)性,這也稱為群

體隱私(GroupPrivacy)。

14

T/TAF137—2022

參考文獻

[1]中華人民共和國全國人民代表大會常務(wù)委員會,中華人民共和國個人信息保護法,2021年11

月.

[2]MironovI.,PandeyO.,ReingoldO.,VadhanS.(2009)ComputationalDifferential

Privacy.In:HaleviS.(eds)AdvancesinCryptology-CRYPTO2009.CRYPTO2009.Lecture

NotesinComputerScience,vol5677.Springer,Berlin,Heidelberg.

[3]/privacy/docs/Differential_Privacy_Overview.pdf

[4]Wang,Tianhao,etal."Locallydifferentiallyprivateprotocolsforfrequency

estimation."26th{USENIX}SecuritySymposium({USENIX}Security17).2017.

[5]Li,Ninghui,etal."Differentialprivacy:Fromtheorytopractice."Synthesis

LecturesonInformationSecurity,Privacy,&Trust8.4(2016):1-138.

[6]Lee,Jaewoo,andChrisClifton."Howmuchisenough?choosing?fordifferential

privacy."InternationalConferenceonInformationSecurity.Springer,Berlin,Heidelberg,

2011.

15

T/TAF137—2022

電信終端產(chǎn)業(yè)協(xié)會團體標準

基于差分隱私的用戶個人信息保護技術(shù)要求

T/TAF137—2022

*

版權(quán)所有侵權(quán)必究

電信終端產(chǎn)業(yè)協(xié)會印發(fā)

地址:北京市西城區(qū)新街口外大街28號

電話/p>

電子版發(fā)行網(wǎng)址:

ICS33.050

CCSM30

團體標準

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論