版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
T/TAF137—2022
基于差分隱私的用戶個人信息保護技術(shù)要求
1范圍
本文件規(guī)范了基于差分隱私的用戶個人信息保護技術(shù)要求,包括差分隱私系統(tǒng)技術(shù)架構(gòu)、差分隱
私能力要求、差分隱私保護分級、差分隱私保護效果評定。
本文件適用于應(yīng)用在移動智能終端的差分隱私技術(shù),也適用于評估機構(gòu)基于本文件開展差分隱私
產(chǎn)品保護個人信息的評估工作。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文
件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適
用于本文件。
GB/T25069-2022信息安全技術(shù)術(shù)語
GB/T35273-2020信息安全技術(shù)個人信息安全規(guī)范
3術(shù)語和定義
下列術(shù)語和定義適用于本文件。
3.1
差分隱私differentialprivacy
一種個人信息的數(shù)據(jù)保護技術(shù),通過隨機響應(yīng)或?qū)υ紨?shù)據(jù)加入噪聲的方式,使得對數(shù)據(jù)集的計
算處理結(jié)果對于具體某個記錄的變化是不敏感的,單個記錄在或不在數(shù)據(jù)集中,對計算結(jié)果的影響微
乎其微,并能保護個人信息不被泄露。
注:差分隱私保護重在提供可度量的數(shù)據(jù)隱私保護方法。
3.2
隱私預(yù)算privacybudget
衡量差分隱私保護效果的參數(shù),在一定程度上給出了隱私保護效果的度量。
注:隱私預(yù)算越小,對數(shù)據(jù)的隱私保護程度越強,但是數(shù)據(jù)的可用性越差;隱私預(yù)算越大,數(shù)據(jù)的可用性越好,
但是隱私保護能力越差。
3.3
本地差分隱私localdifferentialprivacy
不依賴于可信第三方,直接在終端進行數(shù)據(jù)的隱私化處理,處理后的數(shù)據(jù)滿足差分隱私保護要求。
1
T/TAF137—2022
3.4
中心化差分隱私centralizeddifferentialprivacy
將原始終端數(shù)據(jù)集中到一個可信第三方,由第三方對數(shù)據(jù)進行處理,處理后的數(shù)據(jù)滿足差分隱私保
護要求。
3.5
編碼器encoder
智能終端上對原始個人信息進行編碼、加噪等處理的組件。
3.6
數(shù)據(jù)管理器datacurator
對從智能終端接收到的數(shù)據(jù)進行解密、存儲、聚合等操作,并根據(jù)查詢請求進行數(shù)據(jù)處理和添加
噪聲,對查詢進行隱私預(yù)算管理,最終發(fā)布滿足差分隱私要求結(jié)果的組件。
3.7
數(shù)據(jù)信道datachannel
實現(xiàn)數(shù)據(jù)在終端(編碼器)、數(shù)據(jù)管理器和查詢處理器之間流轉(zhuǎn)的組件。
3.8
查詢處理器queryprocessor
發(fā)起數(shù)據(jù)查詢請求并接受結(jié)果的實體。
3.9
數(shù)據(jù)采集者datacollector
在過程中負責(zé)采集數(shù)據(jù)的實體,可以為數(shù)據(jù)管理器或查詢處理器。
4縮略語
下列縮略語適用于本文件。
LDP:本地差分隱私(LocalDifferentialPrivacy)
TLCP:傳輸層密碼協(xié)議(TransportLayerCryptographicProtocol)
TLS:傳輸層安全協(xié)議(TransportLayerSecurity)
5概述
5.1差分隱私用于個人信息保護
2
T/TAF137—2022
數(shù)據(jù)處理是數(shù)字經(jīng)濟社會生產(chǎn)中的重要步驟,數(shù)據(jù)集通常包含大量的個人隱私數(shù)據(jù),企業(yè)在業(yè)務(wù)
中對數(shù)據(jù)處理不當可能會造成個人隱私的泄露?!秱€人信息保護法》等對企業(yè)數(shù)據(jù)處理行為中的個人
信息保護提出了要求,企業(yè)須采取措施確保數(shù)據(jù)處理過程中個人信息不被泄露。
差分隱私是針對數(shù)據(jù)隱私泄露問題提出的一種隱私保護方法。在此定義下,對數(shù)據(jù)集的計算處理
結(jié)果對于某條具體記錄的變化是不敏感的,單條記錄存在或不存在數(shù)據(jù)集中,對計算結(jié)果的影響微乎
其微。所以,一條記錄因其加入到數(shù)據(jù)集中所產(chǎn)生的隱私泄露風(fēng)險被控制在極小的、可接受的范圍內(nèi),
攻擊者無法通過觀察計算結(jié)果而獲取準確的個體信息,從而在數(shù)據(jù)發(fā)布、查詢等過程中保護個體信息
隱私。通常,差分隱私通過在真實數(shù)據(jù)中加入隨機化噪聲擾動的方式來實現(xiàn)保護。
5.2差分隱私的概述
差分隱私技術(shù)可以分為中心化差分隱私和本地化差分隱私。中心化差分隱私定義為假設(shè)有隨機算
法,為所有可能輸出結(jié)果構(gòu)成的集合,表示概率,對于任意兩個差別只有1條記錄的相鄰數(shù)
據(jù)集′,如果滿足:
′
則稱算法提供(?,)-中心化差分隱私保護,其中?為差分隱私預(yù)算,用來保證數(shù)據(jù)集中增加或
者減少一條記錄,隨機算法M的輸出結(jié)果一致的概率;指算法有的概率不滿足?-DP.
本地化差分隱私與中心化差分隱私不同,用戶之間并不能知道相互之間的記錄,也沒有一個中心
化的數(shù)據(jù)管理器,因此在本地化差分隱私中,我們將兩個相鄰數(shù)據(jù)集替換成兩條來自不同用戶的不同
記錄。本地差分隱私定義為,假設(shè)有隨機算法,t為的任意一個輸出結(jié)果,表示概率,對于
任意兩條記錄′,如果滿足:
′
則稱算法提供(?,)-本地化差分隱私保護,其中?為差分隱私預(yù)算,用來保證任意兩個用戶的
記錄,隨機算法M的輸出結(jié)果一致的概率;指算法有的概率不滿足?-DP。
在相同數(shù)據(jù)集和使用相同的差分隱私算法的前提下,差分隱私預(yù)算?越小,隱私保護效果越好。
特別地,δ表示大小為常數(shù)的概率擾動,是允許隨機算法在一定程度上不滿足差分隱私嚴格定義
的一個松弛項。具體地,當δ=0時,我們稱(?,δ)-差分隱私為?-差分隱私。當δ>0時,(?,δ)-差分
隱私相對?-差分隱私而言很大可能會存在概率大于0的額外信息泄露。故我們稱?-差分隱私是嚴格的差
分隱私定義,而(?,δ)-差分隱私則是松弛的差分隱私定義。
5.3差分隱私系統(tǒng)的技術(shù)架構(gòu)
5.3.1差分隱私數(shù)據(jù)處理框架
根據(jù)隱私計算框架中的數(shù)據(jù)管理器是否可信,可將移動智能終端個人信息保護的差分隱私數(shù)據(jù)處
理模式可分為兩種框架類型:
a)本地化差分隱私:包含終端與數(shù)據(jù)管理器兩種角色,數(shù)據(jù)管理器不可信。終端個人信息在添
加噪聲后向數(shù)據(jù)管理器發(fā)送,且數(shù)據(jù)管理器無法查看原始個人信息。
b)中心化差分隱私
包含終端與數(shù)據(jù)管理器兩種角色,數(shù)據(jù)管理器可信。終端個人信息直接發(fā)送并存儲于數(shù)據(jù)管
理器中,再由數(shù)據(jù)管理器對查詢結(jié)果添加噪聲??尚诺臄?shù)據(jù)管理器不會直接查看、共享個人
信息,也不會與攻擊者共謀。圖1中的信任邊界表示數(shù)據(jù)管理器是否被用戶終端信任。
3
T/TAF137—2022
圖1兩類差分隱私數(shù)據(jù)處理模式
5.3.2差分隱私系統(tǒng)組成與角色關(guān)系
基于差分隱私的個人信息保護系統(tǒng)常見組成結(jié)構(gòu)如圖1所示。系統(tǒng)的工作流程主要分為:
a)采集:終端對個人信息進行采集操作;
b)編碼:在本地化模式中,終端通過編碼器對個人信息進行編碼、加噪等處理;在中心化模式
中,終端通過編碼器對個人信息進行編碼等處理。
c)匯聚:終端將原始個人信息(中心化模式)或經(jīng)過編碼器加噪的數(shù)據(jù)(本地化模式)發(fā)送給
數(shù)據(jù)管理器;
d)查詢響應(yīng):數(shù)據(jù)管理器針對查詢請求,對從終端接受到的數(shù)據(jù)進行聚合、解碼、加噪等處理
后,輸出滿足差分隱私要求的查詢結(jié)果。在多次查詢場景中,數(shù)據(jù)管理器需進行隱私預(yù)算的
控制。
5.3.3差分隱私系統(tǒng)的分類
用于個人信息保護的差分隱私系統(tǒng)可以按以下維度進行分類:
a)差分隱私的算法分類
根據(jù)差分隱私算法支持的精度、預(yù)算分配合理性等,將算法分類為基礎(chǔ)差分隱私算法和優(yōu)化
差分隱私算法,見表1。
表1差分隱私算法
分類中心化差分隱私本地化差分隱私
基礎(chǔ)差分隱私算法拉普拉斯機制、指數(shù)機制DirectEncoding
優(yōu)化差分隱私算法階梯機制、幾何機制、高斯機制、高精度拉HistogramEncoding,Unary
普拉斯機制、高精度高斯機制、離散拉普拉Encoding,BinaryLocalHashing,
斯機制、離散高斯機制、Base2-指數(shù)機制、OptimalLocalHashing及其他證明
其他證明完備的中心化差分隱私機制完備的本地化差分隱私機制
b)查詢類型的分類
4
T/TAF137—2022
個人信息保護場景常見的差分隱私查詢類型包括:
1)頻數(shù)統(tǒng)計:分為多值頻數(shù)統(tǒng)計以及單值頻數(shù)統(tǒng)計,包括計數(shù)、眾數(shù)、直方圖、列聯(lián)表等
查詢;
2)均值統(tǒng)計:包括平均值等查詢;
3)極值查詢:包括極大值、極小值、Top-K等查詢;
4)數(shù)據(jù)挖掘與機器學(xué)習(xí):包括分類樹、支持向量機、對率回歸、K-均值等;
5)基礎(chǔ)統(tǒng)計估計:計數(shù),求和,平均數(shù),分位數(shù),最小值,最大值,方差等;
6)直方圖發(fā)布:普通直方圖發(fā)布、約束條件直方圖發(fā)布、本地差分隱私直方圖發(fā)布;
7)隱私保護統(tǒng)計問詢:隱私乘法權(quán)重、稀疏向量技術(shù)、合成數(shù)據(jù)集技術(shù);
8)支持靈活統(tǒng)計問詢(如SQL查詢等)。
6差分隱私能力要求
6.1總體要求
差分隱私能力總體要求見圖2,包括基礎(chǔ)能力要求、系統(tǒng)安全要求、算法安全要求、優(yōu)化算法要求、
場景化安全要求五部分,具體要求如下。
a)基礎(chǔ)能力要求包括協(xié)議模式、數(shù)據(jù)輸入、查詢模型、算法支持、數(shù)據(jù)可用性等差分隱私基本
能力要求;
b)系統(tǒng)數(shù)據(jù)安全要求包括數(shù)據(jù)采集安全、數(shù)據(jù)傳輸安全、輸出存儲安全等系統(tǒng)層面數(shù)據(jù)保護要
求;
c)算法安全要求包括參數(shù)安全、查詢安全、計算結(jié)果安全等算法層面安全要求;
d)優(yōu)化算法要求對差分隱私能力提出了進一步的能力要求和安全性要求;
e)場景化安全要求提出了在不同數(shù)據(jù)敏感場景下的安全保護差異化要求。
圖2差分隱私對個人信息保護的總體要求
6.2差分隱私基礎(chǔ)能力要求
6.2.1差分隱私模式
5
T/TAF137—2022
應(yīng)支持5.3.1中的至少一種差分隱私數(shù)據(jù)處理模式。
6.2.2數(shù)據(jù)輸入
數(shù)據(jù)輸入要求包括:
a)應(yīng)支持整數(shù)、小數(shù)、字符串等至少一種基本數(shù)據(jù)類型;
b)對于數(shù)值型數(shù)據(jù)、枚舉型數(shù)據(jù)應(yīng)添加適配于該類型的噪聲。
6.2.3查詢類型
對于支持數(shù)據(jù)查詢的差分隱私系統(tǒng),應(yīng)支持計數(shù)、均值、直方圖、頻率估計等至少一種常見查詢
類型。
6.2.4算法支持
應(yīng)支持5.3.3a)表1中基礎(chǔ)差分隱私算法中的至少一種算法。
6.2.5數(shù)據(jù)可用性要求
數(shù)據(jù)可用性要求包括數(shù)據(jù)一致性和數(shù)據(jù)準確性:
a)數(shù)據(jù)一致性:差分隱私處理后的數(shù)據(jù),不應(yīng)出現(xiàn)語義矛盾的情況,如應(yīng)滿足:計數(shù)問詢的統(tǒng)
計結(jié)果為正整數(shù)(包括0)、頻率估計中各個頻率的和為100%、且未出現(xiàn)不可能出現(xiàn)的枚舉
值、差分隱私機器學(xué)習(xí)輸出模型應(yīng)可直接執(zhí)行預(yù)測算法;
b)數(shù)據(jù)準確性:宜支持對數(shù)據(jù)準確性的評估,能根據(jù)理論給出差分隱私輸出數(shù)據(jù)的方差等統(tǒng)計
型指標,能使用統(tǒng)計性檢測等手段驗證滿足理論準確性結(jié)果。
6.3差分隱私系統(tǒng)數(shù)據(jù)安全要求
6.3.1數(shù)據(jù)采集安全
數(shù)據(jù)采集安全要求包括:
a)采集的數(shù)據(jù)及采集過程應(yīng)嚴格按照GB/T35273-2020執(zhí)行;
b)數(shù)據(jù)采集者收集、使用個人信息,應(yīng)當遵循合法、正當、必要的原則,公開收集、使用規(guī)則,
明示收集、使用信息的方式和范圍;
c)數(shù)據(jù)采集者應(yīng)制定標準的采集模板、數(shù)據(jù)采集方法、策略和規(guī)范,采集策略參數(shù)配置應(yīng)包括
采集周期、有效性、檢測時間、入口地址和采集深度等;
d)對于初次采集的數(shù)據(jù),宜用人工與技術(shù)相結(jié)合的方式根據(jù)其來源、類型或重要程度進行分類;
e)數(shù)據(jù)采集者宜明確數(shù)據(jù)來源、采集方式、采集范圍等內(nèi)容,并記錄存檔;
f)在數(shù)據(jù)采集前后應(yīng)采用校驗技術(shù)對數(shù)據(jù)完整性進行校驗。
g)針對端側(cè)采集經(jīng)過本地差分隱私算法處理后的個人信息的場景,應(yīng)在用戶協(xié)議等文本中對算
法的使用做出說明,滿足透明性要求。
6.3.2數(shù)據(jù)傳輸安全
數(shù)據(jù)傳輸安全要求包括:
a)數(shù)據(jù)傳輸時應(yīng)建立安全的通信信道,使用TLCP或TLSv1.2及以上版本進行通信;
6
T/TAF137—2022
b)應(yīng)采用密碼技術(shù)保證通信中數(shù)據(jù)的機密性和完整性保護,采用的密碼技術(shù)應(yīng)符合國家行業(yè)主
管部門和相應(yīng)國家標準和行業(yè)標準的要求。
6.3.3數(shù)據(jù)存儲安全
數(shù)據(jù)存儲安全要求包括:
a)應(yīng)采用密碼技術(shù)保證敏感個人信息的機密性保護,采用的密碼技術(shù)應(yīng)符合國家行業(yè)主管部門
和相應(yīng)國家標準和行業(yè)標準的要求;
b)應(yīng)設(shè)置合理的存儲期限,應(yīng)為實現(xiàn)個人信息主體授權(quán)使用的目的所必需的最短時間,對超期
數(shù)據(jù)進行刪除或匿名化處理。
6.4差分隱私算法安全要求
6.4.1概述
差分隱私參數(shù)?是差分隱私算法安全的重要參數(shù),但在實際過程中還包括系統(tǒng)設(shè)計、應(yīng)用場景等
多種因素,如擾動函數(shù)、相鄰數(shù)據(jù)集定義、保護粒度、實際使用過程中的查詢損耗、差分隱私計算結(jié)
果的分布情況等。差分隱私參數(shù)?的配置應(yīng)考慮多個因素,針對實際業(yè)務(wù)場景設(shè)置合理的大小。差分
隱私算法安全驗證建議按附錄C提供驗證信息清單,或自主提供完備的驗證方案和過程。本節(jié)給出其
中重要的參數(shù)和查詢、結(jié)果安全的基本要求。
注:差分隱私參數(shù)的配置可在參考文獻[3][6]中查看。
6.4.2參數(shù)安全
在采用?-DP定義的差分隱私應(yīng)用中,差分隱私參數(shù)?宜不大于以下基礎(chǔ)推薦值,以達到基本的
保護效果:
表2差分隱私參數(shù)基礎(chǔ)推薦值
基礎(chǔ)推薦值中心化差分隱私本地化差分隱私
?28
6.4.3查詢安全
在支持多次查詢(或LDP中的數(shù)據(jù)上傳)的場景中,應(yīng)采取措施保證累計查詢的預(yù)算消耗不超過
所聲明的差分隱私預(yù)算總量,如在一定時間內(nèi)合理限制查詢(上傳)次數(shù)。
6.4.4計算結(jié)果安全
計算結(jié)果安全要求包括:
a)應(yīng)確保算法計算過程中,除了計算結(jié)果和其可推導(dǎo)的信息外,不會泄露其他敏感數(shù)據(jù);
b)采用差分隱私保護后的計算結(jié)果的分布測量值,應(yīng)與所采用的差分隱私算法、參數(shù)兩者共同
計算的理論值保持一致。驗證過程建議按附錄B執(zhí)行,或自主提供完備的驗證方案和過程。
6.4.5差分隱私優(yōu)化算法要求
優(yōu)化算法能力要求
7
T/TAF137—2022
宜支持5.3.3a)表1中優(yōu)化差分隱私算法中的至少一種算法。
優(yōu)化算法安全性要求
對于聲明支持的優(yōu)化差分隱私機制及參數(shù),應(yīng)滿足6.4.1,6.4.2,6.4.3,6.4.4差分隱私算法安
全性要求。
6.5差分隱私場景化安全要求
6.5.1算法能力要求
對于不同的業(yè)務(wù)場景,應(yīng)具備能力來配置、優(yōu)化、組合使用已有成熟算法或設(shè)計新的算法,來解
決場景化業(yè)務(wù)問題,并提供報告說明可行性和安全性,報告內(nèi)容宜根據(jù)不同場景給出單獨的算法配置
說明,報告內(nèi)容參考附錄C。
6.5.2參數(shù)安全
對于不同的業(yè)務(wù)場景,應(yīng)根據(jù)不同的安全性要求對參數(shù)進行對應(yīng)的配置。如對于數(shù)據(jù)保護要求更
高的數(shù)據(jù)場景,應(yīng)設(shè)置更嚴格的差分隱私參數(shù)。對于采用-DP定義的差分隱私應(yīng)用,差分隱私參數(shù)
宜不大于以下場景化推薦值來達到差異化的保護強度:
表3差分隱私參數(shù)場景化推薦值
業(yè)務(wù)場景?場景化推薦值場景化推薦值
中心化差分隱私本地化差分隱私
金融0.25210-6
政務(wù)0.5410-5
醫(yī)療0.5410-5
其他1610-4
7差分隱私保護分級
7.1概述
根據(jù)差分隱私系統(tǒng)滿足第五章能力要求的程度,對于差分隱私的保護效果可將差分隱私保護系統(tǒng)
分為由低到高共3級。
表4差分隱私保護分級對應(yīng)表
6.2差分隱私基礎(chǔ)能力要6.3差分隱私系統(tǒng)數(shù)據(jù)安6.4差分隱私算法安6.5差分隱私場景化
求全要求全要求安全要求
1級√√——
2級√√√—
3級√√√√
7.21級
滿足差分隱私基礎(chǔ)能力要求和系統(tǒng)數(shù)據(jù)安全要求,能夠在數(shù)據(jù)采集、傳輸、存儲等過程滿足安全
要求的前提下,對查詢數(shù)據(jù)加入差分隱私噪聲進行擾動。
8
T/TAF137—2022
7.32級
在滿足1級要求的基礎(chǔ)上,滿足差分隱私算法安全要求,對差分隱私算法參數(shù)進行了正確配置,通
過了實驗驗證。驗證過程建議按附錄B執(zhí)行,或自主提供完備的驗證方案和過程。
7.43級
在滿足2級要求的基礎(chǔ)上,滿足差分隱私場景化安全要求,對于不同數(shù)據(jù)敏感程度的場景,提供差
異化的差分隱私保護等級。
8差分隱私保護效果評定
差分隱私保護效果評定流程如圖3所示:
圖3差分隱私保護效果評定流程
9
T/TAF137—2022
附錄A
(資料性)
應(yīng)用場景
在數(shù)據(jù)發(fā)布領(lǐng)域,支持差分隱私的數(shù)據(jù)發(fā)布算法的應(yīng)用包括但不限于社交網(wǎng)絡(luò)、地理位置服務(wù)
(LBS)、推薦系統(tǒng)。
在數(shù)據(jù)挖掘領(lǐng)域,差分隱私一般通過結(jié)合具體的挖掘算法,根據(jù)挖掘結(jié)果的性能指標進行調(diào)整,
以實現(xiàn)數(shù)據(jù)安全性和模型可用性之間的平衡。目前,支持差分隱私的數(shù)據(jù)挖掘算法的應(yīng)用包括:線性
回歸、邏輯回歸、決策樹、深度學(xué)習(xí)、聚類,隱私保護模型預(yù)測,決策樹構(gòu)造、頻繁模式挖掘、和聯(lián)
邦學(xué)習(xí)。
在本地差分隱私保護中,隱私保護數(shù)據(jù)從終端獲得后可以直接用于后續(xù)計算。具體支持以下場景:
a)發(fā)布終端的行為數(shù)據(jù):將用戶使用偏好等數(shù)據(jù)加入噪聲并發(fā)布,用于服務(wù)端統(tǒng)計數(shù)據(jù)分布;
b)發(fā)布終端數(shù)據(jù)統(tǒng)計信息:將終端原始數(shù)據(jù)進行求最大值,均值等統(tǒng)計后發(fā)布統(tǒng)計結(jié)果;
c)發(fā)布基于終端數(shù)據(jù)的預(yù)訓(xùn)練模型:終端上用原始數(shù)據(jù)進行訓(xùn)練得到模型,并將預(yù)訓(xùn)練模型進
行分享和發(fā)布。由于存在通過預(yù)訓(xùn)練模型推斷終端原始數(shù)據(jù)的風(fēng)險,因此需要在預(yù)訓(xùn)練過程
中或?qū)Y(jié)果模型進行隨機擾動以達到對原始數(shù)據(jù)的隱私保護。
在中心化差分隱私保護中,終端數(shù)據(jù)可能具備一定的差分隱私保護(或者沒有任何隱私保護),終
端數(shù)據(jù)通過在可信第三方聚合后進行計算并發(fā)布計算結(jié)果,具體支持以下場景:
a)分享基于眾多終端數(shù)據(jù)的統(tǒng)計信息:將終端原始數(shù)據(jù)安全聚合后進行求最大值,均值等統(tǒng)計
后發(fā)布統(tǒng)計結(jié)果;
b)聯(lián)邦學(xué)習(xí):目標是在保證終端用戶數(shù)據(jù)隱私安全及合法合規(guī)的基礎(chǔ)上,實現(xiàn)利用大量用戶數(shù)
據(jù)共同建模,提升人工智能模型的效果。
10
T/TAF137—2022
附錄B
(資料性)
測試方法
驗證差分隱私算法的執(zhí)行結(jié)果是否符合算法設(shè)置及參數(shù)配置,可參考以下測試過程。對于滿足
5.3.3a)表1的基礎(chǔ)差分隱私算法,宜按以下過程進行測試;對于優(yōu)化差分隱私算法,需給出合理的測
試評估標準和方法。測試內(nèi)容中的符號含義見表B.1。
表B.1符號含義
符號含義
差分隱私參數(shù)
輸入數(shù)據(jù)
輸入數(shù)據(jù)集
測試輪數(shù)
輸出加噪結(jié)果
輸入離散值的枚舉數(shù)量
a)拉普拉斯機制
輸入數(shù)據(jù):;
測試輪數(shù):;
結(jié)果驗證:對輸出的加噪結(jié)果進行統(tǒng)計,須滿足
1)加噪結(jié)果與輸入數(shù)據(jù)的絕對差的均值,與差分隱私參數(shù)的倒數(shù)接近一致,即
。
2)加噪結(jié)果的均值與輸入數(shù)據(jù)接近一致,即
b)指數(shù)機制
初始化:設(shè)定輸入數(shù)據(jù)有種可能,,原始數(shù)據(jù)集為。設(shè)定查詢函數(shù)
的功能為查詢眾數(shù),的輸出為。為每種輸出可能分別設(shè)定打分函
數(shù),,其中為輸入數(shù)據(jù)集中的元素數(shù)量。
輸入數(shù)據(jù)集:設(shè)定輸入數(shù)據(jù)集=
{1,
2,2,
3,3,3,
4,4,4,4,
5,5,5,5,5,
6,6,6,6,6,6,
7,7,7,7,7,7,7,
8,8,8,8,8,8,8,8,
11
T/TAF137—2022
9,9,9,9,9,9,9,9,9,
10,10,10,10,10,10,10,10,10,10}
測試輪數(shù):
結(jié)果驗證:對輸出的加噪結(jié)果進行統(tǒng)計,應(yīng)滿足
對于所有都成立。
c)DirectEncoding機制
初始化:設(shè)定輸入數(shù)據(jù)有種可能,。
輸入數(shù)據(jù):
測試輪數(shù):
結(jié)果驗證:對輸出的加噪結(jié)果進行統(tǒng)計,須滿足
1)輸出結(jié)果為的比例與理論值應(yīng)接近一致,即
2)輸出任意其他結(jié)果的比例與理論值應(yīng)接近一致,即
對于所有都成立。
12
T/TAF137—2022
附錄C
(資料性)
差分隱私算法安全驗證信息清單
驗證差分隱私算法安全的方案,可提供以下清單。
a)選擇使用的差分隱私模型M,見表C.1。
b)確定需要保護的數(shù)據(jù)類型T,見表C.2。
c)選擇需要進行擾動的查詢函數(shù)F,見表C.3。
d)選擇相鄰數(shù)據(jù)集定義A,見表C.4(可選)。
e)選擇敏感度定義S,見表C.5,及計算公式或上界(可選)。
f)選擇差分隱私定義D,見表C.6。
g)確定噪聲添加機制N,見表C.7。
h)選擇保護粒度G,見表C.8(可選)。
i)確定隱私預(yù)算B:總體的隱私預(yù)算、每個步驟消耗的隱私預(yù)算、使用的組合定理(串行、并
行)、哪些步驟使用了采樣使得隱私預(yù)算降低、哪些步驟因為后處理機制所以不消耗隱私預(yù)
算。
j)確定隱私預(yù)算消耗率R(可選):在多次使用同一數(shù)據(jù)集的情況下,其隱私保護能力會降低。
常用的方式有:限制用戶在多長的單位時間內(nèi)最多貢獻多少次數(shù)據(jù)、每個接口最多詢問請求
數(shù)據(jù)庫多少次。
k)確定數(shù)據(jù)情況(可選):樣本數(shù)量級、樣本屬性維度、樣本分布、數(shù)據(jù)之間的相關(guān)性,IID
或non-IID。
l)確定評估方法E:參考附錄B或自主提供實驗評估方法。
表C.1差分隱私模型(M)示例
差分隱私模型(M)中心化本地化
表C.2保護的數(shù)據(jù)類型(T)示例
數(shù)據(jù)類型(T)連續(xù)型離散型
表C.3擾動的查詢函數(shù)(F)示例
擾動函數(shù)(F)平均數(shù)中位數(shù)求和協(xié)方差直方圖SGD
表C.4相鄰數(shù)據(jù)集定義(A)示例
相鄰數(shù)據(jù)集定義(A)有界無界
注:有界(Bounded):數(shù)據(jù)量不變,等同于替換一條數(shù)據(jù);無界(Unbounded):數(shù)據(jù)量相差1,等同于刪除或
添加一條數(shù)據(jù)。
13
T/TAF137—2022
表C.5敏感度定義(S)示例
敏感度定義(S)全局敏感度局部敏感度
表C.6差分隱私定義(D)示例
差分隱私定義?-DP-DPConcentratedzeroRényiDP
(D)DPConcentrated
DP
表C.7噪聲機制(N)示例
噪聲機制(N)拉普拉斯機制指數(shù)機制高斯機制隨機響應(yīng)
表C.8保護粒度(G)示例
保護粒度(G)樣本級用戶級
注:數(shù)據(jù)集中可能包含了同一用戶在不同時間、不同空間的多條數(shù)據(jù),或數(shù)據(jù)間具有較強的相關(guān)性,這也稱為群
體隱私(GroupPrivacy)。
14
T/TAF137—2022
參考文獻
[1]中華人民共和國全國人民代表大會常務(wù)委員會,中華人民共和國個人信息保護法,2021年11
月.
[2]MironovI.,PandeyO.,ReingoldO.,VadhanS.(2009)ComputationalDifferential
Privacy.In:HaleviS.(eds)AdvancesinCryptology-CRYPTO2009.CRYPTO2009.Lecture
NotesinComputerScience,vol5677.Springer,Berlin,Heidelberg.
[3]/privacy/docs/Differential_Privacy_Overview.pdf
[4]Wang,Tianhao,etal."Locallydifferentiallyprivateprotocolsforfrequency
estimation."26th{USENIX}SecuritySymposium({USENIX}Security17).2017.
[5]Li,Ninghui,etal."Differentialprivacy:Fromtheorytopractice."Synthesis
LecturesonInformationSecurity,Privacy,&Trust8.4(2016):1-138.
[6]Lee,Jaewoo,andChrisClifton."Howmuchisenough?choosing?fordifferential
privacy."InternationalConferenceonInformationSecurity.Springer,Berlin,Heidelberg,
2011.
15
T/TAF137—2022
電信終端產(chǎn)業(yè)協(xié)會團體標準
基于差分隱私的用戶個人信息保護技術(shù)要求
T/TAF137—2022
*
版權(quán)所有侵權(quán)必究
電信終端產(chǎn)業(yè)協(xié)會印發(fā)
地址:北京市西城區(qū)新街口外大街28號
電話/p>
電子版發(fā)行網(wǎng)址:
ICS33.050
CCSM30
團體標準
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度木材運輸碳排放交易合作合同4篇
- 2025年度個人藝術(shù)品投資收藏合同4篇
- 吉林省長春市凈月實驗中學(xué)2024-2025學(xué)年九年級上學(xué)期期末化學(xué)試題(含答案)
- 園區(qū)物業(yè)服務(wù)質(zhì)量提升考核試卷
- 2025版微信公眾號內(nèi)容版權(quán)授權(quán)與運營維護服務(wù)合同3篇
- 原材料卸車作業(yè)中安全生產(chǎn)獎勵制度合同3篇
- 2025年代理經(jīng)銷銷售合同
- 2025年農(nóng)產(chǎn)品合同模板
- 2025年合資合約示范
- 二零二五年度貴州事業(yè)單位合同制工人聘用協(xié)議3篇
- 2025水利云播五大員考試題庫(含答案)
- 中藥飲片驗收培訓(xùn)
- 手術(shù)室??谱o士工作總結(jié)匯報
- DB34T 1831-2013 油菜收獲與秸稈粉碎機械化聯(lián)合作業(yè)技術(shù)規(guī)范
- 創(chuàng)傷處理理論知識考核試題及答案
- 2019級水電站動力設(shè)備專業(yè)三年制人才培養(yǎng)方案
- 肝素誘導(dǎo)的血小板減少癥培訓(xùn)課件
- 抖音認證承諾函
- 高等數(shù)學(xué)(第二版)
- 四合一體系基礎(chǔ)知識培訓(xùn)課件
- ICD-9-CM-3手術(shù)與操作國家臨床版亞目表
評論
0/150
提交評論