TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求

上傳人：1*** IP屬地：浙江上傳時間：2024-12-01 格式：PDF 頁數(shù)：19 大小：1.22MB 積分：11 舉報 版權(quán)申訴

TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第2頁

TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第3頁

TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第4頁

TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求_第5頁

已閱讀5頁，還剩14頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

T/TAF137—2022

基于差分隱私的用戶個人信息保護技術(shù)要求

1范圍

本文件規(guī)范了基于差分隱私的用戶個人信息保護技術(shù)要求，包括差分隱私系統(tǒng)技術(shù)架構(gòu)、差分隱

私能力要求、差分隱私保護分級、差分隱私保護效果評定。

本文件適用于應(yīng)用在移動智能終端的差分隱私技術(shù)，也適用于評估機構(gòu)基于本文件開展差分隱私

產(chǎn)品保護個人信息的評估工作。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中，注日期的引用文

件，僅該日期對應(yīng)的版本適用于本文件；不注日期的引用文件，其最新版本（包括所有的修改單）適

用于本文件。

GB/T25069-2022信息安全技術(shù)術(shù)語

GB/T35273-2020信息安全技術(shù)個人信息安全規(guī)范

3術(shù)語和定義

下列術(shù)語和定義適用于本文件。

3.1

差分隱私differentialprivacy

一種個人信息的數(shù)據(jù)保護技術(shù)，通過隨機響應(yīng)或?qū)υ紨?shù)據(jù)加入噪聲的方式，使得對數(shù)據(jù)集的計

算處理結(jié)果對于具體某個記錄的變化是不敏感的，單個記錄在或不在數(shù)據(jù)集中，對計算結(jié)果的影響微

乎其微，并能保護個人信息不被泄露。

注：差分隱私保護重在提供可度量的數(shù)據(jù)隱私保護方法。

3.2

隱私預(yù)算privacybudget

衡量差分隱私保護效果的參數(shù)，在一定程度上給出了隱私保護效果的度量。

注：隱私預(yù)算越小，對數(shù)據(jù)的隱私保護程度越強，但是數(shù)據(jù)的可用性越差；隱私預(yù)算越大，數(shù)據(jù)的可用性越好，

但是隱私保護能力越差。

3.3

本地差分隱私localdifferentialprivacy

不依賴于可信第三方，直接在終端進行數(shù)據(jù)的隱私化處理，處理后的數(shù)據(jù)滿足差分隱私保護要求。

T/TAF137—2022

3.4

中心化差分隱私centralizeddifferentialprivacy

將原始終端數(shù)據(jù)集中到一個可信第三方,由第三方對數(shù)據(jù)進行處理，處理后的數(shù)據(jù)滿足差分隱私保

護要求。

3.5

編碼器encoder

智能終端上對原始個人信息進行編碼、加噪等處理的組件。

3.6

數(shù)據(jù)管理器datacurator

對從智能終端接收到的數(shù)據(jù)進行解密、存儲、聚合等操作，并根據(jù)查詢請求進行數(shù)據(jù)處理和添加

噪聲，對查詢進行隱私預(yù)算管理，最終發(fā)布滿足差分隱私要求結(jié)果的組件。

3.7

數(shù)據(jù)信道datachannel

實現(xiàn)數(shù)據(jù)在終端（編碼器）、數(shù)據(jù)管理器和查詢處理器之間流轉(zhuǎn)的組件。

3.8

查詢處理器queryprocessor

發(fā)起數(shù)據(jù)查詢請求并接受結(jié)果的實體。

3.9

數(shù)據(jù)采集者datacollector

在過程中負責(zé)采集數(shù)據(jù)的實體，可以為數(shù)據(jù)管理器或查詢處理器。

4縮略語

下列縮略語適用于本文件。

LDP:本地差分隱私（LocalDifferentialPrivacy）

TLCP:傳輸層密碼協(xié)議（TransportLayerCryptographicProtocol）

TLS：傳輸層安全協(xié)議（TransportLayerSecurity）

5概述

5.1差分隱私用于個人信息保護

T/TAF137—2022

數(shù)據(jù)處理是數(shù)字經(jīng)濟社會生產(chǎn)中的重要步驟，數(shù)據(jù)集通常包含大量的個人隱私數(shù)據(jù)，企業(yè)在業(yè)務(wù)

中對數(shù)據(jù)處理不當可能會造成個人隱私的泄露?！秱€人信息保護法》等對企業(yè)數(shù)據(jù)處理行為中的個人

信息保護提出了要求，企業(yè)須采取措施確保數(shù)據(jù)處理過程中個人信息不被泄露。

差分隱私是針對數(shù)據(jù)隱私泄露問題提出的一種隱私保護方法。在此定義下，對數(shù)據(jù)集的計算處理

結(jié)果對于某條具體記錄的變化是不敏感的，單條記錄存在或不存在數(shù)據(jù)集中，對計算結(jié)果的影響微乎

其微。所以，一條記錄因其加入到數(shù)據(jù)集中所產(chǎn)生的隱私泄露風(fēng)險被控制在極小的、可接受的范圍內(nèi)，

攻擊者無法通過觀察計算結(jié)果而獲取準確的個體信息，從而在數(shù)據(jù)發(fā)布、查詢等過程中保護個體信息

隱私。通常，差分隱私通過在真實數(shù)據(jù)中加入隨機化噪聲擾動的方式來實現(xiàn)保護。

5.2差分隱私的概述

差分隱私技術(shù)可以分為中心化差分隱私和本地化差分隱私。中心化差分隱私定義為假設(shè)有隨機算

法，為所有可能輸出結(jié)果構(gòu)成的集合，表示概率，對于任意兩個差別只有1條記錄的相鄰數(shù)

據(jù)集′，如果滿足：

′

則稱算法提供(?,)-中心化差分隱私保護，其中?為差分隱私預(yù)算，用來保證數(shù)據(jù)集中增加或

者減少一條記錄，隨機算法M的輸出結(jié)果一致的概率；指算法有的概率不滿足?-DP.

本地化差分隱私與中心化差分隱私不同，用戶之間并不能知道相互之間的記錄，也沒有一個中心

化的數(shù)據(jù)管理器，因此在本地化差分隱私中，我們將兩個相鄰數(shù)據(jù)集替換成兩條來自不同用戶的不同

記錄。本地差分隱私定義為，假設(shè)有隨機算法，t為的任意一個輸出結(jié)果，表示概率，對于

任意兩條記錄′，如果滿足：

′

則稱算法提供(?,)-本地化差分隱私保護，其中?為差分隱私預(yù)算，用來保證任意兩個用戶的

記錄，隨機算法M的輸出結(jié)果一致的概率；指算法有的概率不滿足?-DP。

在相同數(shù)據(jù)集和使用相同的差分隱私算法的前提下，差分隱私預(yù)算?越小，隱私保護效果越好。

特別地，δ表示大小為常數(shù)的概率擾動，是允許隨機算法在一定程度上不滿足差分隱私嚴格定義

的一個松弛項。具體地，當δ=0時，我們稱(?,δ)-差分隱私為?-差分隱私。當δ>0時，(?,δ)-差分

隱私相對?-差分隱私而言很大可能會存在概率大于0的額外信息泄露。故我們稱?-差分隱私是嚴格的差

分隱私定義，而(?,δ)-差分隱私則是松弛的差分隱私定義。

5.3差分隱私系統(tǒng)的技術(shù)架構(gòu)

5.3.1差分隱私數(shù)據(jù)處理框架

根據(jù)隱私計算框架中的數(shù)據(jù)管理器是否可信，可將移動智能終端個人信息保護的差分隱私數(shù)據(jù)處

理模式可分為兩種框架類型：

a)本地化差分隱私：包含終端與數(shù)據(jù)管理器兩種角色，數(shù)據(jù)管理器不可信。終端個人信息在添

加噪聲后向數(shù)據(jù)管理器發(fā)送，且數(shù)據(jù)管理器無法查看原始個人信息。

b)中心化差分隱私

包含終端與數(shù)據(jù)管理器兩種角色，數(shù)據(jù)管理器可信。終端個人信息直接發(fā)送并存儲于數(shù)據(jù)管

理器中，再由數(shù)據(jù)管理器對查詢結(jié)果添加噪聲?？尚诺臄?shù)據(jù)管理器不會直接查看、共享個人

信息，也不會與攻擊者共謀。圖1中的信任邊界表示數(shù)據(jù)管理器是否被用戶終端信任。

T/TAF137—2022

圖1兩類差分隱私數(shù)據(jù)處理模式

5.3.2差分隱私系統(tǒng)組成與角色關(guān)系

基于差分隱私的個人信息保護系統(tǒng)常見組成結(jié)構(gòu)如圖1所示。系統(tǒng)的工作流程主要分為：

a)采集：終端對個人信息進行采集操作；

b)編碼：在本地化模式中，終端通過編碼器對個人信息進行編碼、加噪等處理；在中心化模式

中，終端通過編碼器對個人信息進行編碼等處理。

c)匯聚：終端將原始個人信息（中心化模式）或經(jīng)過編碼器加噪的數(shù)據(jù)（本地化模式）發(fā)送給

數(shù)據(jù)管理器；

d)查詢響應(yīng)：數(shù)據(jù)管理器針對查詢請求，對從終端接受到的數(shù)據(jù)進行聚合、解碼、加噪等處理

后，輸出滿足差分隱私要求的查詢結(jié)果。在多次查詢場景中，數(shù)據(jù)管理器需進行隱私預(yù)算的

控制。

5.3.3差分隱私系統(tǒng)的分類

用于個人信息保護的差分隱私系統(tǒng)可以按以下維度進行分類：

a)差分隱私的算法分類

根據(jù)差分隱私算法支持的精度、預(yù)算分配合理性等，將算法分類為基礎(chǔ)差分隱私算法和優(yōu)化

差分隱私算法，見表1。

表1差分隱私算法

分類中心化差分隱私本地化差分隱私

基礎(chǔ)差分隱私算法拉普拉斯機制、指數(shù)機制DirectEncoding

優(yōu)化差分隱私算法階梯機制、幾何機制、高斯機制、高精度拉HistogramEncoding,Unary

普拉斯機制、高精度高斯機制、離散拉普拉Encoding,BinaryLocalHashing,

斯機制、離散高斯機制、Base2-指數(shù)機制、OptimalLocalHashing及其他證明

其他證明完備的中心化差分隱私機制完備的本地化差分隱私機制

b)查詢類型的分類

T/TAF137—2022

個人信息保護場景常見的差分隱私查詢類型包括：

1）頻數(shù)統(tǒng)計：分為多值頻數(shù)統(tǒng)計以及單值頻數(shù)統(tǒng)計，包括計數(shù)、眾數(shù)、直方圖、列聯(lián)表等

查詢；

2）均值統(tǒng)計：包括平均值等查詢；

3）極值查詢：包括極大值、極小值、Top-K等查詢；

4）數(shù)據(jù)挖掘與機器學(xué)習(xí)：包括分類樹、支持向量機、對率回歸、K-均值等；

5）基礎(chǔ)統(tǒng)計估計：計數(shù)，求和，平均數(shù)，分位數(shù)，最小值，最大值，方差等；

6）直方圖發(fā)布：普通直方圖發(fā)布、約束條件直方圖發(fā)布、本地差分隱私直方圖發(fā)布；

7）隱私保護統(tǒng)計問詢：隱私乘法權(quán)重、稀疏向量技術(shù)、合成數(shù)據(jù)集技術(shù)；

8）支持靈活統(tǒng)計問詢（如SQL查詢等）。

6差分隱私能力要求

6.1總體要求

差分隱私能力總體要求見圖2，包括基礎(chǔ)能力要求、系統(tǒng)安全要求、算法安全要求、優(yōu)化算法要求、

場景化安全要求五部分，具體要求如下。

a)基礎(chǔ)能力要求包括協(xié)議模式、數(shù)據(jù)輸入、查詢模型、算法支持、數(shù)據(jù)可用性等差分隱私基本

能力要求；

b)系統(tǒng)數(shù)據(jù)安全要求包括數(shù)據(jù)采集安全、數(shù)據(jù)傳輸安全、輸出存儲安全等系統(tǒng)層面數(shù)據(jù)保護要

求；

c）算法安全要求包括參數(shù)安全、查詢安全、計算結(jié)果安全等算法層面安全要求；

d）優(yōu)化算法要求對差分隱私能力提出了進一步的能力要求和安全性要求；

e）場景化安全要求提出了在不同數(shù)據(jù)敏感場景下的安全保護差異化要求。

圖2差分隱私對個人信息保護的總體要求

6.2差分隱私基礎(chǔ)能力要求

6.2.1差分隱私模式

T/TAF137—2022

應(yīng)支持5.3.1中的至少一種差分隱私數(shù)據(jù)處理模式。

6.2.2數(shù)據(jù)輸入

數(shù)據(jù)輸入要求包括：

a)應(yīng)支持整數(shù)、小數(shù)、字符串等至少一種基本數(shù)據(jù)類型；

b）對于數(shù)值型數(shù)據(jù)、枚舉型數(shù)據(jù)應(yīng)添加適配于該類型的噪聲。

6.2.3查詢類型

對于支持數(shù)據(jù)查詢的差分隱私系統(tǒng)，應(yīng)支持計數(shù)、均值、直方圖、頻率估計等至少一種常見查詢

類型。

6.2.4算法支持

應(yīng)支持5.3.3a）表1中基礎(chǔ)差分隱私算法中的至少一種算法。

6.2.5數(shù)據(jù)可用性要求

數(shù)據(jù)可用性要求包括數(shù)據(jù)一致性和數(shù)據(jù)準確性：

a)數(shù)據(jù)一致性：差分隱私處理后的數(shù)據(jù)，不應(yīng)出現(xiàn)語義矛盾的情況，如應(yīng)滿足：計數(shù)問詢的統(tǒng)

計結(jié)果為正整數(shù)（包括0）、頻率估計中各個頻率的和為100%、且未出現(xiàn)不可能出現(xiàn)的枚舉

值、差分隱私機器學(xué)習(xí)輸出模型應(yīng)可直接執(zhí)行預(yù)測算法；

b)數(shù)據(jù)準確性：宜支持對數(shù)據(jù)準確性的評估，能根據(jù)理論給出差分隱私輸出數(shù)據(jù)的方差等統(tǒng)計

型指標，能使用統(tǒng)計性檢測等手段驗證滿足理論準確性結(jié)果。

6.3差分隱私系統(tǒng)數(shù)據(jù)安全要求

6.3.1數(shù)據(jù)采集安全

數(shù)據(jù)采集安全要求包括：

a)采集的數(shù)據(jù)及采集過程應(yīng)嚴格按照GB/T35273-2020執(zhí)行；

b)數(shù)據(jù)采集者收集、使用個人信息，應(yīng)當遵循合法、正當、必要的原則，公開收集、使用規(guī)則，

明示收集、使用信息的方式和范圍；

c)數(shù)據(jù)采集者應(yīng)制定標準的采集模板、數(shù)據(jù)采集方法、策略和規(guī)范，采集策略參數(shù)配置應(yīng)包括

采集周期、有效性、檢測時間、入口地址和采集深度等；

d)對于初次采集的數(shù)據(jù)，宜用人工與技術(shù)相結(jié)合的方式根據(jù)其來源、類型或重要程度進行分類；

e)數(shù)據(jù)采集者宜明確數(shù)據(jù)來源、采集方式、采集范圍等內(nèi)容，并記錄存檔；

f)在數(shù)據(jù)采集前后應(yīng)采用校驗技術(shù)對數(shù)據(jù)完整性進行校驗。

g)針對端側(cè)采集經(jīng)過本地差分隱私算法處理后的個人信息的場景，應(yīng)在用戶協(xié)議等文本中對算

法的使用做出說明，滿足透明性要求。

6.3.2數(shù)據(jù)傳輸安全

數(shù)據(jù)傳輸安全要求包括：

a)數(shù)據(jù)傳輸時應(yīng)建立安全的通信信道，使用TLCP或TLSv1.2及以上版本進行通信；

T/TAF137—2022

b)應(yīng)采用密碼技術(shù)保證通信中數(shù)據(jù)的機密性和完整性保護，采用的密碼技術(shù)應(yīng)符合國家行業(yè)主

管部門和相應(yīng)國家標準和行業(yè)標準的要求。

6.3.3數(shù)據(jù)存儲安全

數(shù)據(jù)存儲安全要求包括：

a)應(yīng)采用密碼技術(shù)保證敏感個人信息的機密性保護，采用的密碼技術(shù)應(yīng)符合國家行業(yè)主管部門

和相應(yīng)國家標準和行業(yè)標準的要求；

b)應(yīng)設(shè)置合理的存儲期限，應(yīng)為實現(xiàn)個人信息主體授權(quán)使用的目的所必需的最短時間，對超期

數(shù)據(jù)進行刪除或匿名化處理。

6.4差分隱私算法安全要求

6.4.1概述

差分隱私參數(shù)?是差分隱私算法安全的重要參數(shù)，但在實際過程中還包括系統(tǒng)設(shè)計、應(yīng)用場景等

多種因素，如擾動函數(shù)、相鄰數(shù)據(jù)集定義、保護粒度、實際使用過程中的查詢損耗、差分隱私計算結(jié)

果的分布情況等。差分隱私參數(shù)?的配置應(yīng)考慮多個因素，針對實際業(yè)務(wù)場景設(shè)置合理的大小。差分

隱私算法安全驗證建議按附錄C提供驗證信息清單，或自主提供完備的驗證方案和過程。本節(jié)給出其

中重要的參數(shù)和查詢、結(jié)果安全的基本要求。

注：差分隱私參數(shù)的配置可在參考文獻[3][6]中查看。

6.4.2參數(shù)安全

在采用?-DP定義的差分隱私應(yīng)用中，差分隱私參數(shù)?宜不大于以下基礎(chǔ)推薦值，以達到基本的

保護效果：

表2差分隱私參數(shù)基礎(chǔ)推薦值

基礎(chǔ)推薦值中心化差分隱私本地化差分隱私

?28

6.4.3查詢安全

在支持多次查詢（或LDP中的數(shù)據(jù)上傳）的場景中，應(yīng)采取措施保證累計查詢的預(yù)算消耗不超過

所聲明的差分隱私預(yù)算總量，如在一定時間內(nèi)合理限制查詢（上傳）次數(shù)。

6.4.4計算結(jié)果安全

計算結(jié)果安全要求包括：

a)應(yīng)確保算法計算過程中，除了計算結(jié)果和其可推導(dǎo)的信息外，不會泄露其他敏感數(shù)據(jù)；

b)采用差分隱私保護后的計算結(jié)果的分布測量值，應(yīng)與所采用的差分隱私算法、參數(shù)兩者共同

計算的理論值保持一致。驗證過程建議按附錄B執(zhí)行，或自主提供完備的驗證方案和過程。

6.4.5差分隱私優(yōu)化算法要求

優(yōu)化算法能力要求

T/TAF137—2022

宜支持5.3.3a)表1中優(yōu)化差分隱私算法中的至少一種算法。

優(yōu)化算法安全性要求

對于聲明支持的優(yōu)化差分隱私機制及參數(shù)，應(yīng)滿足6.4.1,6.4.2,6.4.3,6.4.4差分隱私算法安

全性要求。

6.5差分隱私場景化安全要求

6.5.1算法能力要求

對于不同的業(yè)務(wù)場景，應(yīng)具備能力來配置、優(yōu)化、組合使用已有成熟算法或設(shè)計新的算法，來解

決場景化業(yè)務(wù)問題，并提供報告說明可行性和安全性，報告內(nèi)容宜根據(jù)不同場景給出單獨的算法配置

說明，報告內(nèi)容參考附錄C。

6.5.2參數(shù)安全

對于不同的業(yè)務(wù)場景，應(yīng)根據(jù)不同的安全性要求對參數(shù)進行對應(yīng)的配置。如對于數(shù)據(jù)保護要求更

高的數(shù)據(jù)場景，應(yīng)設(shè)置更嚴格的差分隱私參數(shù)。對于采用-DP定義的差分隱私應(yīng)用，差分隱私參數(shù)

宜不大于以下場景化推薦值來達到差異化的保護強度：

表3差分隱私參數(shù)場景化推薦值

業(yè)務(wù)場景?場景化推薦值場景化推薦值

中心化差分隱私本地化差分隱私

金融0.25210-6

政務(wù)0.5410-5

醫(yī)療0.5410-5

其他1610-4

7差分隱私保護分級

7.1概述

根據(jù)差分隱私系統(tǒng)滿足第五章能力要求的程度，對于差分隱私的保護效果可將差分隱私保護系統(tǒng)

分為由低到高共3級。

表4差分隱私保護分級對應(yīng)表

6.2差分隱私基礎(chǔ)能力要6.3差分隱私系統(tǒng)數(shù)據(jù)安6.4差分隱私算法安6.5差分隱私場景化

求全要求全要求安全要求

1級√√——

2級√√√—

3級√√√√

7.21級

滿足差分隱私基礎(chǔ)能力要求和系統(tǒng)數(shù)據(jù)安全要求，能夠在數(shù)據(jù)采集、傳輸、存儲等過程滿足安全

要求的前提下，對查詢數(shù)據(jù)加入差分隱私噪聲進行擾動。

T/TAF137—2022

7.32級

在滿足1級要求的基礎(chǔ)上，滿足差分隱私算法安全要求，對差分隱私算法參數(shù)進行了正確配置，通

過了實驗驗證。驗證過程建議按附錄B執(zhí)行，或自主提供完備的驗證方案和過程。

7.43級

在滿足2級要求的基礎(chǔ)上，滿足差分隱私場景化安全要求，對于不同數(shù)據(jù)敏感程度的場景，提供差

異化的差分隱私保護等級。

8差分隱私保護效果評定

差分隱私保護效果評定流程如圖3所示：

圖3差分隱私保護效果評定流程

T/TAF137—2022

附錄A

（資料性）

應(yīng)用場景

在數(shù)據(jù)發(fā)布領(lǐng)域，支持差分隱私的數(shù)據(jù)發(fā)布算法的應(yīng)用包括但不限于社交網(wǎng)絡(luò)、地理位置服務(wù)

（LBS)、推薦系統(tǒng)。

在數(shù)據(jù)挖掘領(lǐng)域，差分隱私一般通過結(jié)合具體的挖掘算法，根據(jù)挖掘結(jié)果的性能指標進行調(diào)整，

以實現(xiàn)數(shù)據(jù)安全性和模型可用性之間的平衡。目前，支持差分隱私的數(shù)據(jù)挖掘算法的應(yīng)用包括：線性

回歸、邏輯回歸、決策樹、深度學(xué)習(xí)、聚類，隱私保護模型預(yù)測，決策樹構(gòu)造、頻繁模式挖掘、和聯(lián)

邦學(xué)習(xí)。

在本地差分隱私保護中，隱私保護數(shù)據(jù)從終端獲得后可以直接用于后續(xù)計算。具體支持以下場景：

a)發(fā)布終端的行為數(shù)據(jù)：將用戶使用偏好等數(shù)據(jù)加入噪聲并發(fā)布，用于服務(wù)端統(tǒng)計數(shù)據(jù)分布；

b)發(fā)布終端數(shù)據(jù)統(tǒng)計信息：將終端原始數(shù)據(jù)進行求最大值，均值等統(tǒng)計后發(fā)布統(tǒng)計結(jié)果；

c)發(fā)布基于終端數(shù)據(jù)的預(yù)訓(xùn)練模型：終端上用原始數(shù)據(jù)進行訓(xùn)練得到模型，并將預(yù)訓(xùn)練模型進

行分享和發(fā)布。由于存在通過預(yù)訓(xùn)練模型推斷終端原始數(shù)據(jù)的風(fēng)險，因此需要在預(yù)訓(xùn)練過程

中或?qū)Y(jié)果模型進行隨機擾動以達到對原始數(shù)據(jù)的隱私保護。

在中心化差分隱私保護中，終端數(shù)據(jù)可能具備一定的差分隱私保護(或者沒有任何隱私保護)，終

端數(shù)據(jù)通過在可信第三方聚合后進行計算并發(fā)布計算結(jié)果，具體支持以下場景：

a)分享基于眾多終端數(shù)據(jù)的統(tǒng)計信息：將終端原始數(shù)據(jù)安全聚合后進行求最大值，均值等統(tǒng)計

后發(fā)布統(tǒng)計結(jié)果；

b)聯(lián)邦學(xué)習(xí)：目標是在保證終端用戶數(shù)據(jù)隱私安全及合法合規(guī)的基礎(chǔ)上，實現(xiàn)利用大量用戶數(shù)

據(jù)共同建模，提升人工智能模型的效果。

T/TAF137—2022

附錄B

（資料性）

測試方法

驗證差分隱私算法的執(zhí)行結(jié)果是否符合算法設(shè)置及參數(shù)配置，可參考以下測試過程。對于滿足

5.3.3a)表1的基礎(chǔ)差分隱私算法，宜按以下過程進行測試；對于優(yōu)化差分隱私算法，需給出合理的測

試評估標準和方法。測試內(nèi)容中的符號含義見表B.1。

表B.1符號含義

符號含義

差分隱私參數(shù)

輸入數(shù)據(jù)

輸入數(shù)據(jù)集

測試輪數(shù)

輸出加噪結(jié)果

輸入離散值的枚舉數(shù)量

a)拉普拉斯機制

輸入數(shù)據(jù)：；

測試輪數(shù)：；

結(jié)果驗證：對輸出的加噪結(jié)果進行統(tǒng)計，須滿足

1）加噪結(jié)果與輸入數(shù)據(jù)的絕對差的均值，與差分隱私參數(shù)的倒數(shù)接近一致，即

。

2)加噪結(jié)果的均值與輸入數(shù)據(jù)接近一致，即

b)指數(shù)機制

初始化：設(shè)定輸入數(shù)據(jù)有種可能，，原始數(shù)據(jù)集為。設(shè)定查詢函數(shù)

的功能為查詢眾數(shù)，的輸出為。為每種輸出可能分別設(shè)定打分函

數(shù)，,其中為輸入數(shù)據(jù)集中的元素數(shù)量。

輸入數(shù)據(jù)集：設(shè)定輸入數(shù)據(jù)集=

{1,

2,2,

3,3,3,

4,4,4,4,

5,5,5,5,5,

6,6,6,6,6,6,

7,7,7,7,7,7,7,

8,8,8,8,8,8,8,8,

T/TAF137—2022

9,9,9,9,9,9,9,9,9,

10,10,10,10,10,10,10,10,10,10}

測試輪數(shù)：

結(jié)果驗證：對輸出的加噪結(jié)果進行統(tǒng)計，應(yīng)滿足

對于所有都成立。

c)DirectEncoding機制

初始化：設(shè)定輸入數(shù)據(jù)有種可能，。

輸入數(shù)據(jù)：

測試輪數(shù)：

結(jié)果驗證：對輸出的加噪結(jié)果進行統(tǒng)計，須滿足

1）輸出結(jié)果為的比例與理論值應(yīng)接近一致，即

2）輸出任意其他結(jié)果的比例與理論值應(yīng)接近一致，即

對于所有都成立。

T/TAF137—2022

附錄C

（資料性）

差分隱私算法安全驗證信息清單

驗證差分隱私算法安全的方案，可提供以下清單。

a)選擇使用的差分隱私模型M,見表C.1。

b)確定需要保護的數(shù)據(jù)類型T,見表C.2。

c)選擇需要進行擾動的查詢函數(shù)F,見表C.3。

d)選擇相鄰數(shù)據(jù)集定義A,見表C.4（可選）。

e)選擇敏感度定義S,見表C.5，及計算公式或上界（可選）。

f)選擇差分隱私定義D,見表C.6。

g)確定噪聲添加機制N,見表C.7。

h)選擇保護粒度G,見表C.8（可選）。

i)確定隱私預(yù)算B：總體的隱私預(yù)算、每個步驟消耗的隱私預(yù)算、使用的組合定理（串行、并

行）、哪些步驟使用了采樣使得隱私預(yù)算降低、哪些步驟因為后處理機制所以不消耗隱私預(yù)

算。

j)確定隱私預(yù)算消耗率R（可選）：在多次使用同一數(shù)據(jù)集的情況下，其隱私保護能力會降低。

常用的方式有：限制用戶在多長的單位時間內(nèi)最多貢獻多少次數(shù)據(jù)、每個接口最多詢問請求

數(shù)據(jù)庫多少次。

k)確定數(shù)據(jù)情況（可選）：樣本數(shù)量級、樣本屬性維度、樣本分布、數(shù)據(jù)之間的相關(guān)性，IID

或non-IID。

l)確定評估方法E：參考附錄B或自主提供實驗評估方法。

表C.1差分隱私模型（M）示例

差分隱私模型（M）中心化本地化

表C.2保護的數(shù)據(jù)類型（T）示例

數(shù)據(jù)類型（T）連續(xù)型離散型

表C.3擾動的查詢函數(shù)（F）示例

擾動函數(shù)（F）平均數(shù)中位數(shù)求和協(xié)方差直方圖SGD

表C.4相鄰數(shù)據(jù)集定義（A）示例

相鄰數(shù)據(jù)集定義（A）有界無界

注：有界（Bounded）：數(shù)據(jù)量不變，等同于替換一條數(shù)據(jù)；無界（Unbounded）：數(shù)據(jù)量相差1，等同于刪除或

添加一條數(shù)據(jù)。

T/TAF137—2022

表C.5敏感度定義（S）示例

敏感度定義（S）全局敏感度局部敏感度

表C.6差分隱私定義（D）示例

差分隱私定義?-DP-DPConcentratedzeroRényiDP

（D）DPConcentrated

表C.7噪聲機制（N）示例

噪聲機制（N）拉普拉斯機制指數(shù)機制高斯機制隨機響應(yīng)

表C.8保護粒度（G）示例

保護粒度（G）樣本級用戶級

注：數(shù)據(jù)集中可能包含了同一用戶在不同時間、不同空間的多條數(shù)據(jù)，或數(shù)據(jù)間具有較強的相關(guān)性，這也稱為群

體隱私（GroupPrivacy）。

T/TAF137—2022

參考文獻

[1]中華人民共和國全國人民代表大會常務(wù)委員會，中華人民共和國個人信息保護法，2021年11

月.

[2]MironovI.,PandeyO.,ReingoldO.,VadhanS.(2009)ComputationalDifferential

Privacy.In:HaleviS.(eds)AdvancesinCryptology-CRYPTO2009.CRYPTO2009.Lecture

NotesinComputerScience,vol5677.Springer,Berlin,Heidelberg.

[3]/privacy/docs/Differential_Privacy_Overview.pdf

[4]Wang,Tianhao,etal."Locallydifferentiallyprivateprotocolsforfrequency

estimation."26th{USENIX}SecuritySymposium({USENIX}Security17).2017.

[5]Li,Ninghui,etal."Differentialprivacy:Fromtheorytopractice."Synthesis

LecturesonInformationSecurity,Privacy,&Trust8.4(2016):1-138.

[6]Lee,Jaewoo,andChrisClifton."Howmuchisenough?choosing?fordifferential

privacy."InternationalConferenceonInformationSecurity.Springer,Berlin,Heidelberg,

2011.

T/TAF137—2022

電信終端產(chǎn)業(yè)協(xié)會團體標準

基于差分隱私的用戶個人信息保護技術(shù)要求

T/TAF137—2022

版權(quán)所有侵權(quán)必究

電信終端產(chǎn)業(yè)協(xié)會印發(fā)

地址：北京市西城區(qū)新街口外大街28號

電話/p>

電子版發(fā)行網(wǎng)址：

ICS33.050

CCSM30

團體標準

人人文庫> 全部分類> 專業(yè)文獻 > 工程機械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求

文檔簡介

溫馨提示

最新文檔

評論

TTAF137-2022基于差分隱私的用戶個人信息保護技術(shù)要求

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔