![數(shù)據(jù)安全 課件 專題6-數(shù)據(jù)隱私保護(hù)技術(shù)_第1頁(yè)](http://file4.renrendoc.com/view10/M02/10/0A/wKhkGWVxoXyAPLznAACtKAJZwgc216.jpg)
![數(shù)據(jù)安全 課件 專題6-數(shù)據(jù)隱私保護(hù)技術(shù)_第2頁(yè)](http://file4.renrendoc.com/view10/M02/10/0A/wKhkGWVxoXyAPLznAACtKAJZwgc2162.jpg)
![數(shù)據(jù)安全 課件 專題6-數(shù)據(jù)隱私保護(hù)技術(shù)_第3頁(yè)](http://file4.renrendoc.com/view10/M02/10/0A/wKhkGWVxoXyAPLznAACtKAJZwgc2163.jpg)
![數(shù)據(jù)安全 課件 專題6-數(shù)據(jù)隱私保護(hù)技術(shù)_第4頁(yè)](http://file4.renrendoc.com/view10/M02/10/0A/wKhkGWVxoXyAPLznAACtKAJZwgc2164.jpg)
![數(shù)據(jù)安全 課件 專題6-數(shù)據(jù)隱私保護(hù)技術(shù)_第5頁(yè)](http://file4.renrendoc.com/view10/M02/10/0A/wKhkGWVxoXyAPLznAACtKAJZwgc2165.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《數(shù)據(jù)安全》【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】本章要點(diǎn)【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】目的與要求:了解隱私保護(hù)的基礎(chǔ)知識(shí);了解幾種常見的隱私保護(hù)技術(shù),包括基于限制發(fā)布的技術(shù)、基于數(shù)據(jù)加密的技術(shù)、基于數(shù)據(jù)失真的技術(shù)等;了解大數(shù)據(jù)隱私保護(hù)相關(guān)的內(nèi)容以及區(qū)塊鏈技術(shù)與AI數(shù)據(jù)脫敏在隱私保護(hù)中的應(yīng)用。
重點(diǎn)與難點(diǎn):隱私保護(hù)的基礎(chǔ)知識(shí)(重點(diǎn))基于限制發(fā)布的技術(shù)(重點(diǎn))基于數(shù)據(jù)加密的技術(shù)(難點(diǎn))基于數(shù)據(jù)失真的技術(shù)(難點(diǎn))區(qū)塊鏈技術(shù)(難點(diǎn))AI數(shù)據(jù)脫敏(難點(diǎn))本章要點(diǎn)
6.1案例6.2隱私保護(hù)的基礎(chǔ)知識(shí)6.3基于限制發(fā)布的技術(shù)6.4基于數(shù)據(jù)加密的技術(shù)6.5基于數(shù)據(jù)失真的技術(shù)6.6區(qū)塊鏈技術(shù)6.7AI數(shù)據(jù)脫敏【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】案例【
案例1:數(shù)據(jù)匿名化--K-anonymity】案例描述:在醫(yī)療數(shù)據(jù)發(fā)布之前,為了防止用戶隱私泄露,委員會(huì)對(duì)數(shù)據(jù)進(jìn)行了匿名化處理,即刪除了所有的敏感信息,如姓名、身份證號(hào)和家庭住址等。然而,來(lái)自X國(guó)W大學(xué)的密碼專家M成功破解了這份匿名化處理后的醫(yī)療數(shù)據(jù),能夠確定具體某一個(gè)人的醫(yī)療記錄。匿名醫(yī)療數(shù)據(jù)雖然刪除了所有的敏感信息,但仍然保留了三個(gè)關(guān)鍵字段:性別、出生日期和郵編。密碼專家M同時(shí)有一份公開的X國(guó)民主投票人名單(被攻擊者也在其中),包括投票人的姓名、性別、出生年月、住址和郵編等個(gè)人信息。他將兩份數(shù)據(jù)進(jìn)行匹配,發(fā)現(xiàn)匿名醫(yī)療數(shù)據(jù)中與被攻擊者生日相同的人有限,而其中與被攻擊者性別和郵編都相同的人更是少之又少。由此,密碼專家M就能確定被攻擊者的醫(yī)療記錄。密碼專家M進(jìn)一步研究發(fā)現(xiàn),80%以上的X國(guó)公民擁有唯一的性別、出生日期和郵編三元組信息,同時(shí)發(fā)布事實(shí)上幾乎等同于直接公開。進(jìn)行2-K匿名化處理原始醫(yī)療數(shù)據(jù),每一條記錄對(duì)應(yīng)一個(gè)唯一的病人,其中{"姓名"}為標(biāo)識(shí)符屬性,{"膚色","年齡","性別","郵編"}為準(zhǔn)標(biāo)識(shí)符屬性,{"疾病"}為敏感屬性。K-匿名實(shí)現(xiàn)了同一等價(jià)類內(nèi)記錄之間無(wú)法區(qū)分(敏感屬性值除外)。匿名化后的表中的每個(gè)序列值在表中至少出現(xiàn)k次(k>1)案例案例解析鏈?zhǔn)焦?某些數(shù)據(jù)集存在其自身的安全性,即孤立情況下不會(huì)泄露任何隱私信息,但是當(dāng)惡意攻擊者利用其他存在屬性重疊的數(shù)據(jù)集進(jìn)行鏈接操作,便可能唯一識(shí)別出特定的個(gè)體,從而獲取該個(gè)體的隱私信息?!?/p>
案例1:數(shù)據(jù)匿名化--K-anonymity】將醫(yī)療信息和選民信息結(jié)合在一起,能夠發(fā)現(xiàn)兩個(gè)數(shù)據(jù)集的共有屬性(性別、生日、郵編等),這樣惡意攻擊者通過(guò)鏈接攻擊能夠輕易確定選舉人的醫(yī)療信息情況,因此該類攻擊手段會(huì)造成極其嚴(yán)重的隱私泄露。案例案例解析公共屬性分類2標(biāo)識(shí)符(Keyattributes)一般是個(gè)體的唯一標(biāo)示,比如說(shuō)姓名、地址、電話等等,這些內(nèi)容需要在公開數(shù)據(jù)的時(shí)候刪掉?!?/p>
案例1:數(shù)據(jù)匿名化--K-anonymity】準(zhǔn)標(biāo)識(shí)符(Quasi-identifier)敏感屬性(Sensitiveattributes)類似郵編、年齡、生日、性別等不是唯一的,但是能幫助研究人員關(guān)聯(lián)相關(guān)數(shù)據(jù)的標(biāo)示。敏感數(shù)據(jù),比如說(shuō)疾病、購(gòu)買偏好、薪水等等,這些數(shù)據(jù)是研究人員最關(guān)心的,所以一般都直接公開。案例案例解析k-匿名(k-anonymity)3k-anonymity的目的是保證公開的數(shù)據(jù)中包含的個(gè)人信息至少k-1條不能通過(guò)其他個(gè)人信息確定出來(lái)。也就是公開數(shù)據(jù)中的任意Quasi-identifier信息,相同的組合都需要出現(xiàn)至少k次。假設(shè)一個(gè)公開的數(shù)據(jù)進(jìn)行了2-anonymity保護(hù)。如果攻擊者想確認(rèn)一個(gè)人(小A)的敏感信息(購(gòu)買偏好),通過(guò)查詢他的年齡、郵編和性別,攻擊者會(huì)發(fā)現(xiàn)數(shù)據(jù)里至少有兩個(gè)人是有相同的年齡、郵編和性別。這樣攻擊者就沒(méi)辦法區(qū)分這兩條數(shù)據(jù)到底哪個(gè)是小A了,從而也就保證了小A的隱私不會(huì)被泄露。k=2k-anonymity攻擊者無(wú)法知道某個(gè)人是否在公開的數(shù)據(jù)中;給定一個(gè)人,攻擊者無(wú)法確認(rèn)他是否有某項(xiàng)敏感屬性;攻擊者無(wú)法確認(rèn)某條數(shù)據(jù)對(duì)應(yīng)的是哪個(gè)?!?/p>
案例1:數(shù)據(jù)匿名化--K-anonymity】能保證以下三點(diǎn)案例【
案例2:數(shù)據(jù)匿名化--L-diversity】案例描述:X國(guó)研究人員在案例1的K-匿名基礎(chǔ)上引入多樣化的概念,采取L-多樣性(L-diversity)原則。L-diversity保證每一個(gè)等價(jià)類的敏感屬性至少有L個(gè)不同的值,L-diversity使得攻擊者最多以1/L的概率確認(rèn)某個(gè)體的敏感信息。簡(jiǎn)單來(lái)說(shuō),在公開的數(shù)據(jù)中,對(duì)于那些準(zhǔn)標(biāo)識(shí)符(Quasi-identifier)相同的數(shù)據(jù)中,敏感屬性必須具有多樣性,這樣才能保證用戶的隱私不能通過(guò)背景知識(shí)等方法推測(cè)出來(lái)。案例案例解析同質(zhì)攻擊1當(dāng)通過(guò)鏈接攻擊仍然無(wú)法唯一確認(rèn)個(gè)體,但是卻存在個(gè)體對(duì)應(yīng)的多條記錄擁有同一個(gè)敏感隱私信息,從而造成隱私的泄露,稱這一過(guò)程為同質(zhì)攻擊。【
案例2:數(shù)據(jù)匿名化--L-diversity】背景知識(shí)攻擊2如果攻擊者掌握了某個(gè)體的某些具體信息,通過(guò)鏈接攻擊后即使只能得到某個(gè)體對(duì)應(yīng)的多條信息記錄,并且記錄間的敏感屬性也完全不同或不相似,但攻擊者卻能夠根據(jù)所掌握的背景知識(shí),從多條信息記錄中找出唯一對(duì)應(yīng)的信息記錄,從而獲取到該個(gè)體的隱私信息。案例L-diversity的定義3L-多樣化主要指的是在公開的數(shù)據(jù)中,對(duì)于那些包含相同數(shù)據(jù)的準(zhǔn)標(biāo)識(shí)符的數(shù)據(jù),敏感數(shù)據(jù)必須具有多樣化。案例解析有10條相同的類型的數(shù)據(jù),其中8條的購(gòu)買偏好是電子產(chǎn)品,其他2條分別是圖書和家用電器。那么在這個(gè)例子中,公開的數(shù)據(jù)就滿足3-diversity的屬性。【
案例2:數(shù)據(jù)匿名化--L-diversity】l基于概率的L-多樣化(probabilisticl-diversity):在一個(gè)類型中出現(xiàn)頻率最高的值的概率不大于1/L。l基于墑的L-多樣化
(entropyl-diversity):在一個(gè)類型中敏感數(shù)據(jù)分布的墑至少是
log(l)。l遞歸
(c,l)-diversity(recursive(c,l)-diversity):簡(jiǎn)單來(lái)說(shuō)就是保證最經(jīng)常出現(xiàn)的值的出現(xiàn)頻率不要太高。案例L-diversity的局限性4敏感屬性的性質(zhì)決定即使保證了一定概率的多樣性也很容易泄露隱私。案例解析例如,醫(yī)院公開的艾滋病數(shù)據(jù)中,敏感屬性是“艾滋病陽(yáng)性”(出現(xiàn)概率是1%)和“艾滋病陰性”(出現(xiàn)概率是99%),這兩種值的敏感性不同,造成的結(jié)果也不同。(1)有些情況下L-diversity是沒(méi)有意義的:比如說(shuō)艾滋病數(shù)據(jù)的例子中僅含有兩種不同的值,保證2-diversity也是沒(méi)有意義的。(2)L-diversity很難達(dá)成:例如,想在10000條數(shù)據(jù)中保證2-diversity,那么可能最多需要10000*0.01=100個(gè)相同的類型。(3)偏斜性攻擊(SkewnessAttack):假如要保證在同一類型的數(shù)據(jù)中出現(xiàn)“艾滋病陽(yáng)性”和出現(xiàn)“艾滋病陰性”的概率是相同的,我們雖然保證了diversity,但是泄露隱私的可能性會(huì)變大。因?yàn)閘-diversity并沒(méi)有考慮敏感屬性的總體的分布。【
案例2:數(shù)據(jù)匿名化--L-diversity】通過(guò)小六的信息從公開數(shù)據(jù)中關(guān)聯(lián)到了兩條信息,通過(guò)這兩條信息能得出兩個(gè)結(jié)論。第一,小六的工資相對(duì)較低;第二,小六喜歡買電子電器相關(guān)的產(chǎn)品。案例【
案例3:數(shù)據(jù)匿名化--T-closeness】案例解析案例2最后一個(gè)問(wèn)題就引出了T-closeness的概念,T-closeness是為了保證在相同的準(zhǔn)標(biāo)識(shí)符Quasi-identifier類型組中,敏感信息的分布情況與整個(gè)數(shù)據(jù)的敏感信息分布情況接近(close),不超過(guò)閾值t。如果剛才的那個(gè)數(shù)據(jù)保證了T-closeness屬性,那么通過(guò)小六的信息查詢出來(lái)的結(jié)果中,工資的分布就和整體的分布類似,進(jìn)而很難推斷出小六工資的高低。如果保證了K-anonymity,L-diversity和T-closeness,隱私就不會(huì)泄露了么?保證了2-anonymity,2-diversity,t-closeness(分布近似),工資和購(gòu)買偏好是敏感屬性。攻擊者通過(guò)小六的個(gè)人信息找到了四條數(shù)據(jù),同時(shí)知道小六有很多書,這樣就能很容易在四條數(shù)據(jù)中找到小六的那一條,從而造成隱私泄露。
知識(shí)點(diǎn)【隱私保護(hù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】隱私保護(hù)相關(guān)的各類場(chǎng)景說(shuō)明知識(shí)點(diǎn)【隱私保護(hù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】數(shù)據(jù)隱私保護(hù)方法分析知識(shí)點(diǎn)【數(shù)據(jù)脫敏技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】數(shù)據(jù)脫敏是通過(guò)脫敏規(guī)則對(duì)某些敏感信息進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)對(duì)個(gè)人數(shù)據(jù)的隱私保護(hù)。使用標(biāo)準(zhǔn)的加密算法,使加密后得數(shù)據(jù)完全失去業(yè)務(wù)屬性,這種方法屬于低層次脫敏,算法開銷大,適用于機(jī)密性要求高、不需要保持業(yè)務(wù)屬性的場(chǎng)景?;跀?shù)據(jù)失真的技術(shù)加密方法最常用的是隨機(jī)干擾、亂序等,是不可逆算法,通過(guò)這種算法可以生成“看起來(lái)很真實(shí)的假數(shù)據(jù)”,以此來(lái)達(dá)到對(duì)個(gè)人數(shù)據(jù)的保護(hù),該方法適用于群體信息統(tǒng)計(jì)或需要保持業(yè)務(wù)屬性的場(chǎng)景。這種方法兼具可逆和保證業(yè)務(wù)屬性的特征,可以通過(guò)位置變換、表映射、算法映射等方式實(shí)現(xiàn)。可逆的置換算法知識(shí)點(diǎn)【基于限制發(fā)布的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】收集和共享個(gè)人數(shù)據(jù)引發(fā)了個(gè)人隱私的擔(dān)憂。針對(duì)這個(gè)問(wèn)題,目前的解決方法主要采用基于限制發(fā)布的技術(shù),包括匿名化處理和公布不完全的數(shù)據(jù)集。數(shù)據(jù)匿名化算法可以實(shí)現(xiàn)根據(jù)具體情況有條件地發(fā)布部分?jǐn)?shù)據(jù),或者數(shù)據(jù)的部分屬性內(nèi)容,包括差分隱私(Differentialprivacy)、K匿名(K-anonymity)、L多樣化(L-diversity)、同態(tài)加密(Homomorphicencryption)等。k-anonymityExplicitidentifier:表示個(gè)體的唯一標(biāo)示,比如姓名(如小紅、小明)等具有唯一標(biāo)示型的內(nèi)容,在公開數(shù)據(jù)的時(shí)候需要對(duì)這些內(nèi)容進(jìn)行刪除。Quasi-identifiers:包括郵編、年齡、性別等非唯一,但是可以幫助研究人員對(duì)相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)的標(biāo)示。Sensitiveattributes:表示敏感但并不能直接得到用戶信息的數(shù)據(jù),比如用戶購(gòu)買偏好(如電子產(chǎn)品,護(hù)膚品)等,這些數(shù)據(jù)是研究人員最關(guān)心的,但并不能通過(guò)其直接得到用戶的信息,所以一般都直接公開。K匿名化方法主要有兩種操作策略。第一種是將某些敏感數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)列刪除,用星號(hào)(*)代替。另外一種方法是用概括的方法對(duì)信息進(jìn)行整合,使之無(wú)法區(qū)分,比如把年齡修改為所在的年齡段。知識(shí)點(diǎn)L-diversity【例6-1】一個(gè)簡(jiǎn)單的隱私泄露案例。小王去電影院看電影,在買票前,某影片的售賣票數(shù)是100張,而小紅買票后,該影片的售賣票數(shù)變成了101,那么就有很大的概率推測(cè)小王看的電影與小紅是同一部。這樣就會(huì)導(dǎo)致小王的隱私遭到了泄露?!净谙拗瓢l(fā)布的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】L多樣化主要指的是在公開的數(shù)據(jù)中,對(duì)于那些包含相同數(shù)據(jù)的Quasi-identifiers(非唯一性標(biāo)示)數(shù)據(jù),敏感數(shù)據(jù)必須具有多樣化。需要保證相同類型數(shù)據(jù)中至少有L
種內(nèi)容不同的敏感屬性,這樣才能保證確保用戶信息不能通過(guò)背景知識(shí)或其他方法推斷得出。知識(shí)點(diǎn)differentialprivacy差分隱私差分隱私主要用于防止差異攻擊。簡(jiǎn)單來(lái)說(shuō),差分隱私是一種確保在同一組數(shù)據(jù)中查詢100條信息的結(jié)果和查詢99條信息結(jié)果相同的方法。因?yàn)椴樵兊玫降慕Y(jié)果相對(duì)一致,因此攻擊者無(wú)法僅僅比較差異來(lái)進(jìn)行差異攻擊?!净谙拗瓢l(fā)布的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】假設(shè)有一個(gè)表A,在對(duì)它做一定的擾動(dòng)后得到A1,而后在去掉表A中的某一行構(gòu)成表B,在對(duì)表B做一個(gè)擾動(dòng)得到B1,如果在數(shù)學(xué)意義上,表A1和表B1完全相同,這樣就可以做到隱私保護(hù)了。知識(shí)點(diǎn)【基于數(shù)據(jù)加密的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】(SecurityMulti-PartyComputation,SMC)眾多分布環(huán)境下基于隱私保護(hù)的數(shù)據(jù)挖掘應(yīng)用都可以抽象為無(wú)信任第三方(trustedthirdparty)參與的安全多方計(jì)算(SecurityMulti-PartyComputation,SMC)問(wèn)題。分布式匿名化安全多方計(jì)算匿名化即是隱藏?cái)?shù)據(jù)或數(shù)據(jù)來(lái)源。因?yàn)閷?duì)大多數(shù)應(yīng)用而言,首先需要對(duì)原始數(shù)據(jù)進(jìn)行處理以保證敏感信息的安全;然后再在此基礎(chǔ)上,進(jìn)行數(shù)據(jù)挖掘、發(fā)布等操作。由于多數(shù)SMC基于“準(zhǔn)誠(chéng)信模型”假設(shè)之上,因此應(yīng)用范圍有限。SCAMD(SecureCentralizedAnalysisofMulti-partyData)協(xié)議在去除該假設(shè)基礎(chǔ)上,引入準(zhǔn)誠(chéng)信第三方實(shí)現(xiàn)當(dāng)站點(diǎn)都是惡意時(shí)進(jìn)行安全多方計(jì)算即怎樣使兩個(gè)或多個(gè)站點(diǎn)通過(guò)某種協(xié)議完成計(jì)算后,每一方都只知道自己的輸入數(shù)據(jù)和所有數(shù)據(jù)計(jì)算后的最終結(jié)果。兩個(gè)站點(diǎn)S1和S2,它們擁有的數(shù)據(jù)分別為{ID,A11,A12,…,A1n1},{ID,A21,A22,…,A2n2}。其中Aij為Si擁有數(shù)據(jù)的第j個(gè)屬性。利用可交換加密在通信過(guò)程中隱藏原始信息,再構(gòu)建完整的匿名表判斷是否滿足k-匿名條件來(lái)實(shí)現(xiàn)。以在垂直劃分的數(shù)據(jù)環(huán)境下實(shí)現(xiàn)兩方的分布式k-匿名為例。知識(shí)點(diǎn)【基于數(shù)據(jù)加密的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】在分布式環(huán)境下,關(guān)聯(lián)規(guī)則挖掘的關(guān)鍵是計(jì)算項(xiàng)集的全局計(jì)數(shù),加密技術(shù)能保證在計(jì)算項(xiàng)集計(jì)數(shù)的同時(shí),不會(huì)泄露隱私信息。分布式聚類分布式關(guān)聯(lián)規(guī)則挖掘基于隱私保護(hù)的分布式聚類的關(guān)鍵是安全地計(jì)算數(shù)據(jù)間的距離(1)Na?ve聚類模型。各個(gè)站點(diǎn)將數(shù)據(jù)用加密方式安全地傳遞給信任第三方,由信任第三方進(jìn)行聚類后返回結(jié)果。(2)多次聚類模型。首先各個(gè)站點(diǎn)對(duì)本地?cái)?shù)據(jù)進(jìn)行聚類并發(fā)布結(jié)果,再通過(guò)對(duì)各個(gè)站點(diǎn)發(fā)布的結(jié)果進(jìn)行二次處理,實(shí)現(xiàn)分布式聚類。知識(shí)點(diǎn)【基于數(shù)據(jù)失真的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】數(shù)據(jù)失真技術(shù)通過(guò)擾動(dòng)(perturbation)原始數(shù)據(jù)來(lái)實(shí)現(xiàn)隱私保護(hù)。它要使擾動(dòng)后的數(shù)據(jù)同時(shí)滿足:(1)攻擊者不能發(fā)現(xiàn)真實(shí)的原始數(shù)據(jù)。攻擊者通過(guò)發(fā)布的失真數(shù)據(jù)不能重構(gòu)出真實(shí)的原始數(shù)據(jù)。(2)失真后的數(shù)據(jù)仍然保持某些性質(zhì)不變。利用失真數(shù)據(jù)得出的某些信息等同于從原始數(shù)據(jù)上得出的信息。這就保證了基于失真數(shù)據(jù)的某些應(yīng)用的可行性。隨機(jī)化數(shù)據(jù)隨機(jī)化即是對(duì)原始數(shù)據(jù)加入隨機(jī)噪聲,然后發(fā)布擾動(dòng)后數(shù)據(jù)的方法1.隨機(jī)擾動(dòng)2.隨機(jī)化應(yīng)答隨機(jī)擾動(dòng)過(guò)程重構(gòu)過(guò)程數(shù)據(jù)所有者對(duì)原始數(shù)據(jù)擾動(dòng)后發(fā)布,使攻擊者不能以高于預(yù)定閾值的概率得出原始數(shù)據(jù)是否包含某些真實(shí)信息或偽信息。雖然發(fā)布的數(shù)據(jù)不再真實(shí),但在數(shù)據(jù)量比較大的情況下,統(tǒng)計(jì)信息和匯聚(aggregate)信息仍然可以較為精確地被估算出。知識(shí)點(diǎn)【基于數(shù)據(jù)失真的技術(shù)】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】阻塞與凝聚它將原始數(shù)據(jù)記錄分成組,每一組內(nèi)存儲(chǔ)著由k條記錄產(chǎn)生的統(tǒng)計(jì)信息,包括每個(gè)屬性的均值、協(xié)方差等。這樣,只要是采用凝聚技術(shù)處理的數(shù)據(jù),都可以用通用的重構(gòu)算法進(jìn)行處理,并且重構(gòu)后的記錄并不會(huì)披露原始記錄的隱私,因?yàn)橥唤M內(nèi)的k條記錄是兩兩不可區(qū)分的。1.凝聚技術(shù)2.阻塞技術(shù)阻塞技術(shù)采用的是不發(fā)布某些特定數(shù)據(jù)的方法,因?yàn)槟承?yīng)用更希望基于真實(shí)數(shù)據(jù)進(jìn)行研究。阻塞技術(shù)具體反應(yīng)到數(shù)據(jù)表中,即是將某些特定的值用一個(gè)不確定符號(hào)代替。例如通過(guò)引入除{0,1}外的代表不確定值的符號(hào)“?”可以實(shí)現(xiàn)對(duì)布爾關(guān)聯(lián)規(guī)則的隱藏。由于某些值被“?”代替,那么對(duì)某些項(xiàng)集的計(jì)數(shù)則為一個(gè)不確定的值,位于一個(gè)最小估計(jì)值和最大估計(jì)值范圍內(nèi)。數(shù)據(jù)采集過(guò)程中對(duì)隱私的侵犯1用戶在上網(wǎng)過(guò)程中的每一次點(diǎn)擊,錄入行為都會(huì)在云端服務(wù)器上留下相應(yīng)的記錄,特別是在現(xiàn)今移動(dòng)互聯(lián)網(wǎng)智能手機(jī)大發(fā)展的背景下,我們每時(shí)每刻都與網(wǎng)絡(luò)連通,同時(shí)我們也每時(shí)每刻都在被網(wǎng)絡(luò)所記錄,這些記錄被儲(chǔ)存就形成了龐大的數(shù)據(jù)庫(kù)。知識(shí)點(diǎn)【大數(shù)據(jù)隱私威脅】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】數(shù)據(jù)存儲(chǔ)過(guò)程中對(duì)隱私的侵犯2互聯(lián)網(wǎng)運(yùn)營(yíng)服務(wù)商往往把他們所采集的數(shù)據(jù)放到云端服務(wù)器上,并運(yùn)用大量的信息技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行保護(hù)。賬戶劫持、攻擊、身份偽造、認(rèn)證失效、密匙丟失等都可能威脅用戶數(shù)據(jù)安全。數(shù)據(jù)使用過(guò)程中對(duì)隱私的侵犯3聯(lián)網(wǎng)運(yùn)營(yíng)服務(wù)商采集用戶行為數(shù)據(jù)的目的是為了其自身利益,因此基于對(duì)這些數(shù)據(jù)分析使用在一定程度上也會(huì)侵犯用戶的權(quán)益。知識(shí)點(diǎn)【大數(shù)據(jù)隱私威脅】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】數(shù)據(jù)銷毀過(guò)程中對(duì)隱私的侵犯4由于數(shù)字化信息低成本易復(fù)制的特點(diǎn),導(dǎo)致大數(shù)據(jù)一旦產(chǎn)生很難通過(guò)單純的刪除操作徹底銷毀,它對(duì)用戶隱私的侵犯將是一個(gè)長(zhǎng)期的過(guò)程。一是數(shù)據(jù)收集缺乏針對(duì)性,容易導(dǎo)致廣泛、不合理、過(guò)度收集信息數(shù)據(jù),常常通過(guò)覆蓋面很廣的信息收集和分析后才能找出其中有價(jià)值的信息,在此過(guò)程中很難避免不觸碰到一些隱私數(shù)據(jù)。二是信息數(shù)據(jù)多種多樣,如智能終端、智能手環(huán)、物聯(lián)網(wǎng)、位置導(dǎo)航等個(gè)人端產(chǎn)生的海量信息,這些開放、分散的數(shù)據(jù)實(shí)時(shí)接入網(wǎng)絡(luò),管理員很難像傳統(tǒng)互聯(lián)網(wǎng)管理一樣逐一對(duì)其編輯和管理,進(jìn)行實(shí)時(shí)跟蹤保護(hù)。三是開源的開發(fā)環(huán)境、頻繁的迭代升級(jí)、輕量化的快速部署和規(guī)模復(fù)制、分布式和非關(guān)系型數(shù)據(jù)存儲(chǔ),容易使企業(yè)在源頭上忽視信息安全問(wèn)題。四是在數(shù)據(jù)進(jìn)行分析利用后,往往將大量的看似無(wú)價(jià)值、碎片化的信息數(shù)據(jù)隨意丟棄,容易導(dǎo)致被其他企業(yè)甚至不法分子進(jìn)行廣泛收集和合成分析后變成其所用的高價(jià)值數(shù)據(jù)。五是大數(shù)據(jù)集群保障了快速的處理特點(diǎn),但其自我組織性和自由開放性使用戶與多個(gè)數(shù)據(jù)節(jié)點(diǎn)同時(shí)通信互聯(lián),容易導(dǎo)致數(shù)據(jù)節(jié)點(diǎn)被滲透、被攻擊,甚至產(chǎn)生數(shù)據(jù)泄露事件。知識(shí)點(diǎn)【大數(shù)據(jù)獨(dú)特的隱私問(wèn)題】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】大數(shù)據(jù)具備數(shù)據(jù)體量大、數(shù)據(jù)類型繁多、價(jià)值密度低和處理速度快四大特點(diǎn)知識(shí)點(diǎn)【大數(shù)據(jù)安全對(duì)策措施】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】大數(shù)據(jù)安全對(duì)策措施:加強(qiáng)信息保護(hù),要完善現(xiàn)有法律法規(guī)加強(qiáng)信息保護(hù),要加大對(duì)信息源頭的監(jiān)管加強(qiáng)信息保護(hù),要提高公眾的自我保護(hù)意識(shí)知識(shí)點(diǎn)【區(qū)塊鏈】【第六章數(shù)據(jù)隱私保護(hù)技術(shù)】區(qū)塊鏈與隱私保護(hù)區(qū)塊鏈具有去中心化、信息不可篡改、數(shù)據(jù)公開透明等基本特點(diǎn)以及共識(shí)機(jī)制、智能合約、非對(duì)稱加密三大保障機(jī)制。區(qū)塊鏈技術(shù)可利用去中心化存儲(chǔ)策略,將安全信息存放到網(wǎng)絡(luò)節(jié)點(diǎn)中,同時(shí)將流程管理信息以云端開放的方式分而治
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年互聯(lián)網(wǎng)融資項(xiàng)目協(xié)議模板
- 2025年養(yǎng)殖業(yè)牛羊銷售合同
- 2025年農(nóng)業(yè)用地交換協(xié)議樣本
- 2025年業(yè)主前期物業(yè)安全服務(wù)協(xié)議
- 2025年中鐵隧道煤礦鉆孔工程合同文本
- 2025年二手房產(chǎn)顧問(wèn)職位合同
- 2025年典型房地產(chǎn)咨詢服務(wù)合同
- 2025年全勤教師合同范本
- 2025年游戲劇情策劃授權(quán)合同
- 2025年企業(yè)招聘審計(jì)專員合同范本
- (高清版)TDT 1037-2013 土地整治重大項(xiàng)目可行性研究報(bào)告編制規(guī)程
- 幼兒園春季開學(xué)教職工安全培訓(xùn)內(nèi)容
- 儲(chǔ)油罐安全操作規(guī)程培訓(xùn)
- 情緒障礙跨診斷治療的統(tǒng)一方案
- 《萬(wàn)以內(nèi)數(shù)的認(rèn)識(shí)》大單元整體設(shè)計(jì)
- 中醫(yī)護(hù)理質(zhì)量敏感指標(biāo)的構(gòu)建
- 聚焦幼兒作品分析的游戲觀察與評(píng)價(jià)
- 創(chuàng)傷性腦疝查房
- 農(nóng)村常見傳染病預(yù)防知識(shí)講座
- XX醫(yī)院網(wǎng)絡(luò)及設(shè)備巡檢記錄表
- 開龍IT2021使用手冊(cè)
評(píng)論
0/150
提交評(píng)論