




已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
自然語(yǔ)言浮水印(Natural Language Water Marking),International Workshop on Digital Watermarking IWDW 2003,What is NL Watermarking,文字?jǐn)?shù)位 浮水印技術(shù),原文,將浮水印加入數(shù)位文字內(nèi)容中,此浮水印技術(shù)與文字的內(nèi)容語(yǔ)意相關(guān)而無(wú)關(guān)於文字儲(chǔ)存的格式,可以加強(qiáng)數(shù)位文字內(nèi)容的保護(hù)。,加入浮水印之後的文章,浮水印技術(shù)規(guī)格,透明性(transparency) 被加入浮水印(watermark)須感官上(perceptually) 看不見(jiàn)(invisible)或聽(tīng)不到(inaudible) 亦即無(wú)法察覺(jué)(imperceptible)以免影響原來(lái)資訊的品質(zhì)。 非偵測(cè)性(undetectability) 所加入的浮水印須無(wú)法被偵測(cè)出其位置,以免被不法者輕易剪下而移除。 強(qiáng)健性(robustness) 安全的浮水印需能忍受各種數(shù)位處理與攻擊(attacks)以維持其功能,或者至少在其被破壞前原始影像已嚴(yán)重失真。 安全性(security) 即使知道加入的浮水印的程序也無(wú)法讓未經(jīng)授權(quán)者移除所加入的浮水印。 非模糊性(unambiguousness) 解決合法擁有者死結(jié)的問(wèn)題,亦即確認(rèn)唯一合法擁有者。 鑑定時(shí)勿需原始影像(authentication without original source),浮水印示意圖,文字(Doc,Txt),密鑰,加密後語(yǔ)意不變,修改後之文字,浮水印解析,公開(kāi)發(fā)表,第三者修改,公開(kāi)發(fā)表,2,3,4,5,6,浮水印植入,1,使用者上載,2005我於臺(tái)北發(fā)表,2005我於臺(tái)北發(fā)表,自然語(yǔ)言浮水印-研發(fā)規(guī)格說(shuō)明,詞彙分析技術(shù): 發(fā)展一句子語(yǔ)意解析技術(shù),了解句子中的語(yǔ)意,包含斷詞、詞性標(biāo)記與詞彙分析技術(shù)等功能。 語(yǔ)句句型解析技術(shù): 發(fā)展一語(yǔ)句技術(shù)分析是那一種句型,再依照不同的句型解析成不同句型樹(shù)。 句子選擇技術(shù): 發(fā)展一句子選擇技術(shù),從文件中分析語(yǔ)句得重要性已選擇適當(dāng)?shù)木渥印?浮水印encoding技術(shù): 發(fā)展一浮水印encoding技術(shù),將欲植入的浮水印分解成小部分,分別植入選定的句子中。而此浮水印encoding技術(shù)採(cǎi)用密鑰(encryption key) approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。 發(fā)展一句型替換技術(shù),將語(yǔ)句的語(yǔ)意保留而進(jìn)行不同句型的替換,替換的方式包括同義詞與同義句型樹(shù)替換。,自然語(yǔ)言浮水印技術(shù)突破,句型替換技術(shù): 同義詞替換 以ACT thesaurus 為基礎(chǔ)之同義詞替換 同義句型替換 Zero Anaphora 技術(shù)研發(fā) Co-Reference 技術(shù)研發(fā) 浮水印encoding技術(shù): 以同義詞替換方法為基礎(chǔ)之資訊隱藏方法 二元樹(shù)分法,可隱藏 logn 個(gè)bit ,n 為同義詞個(gè)數(shù)。 完成以同義詞替換為主的浮水印加密方式,植入文字格式數(shù)位浮水印流程圖,文字格式數(shù)位浮水印研發(fā)技術(shù),創(chuàng)新前瞻語(yǔ)意利解搜尋引擎既有成果,文字格式數(shù)位浮水印技術(shù)-詞彙分析技術(shù),了解句子中的語(yǔ)意,當(dāng)進(jìn)行Watermark encoding時(shí)便能維持文字中的語(yǔ)意 斷詞與詞性標(biāo)記 中研院分詞及詞性標(biāo)注Autotag系統(tǒng) 詞彙分析 知網(wǎng)(How Net) 創(chuàng)新前瞻語(yǔ)意搜尋引擎計(jì)畫(huà)中所研發(fā)的”ACT thesaurus”,文字格式數(shù)位浮水印技術(shù)-語(yǔ)句句型解析技術(shù)(續(xù)),同義中文結(jié)構(gòu)樹(shù)關(guān)聯(lián)技術(shù):由於選定做Watermark encoding的句子的結(jié)構(gòu)不一定能將Watermark encoding在此結(jié)構(gòu)中,需保留句子的語(yǔ)意並且更改句子的結(jié)構(gòu),文字格式數(shù)位浮水印技術(shù)-句子選擇演算法(續(xù)),句子重要性分析技術(shù): 原因 一篇文章中句子數(shù)目眾多,浮水印的資訊有限,不可能每一句子都encoding浮水印資訊於其中。 侵權(quán)者往往只會(huì)盜用重要的句子。 增加浮水印之彈性。 計(jì)算句子資訊量的方法,計(jì)算每一句的資訊量,資訊量高的句子假設(shè)為重要的句子,文字格式數(shù)位浮水印技術(shù)-句子選擇演算法,句子排序技術(shù):將句子做一排序,以決定浮水印的每一小部分資訊encoding到句子中的順序,這樣可保護(hù)浮水印資訊不容易被偵測(cè)與不容易被破壞。,文字格式數(shù)位浮水印技術(shù)-句型替換演算法,當(dāng)選定做Watermark encoding的句子不符合時(shí),可將此句的語(yǔ)意保留而進(jìn)行不同句型的替換。,文字格式數(shù)位浮水印技術(shù)-句型替換演算法(續(xù)),同義詞替換技術(shù): 知網(wǎng)(How Net) 與”ACT thesaurus” 所定義之詞義,進(jìn)行詞之相似度計(jì)算建立同義詞庫(kù)。,文字格式數(shù)位浮水印技術(shù)-句型替換演算法(續(xù)),同義中文結(jié)構(gòu)樹(shù)轉(zhuǎn)換技術(shù):當(dāng)Watermark要encoding到選定句子的結(jié)構(gòu)樹(shù)之結(jié)構(gòu)中,而結(jié)構(gòu)樹(shù)的結(jié)構(gòu)不符合時(shí),將語(yǔ)意保留而進(jìn)行不同句型的替換。 利用同義中文結(jié)構(gòu)樹(shù)關(guān)聯(lián)技術(shù)所建立出來(lái)的同義結(jié)構(gòu)樹(shù)進(jìn)行替換,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù),發(fā)展一浮水印encoding技術(shù),將欲植入的浮水印分解成小部分,分別植入選定的句子中,而即使知道加入的浮水印的encoding程序,未經(jīng)授權(quán)者也無(wú)法移除所加入的浮水印。 此浮水印encoding技術(shù)採(cǎi)用密鑰(encryption key) approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù)(續(xù)),浮水印分解技術(shù):將欲植入的浮水印分解成小部分,分別植入選定的句子結(jié)構(gòu)樹(shù)之結(jié)構(gòu)中。 Unicode轉(zhuǎn)換,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù)(續(xù)),浮水印植入技術(shù):將經(jīng)過(guò)分解過(guò)後的浮水印資訊的每一小部分,分別Encoding到選定的句子樹(shù)狀結(jié)構(gòu)中。,Watermark,Unicode 轉(zhuǎn)換,1 0 0 1 1 1,Bit轉(zhuǎn)換,Bit轉(zhuǎn)換,Bit轉(zhuǎn)換,句子1,句子2,句子n,. . .,Encryption key,Encryption key,Encryption key,1 0 1 0 ,0 1 1 0 ,0 0 1 0 ,Match,Match,Match,Yes,Yes,no,成功,成功,句型替換,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù)(續(xù)),浮水印解析技術(shù):為浮水印植入技術(shù)的一個(gè)反向操作 滿(mǎn)足就算知道Encoding的方式,只有拿到Encoding用的密鑰(encryption key)以及encoding後的文章才可解析浮水印,Quadratic Residue,二次殘差(quadratic residue),目前做法,找一質(zhì)數(shù)p, 產(chǎn)生 Quadratic Residue Table,Quadratic Residue :1 Quadratic nonResidue:0,同義句型替換,目的,維持一句子的語(yǔ)意,而將句子的結(jié)構(gòu)(句型)進(jìn)行替換(換句換說(shuō)) 。,同義句型替換- Zero anaphora,n m 他買(mǎi)了一顆蘋(píng)果,很新鮮。 他買(mǎi)了一顆蘋(píng)果,蘋(píng)果很新鮮。,VP,VH,Dfa,很,新鮮,S,VP,VH,Dfa,很,新鮮,NP,Na,蘋(píng)果,S,同義句型替換-CoReference,代名詞以其所指涉之名詞替換 張三是老師,他教學(xué)很認(rèn)真。 張三是老師,張三教學(xué)很認(rèn)真。,S,VP,NP,Nh,他,S,VP,NP,Nb,張三,同義句型替換-CoReference (Con.),代名詞(名詞)以其所指涉之(名詞+屬性)替換 張三是老師,同時(shí),他也是一位好爸爸。 張三是老師,同時(shí),張三老師也是一位好爸爸。,S,NP,NP,NP,NP,S,NP,NP,NP,NP,同義句型替換-以 Grammar 分析為基礎(chǔ)之同義句型替換,分析中文 Grammar 以獲得各種同義句型替換規(guī)則。 並列連接詞(Ca) 關(guān)聯(lián)連接詞(Cb) 需有中文人才支援 整理出各種Grammar轉(zhuǎn)換rule Rule如何套用在同義句型替換? 寫(xiě)死在程式中? 發(fā)展一套用rule的 adapter,並列連接詞(Ca),並列連接詞連接兩個(gè)概念相似的成分,形成向心式結(jié)構(gòu),組成成分的作用與其連接成分相同。 對(duì)等連接詞(Caa),關(guān)聯(lián)連接詞(Cb),一般關(guān)聯(lián)連接詞存在有前後相對(duì)的連接詞(e.g.因?yàn)樗? 。 我因?yàn)樯×怂詪寢尣唤o我出去玩 我生病了所以媽媽不給我出去玩 媽媽不給我出去玩是因?yàn)槲疑×?以同義句型替換方法為基礎(chǔ)之資訊隱藏方法,Encoding Watermark in Tree Structure,以詞性與structure為依據(jù)。 依照詞性標(biāo)上對(duì)應(yīng)之?dāng)?shù)字 利用 DFS, BFS 將數(shù)字連接起來(lái) 一個(gè)Tree structure, 兩個(gè)”很大的數(shù)” 。 可以利用 “and”, “or”, “xor”等bit operation 增加其encoding bit的能力。 將所得到的”很大的數(shù)”利用 bit operation合併之後 mod P (Key) 去查 table。,DFS,1547021718470847154747,BFS,47024715471547081718,Bit operation,21232512346235,Mod P & Lookup table,1,435241241241241,Bit operation,Mod P & Lookup table,0,浮水印評(píng)量標(biāo)準(zhǔn),透明性 PSNR 資訊隱藏量 互斥條件 強(qiáng)健性 透明性 容量 1long n 攻擊 同義字替換 句子語(yǔ)意結(jié)構(gòu)樹(shù)之替換 部分句子取用 句子順序掉換 新增/刪除句子 竄改偵測(cè) Retrieval Watermark ratio Normal Correction Gaussian sequence,未來(lái)應(yīng)用的情境,Text watermarking Data hiding 使用者輸入一文章、密鑰,與一訊息,系統(tǒng)自動(dòng)將訊息隱藏於文章中,而文章的語(yǔ)意不變。 Sub Set of
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 倉(cāng)儲(chǔ)辦公家具保管合同范例
- 酒店經(jīng)營(yíng)管理師職業(yè)環(huán)境分析試題及答案
- 適應(yīng)2024年Adobe設(shè)計(jì)師考試的學(xué)習(xí)資料試題及答案
- 二手車(chē)分期付款合同范例
- 業(yè)務(wù)提成合同范例范例
- 臨時(shí)協(xié)議過(guò)戶(hù)合同范例
- 中級(jí)審計(jì)師復(fù)習(xí)資料整合與篩選的科學(xué)方法及技巧探討試題及答案
- 公路煤炭運(yùn)輸合同范例
- 公司做廣告合同范例
- 中介股東合同范例
- 歲月不負(fù)母親時(shí)光留住溫情 課件高二下學(xué)期母親節(jié)(5月11日)主題班會(huì)
- 2025年公共衛(wèi)生與預(yù)防醫(yī)學(xué)考試試卷及答案
- Unit 5 Animals Lesson 3 教學(xué)設(shè)計(jì)-人教精通版三年級(jí)英語(yǔ)下冊(cè)
- 2024年四川公安廳招聘警務(wù)輔助人員筆試真題
- 網(wǎng)站聯(lián)盟廣告專(zhuān)題報(bào)告
- 廣東入團(tuán)考試試題及答案
- 2025年四川省成都市高新區(qū)中考數(shù)學(xué)二診試卷
- 平安人壽代理合同協(xié)議
- 貴州煙草專(zhuān)賣(mài)局招聘筆試題庫(kù)2025
- iso28000-2022供應(yīng)鏈安全管理手冊(cè)程序文件表單一整套
- 《連續(xù)性腎替代治療容量評(píng)估與管理專(zhuān)家共識(shí)》解讀課件
評(píng)論
0/150
提交評(píng)論