




已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2014年數(shù)學(xué)建模競(jìng)賽湖南賽區(qū)研討會(huì),2013B題“碎紙片拼接復(fù)原”評(píng)論,題 目,B題 碎紙片的拼接復(fù)原 破碎文件的拼接在司法物證復(fù)原、歷史文獻(xiàn)修復(fù)以及軍事情報(bào)獲取等領(lǐng)域都有著重要的應(yīng)用。傳統(tǒng)上,拼接復(fù)原工作需由人工完成,準(zhǔn)確率較高,但效率很低。特別是當(dāng)碎片數(shù)量巨大,人工拼接很難在短時(shí)間內(nèi)完成任務(wù)。隨著計(jì)算機(jī)技術(shù)的發(fā)展,人們?cè)噲D開(kāi)發(fā)碎紙片的自動(dòng)拼接技術(shù),以提高拼接復(fù)原效率。請(qǐng)討論以下問(wèn)題: 1. 對(duì)于給定的來(lái)自同一頁(yè)印刷文字文件的碎紙機(jī)破碎紙片(僅縱切),建立碎紙片拼接復(fù)原模型和算法,并針對(duì)附件1、附件2給出的中、英文各一頁(yè)文件的碎片數(shù)據(jù)進(jìn)行拼接復(fù)原。如果復(fù)原過(guò)程需要人工干預(yù),請(qǐng)寫(xiě)出干預(yù)方式及干預(yù)的時(shí)間節(jié)點(diǎn)。復(fù)原結(jié)果以圖片形式及表格形式表達(dá)。,題 目,2. 對(duì)于碎紙機(jī)既縱切又橫切的情形,請(qǐng)?jiān)O(shè)計(jì)碎紙片拼接復(fù)原模型和算法,并針對(duì)附件3、附件4給出的中、英文各一頁(yè)文件的碎片數(shù)據(jù)進(jìn)行拼接復(fù)原。如果復(fù)原過(guò)程需要人工干預(yù),請(qǐng)寫(xiě)出干預(yù)方式及干預(yù)的時(shí)間節(jié)點(diǎn)。復(fù)原結(jié)果表達(dá)要求同上。 3. 上述所給碎片數(shù)據(jù)均為單面打印文件,從現(xiàn)實(shí)情形出發(fā),還可能有雙面打印文件的碎紙片拼接復(fù)原問(wèn)題需要解決。附件5給出的是一頁(yè)英文印刷文字雙面打印文件的碎片數(shù)據(jù)。請(qǐng)嘗試設(shè)計(jì)相應(yīng)的碎紙片拼接復(fù)原模型與算法,并就附件5的碎片數(shù)據(jù)給出拼接復(fù)原結(jié)果,結(jié)果表達(dá)要求同上。,目 錄,命題背景 解題思路 評(píng)閱要點(diǎn) 存在問(wèn)題 幾點(diǎn)評(píng)價(jià),命 題 背 景,有實(shí)際應(yīng)用 難度適中 參考文獻(xiàn)少 一篇參考文獻(xiàn):Reconstruction of shredded document based on image feature matching,解 題 思 路,總體思路 三步走:分行,行內(nèi)排序,行間排序 其他做法有: 全局生長(zhǎng)算法 :技術(shù)含量低,出錯(cuò)概率大。 鄰近生長(zhǎng)算法:同上,解 題 思 路,第一步:分行 行距信息 :普遍做法,精度略差(尤其是英文),大約是80%左右,技術(shù)含量不足。 聚類算法:主流算法,技術(shù)含量較高,效果好。,圖1:英文文本行特征像素行和,解 題 思 路,第一步:分行聚類算法 計(jì)算Ai 的行和,得到180維向量ri。定義合適的向量相似度,對(duì)ri(i = 1;2;: : ; n)進(jìn)行相似度計(jì)算,然后對(duì)所有碎片進(jìn)行聚類,從而得到分行結(jié)果。,解 題 思 路,第一步:分行聚類算法 幾種相似性度量 歐氏距離倒數(shù): 夾角余弦: 相關(guān)系數(shù):,解 題 思 路,第一步:分行聚類算法,解 題 思 路,第一步:分行規(guī)劃算法 假設(shè)每一組最左邊一塊可以識(shí)別出來(lái),記為 ,其他198塊碎片記為 ,相似度記為 ,則可以求解以下0-1線性規(guī)劃求得分組結(jié)果: s.t.,解 題 思 路,第二步:行內(nèi)排序距離定義 歐氏距離 夾角余弦 相關(guān)系數(shù),解 題 思 路,第二步:行內(nèi)排序距離定義 考慮斜率的距離: 考慮像素陣列分布的距離:,解 題 思 路,第二步:行內(nèi)排序排序算法 貪心算法1:從左到右逐步拼接 貪心算法2:從右到左逐步拼接 貪心算法3:所有鄰接距離中最小的兩片拼接 圖論+規(guī)劃方法:按鄰接距離定義有向權(quán)圖,將最佳排序問(wèn)題轉(zhuǎn)化為T(mén)SP問(wèn)題,再應(yīng)用規(guī)劃軟件求解。,解 題 思 路,第二步:行內(nèi)排序排序算法 規(guī)劃方法:定義兩碎片i,j之間邊緣(有向)距離為rij,并規(guī)定ri0=r18,j=,求解以下規(guī)劃模型: 如果求解結(jié)果無(wú)子回路,則得到問(wèn)題最優(yōu)解。,解 題 思 路,第二步:行內(nèi)排序排序算法 第三問(wèn)雙面規(guī)劃方法: 如果求解結(jié)果無(wú)子回路,則得到問(wèn)題最優(yōu)解。,解 題 思 路,第二步:行內(nèi)排序排序算法結(jié)果,說(shuō)明:假設(shè)分行完全正確;括號(hào)中的數(shù)字是沒(méi)有完全復(fù)原的行數(shù)。,解 題 思 路,第三步:行間排序 根據(jù)行距排序,或者根據(jù)內(nèi)容排序。,評(píng) 閱 要 點(diǎn),1. 看思路:是否有全局最優(yōu)的思想。 2. 看特征信息:分行時(shí)是否用到所有像素點(diǎn)信息?是否用到文字結(jié)構(gòu)信息?是否考慮多種信息,并從比較中選取合適信息? 3. 看算法:看算法與模型是否一致,看算法描述。 4. 看人工干預(yù):干預(yù)方式及干預(yù)時(shí)間節(jié)點(diǎn)是否明確表述?,評(píng) 閱 要 點(diǎn),存 在 問(wèn) 題,直觀想法建模比例之高超乎意料。 過(guò)于依賴人工拼接。 特征信息發(fā)掘不深、不廣。 計(jì)算能力不強(qiáng)。 模型、算法、程序、結(jié)果脫節(jié),甚至有造假現(xiàn)象。 最普遍的缺陷是模型檢驗(yàn)嚴(yán)重不足。,幾 點(diǎn) 評(píng) 價(jià),過(guò)于重視結(jié)果的痼疾在競(jìng)賽論文中充分暴露,在題目中直接給出結(jié)果也許能啟發(fā)學(xué)生更關(guān)注模型。 模型檢驗(yàn)是建模過(guò)程的必要環(huán)節(jié),甚至是重要環(huán)節(jié),從此次論文來(lái)看,這還是一個(gè)較薄弱
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2021-2026年中國(guó)葵花籽行業(yè)發(fā)展監(jiān)測(cè)及投資戰(zhàn)略規(guī)劃研究報(bào)告
- 青島房地產(chǎn)項(xiàng)目投資可行性初步分析報(bào)告
- 四川省樂(lè)山市高中2025屆高二化學(xué)第二學(xué)期期末預(yù)測(cè)試題含解析
- 中國(guó)公廁溝槽式?jīng)_便器行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告(2024-2030)
- 2025年中國(guó)光模塊行業(yè)競(jìng)爭(zhēng)格局分析及投資規(guī)劃研究報(bào)告
- 國(guó)家生產(chǎn)安全監(jiān)督管理總局
- 安全生產(chǎn)事故案例分析及經(jīng)驗(yàn)反饋
- 公交車(chē)安全操作規(guī)程
- 誰(shuí)是本地區(qū)安全生產(chǎn)第一責(zé)任人
- 光伏發(fā)電EPC項(xiàng)目建設(shè)方案及可行性分析報(bào)告
- 巖土工程勘察中鉆探工藝的選取
- 中國(guó)思想史課件
- 重癥肺炎個(gè)案護(hù)理查房
- 2023消防系統(tǒng)驗(yàn)收記錄表室內(nèi)給水系統(tǒng)室內(nèi)消火栓
- 植保無(wú)人機(jī)作業(yè)情況記錄表
- 北師大版小學(xué)六年級(jí)數(shù)學(xué)下冊(cè)教學(xué)工作總結(jié)
- 工業(yè)相機(jī)與機(jī)器視覺(jué)知識(shí)考試題庫(kù)及答案
- (完整word版)人教版九年級(jí)英語(yǔ)課文原文word版
- 三菱通用變頻器D700使用手冊(cè)
- 分期付款合同協(xié)議
- 埃得新材料有限公司年產(chǎn)10425噸聚苯醚及5000噸鄰甲酚項(xiàng)目環(huán)境影響報(bào)告書(shū)
評(píng)論
0/150
提交評(píng)論