圖像處理與計(jì)算機(jī)視覺(jué)基礎(chǔ),經(jīng)典以及最近發(fā)展(共29頁(yè))_第1頁(yè)
圖像處理與計(jì)算機(jī)視覺(jué)基礎(chǔ),經(jīng)典以及最近發(fā)展(共29頁(yè))_第2頁(yè)
圖像處理與計(jì)算機(jī)視覺(jué)基礎(chǔ),經(jīng)典以及最近發(fā)展(共29頁(yè))_第3頁(yè)
圖像處理與計(jì)算機(jī)視覺(jué)基礎(chǔ),經(jīng)典以及最近發(fā)展(共29頁(yè))_第4頁(yè)
圖像處理與計(jì)算機(jī)視覺(jué)基礎(chǔ),經(jīng)典以及最近發(fā)展(共29頁(yè))_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、圖像處理與計(jì)算機(jī)視覺(jué)基礎(chǔ),經(jīng)典以及(yj)最近發(fā)展一、緒論(xln)1. 為什么要寫(xiě)這篇文章從2002年到現(xiàn)在,接觸圖像快十年了。雖然沒(méi)有做出什么很出色的工作,不過(guò)在這個(gè)領(lǐng)域摸爬滾打了十年之后,發(fā)現(xiàn)自己對(duì)圖像處理和計(jì)算機(jī)視覺(jué)的感情越來(lái)越深厚。下班之后看看相關(guān)的書(shū)籍和文獻(xiàn)是一件很愜意的事情。平常的一大業(yè)余愛(ài)好就是收集一些(yxi)相關(guān)的文章,尤其是經(jīng)典的文章,到現(xiàn)在我的電腦里面已經(jīng)有了幾十G的文章。寫(xiě)這個(gè)文檔的想法源于我前一段時(shí)間整理文獻(xiàn)時(shí)的一個(gè)突發(fā)奇想,既然有這個(gè)多文獻(xiàn),何不整理出其中的經(jīng)典,抓住重點(diǎn)來(lái)閱讀,同時(shí)也可以共享給大家。于是當(dāng)時(shí)即興寫(xiě)了一個(gè)圖像處理與計(jì)算機(jī)視覺(jué)中的經(jīng)典論文?,F(xiàn)在來(lái)看,

2、那個(gè)文檔寫(xiě)得很一般,所共享的論文也非常之有限。就算如此,還是得到了一些網(wǎng)友的夸獎(jiǎng),心里感激不盡。因此,一直想下定決心把這個(gè)工作給完善,力求做到盡量全面。本文是對(duì)現(xiàn)有的圖像處理和計(jì)算機(jī)視覺(jué)的經(jīng)典書(shū)籍(后面會(huì)有推薦)的一個(gè)補(bǔ)充。一般的圖像處理書(shū)籍都是介紹性的介紹某個(gè)方法,在每個(gè)領(lǐng)域內(nèi)都會(huì)引用幾十上百篇參考文獻(xiàn)。有時(shí)候想深入研究這個(gè)領(lǐng)域的時(shí)候卻發(fā)現(xiàn)文獻(xiàn)太多,不知如何選擇。但實(shí)際上在每個(gè)領(lǐng)域都有那么三五篇抑或更多是非讀不可的經(jīng)典文獻(xiàn)。這些文獻(xiàn)除了提出了很經(jīng)典的算法,同時(shí)他們的Introduction和Related work也是對(duì)所在的領(lǐng)域很好的總結(jié)。讀通了這幾篇文獻(xiàn)也就等于深入了解了這個(gè)領(lǐng)域,比單純

3、的看書(shū)收獲要多很多。寫(xiě)本文的目的就是想把自己所了解到的各個(gè)領(lǐng)域的經(jīng)典文章整理出來(lái),不用迷失在參考文獻(xiàn)的汪洋大海里。2. 圖像處理和計(jì)算機(jī)視覺(jué)的分類(lèi)按照當(dāng)前流行的分類(lèi)方法,可以分為以下三部分:A. 圖像處理:對(duì)輸入的圖像做某種變換,輸出仍然是圖像,基本不涉及或者很少涉及圖像內(nèi)容的分析。比較典型的有圖像變換,圖像增強(qiáng),圖像去噪,圖像壓縮,圖像恢復(fù),二值圖像處理等等?;陂撝档膱D像分割也屬于圖像處理的范疇。一般處理的是單幅圖像。B. 圖像分析:對(duì)圖像的內(nèi)容進(jìn)行分析,提取有意義的特征,以便于后續(xù)的處理。處理的仍然是單幅圖像。C. 計(jì)算機(jī)視覺(jué)(shju):對(duì)圖像分析得到的特征進(jìn)行分析,提取場(chǎng)景的語(yǔ)義表示

4、,讓計(jì)算機(jī)具有人眼和人腦的能力。這時(shí)處理的是多幅圖像或者序列圖像,當(dāng)然也包括部分(b fen)單幅圖像。關(guān)于圖像處理,圖像分析(fnx)和計(jì)算機(jī)視覺(jué)的劃分并沒(méi)有一個(gè)很統(tǒng)一的標(biāo)準(zhǔn)。一般的來(lái)說(shuō),圖像處理的書(shū)籍總會(huì)或多或少的介紹一些圖像分析和計(jì)算機(jī)視覺(jué)的知識(shí),比如岡薩雷斯的數(shù)字圖像處理。而計(jì)算機(jī)視覺(jué)的書(shū)籍基本上都會(huì)包括圖像處理和圖像分析,只是不會(huì)介紹的太詳細(xì)。其實(shí)圖像處理,圖像分析和計(jì)算機(jī)視覺(jué)都可以納入到計(jì)算機(jī)視覺(jué)的范疇:圖像處理-低層視覺(jué)(low level vision),圖像分析-中間層視覺(jué)(middle level vision),計(jì)算機(jī)視覺(jué)-高層視覺(jué)(high level vision)。

5、這是一般的計(jì)算機(jī)視覺(jué)或者機(jī)器視覺(jué)的劃分方法。在本文中,仍然按照傳統(tǒng)的方法把這個(gè)領(lǐng)域劃分為圖像處理,圖像分析和計(jì)算機(jī)視覺(jué)。3. 圖像處理和計(jì)算機(jī)視覺(jué)開(kāi)源庫(kù)以及編程語(yǔ)言選擇目前在圖像處理中有兩種最重要的語(yǔ)言:c/c+和matlab。它們各有優(yōu)點(diǎn):c/c+比較適合大型的工程,效率較高,而且容易轉(zhuǎn)成硬件語(yǔ)言,是工業(yè)界的默認(rèn)語(yǔ)言之一。而matlab實(shí)現(xiàn)起來(lái)比較方便,適用于算法的快速驗(yàn)證,而且matlab有成熟的工具箱可以使用,比如圖像處理工具箱,信號(hào)處理工具箱。它們有一個(gè)共同的特點(diǎn):開(kāi)源的資源非常多。在學(xué)術(shù)界matlab使用的非常多,很多作者給出的源代碼都是matlab版本。最近由于OpenCV的興起和

6、不斷完善,c/c+在圖像處理中的作用越來(lái)越大??偟膩?lái)說(shuō),c/c+和matlab都必須掌握,最好是精通,當(dāng)然側(cè)重在c/c+上對(duì)找工作會(huì)有很大幫助。至于開(kāi)源庫(kù),個(gè)人非常推薦OpenCV,主要有以下原因:(1)簡(jiǎn)單易入手。OpenCV進(jìn)入OpenCV2.x的時(shí)代后,使用起來(lái)越來(lái)越簡(jiǎn)單,接口越來(lái)越傻瓜化,越來(lái)越matlab化。只要會(huì)imread, imwrite, imshow和了解Mat的基本操作就可以開(kāi)始入手了。(2)OpenCV有一堆圖像處理和計(jì)算機(jī)視覺(jué)的大牛在維護(hù),bug在逐步減少,每個(gè)新的版本都會(huì)帶來(lái)不同的驚喜。而且它已經(jīng)或者逐步在移植到不懂的平臺(tái),并提供了對(duì)Python的很好的支持。(3)

7、在OpenCV上可以嘗試各種最新以及成熟的技術(shù),而不需要自己從頭去寫(xiě),比如人臉檢測(cè)(Harr,LBP),DPM(Latent SVM),高斯背景模型,特征檢測(cè),聚類(lèi),Hough變換等等 。而且它還支持各種機(jī)器學(xué)習(xí)方法(SVM,NN,KNN,決策樹(shù),Boosting等),使用起來(lái)很簡(jiǎn)單。(4)文檔內(nèi)容豐富(fngf),并且給出了很多示例程序。(5)完全開(kāi)源。可以從中間提取出任何(rnh)需要的算法。(6)從學(xué)校出來(lái)后,除極少數(shù)會(huì)繼續(xù)在學(xué)術(shù)圈里,大部分還是要進(jìn)入(jnr)工業(yè)界?,F(xiàn)在工業(yè)界,c/c+仍是主流,很多公司都會(huì)優(yōu)先考慮熟悉或者精通OpenCV的。事實(shí)上,在學(xué)術(shù)界,現(xiàn)在OpenCV也大有取

8、代matlab之勢(shì)。以前的demo或者source code,很多作者都愿意給出matlab版本的,然后別人再呼哧呼哧改成c版本的?,F(xiàn)在作者干脆給出c/c+版本,或者自己集成到OpenCV中去,這樣能快速提升自己的影響力。如果想在圖像處理和計(jì)算機(jī)視覺(jué)界有比較深入的研究,并且以后打算進(jìn)入這個(gè)領(lǐng)域工作的話(huà),建議把OpenCV作為自己的主攻方向。如果找工作的時(shí)候敢號(hào)稱(chēng)自己精通OpenCV的話(huà),肯定可以找到一份滿(mǎn)意的工作。4. 本文的特點(diǎn)和結(jié)構(gòu),以及適合的對(duì)象在本文面向的對(duì)象是即將進(jìn)入或者剛剛進(jìn)入圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域的童鞋,可以在閱讀書(shū)籍的同時(shí)參閱這些文獻(xiàn),能對(duì)書(shū)中提到的算法有比較深刻的理解。由于

9、本文涉及到的范圍比較廣,如果能對(duì)計(jì)算機(jī)視覺(jué)的資深從業(yè)者也有一定的幫助,我將倍感欣慰。為了不至太誤人子弟,每一篇文章都或多或少的看了一下,最不濟(jì)也看了摘要(這句話(huà)實(shí)在整理之前寫(xiě)的,實(shí)際上由于精力有限,好多文獻(xiàn)都只是大概掃了一眼,然后看了看Google的引用數(shù),一般在1000以上就放上來(lái)了,把這些文章細(xì)細(xì)品味一遍也是我近一兩年之內(nèi)的目標(biāo))。在成文的過(guò)程中,我本人也受益匪淺,希望能對(duì)大家也有所幫助。由于個(gè)人精力和視野的關(guān)系,有一些我未涉足過(guò)的領(lǐng)域不敢斗膽推薦,只是列出了一些引用率比較高的文章,比如攝像機(jī)標(biāo)定和立體視覺(jué)。不過(guò)將來(lái),由于工作或者其他原因,這些領(lǐng)域也會(huì)接觸到,我會(huì)逐步增減這些領(lǐng)域的文章。盡

10、管如此,仍然會(huì)有疏漏,忘見(jiàn)諒。同時(shí)文章的挑選也夾帶了一些個(gè)人的喜好,比如我個(gè)人比較喜歡low level方向的,尤其是IJCV和PAMI上面的文章,因此這方面也稍微多點(diǎn),希望不要引起您的反感。如果有什么意見(jiàn)或者建議,歡迎mail我。文章和資源我都會(huì)在我的csdn blog和sina ishare同步更新。此申明:這些論文的版權(quán)歸作者及其出版商所有,請(qǐng)勿用于商業(yè)目的。個(gè)人blog: HYPERLINK /dcraw /dcraw新浪iask地址: HYPERLINK /u/2252291285/ish?folderid=868438 /u/2252291285/ish?folderid=8684

11、38本文的安排(npi)如下。第一部分是緒論。第二部分是圖像處理中所需要用到的理論基礎(chǔ),主要是這個(gè)領(lǐng)域所涉及到的一些比較好的參考書(shū)籍。第三部分是計(jì)算機(jī)視覺(jué)中所涉及到的信號(hào)處理和模式識(shí)別文章。由于圖像處理與圖像分析太難區(qū)分了,第四部分集中討論了它們。第五部分是計(jì)算機(jī)視覺(jué)部分。最后是小結(jié)。二、 圖像處理與計(jì)算機(jī)視覺(jué)(shju)相關(guān)的書(shū)籍1. 數(shù)學(xué)(shxu)我們所說(shuō)的圖像處理實(shí)際上就是數(shù)字圖像處理,是把真實(shí)世界中的連續(xù)三維隨機(jī)信號(hào)投影到傳感器的二維平面上,采樣并量化后得到二維矩陣。數(shù)字圖像處理就是二維矩陣的處理,而從二維圖像中恢復(fù)出三維場(chǎng)景就是計(jì)算機(jī)視覺(jué)的主要任務(wù)之一。這里面就涉及到了圖像處理所涉

12、及到的三個(gè)重要屬性:連續(xù)性,二維矩陣,隨機(jī)性。所對(duì)應(yīng)的數(shù)學(xué)知識(shí)是高等數(shù)學(xué)(微積分),線性代數(shù)(矩陣論),概率論和隨機(jī)過(guò)程。這三門(mén)課也是考研數(shù)學(xué)的三個(gè)組成部分,構(gòu)成了圖像處理和計(jì)算機(jī)視覺(jué)最基礎(chǔ)的數(shù)學(xué)基礎(chǔ)。如果想要更進(jìn)一步,就要到網(wǎng)上搜搜林達(dá)華推薦的數(shù)學(xué)書(shū)目了。2. 信號(hào)處理圖像處理其實(shí)就是二維和三維信號(hào)處理,而處理的信號(hào)又有一定的隨機(jī)性,因此經(jīng)典信號(hào)處理和隨機(jī)信號(hào)處理都是圖像處理和計(jì)算機(jī)視覺(jué)中必備的理論基礎(chǔ)。2.1經(jīng)典信號(hào)處理信號(hào)與系統(tǒng)(第2版) Alan V.Oppenheim等著 劉樹(shù)棠譯離散時(shí)間信號(hào)處理(第2版) A.V.奧本海姆等著 劉樹(shù)棠譯數(shù)字信號(hào)處理:理論算法與實(shí)現(xiàn) 胡廣書(shū) (編者)

13、2.2隨機(jī)信號(hào)處理現(xiàn)代信號(hào)處理 張賢達(dá)著統(tǒng)計(jì)信號(hào)處理基礎(chǔ):估計(jì)與檢測(cè)理論 Steven M.Kay等著 羅鵬飛等譯自適應(yīng)濾波器原理(第4版) Simon Haykin著 鄭寶玉等譯2.3 小波變換信號(hào)處理的小波導(dǎo)引:稀疏方法(原書(shū)第3版) tephane Malla著, 戴道清等譯2.4 信息論信息論基礎(chǔ)(原書(shū)第2版) Thomas M.Cover等著 阮吉壽等譯3. 模式識(shí)別Pattern Recognition and Machine Learning Bishop, Christopher M. Springer模式識(shí)別(m sh sh bi)(英文版)(第4版) 西奧多里德斯著Patt

14、ern Classification (2nd Edition) Richard O. Duda等著Statistical Pattern Recognition, 3rd Edition Andrew R. Webb等著模式識(shí)別(m sh sh bi)(第3版) 張學(xué)工著4. 圖像處理(t xin ch l)與計(jì)算機(jī)視覺(jué)的書(shū)籍推薦圖像處理,分析與機(jī)器視覺(jué) 第三版 Sonka等著 艾海舟等譯Image Processing, Analysis and Machine Vision(附:這本書(shū)是圖像處理與計(jì)算機(jī)視覺(jué)里面比較全的一本書(shū)了,幾乎涵蓋了圖像視覺(jué)領(lǐng)域的各個(gè)方面。中文版的個(gè)人感覺(jué)也還可以,

15、值得一看。)數(shù)字圖像處理 第三版 岡薩雷斯等著Digital Image Processing(附:數(shù)字圖像處理永遠(yuǎn)的經(jīng)典,現(xiàn)在已經(jīng)出到了第三版,相當(dāng)給力。我的導(dǎo)師曾經(jīng)說(shuō)過(guò),這本書(shū)寫(xiě)的很優(yōu)美,對(duì)寫(xiě)英文論文也很有幫助,建議購(gòu)買(mǎi)英文版的。)計(jì)算機(jī)視覺(jué):理論與算法 Richard Szeliski著Computer Vision: Theory and Algorithm(附:微軟的Szeliski寫(xiě)的一本最新的計(jì)算機(jī)視覺(jué)著作。內(nèi)容非常豐富,尤其包括了作者的研究興趣,比如一般的書(shū)里面都沒(méi)有的Image Stitching和Image Matting等。這也從另一個(gè)側(cè)面說(shuō)明這本書(shū)的通用性不如Sonka

16、的那本。不過(guò)作者開(kāi)放了這本書(shū)的電子版,可以有選擇性的閱讀。 HYPERLINK /Book/ /Book/Multiple View Geometry in Computer Vision 第二版Harley等著引用達(dá)一萬(wàn)多次的經(jīng)典書(shū)籍了。第二版到處都有電子版的。第一版曾出過(guò)中文版的,后來(lái)絕版了。網(wǎng)上也可以找到中英文版的電子版。)計(jì)算機(jī)視覺(jué):一種現(xiàn)代方法 DA Forsyth等著Computer Vision: A Modern ApproachMIT的經(jīng)典教材。雖然已經(jīng)過(guò)去十年了,還是值得一讀。期待第二版Machine vision: theory, algorithms, practica

17、lities 第三版 Davies著(附:為數(shù)不多的英國(guó)人寫(xiě)的書(shū),偏向于工業(yè)應(yīng)用。)數(shù)字圖像處理 第四版 Pratt著Digital Image Processing(附:寫(xiě)作風(fēng)格獨(dú)樹(shù)一幟,也是圖像處理領(lǐng)域(ln y)很不錯(cuò)的一本書(shū)。網(wǎng)上也可以找到非常清晰的電子版。)5. 小結(jié)(xioji)羅嗦了這么多,實(shí)際上就是幾個(gè)(j )建議:(1)基礎(chǔ)書(shū)千萬(wàn)不可以扔,也不能低價(jià)處理給同學(xué)或者師弟師妹。不然到時(shí)候還得一本本從書(shū)店再買(mǎi)回來(lái)的。錢(qián)是一方面的問(wèn)題,對(duì)著全新的書(shū)看完全沒(méi)有看自己當(dāng)年上過(guò)的課本有感覺(jué)。(2)遇到有相關(guān)的課,果斷選修或者蹭之,比如隨機(jī)過(guò)程,小波分析,模式識(shí)別,機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,現(xiàn)代信

18、號(hào)處理甚至泛函。多一些理論積累對(duì)將來(lái)科研和工作都有好處。(3)資金允許的話(huà)可以多囤一些經(jīng)典的書(shū),有的時(shí)候從牙縫里面省一點(diǎn)都可以買(mǎi)一本好書(shū)。不過(guò)千萬(wàn)不要像我一樣只囤不看。三、 計(jì)算機(jī)視覺(jué)中的信號(hào)處理與模式識(shí)別從本章開(kāi)始,進(jìn)入本文的核心章節(jié)。一共分三章,分別講述信號(hào)處理與模式識(shí)別,圖像處理與分析以及計(jì)算機(jī)視覺(jué)。與其說(shuō)是講述,不如說(shuō)是一些經(jīng)典文章的羅列以及自己的簡(jiǎn)單點(diǎn)評(píng)。與前一個(gè)版本不同的是,這次把所有的文章按類(lèi)別歸了類(lèi),并且增加了很多文獻(xiàn)。分類(lèi)的時(shí)候并沒(méi)有按照傳統(tǒng)的分類(lèi)方法,而是劃分成了一個(gè)個(gè)小的門(mén)類(lèi),比如SIFT,Harris都作為了單獨(dú)的一類(lèi),雖然它們都可以劃分到特征提取里面去。這樣做的目的是

19、希望能突出這些比較實(shí)用且比較流行的方法。為了以后維護(hù)的方便,按照字母順序排的序。1. BoostingBoosting是最近十來(lái)年來(lái)最成功的一種模式識(shí)別方法之一,個(gè)人認(rèn)為可以和SVM并稱(chēng)為模式識(shí)別雙子星。它真正實(shí)現(xiàn)了“三個(gè)臭皮匠,賽過(guò)諸葛亮”。只要保證每個(gè)基本分類(lèi)器的正確率超過(guò)50%,就可以實(shí)現(xiàn)組合成任意精度的分類(lèi)器。這樣就可以使用最簡(jiǎn)單的線性分類(lèi)器。Boosting在計(jì)算機(jī)視覺(jué)中的最成功的應(yīng)用無(wú)疑就是Viola-Jones提出的基于Haar特征的人臉檢測(cè)方案。聽(tīng)起來(lái)似乎不可思議,但Haar+Adaboost確實(shí)在人臉檢測(cè)上取得了巨大的成功,已經(jīng)成了工業(yè)界的事實(shí)標(biāo)準(zhǔn),并且逐步推廣到其他物體的檢

20、測(cè)。Rainer Lienhart在2002 ICIP發(fā)表的這篇文章是Haar+Adaboost的最好的擴(kuò)展,他把原始的兩個(gè)方向的Haar特征擴(kuò)展到了四個(gè)方向,他本人是OpenCV積極的參與者?,F(xiàn)在OpenCV的庫(kù)里面實(shí)現(xiàn)的Cascade Classification就包含了他的方法。這也說(shuō)明了盛會(huì)(如ICIP,ICPR,ICASSP)也有好文章啊,只要用心去發(fā)掘。1997 A Decision-Theoretic Generalization of on-Line Learning and an Application to Boosting1998 Boosting the margin

21、A new explanation for the effectiveness of voting methods2002 ICIP TR Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection2003 The Boosting Approach to Machine Learning An Overview2004 IJCV Robust Real-time Face Detection2. Clustering聚類(lèi)主要(zhyo)有K均值聚類(lèi),譜聚類(lèi)和模糊聚類(lèi)。在聚

22、類(lèi)的時(shí)候如果自動(dòng)確定聚類(lèi)中心的數(shù)目是一個(gè)一直沒(méi)有解決的問(wèn)題。不過(guò)這也很正常,評(píng)價(jià)標(biāo)準(zhǔn)不同,得到(d do)的聚類(lèi)中心數(shù)目也不一樣。不過(guò)這方面還是有一些可以參考的文獻(xiàn),在使用的時(shí)候可以基于這些方法設(shè)計(jì)自己的準(zhǔn)則。關(guān)于聚類(lèi),一般的模式識(shí)別書(shū)籍都介紹的比較詳細(xì),不過(guò)關(guān)于cluster validity講的比較少,可以參考(cnko)下面的文章看看。1989 PAMI Unsupervised Optimal Fuzzy Clustering1991 PAMI A validity measure for fuzzy clustering1995 PAMI On cluster validity fo

23、r the fuzzy c-means model1998 Some New Indexes of Cluster Validity1999 ACM Data Clustering A Review1999 JIIS On Clustering Validation Techniques2001 Estimating the number of clusters in a dataset via the Gap statistic2001 NIPS On Spectral Clustering2002 A stability based method for discovering struc

24、ture in clustered data2007 A tutorial on spectral clustering3. Compressive Sensing最近大紅大紫的壓縮感知理論。2006 TIT Compressed Sensing2008 SPM An Introduction to Compressive Sampling2011 TSP Structured Compressed Sensing From Theory to Applications4. Decision Trees對(duì)決策樹(shù)感興趣的同學(xué)(tng xu)這篇文章是非看不可的了。1986 Introductio

25、n to Decision Trees5. Dynamical Programming動(dòng)態(tài)規(guī)劃也是一個(gè)比較使用的方法,這里挑選(tioxun)了一篇PAMI的文章以及(yj)一篇Book Chapter1990 PAMI using dynamic programming for solving variational problems in visionBook Chapter Dynamic Programming6. Expectation MaximizationEM是計(jì)算機(jī)視覺(jué)中非常常見(jiàn)的一種方法,尤其是對(duì)參數(shù)的估計(jì)和擬合,比如高斯混合模型。EM和GMM在Bishop的PRML里單獨(dú)

26、的作為一章,講的很不錯(cuò)。關(guān)于EM的tutorial,網(wǎng)上也可以搜到很多。1977 Maximum likelihood from incomplete data via the EM algorithm1996 SPM The Expectation-Maximzation Algorithm7. Graphical Models伯克利的喬丹大師的Graphical Model,可以配合這Bishop的PRML一起看。1999 ML An Introduction to Variational Methods for Graphical Models8. Hidden Markov Model

27、HMM在語(yǔ)音識(shí)別中發(fā)揮著巨大的作用。在信號(hào)處理和圖像處理中也有一定的應(yīng)用。最早接觸它是跟小波和檢索相關(guān)的,用HMM來(lái)描述小波系數(shù)之間的相互關(guān)系,并用來(lái)做檢索。這里提供一篇1989年的經(jīng)典綜述,幾篇HMM在小波,分割,檢索和紋理上的應(yīng)用以及一本比較早的中文電子書(shū),現(xiàn)在也不知道作者是誰(shuí),在這里對(duì)作者表示感謝。1989 A tutorial on hidden markov models and selected applications in speech recognition1998 TSP Wavelet-based statistical signal processing using h

28、idden Markov models2001 TIP Multiscale image segmentation using wavelet-domain hidden Markov models2002 TMM Rotation invariant texture characterization and retrieval using steerable wavelet-domain hidden Markov models2003 TIP Wavelet-based texture analysis and synthesis using hidden Markov modelsHmm

29、 Chinese book.pdf9. Independent Component Analysis同PCA一樣,獨(dú)立成分分析在計(jì)算機(jī)視覺(jué)中也發(fā)揮著重要的作用。這里介紹兩篇綜述性的文章,最后一篇是第二篇的TR版本,內(nèi)容差不多,但比較清楚一些。1999 Independent Component Analysis A Tutorial2000 NN Independent component analysis algorithms and applications2000 Independent Component Analysis Algorithms and Applications10.

30、Information Theory計(jì)算機(jī)視覺(jué)(shju)中的信息論。這方面有一本很不錯(cuò)的書(shū)Information Theory in Computer Vision and Pattern Recognition。這本書(shū)有電子版,如果需要(xyo)用到的話(huà),也可以參考這本書(shū)。1995 NC An Information-Maximization Approach to Blind Separation and Blind Deconvolution2010 An information theory perspective on computational vision11. Kalman

31、Filter這個(gè)話(huà)題在張賢達(dá)老師的現(xiàn)代信號(hào)處理里面講的比較深入(shnr),還給出了一個(gè)有趣的例子。這里列出了Kalman的最早的論文以及幾篇綜述,還有Unscented Kalman Filter。同時(shí)也有一篇Kalman Filter在跟蹤中的應(yīng)用以及兩本電子書(shū)。1960 Kalman A New Approach to Linear Filtering and Prediction Problems Kalman1970 Least-squares estimation_from Gauss to Kalman1997 SPIE A New Extension of the Kalman

32、 Filter to Nonlinear System2000 The Unscented Kalman Filter for Nonlinear Estimation2001 Siggraph An Introduction to the Kalman Filter_full2003 A Study of the Kalman Filter applied to Visual Tracking12. Pattern Recognition and Machine Learning模式識(shí)別名氣比較大的幾篇綜述2000 PAMI Statistical pattern recognition a

33、 review2004 CSVT An Introduction to Biometric Recognition2010 SPM Machine Learning in Medical Imaging13. Principal Component Analysis著名的PCA,在特征的表示和特征降維上非常有用。2001 PAMI PCA versus LDA2001 Nonlinear component analysis as a kernel eigenvalue problem2002 A Tutorial on Principal Component Analysis2009 A T

34、utorial on Principal Component Analysis2011 Robust Principal Component AnalysisBook Chapter Singular Value Decomposition and Principal Component Analysis14. Random Forest隨機(jī)(su j)森林2001 ML Random Forests15. RANSAC隨機(jī)抽樣一致性方法,與傳統(tǒng)(chuntng)的最小均方誤差等完全是兩個(gè)路子。在Sonka的書(shū)里面(lmin)也有提到。2009 BMVC Performance Evaluat

35、ion of RANSAC Family16. Singular Value Decomposition對(duì)于非方陣來(lái)說(shuō),就是SVD發(fā)揮作用的時(shí)刻了。一般的模式識(shí)別書(shū)都會(huì)介紹到SVD。這里列出了K-SVD以及一篇Book Chapter2006 TSP K-SVD An Algorithm for Designing Overcomplete Dictionaries for Sparse RepresentationBook Chapter Singular Value Decomposition and Principal Component Analysis17. Sparse Repre

36、sentation這里主要是Proceeding of IEEE上的幾篇文章2009 PAMI Robust Face Recognition via Sparse Representation2009 PIEEE Image Decomposition and Separation Using Sparse Representations An Overview2010 PIEEE Dictionaries for Sparse Representation Modeling2010 PIEEE Its All About the Data2010 PIEEE Matrix Completi

37、on With Noise2010 PIEEE On the Role of Sparse and Redundant Representations in Image Processing2010 PIEEE Sparse Representation for Computer Vision and Pattern Recognition2011 SPM Directionary Learning18. Support Vector Machines1998 A Tutorial on Support Vector Machines for Pattern Recognition2004 L

38、IBSVM A Library for Support Vector Machines19. Wavelet在小波變換之前,時(shí)頻分析的工具只有傅立葉變換。眾所周知,傅立葉變換在時(shí)域沒(méi)有分辨率,不能捕捉局部頻域信息。雖然短時(shí)傅立葉變換克服了這個(gè)缺點(diǎn),但只能刻畫(huà)恒定窗口的頻率特性,并且不能很好的擴(kuò)展到二維。小波變換的出現(xiàn)很好的解決了時(shí)頻分析的問(wèn)題,作為一種多分辨率分析工具,在圖像處理中得到了極大的發(fā)展和應(yīng)用。在小波變換的發(fā)展過(guò)程中,有幾個(gè)人是不得不提的,Mallat, Daubechies,Vetteri, M.N.Do, Swelden,Donoho。Mallat和Daubechies奠定了第一

39、代小波的框架,他們的著作更是小波變換的必讀之作,相對(duì)來(lái)說(shuō),小波十講太偏數(shù)學(xué)了,比較難懂。而Mallat的信號(hào)處理的小波導(dǎo)引更偏應(yīng)用一點(diǎn)。Swelden提出了第二代小波,使小波變換能夠快速方便的實(shí)現(xiàn),他的功勞有點(diǎn)類(lèi)似于FFT。而Donoho,Vetteri,Mallat及其學(xué)生們提出了Ridgelet, Curvelet, Bandelet,Contourlet等幾何小波變換,讓小波變換有了方向性,更便于壓縮,去噪等任務(wù)。尤其要提的是M.N.Do,他是一個(gè)越南人,得過(guò)IMO的銀牌,在這個(gè)領(lǐng)域著作頗豐。我們國(guó)家每年都有5個(gè)左右的IMO金牌,希望也有一兩個(gè)進(jìn)入這個(gè)領(lǐng)域,能夠也讓我等也敬仰一下。而不是

40、一股腦的都進(jìn)入金融,管理這種跟數(shù)學(xué)沒(méi)有多大關(guān)系的行業(yè),呵呵。很希望能看到中國(guó)的陶哲軒,中國(guó)的M.N.Do。說(shuō)到小波,就不得不提JPEG2000。在JPEG2000中使用(shyng)了Swelden和Daubechies提出的用提升(tshng)算法實(shí)現(xiàn)的9/7小波和5/3小波。如果(rgu)對(duì)比JPEG和JPEG2000,就會(huì)發(fā)現(xiàn)JPEG2000比JPEG在性能方面有太多的提升。本來(lái)我以為JPEG2000的普及只是時(shí)間的問(wèn)題。但現(xiàn)在看來(lái),這個(gè)想法太Naive了?,F(xiàn)在已經(jīng)過(guò)去十幾年了,JPEG2000依然沒(méi)有任何出頭的跡象。不得不說(shuō),工業(yè)界的慣性力量太強(qiáng)大了。如果以前的東西沒(méi)有什么硬傷的話(huà),想

41、改變太難了。不巧的是,JPEG2000的種種優(yōu)點(diǎn)在最近的硬件上已經(jīng)有了很大的提升。壓縮率?現(xiàn)在動(dòng)輒1T,2T的硬盤(pán),沒(méi)人太在意壓縮率。漸進(jìn)傳輸?現(xiàn)在的網(wǎng)速包括無(wú)線傳輸?shù)乃俣纫呀?jīng)相當(dāng)快了,漸進(jìn)傳輸也不是什么優(yōu)勢(shì)。感覺(jué)現(xiàn)在做圖像壓縮越來(lái)越?jīng)]有前途了,從最近的會(huì)議和期刊文檔也可以看出這個(gè)趨勢(shì)。不管怎么說(shuō),JPEG2000的Overview還是可以看看的。1989 PAMI A theory for multiresolution signal decomposition_the wavelet representation1996 PAMI Image Representation using 2D

42、 Gabor Wavelet1998 FACTORING WAVELET TRANSFORMS INTO LIFTING STEPS1998 The Lifting Scheme_ A Construction Of Second Generation Wavelets2000 TCE The JPEG2000 still image coding system_ an overview2002 TIP The curvelet transform for image denoising2003 TIP Gray and color image contrast enhancement by

43、the curvelet transform2003 TIP Mathematical Properties of the jpeg2000 wavelet filters2003 TIP The finite ridgelet transform for image representation2005 TIP Sparse Geometric Image Representations With Bandelets2005 TIP The Contourlet Transform_ An Efficient Directional Multiresolution Image Represe

44、ntation2010 SPM The Curvelet Transform四、 圖像處理(t xin ch l)與分析本章主要討論圖像處理與分析。雖然后面計(jì)算機(jī)視覺(jué)部分的有些內(nèi)容比如特征提取等也可以歸結(jié)到圖像分析中來(lái),但鑒于它們與計(jì)算機(jī)視覺(jué)的緊密聯(lián)系,以及它們的出處,沒(méi)有把它們納入到圖像處理與分析中來(lái)。同樣,這里面(lmin)也有一些也可以劃歸到計(jì)算機(jī)視覺(jué)中去。這都不重要,只要知道有這么個(gè)方法,能為自己所用,或者從中得到靈感,這就夠了。1. Bilateral FilterBilateral Filter俗稱(chēng)雙邊(shungbin)濾波器是一種簡(jiǎn)單實(shí)用的具有保持邊緣作用的平緩濾波器,由Tom

45、asi等在1998年提出。它現(xiàn)在已經(jīng)發(fā)揮著重大作用,尤其是在HDR領(lǐng)域。1998 ICCV Bilateral Filtering for Gray and Color Images2008 TIP Adaptive Bilateral Filter for Sharpness Enhancement and Noise Removal2. Color如果對(duì)顏色的形成有一定的了解,能比較深刻的理解一些算法。這方面推薦岡薩雷斯的數(shù)字圖像處理中的相關(guān)章節(jié)以及Sharma在Digital Color Imaging Handbook中的第一章“Color fundamentals for digit

46、al imaging”。跟顏色相關(guān)的知識(shí)包括Gamma,顏色空間轉(zhuǎn)換,顏色索引以及膚色模型等,這其中也包括著名的EMD。1991 IJCV Color Indexing2000 IJCV The Earth Movers Distance as a Metric for Image Retrieval2001 PAMI Color invariance2002 IJCV Statistical Color Models with Application to Skin Detection2003 A review of RGB color spaces2007 PRA survey of sk

47、in-color modeling and detection methodsGamma.pdfGammaFAQ.pdf3. Compression and Encoding個(gè)人以為圖像壓縮編碼并不是當(dāng)前很熱的一個(gè)話(huà)題(hut),原因前面已經(jīng)提到過(guò)。這里可以看看一篇對(duì)編碼方面的展望文章2005 IEEE Trends and perspectives in image and video coding4. Contrast Enhancement對(duì)比度增強(qiáng)一直是圖像處理中的一個(gè)恒久話(huà)題,一般來(lái)說(shuō)都是基于直方圖的,比如直方圖均衡化。岡薩雷斯的書(shū)里面(lmin)對(duì)這個(gè)話(huà)題講的比較透徹。這里推薦幾篇

48、個(gè)人認(rèn)為不錯(cuò)的文章。2002 IJCV Vision and the Atmosphere2003 TIP Gray and color image contrast enhancement by the curvelet transform2006 TIP Gray-level grouping (GLG) an automatic method for optimized image contrast enhancement-part II2006 TIP Gray-level grouping (GLG) an automatic method for optimized image c

49、ontrast Enhancement-part I2007 TIP Transform Coefficient Histogram-Based Image Enhancement Algorithms Using Contrast Entropy2009 TIP A Histogram Modification Framework and Its Application for Image Contrast Enhancement5. Deblur (Restoration)圖像恢復(fù)或者圖像去模糊一直是一個(gè)非常難的問(wèn)題(wnt),尤其是盲圖像恢復(fù)。港中文的jiaya jia老師在這方面做的不

50、錯(cuò),他在主頁(yè)也給出了可執(zhí)行文件。這方面的內(nèi)容也建議看岡薩雷斯的書(shū)。這里列出了幾篇口碑比較好的文獻(xiàn),包括古老的Richardson-Lucy方法,幾篇盲圖像恢復(fù)的綜述以及最近的幾篇文章,尤以Fergus和Jiaya Jia的為經(jīng)典。1972 Bayesian-Based Iterative Method of Image Restoration1974 an iterative technique for the rectification of observed distributions1990 IEEE Iterative methods for image deblurring1996

51、SPM Blind Image Deconvolution1997 SPM Digital image restoration2005 Digital Image Reconstruction - Deblurring and Denoising2006 Siggraph Removing Camera Shake from a Single Photograph2008 Siggraph High-quality Motion Deblurring from a Single Image2011 PAMI Richardson-Lucy Deblurring for Scenes under

52、 a Projective Motion Path6. Dehazing and Defog嚴(yán)格來(lái)說(shuō)去霧化也算是圖像對(duì)比度增強(qiáng)的一種。這方面最近(zujn)比較好的工作就是He kaiming等提出(t ch)的Dark Channel方法(fngf)。這篇論文也獲得了2009的CVPR最佳論文獎(jiǎng)。這位2003年的廣東高考狀元已經(jīng)于2011年從港中文博士畢業(yè)加入MSRA(估計(jì)當(dāng)時(shí)也就二十五六歲吧),相當(dāng)了不起。2008 Siggraph Single Image Dehazing2009 CVPR Single Image Haze Removal Using Dark Channel Pri

53、or2011 PAMI Single Image Haze Removal Using Dark Channel Prior7. Denoising圖像去噪也是圖像處理中的一個(gè)經(jīng)典問(wèn)題,在數(shù)碼攝影中尤其重要。主要的方法有基于小波的方法和基于偏微分方程的方法。1992 SIAM Image selective smoothing and edge detection by nonlinear diffusion. II1992 SIAM Image selective smoothing and edge detection by nonlinear diffusion1992 Nonlinea

54、r total variation based noise removal algorithms1994 SIAM Signal and image restoration using shock filters and anisotropic diffusion1995 TIT De-noising by soft-thresholding1998 TIP Orientation diffusions2000 TIP Adaptive wavelet thresholding for image denoising and compression2000 TIP Fourth-order p

55、artial differential equations for noise removal2001 Denoising through wavelet shrinkage2002 TIP The Curvelet Transform for Image Denoising2003 TIP Noise removal using fourth-order partial differential equation with applications to medical magnetic resonance images in space and time2008 PAMI Automati

56、c Estimation and Removal of Noise from a Single Image2009 TIP Is Denoising Dead8. Edge Detection邊緣檢測(cè)也是圖像處理中的一個(gè)基本任務(wù)。傳統(tǒng)的邊緣檢測(cè)方法有基于梯度算子,尤其是Sobel算子,以及經(jīng)典的Canny邊緣檢測(cè)。到現(xiàn)在,Canny邊緣檢測(cè)及其思想仍在廣泛使用。關(guān)于Canny算法的具體細(xì)節(jié)可以在Sonka的書(shū)以及canny自己的論文中找到,網(wǎng)上也可以搜到。最快最直接的方法就是看OpenCV的源代碼,非常好懂。在邊緣檢測(cè)方面,Berkeley的大牛J Malik和他的學(xué)生在2004年的PAMI提

57、出的方法效果非常好,當(dāng)然也比較復(fù)雜。在復(fù)雜度要求不高的情況下,還是值得一試的。MIT的Bill Freeman早期的代表作Steerable Filter在邊緣檢測(cè)方面效果也非常好,并且便于實(shí)現(xiàn)。這里給出了幾篇比較好的文獻(xiàn),包括一篇最新的綜述。邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中任何方向都無(wú)法逃避的一個(gè)問(wèn)題,這方面研究多深都不為過(guò)。1980 theory of edge detection1983 Canny Thesis find edge1986 PAMI A Computational Approach to Edge Detection1990 PAMI Scale-space and e

58、dge detection using anisotropic diffusion1991 PAMI The design and use of steerable filters1995 PR Multiresolution edge detection techniques1996 TIP Optimal edge detection in two-dimensional images1998 PAMI Local Scale Control for Edge Detection and Blur Estimation2003 PAMI Statistical edge detection

59、_ learning and evaluating edge cues2004 IEEE Edge Detection Revisited2004 PAMI Design of steerable filters for feature detection using canny-like criteria2004 PAMI Learning to Detect Natural Image Boundaries Using Local Brightness, Color, and Texture Cues2011 IVC Edge and line oriented contour detec

60、tion State of the art9. Graph Cut基于圖割的圖像分割算法。在這方面沒(méi)有研究,僅僅(jnjn)列出幾篇引用比較高的文獻(xiàn)。這里又見(jiàn)J Malik,當(dāng)然還有華人杰出(jich)學(xué)者Jianbo Shi,他的主頁(yè)非常搞笑,在醒目(xngm)的位置標(biāo)注Do not fly China Eastern Airlines . 看來(lái)是被坑過(guò),而且坑的比較厲害。這個(gè)領(lǐng)域,俄羅斯人比較厲害。2000 PAMI Normalized cuts and image segmentation2001 PAMI Fast approximate energy minimization vi

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論