機器學(xué)習(xí)初學(xué)者最常見的5個錯誤_第1頁
機器學(xué)習(xí)初學(xué)者最常見的5個錯誤_第2頁
機器學(xué)習(xí)初學(xué)者最常見的5個錯誤_第3頁
機器學(xué)習(xí)初學(xué)者最常見的5個錯誤_第4頁
機器學(xué)習(xí)初學(xué)者最常見的5個錯誤_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

機器學(xué)習(xí)初學(xué)者最常見的5個錯誤機器學(xué)習(xí)初學(xué)者最常見的5個錯誤機器學(xué)習(xí)初學(xué)者最常見的5個錯誤我一直在幫助初學(xué)者入門機器學(xué)習(xí),但我也一直看到初學(xué)者在思想和行動上屢屢犯錯。在這篇文章中,你將看到我總結(jié)的初學(xué)者上手機器學(xué)習(xí)時最常出現(xiàn)的5種錯誤。我堅定地認(rèn)為任何人都可以入門機器學(xué)習(xí)并且很好地應(yīng)用它們。希望這篇文章能夠幫助你避開或解決你學(xué)習(xí)和實踐中的一些錯誤。一、不要從理論開始入手傳統(tǒng)的機器學(xué)習(xí)教學(xué)是自下而上的:努力掌握數(shù)學(xué)背景知識努力學(xué)習(xí)機器學(xué)習(xí)理論努力從頭開始實現(xiàn)算法最后開始使用機器學(xué)習(xí)(這是你的目標(biāo))這種方法非常慢,而且很困難。這是為想要拓展該領(lǐng)域前沿的學(xué)者設(shè)計的,并不適合只是想要得到結(jié)果的實踐者.如果你在想以下問題,你就掉入了這個陷阱:我需要先完成線性代數(shù)的課程;我需要回去先拿個博士學(xué)位;我必須先讀完教科書。避開陷阱4年的數(shù)學(xué)或深奧的算法理論學(xué)習(xí)能夠怎樣幫助你實現(xiàn)目標(biāo)?你多半會停下來。會失敗。不會離你的目標(biāo)更進(jìn)一步.解決的方法是鼓搗模型。如果機器學(xué)習(xí)對市場的有價值的貢獻(xiàn)是準(zhǔn)確的預(yù)測,那么你就學(xué)習(xí)對問題進(jìn)行建模并得出準(zhǔn)確的預(yù)測吧.就從現(xiàn)在開始!然后努力掌握它,做到非常擅長.如果你需要,就閱讀、竊取、收割別人的理論,但你只需要你的目標(biāo)所需要的——只要它能幫助你實現(xiàn)更好的價值。二、不要學(xué)習(xí)所有的機器學(xué)習(xí)機器學(xué)習(xí)是一個非常大的研究領(lǐng)域。它是指計算機學(xué)習(xí)過程的自動化,與人工智能有很大的交疊.從深奧的學(xué)習(xí)理論到機器人技術(shù)-—這個領(lǐng)域的范圍非常廣.你不可能將它們整個拿下.陷阱如果你在想下面這些,你就落套了:我需要學(xué)習(xí)一個新網(wǎng)站上提到的每一種新技術(shù);我首先需要學(xué)習(xí)計算機視覺、自然語言處理、語音等等;我需要了解每項技術(shù)的每個方面。避開陷阱選擇一個小方向并且保持專注.然后進(jìn)一步收窄。機器學(xué)習(xí)中最有價值的領(lǐng)域是預(yù)測建模——創(chuàng)建數(shù)據(jù)的模型以做出預(yù)測.就從這里開始。接下來,專注于一種與你最相關(guān)或你最感興趣的預(yù)測建模.然后保持專注。也許你是根據(jù)技術(shù)選擇的(比如深度學(xué)習(xí)),也許你是根據(jù)問題類型選擇的(比如推薦系統(tǒng));也許你不確定,只是隨便選了一個。不管怎樣,努力掌握它或至少做到精通。接下來才開始進(jìn)入下一個領(lǐng)域。三、不要在算法上花費太多時間機器學(xué)習(xí)實際上就是算法。算法實在太多了。每一個算法都是一個復(fù)雜的系統(tǒng)而且擁有自己的小研究領(lǐng)域和生態(tài)系統(tǒng)。你可以將自己迷失在算法之中,這么做的人被稱為學(xué)者。陷阱如果你在說這些,你就已經(jīng)在陷阱里了:在我使用它之前我需要知道它的工作原理;我首先需要深入理解超參數(shù);在進(jìn)行微調(diào)時,我需要解釋其因果關(guān)系.避開陷阱算法并非結(jié)果.它們只是實現(xiàn)結(jié)果的方法。事實上,機器學(xué)習(xí)算法是一種商品.切換它們。在你的問題上實驗各種各樣的算法.你可以對其中一些進(jìn)行調(diào)節(jié),但不要把自己困在這一步.使用一個系統(tǒng)過程(systematicprocess)。設(shè)計調(diào)試實驗并將它們的執(zhí)行和分析自動化。機器學(xué)習(xí)的關(guān)鍵是好好利用算法,而應(yīng)用算法不只是鼓搗算法本身.你的目標(biāo)應(yīng)該是為每一個項目得出一個結(jié)果——一組預(yù)測或一個能給出預(yù)測的模型。四、不要從頭開始實現(xiàn)所有東西從頭開始實現(xiàn)算法能夠教會你很多東西。有時候你需要實現(xiàn)一項技術(shù),因為沒有合適的或可用的實現(xiàn)。但是,通常來說,你不一定要也不應(yīng)該這么做。很抱歉地說:你的實現(xiàn)結(jié)果可能很糟糕.有各種漏洞速度很慢非常吃內(nèi)存無法很好地解決邊緣情況甚至可能是錯的陷阱如果你在做下面這些事,你已經(jīng)掉入陷阱了:你在編寫載入CSV文件的代碼(搞什么鬼!?);你在編寫線性回歸這種標(biāo)準(zhǔn)算法的代碼;你在編寫用于交叉驗證或超參數(shù)調(diào)整的代碼.避開陷阱別這么做就好了!使用一個已被成千上萬的開發(fā)者所使用過的能夠處理所有邊緣情況的庫,眾所周知它是正確的;使用一個經(jīng)過了高度優(yōu)化的庫,它能充分利用你的硬件的每一個計算周期和你的內(nèi)存的每一個字節(jié);為你的項目使用一個圖形用戶界面,從而完全避開代碼。每次都自己實現(xiàn)你想要使用的算法是非常緩慢的入門機器學(xué)習(xí)的方式.如果你是為了學(xué)習(xí)而實現(xiàn)它們,那么就要對自己誠實:你的實現(xiàn)還不夠好,你不能通過這樣應(yīng)用機器學(xué)習(xí)來帶來價值.五、不要總改變使用的工具目前有很多的很棒的機器學(xué)習(xí)工具。事實上,很棒的工具加上數(shù)據(jù)的可用性和更快的硬件使得機器學(xué)習(xí)的復(fù)興成為了可能。但你可能陷入這樣一個坑中:跳入每個你偶然發(fā)現(xiàn)的新工具中.陷阱如果發(fā)現(xiàn)自己符合以下三點那你就陷入了該陷阱中:使用每個你聽到過的新工具發(fā)現(xiàn)自己每周或每個月都學(xué)習(xí)一項新工具或語言學(xué)習(xí)一個庫時半途而廢并轉(zhuǎn)向新的庫避開陷阱有策略的學(xué)習(xí)和使用新工具,在解決機器學(xué)習(xí)問題的系統(tǒng)處理過程中融合你學(xué)到的新工具。如果你選擇一個主要的大型平臺并堅持使用它,那在解決機器學(xué)習(xí)問題時會更加高效,至少也要足夠精通該平臺。這里我推薦3個頂尖的平臺:WekaWorkbenchPythonEcosystemRPlatform該領(lǐng)域也有其他的更專門化的工具,根

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論