人工智能領(lǐng)域的機器學(xué)習(xí)面試題_第1頁
人工智能領(lǐng)域的機器學(xué)習(xí)面試題_第2頁
人工智能領(lǐng)域的機器學(xué)習(xí)面試題_第3頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、人工智能領(lǐng)域的機器學(xué)習(xí)面試題如果您對技術(shù)感興趣并且正在尋找涉及數(shù)據(jù)科學(xué)的工作,那么您很可能已經(jīng)聽說過機器學(xué)習(xí)。這個詞籠罩著神秘的氣氛 -許多人對這個概念本身感到困惑。 但是,如果您正在尋找如何成為 AI 工程師或商業(yè)智能開發(fā)人員,則可能對機器學(xué)習(xí)及其周圍的一切非常熟悉。但是,如果您想為該工作評分,則必須準(zhǔn)備一份工作面試。還有什么比修訂機器學(xué)習(xí)面試問題更好的準(zhǔn)備方法呢在本教程中,我們將研究一些有關(guān)機器學(xué)習(xí)的最受歡迎的面試問題。我們將介紹基本知識和高級知識,因此請抓住思路,讓我們繼續(xù)前進。機器學(xué)習(xí)的主要方面最好的方法是從最基本的機器學(xué)習(xí)工程師面試問題開始。這些是您在面試開始時可以期望得到的。通過這

2、種方式,雇主希望查看您是否具有批判性思維能力,并能夠形成自己的凝聚力思想。這就是為什么許多這樣的問題將基于定義,比較,解釋等等的原因。問題 1:描述 “機器學(xué)習(xí) ”。您的絕大多數(shù)雇主可能會首先問您與此類似的問題。這樣做有兩個原因。首先,您的面試官無法繼續(xù)進行其他一般性的機器學(xué)習(xí)面試問題,直到他們看到您是否首先了解什么是 “ 機器學(xué)習(xí) ”。此外,您的回答方式將顯示您對定義的理解程度,或者換句話說,您可以以一種易于理解的方式很好地解釋一個困難的話題。如果您只花了整整一個晚上從某個隨機科學(xué)雜志上記下來的 20 根內(nèi)襯,那么與您想辦法自己解釋的情況相比,它可能會給您帶來更少的信譽。那么 什么是機器學(xué)習(xí)

3、描述機器學(xué)習(xí)的最簡單,最容易理解的方法可能是將其稱為AI 開發(fā)的特定哲學(xué)。這是一個科學(xué)領(lǐng)域,涉及如何使機器能夠從提供給他們的信息中學(xué)習(xí),而無需事先進行編程。問題 2:什么是 “深度學(xué)習(xí) ”由于深度學(xué)習(xí)與機器學(xué)習(xí)息息相關(guān),因此您甚至可能會遇到跨深度學(xué)習(xí)和機器學(xué)習(xí)面試的問題。深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支??茖W(xué)的這一方面與使機器的神經(jīng)網(wǎng)絡(luò)盡可能類似于人的大腦有關(guān)。問題 3: “類型 1”和 “類型 2”錯誤有什么區(qū)別類型 1 錯誤聲稱實際上已經(jīng)發(fā)生了某事,而實際上卻不可能發(fā)生。類型2 錯誤的作用與此相反聲稱這樣做時沒有任何反應(yīng)。例如,這是一種很好的方法來幫助您記住兩種類型的錯誤之間的區(qū)別:想象一下,

4、如果類型的錯誤是當(dāng)您告訴狗狗是貓,而類型 2 的錯誤是當(dāng)您告訴狗狗是貓。狗不能吠的狗。1問題 4:什么是 “數(shù)據(jù)擴充 ”數(shù)據(jù)擴充是較簡單的機器學(xué)習(xí)面試問題之一,是一種從舊數(shù)據(jù)中修改和創(chuàng)建新數(shù)據(jù)的方法。完成此操作的方法是保留目標(biāo)不變或?qū)⑵涓臑橐阎哪繕?biāo)。問題 5:為什么叫“樸素貝葉斯”樸素貝葉斯之所以被稱為樸素,是因為它的思維方式。假定數(shù)據(jù)集中的每個元素的重要性相同。不用說,在日常情況下很少如此。問題 6:深層網(wǎng)絡(luò)或淺層網(wǎng)絡(luò)哪個更好您可以將其歸類為比較機器學(xué)習(xí)面試問題之一,因為您必須對這兩個網(wǎng)絡(luò)有相當(dāng)?shù)牧私?,還必須能夠?qū)λ鼈冞M行比較以找到明顯的區(qū)別。深度網(wǎng)絡(luò)通常被認(rèn)為是更好的選擇。這僅僅是因為

5、它們由更多層組成,其中大多數(shù)層都是隱藏的這有助于深度網(wǎng)絡(luò)提取并構(gòu)建更好的功能。問題 7:什么是 “傅立葉變換”“ 傅立葉變換 ”方法用于將簡單的通用函數(shù)轉(zhuǎn)換為所謂的超函數(shù)。如果這是您想進一步擴展的機器學(xué)習(xí)面試問題之一,則可以將其與汽車拆解并查看所制造的所有不同零部件的情況進行比較。在. 之外。問題 8:什么是 “卷積網(wǎng)絡(luò) ”通常,簡單的網(wǎng)絡(luò)使用連接的層來執(zhí)行其過程。反過來,卷積網(wǎng)絡(luò)是那些,而是采用連接層,使用卷積的。人們偏愛使用卷積網(wǎng)絡(luò)而不是標(biāo)準(zhǔn)的連接層網(wǎng)絡(luò)的主要原因是,卷積網(wǎng)絡(luò)具有較少的歸因于它們的參數(shù)。問題9:我們應(yīng)該了解“真實陽性率 ”和 “召回率 ”之間的相關(guān)性嗎盡管這聽起來像是更高級

6、的機器學(xué)習(xí)面試問題之一,但答案非常簡單。這兩個指標(biāo)完全相同。我們可以通過查看他們的公式TP / TP + FN來看到這一點。問題 10:什么是 “反向傳播 ”反向傳播本身就是一個花哨的術(shù)語,它只是一種訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)的方法。我們將通過從該方法的最末端獲取 “ 錯誤 ”并將其放置在網(wǎng)絡(luò)中的每個權(quán)重之內(nèi),使用該方法來訓(xùn)練網(wǎng)絡(luò)。這樣,機器就有機會有效地應(yīng)用其計算。問題 11:如果僅使用“驗證集 ”而不應(yīng)用 “測試集 ”會怎樣在機器學(xué)習(xí)面試問題中,這個問題可能會變得更棘手。如果僅應(yīng)用驗證集,它將無法提供您要測試的模型的所有度量的準(zhǔn)確估計。這是因為 “ 測試集”用于測試該模型在截至該時間點尚未遇到的示例

7、中的性能。因此,可以說,如果刪除測試集,則會自動破壞可能有效的測試結(jié)果。問題 12:演繹和歸納機器學(xué)習(xí)有什么區(qū)別主要區(qū)別在于它們的開始方式。歸納式機器學(xué)習(xí)始于得出結(jié)論的示例。演繹式機器學(xué)習(xí)從結(jié)論開始,然后通過推論該結(jié)論是對還是錯來進行學(xué)習(xí)。問題 13:方差和偏差在機器學(xué)習(xí)中如何發(fā)揮作用它們都是錯誤。差異是一個錯誤,是機器學(xué)習(xí)算法過于復(fù)雜的結(jié)果。偏差是一種錯誤,是由于學(xué)習(xí)算法中的假設(shè)有誤而導(dǎo)致的。不要混淆這些內(nèi)容,因為在跟隨機器學(xué)習(xí)面試問題時您將需要記住它們。問題 14:什么是監(jiān)督學(xué)習(xí),它與無監(jiān)督學(xué)習(xí)有何區(qū)別監(jiān)督式機器學(xué)習(xí)是一個過程,其中輸出被反饋到計算機中,供軟件從中學(xué)習(xí)并在下一次獲得更準(zhǔn)確的

8、結(jié)果。無監(jiān)督機器學(xué)習(xí)意味著計算機將無需初始培訓(xùn)就可以學(xué)習(xí),這是對有監(jiān)督的機器學(xué)習(xí)的替代方法,其中 “機器 ”接受了初始培訓(xùn)。問題 15:如何為分類問題選擇算法在這種情況下,答案取決于所需的準(zhǔn)確性程度和訓(xùn)練集的大小。如果訓(xùn)練集較小,建議選擇低方差 / 高偏差分類器。如果情況相反,則訓(xùn)練集很大,那么您應(yīng)該選擇高方差和低偏差的分類器。高級機器學(xué)習(xí)面試題現(xiàn)在,您對一般的機器學(xué)習(xí)以及在工作面試中可以期望的基本機器和深度學(xué)習(xí)面試問題類型有了一些了解,我們可以繼續(xù)學(xué)習(xí)更高級的內(nèi)容。但是,不要上當(dāng)。您的雇主很可能不會要求您建立一個自給自足的AI 系統(tǒng),也不會寫一本長達300 頁的書來介紹您學(xué)習(xí)深度學(xué)習(xí)的所有不

9、同方式。在這種情況下, “ 高級”僅意味著問題將變得有點棘手 -您可能會被要求為您的答案提供進一步的解釋,舉一些例子等。因此,請放心,放松并直接進入它。問題 1: “生成 ”模型和 “區(qū)別 ”模型之間有什么區(qū)別盡管這聽起來像是機器學(xué)習(xí)面試技巧中的棘手問題之一,但您的雇主很可能只想知道這些模型如何處理數(shù)據(jù)。一個生成模式,顧名思義, 是要付出努力和學(xué)習(xí)它提供的不同類別的數(shù)據(jù)。與此相反, 判別模型將僅研究各種數(shù)據(jù)類別之間的差異。開發(fā)人員和工程師通常更喜歡使用區(qū)分模型,因為它傾向于更快,更高效地處理其任務(wù)。問題 2:解釋 “交叉驗證 ”和 “分層交叉驗證”之間的區(qū)別。簡單的交叉驗證用于在訓(xùn)練期間和驗證

10、集之間隨機分離數(shù)據(jù)。分層交叉驗證的作用相同,但是沒有隨機變量 -它確實跟蹤并保留了訓(xùn)練與驗證測試的比率。這是可能很容易混淆的那些機器學(xué)習(xí)面試問題之一,所以請當(dāng)心!問題 3:在什么情況下應(yīng)該使用“套索 ”和 “里奇 ”回歸這屬于高級機器學(xué)習(xí)工程師面試問題,主要是因為您確實需要一些有關(guān)兩種回歸類型的深入知識才能提供有效的答案。該套索回歸可以執(zhí)行選擇變量和收縮參數(shù)的兩者的功能,而嶺回歸只能用于后者??紤]到這一點,當(dāng)您只有幾個變量且影響很大時,很可能會使用 Lasso 回歸。反過來,當(dāng)有許多小變量時,應(yīng)使用 Ridge 回歸。這是,你可以與你的答案擴大后,不只是給一個通用的機器學(xué)習(xí)面試問題一個很好的例

11、子一個班輪。問題 4:什么是 “F1”不,您只需按一下即可獲得答案,這不是鍵盤上的鍵。在 F1 成績是你的模型只是做得如何測量。任何接近“1 ”標(biāo)記的東西都很好,任何低于“0,5 ”標(biāo)記的東西都應(yīng)該進行處理。問題 5:在大多數(shù)情況下,合奏或單個模型中的哪一個得分較高樂團通常會提供更高的分?jǐn)?shù)。這是因為它們只是各種模型的組合,可以預(yù)測一個特定的結(jié)果。模型越多,它們可以分類的錯誤就越多-最終預(yù)測得分將越好。問題 6: “相關(guān) ”和 “協(xié)方差 ”之間有什么區(qū)別僅當(dāng)您不知道這兩個相關(guān)性如何時(這不是雙關(guān)語),這才是高級機器學(xué)習(xí)面試問題之一。但是,如果您確實知道,答案就非常簡單:協(xié)方差一旦標(biāo)準(zhǔn)化就成為一個

12、相關(guān)性。問題7:描述一個“不平衡的數(shù)據(jù)集”。一種不平衡數(shù)據(jù)集是一組,測試后,帶回來的結(jié)果,超過一半的整個信息駐扎在短短的一類。如何避免這種情況嗯,有幾個簡單的解決方案要么使用不同的算法再次執(zhí)行測試,要么嘗試測試更多的數(shù)據(jù),以使結(jié)果均勻。問題8:什么是 “數(shù)據(jù)標(biāo)準(zhǔn)化”還記得我們在之前的機器學(xué)習(xí)面試問題中談到“ 反向傳播”嗎很好,數(shù)據(jù)規(guī)范化用于最小化反向傳播過程中的數(shù)據(jù)冗余。它允許用戶在自己認(rèn)為合適的情況下重新縮放不同的值,從而消除了可能的冗余問題。問題 9:您能否捕獲分類變量和連續(xù)變量之間的相關(guān)性可以,但是您必須使用所謂的協(xié)方差分析(ANCOVA)方法。使用它,您可以捕獲相關(guān)性。問題 10:激活功能有什么作用此功能允許您通過引入非線性學(xué)習(xí)方法來使您的網(wǎng)絡(luò)多樣化。這樣做是為了幫助您

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論