版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
3育培訓(xùn)有限公司目育培訓(xùn)有限公司譯序 1前言 2 二、數(shù)據(jù)科學(xué)崗位 1三、科學(xué)數(shù)據(jù)崗位劃分 2如何看待數(shù)據(jù)科學(xué) 34.1開發(fā)數(shù)據(jù)產(chǎn)品的創(chuàng)業(yè)公司(200人及以下規(guī)模) 34.2分析自有數(shù)據(jù)的創(chuàng)業(yè)公司(200人及以下規(guī)模) 4.3分析自有數(shù)據(jù)的財富500強大中型公司 54.4自有成熟數(shù)據(jù)團隊的大型科技公司 6五、聘用數(shù)據(jù)科學(xué)家的行業(yè) 75.1獲得數(shù)據(jù)科學(xué)面試機會 75.2.通往數(shù)據(jù)科學(xué)面試的九條途徑 7 獲得面試機會的主動途徑 8.與第三方招聘公司合作 12.如何提出求職申請 12簡歷VS領(lǐng)英 12求職信VS電子郵件 13請人推薦,讓人脈為你服務(wù) 13六、準備面試 156.1.面試內(nèi)容 15電話面試 15家庭作業(yè) 15招聘經(jīng)理電話面試 15招聘經(jīng)理電話面試 17招聘經(jīng)理現(xiàn)場面試 17技術(shù)挑戰(zhàn) 17總監(jiān)面試 176.2.數(shù)據(jù)科學(xué)崗位技能矩陣 186.3.數(shù)據(jù)科學(xué)崗位縱覽 184育培訓(xùn)有限公司七、數(shù)據(jù)科學(xué)面試題 207.1.行為試題 20項目? 20?反感什么? 20請說明,當必須說服別人認同你的觀點時,你是怎么做的,效果如何? 217.2.數(shù)學(xué)試題 21如何使用線性回歸算法求解最優(yōu)系數(shù)?(C3能源的數(shù)據(jù)科學(xué)家面試時曾問過這個問題) 21學(xué)試題 21I型錯誤與II型錯誤的區(qū)別是什么?(Niraj,我們的校友就遇到了這個問題) 21 試題 25SQL交易表(Transaction_ID,Item_ID,Quantity,DPrice 算法問題—從0開始,編寫K近鄰算法 28 7.5.場景試題 30假如你是一家鞋品電子商務(wù)公司的數(shù)據(jù)科學(xué)家,如何搭建一個鞋品訪客推薦系統(tǒng)?(Verizon公司面試數(shù)據(jù)科學(xué)家時問過這個問題) 30 體育、政治、經(jīng)濟等類別,怎樣為新文章分類? 31網(wǎng)頁設(shè)計替代方案的實驗。假設(shè)沒有其它實驗結(jié)果支持,也沒有采集用戶行為知識。這一結(jié)論可能導(dǎo)致的潛在問題,以及如何避免這些問題。 327.6.面試提示 337.7.結(jié)論 33八、招聘經(jīng)理的想法 338.1WillKurt(QuickSprout公司)訪談 33些方面? 33有什么好建議? 34你想考核的是什么? 34 8.2MattFornito(OpsVisionSolutions公司)訪談 34是什么? 35有什么建議? 355育培訓(xùn)有限公司 8.3AndrewMaguire(PMC/谷歌/Accenture)訪談 36什么? 36有什么建議? 36?你想考察的是什么? 36谷歌招聘數(shù)據(jù)科學(xué)家和業(yè)界其它公司有什么不同? 378.4HirstoGyoshev(MasterClass公司)訪談 37么? 37人有什么建議? 38?你想考察的是什么? 38 8九、求職者的成功經(jīng)驗 399.1SaraWeinstein 39什么建議? 39讓你覺得意外或很難的是什么? 399.2NirajSheth 39什么建議? 39什么建議?最難的問題是什么? 40 0定因素是什么? 409.3結(jié)論 40十、面試后要做的7件事 4210.1面試后,寄出感謝信,保持跟進 4210.2列出對面試問題的想法,寄給他們 42聘公司 4210.4保持聯(lián)系,正確的方式 4310.5利用人脈 4310.6招聘被拒,更要表現(xiàn)出專業(yè)性 4310.7不要放棄希望 43ffer 11.1Offer流程 44Offer 4企業(yè)文化 446育培訓(xùn)有限公司團隊 45上班地點 45薪資談判 45 11.2上班前的準備 4611.3結(jié)論 46十二、資料和數(shù)據(jù) 4712.1名人名言 4712.2核對清單 4712.3模板 48爭取信息化約談 48找人推薦工作 48面試后的跟進 4812.4術(shù)語庫 4912.5資源 491育培訓(xùn)有限公司?DJPatil十年來,這一名詞一直飽受爭議,實干家與學(xué)院派對于數(shù)據(jù)科學(xué)涵義的論辯屢見不鮮,更可怕的是,他們的理念和數(shù)據(jù)分析公司常用的理念也不一樣。只要一討論大數(shù)據(jù)與機器學(xué)習(xí)數(shù)據(jù)解決方案,就會發(fā)現(xiàn)新詞讓人應(yīng)接不暇。每個公司對數(shù)據(jù)科學(xué)的涵義都有自己的理解,招聘經(jīng)理的理解也各不相同,大家都喜歡根據(jù)自己的理解來面試。數(shù)據(jù)科學(xué)定義隨著公司和崗位變來變?nèi)?,定義不清使得數(shù)據(jù)科學(xué)面試困難重重。2育培訓(xùn)有限公司分簡單的數(shù)據(jù)科學(xué)項目說明數(shù)據(jù)科學(xué)的崗位。某數(shù)據(jù)科學(xué)團隊想效仿Yelp團隊利用深度學(xué)習(xí)技術(shù)識別圖片。Yelp到適合顯示的圖片。有時上傳的都是同類照片,食物,要么是飯店外景,但是想全面評價一家飯店需要不同類別的圖片。要實現(xiàn)這個目的需要幫助計算機利用訓(xùn)別哪些照片是飯店外景,哪些照片只是食物。數(shù)據(jù)科學(xué)家負責搭建模型,讓機器創(chuàng)建不同圖片類別,要從用戶標注過的照片和照片標題的關(guān)鍵字里提取所有相關(guān)的數(shù)據(jù)類型。這是個高端崗位,通常要全方位管理數(shù)據(jù)產(chǎn)品,搞定從算法選擇到工程設(shè)計等方面據(jù)科學(xué)問題。數(shù)據(jù)工程師負責搭建系統(tǒng),獲取并存儲所有圖片數(shù)據(jù),實現(xiàn)數(shù)據(jù)科學(xué)家選定的算法。這個崗位需要很強的力,但是不需要深入理解算法理論。數(shù)據(jù)分析師負責查詢數(shù)據(jù)、展示業(yè)務(wù)變化帶來的影響。用戶滿不滿意?最近的改版為Yelp帶來了多少流量?這些都是數(shù)據(jù)分析師要提出和解答的問題,此外,數(shù)據(jù)分析師還要和其它崗位的同事溝通數(shù)據(jù)分析結(jié)是個入門級的崗位,數(shù)據(jù)科學(xué)新人或有一定技術(shù)能力的業(yè)務(wù)人員就可以勝任。后文還會提到更多數(shù)據(jù)科學(xué)崗位?,F(xiàn)在只要知道這三個數(shù)據(jù)科學(xué)崗的面試不一樣就可以了,其實,大部分,各個數(shù)據(jù)科學(xué)崗位的面試都不一樣。3育培訓(xùn)有限公司不但數(shù)據(jù)科學(xué)各崗位的面試要求不一樣,各類公司對數(shù)據(jù)科學(xué)面試的要求也不一樣??梢园压敬笾聞澐?.1開發(fā)數(shù)據(jù)產(chǎn)品的創(chuàng)業(yè)公司(200人及以下規(guī)模)歡迎來到硅谷的心臟,創(chuàng)業(yè)公司是技術(shù)人員的浪漫國度,很多創(chuàng)業(yè)公司短期內(nèi)就能取得驚人的成績。加入創(chuàng)業(yè)公司,要做好一人多職的心理準備,很多時候一個人要兼任三個數(shù)據(jù)科學(xué)崗位的工作,而且可能永遠到想要的資源,加班加點,累死累活更是家常便飯。這類公司都希望求職者具有很高的水平,他們對數(shù)據(jù)處理技能的要求遠高于那些只處理內(nèi)部數(shù)據(jù)的公司。這類公司的創(chuàng)始人大多都是數(shù)據(jù)科學(xué)精英,或者曾經(jīng)當過大型數(shù)據(jù)科學(xué)團隊的領(lǐng)導(dǎo)。他們招聘的都是頂級人才,要有豐富的從業(yè)經(jīng)驗、突出的發(fā)展?jié)摿蛷姶蟮淖晕彝苿恿Α<尤脒@樣的公司可能是這輩子最好的,不過,也要做好面對數(shù)據(jù)科學(xué)頂尖挑戰(zhàn)的心理準備。odeAnalyticsRJMetrics崗位實例:數(shù)據(jù)分析師(Looker),高級分析師(ModeAnalytics)。OMode作效率更高、效果更的目標是為各行各業(yè)的分析師提供教育與激勵服務(wù)。,協(xié)制定更科學(xué)的決策。第二,為希望實現(xiàn)數(shù)據(jù)驅(qū)動轉(zhuǎn)型的公司或分析師提供開源資料和分析服務(wù)。1崗位職責:1我們心目中的人選:O管道經(jīng)驗者優(yōu)先;公司規(guī)模:143名員工使用領(lǐng)英(11-50人的公司規(guī)模)崗位解讀:本崗位的重點是溝通能力、數(shù)據(jù)庫查詢能力、利用編程語言實現(xiàn)數(shù)據(jù)可視化的能力,說明這是崗,與相關(guān)團隊溝通數(shù)據(jù)分析結(jié)果是必備能力。4育培訓(xùn)有限公司4.2分析自有數(shù)據(jù)的創(chuàng)業(yè)公司(200人及以下規(guī)模)這類創(chuàng)業(yè)公司只分析自有數(shù)據(jù),不向其它公司銷售數(shù)據(jù)產(chǎn)品。因此,招聘門檻比前一類公司略低。不過分數(shù)據(jù)對創(chuàng)業(yè)公司一樣至關(guān)重要,因此這類公司的招聘門檻往往也會很高。IT術(shù)天才很多,不過能為業(yè)務(wù)與技術(shù)搭橋的人才也不可或缺,要是公司里各部門對理解和使用數(shù)據(jù)各執(zhí)己見,這樣的人才就更重要了。在數(shù)據(jù)驅(qū)動型公司工作,要做好吃苦耐勞的心理準備,還要拓展思路,為公司各部門采集數(shù)據(jù)、使用數(shù)據(jù)推薦新工具,制定新流程。在處理自有數(shù)據(jù)的公司工作,非??简灁?shù)據(jù)分析師的水平,要在公司里持續(xù)推廣、強化數(shù)據(jù)驅(qū)動型的企業(yè)文化。趕緊提高自己的領(lǐng)導(dǎo)能力與溝通技巧吧!BCBB量一般不大,但特別在意數(shù)據(jù)細節(jié)BC戶量極大,數(shù)據(jù)問題主要是數(shù)據(jù)規(guī)模龐大,過度關(guān)注消費者個體會分散其對消費者群體的注就不錯了。求職者一定要深入了解面試的公司及其數(shù)據(jù)問題,做足功課,確認能在該公司滿懷激情地工作,具備的專好也要和該公司的崗位職責相匹配。terclassSprig崗位實例:Branch公司首席數(shù)據(jù)科學(xué)家,Rocksbox公司數(shù)據(jù)(研究)科學(xué)家,Masterclass公司數(shù)據(jù)等。O數(shù)據(jù)科學(xué)家(決策科學(xué)家)MasterclassMasterclass致力于讓來自世界各地的朋友都能獲得最好的在線教育。演員為什么感情這么豐富?運動員怎么能抵抗地心引力?暢銷書作者又是如何煉成的?我們的課程將對這些問題為您一一解密。作為我們的學(xué)員,您可以隨時隨地學(xué)習(xí)在線課程。至于那些天才寶寶,您可有福了,可以享受每節(jié)課一次免費試聽的優(yōu)惠待遇。我們是風(fēng)投提供資金支持舊金山,現(xiàn)已聘請各行各業(yè)的專家錄制了大量始搭建自己的數(shù)據(jù)團隊,現(xiàn)在就申請加入我們吧!1我們心目中的人選:O務(wù)分析,這些分析領(lǐng)域都要有所涉獵。我們希望你能熱愛數(shù)據(jù)項目涉及的各種分析工作;O實用主義。成果導(dǎo)向、積極主動、動作迅速、無懼荊棘、高屋建瓴、主次分明。必要時可以在短時間內(nèi)提供足夠好的解決方案;O科學(xué)思維。能深入鉆研問題,提煉出可用于商務(wù)實戰(zhàn)的假設(shè)推理;O善于交往。具有豐富的溝通技巧,能夠描述各類業(yè)務(wù)伙伴提出的模型、邏輯和含義;5育培訓(xùn)有限公司O樂于學(xué)習(xí)。快速上手新工具與新技能,能打破瓶頸,推動項目開展;O具有敏銳的商業(yè)洞察力、產(chǎn)品意識及系統(tǒng)思維。公司規(guī)模:37名員工使用領(lǐng)英(11-50人的公司規(guī)模)崗位解讀:尋找樂于鉆研問題的通才,能對各種數(shù)據(jù)分析結(jié)果進行溝通。說明這是個多面手型的數(shù)據(jù)科學(xué)作態(tài)度,還要有創(chuàng)業(yè)精神。4.3分析自有數(shù)據(jù)的財富500強大中型公司世界級的大公司深知使用自有數(shù)據(jù)的重要性。不少公司已經(jīng)組建了強大的數(shù)據(jù)科學(xué)團隊,并提供充足的資金支持,使其安心開展數(shù)據(jù)科學(xué)工作。這些數(shù)據(jù)團隊有點像大公司內(nèi)部的創(chuàng)業(yè)公司,幫助公司將數(shù)據(jù)轉(zhuǎn)化為商務(wù)洞察結(jié)果。還有很多公司意識到數(shù)據(jù)對保持競爭力的重要性,為此不惜招募整個數(shù)據(jù)科學(xué)團隊。利自身優(yōu)勢,說不定就能輕松通過這些知名大公司的數(shù)據(jù)科學(xué)面試。雖然這些公司的企業(yè)文化已經(jīng)成形,甚至還有官僚作風(fēng),多多少少會給創(chuàng)新帶來更多困難,但擁有百萬客戶數(shù)據(jù)可以為數(shù)據(jù)科學(xué)帶來無限可能。以沃爾瑪?shù)牟少彅?shù)據(jù)為例,這可是百萬量級的數(shù)據(jù),分析結(jié)果會影響千萬人的生活。雖然這類公司一般不會研發(fā)尖端數(shù)據(jù)科學(xué)解決方案,但處理他們的數(shù)據(jù)集依然是一種挑和他們的精英員工一同工作,也能讓你受益匪淺。清楚問題。給定一個特征向量,找出該向量到所有其它已知向量的歐式距離并且找出最接近的KJP可樂、第一資本家與建模師,第一資本數(shù)據(jù)工程師數(shù)據(jù)工程師職位ID:R5046發(fā)布日期:2016年6月16日工作所在地:弗吉尼亞州,麥克林市多年以來,我們一直努力為客戶提供獨創(chuàng)、精簡和人性的銀行服務(wù),我們以幫助客戶取得成功為使命,客成功就是我們的成功,客戶的滿意就是我們的標準。在共同價值觀的指導(dǎo)下,我們視合作與開放為核心價值,相信快人一步的創(chuàng)新、同心協(xié)力的團隊,只要互相扶持,以做正確的事情為準則,必能創(chuàng)造卓越的成就。我們的合伙人為客戶服務(wù)盡心盡力,全力協(xié)助客成目標、實現(xiàn)夢想,共同為把銀行業(yè)變得更好而努力。O我們心目中的人選:想用數(shù)據(jù)引爆軟件的能量嗎?開發(fā)過引以為豪的應(yīng)用嗎?喜歡優(yōu)雅的數(shù)據(jù)解決方案嗎?第一資本正在尋求一位資深數(shù)據(jù)工程師,能夠開發(fā)語言優(yōu)雅、擴展性強的數(shù)據(jù)解決方案,通過內(nèi)外部客戶觸點,改變業(yè)界游,提交用戶體驗分析成果。作為引領(lǐng)下一波新浪潮的銀行客戶團隊成員,您將領(lǐng)導(dǎo)整個團隊不斷完善第一資本的生態(tài)系統(tǒng),最終創(chuàng)建CassandraMongoAPI式處理等。000+人的公司規(guī)模)明這是個非常專業(yè)的崗位,需要掌控第一資本龐大的數(shù)據(jù)資源。6育培訓(xùn)有限公司4.4自有成熟數(shù)據(jù)團隊的大型科技公司大型科技公司也在不斷孵化成長,他們對數(shù)據(jù)的癡迷源于當年創(chuàng)業(yè)公司的初心,只不過他們的數(shù)據(jù)規(guī)模已經(jīng)達到甚至超過了百萬量級。優(yōu)步、Airbnb、Facebook和谷歌等世界級大公司有著業(yè)界頂尖精英領(lǐng)技術(shù)團隊,這類公司的數(shù)據(jù)科學(xué)人才專業(yè)性極高,可以用最狂野的革新思想應(yīng)對最前沿的數(shù)據(jù)問題。如果你渴望挑戰(zhàn)、向往處理大規(guī)模數(shù)據(jù),一定要加入這些頂級公司。雖然在這里你的優(yōu)勢不如在創(chuàng)業(yè)公司明顯,但是這些公司福利好、薪資高、團隊成員極其優(yōu)秀—就算將來想換工作,這里的工作履歷也簡歷高人一等。cebookAirbnb崗位示例:Oculus數(shù)據(jù)分析師,Airbnb機器學(xué)習(xí)數(shù)據(jù)分析師O數(shù)據(jù)與分析數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師(Oculus)Facebook產(chǎn)品改變了整個世界的供了無限的可能。Facebook對促進世界溝通與共享做出了巨大的貢獻,過去的十年里,,十幾億人使用我ebookOculus在尋覓既熱衷于虛擬現(xiàn)實,還能驅(qū)動數(shù)據(jù)化業(yè)務(wù)決策的數(shù)據(jù)產(chǎn)品科學(xué)家??梢圆倏厥澜缟献顝?fù)雜的數(shù)據(jù)集、使用最前沿的技術(shù),在日常工作中,您的洞察結(jié)果將會變數(shù)據(jù)驅(qū)動出成功的產(chǎn)品。公司規(guī)模:16,715名員工使用領(lǐng)英(10,000+人的公司規(guī)模)崗位解讀:本崗位指出求職者應(yīng)該是敢于創(chuàng)新的全面型人才,屬于開放式數(shù)據(jù)科學(xué)崗,招聘方希望求職者7育培訓(xùn)有限公司學(xué)家的行業(yè)各行業(yè)對數(shù)據(jù)科學(xué)的要求不一樣。每個行業(yè)都有專業(yè)知識,數(shù)據(jù)類型也因此不同,比如學(xué)校與銀行關(guān)注的不一樣。假如求職者恰巧對要面試的行業(yè)充滿熱情,記得一定要在簡歷或領(lǐng)英里多多列出該行業(yè)的關(guān)鍵字。說明對業(yè)很感興趣,對這個行業(yè)的知識了解得非常深刻,會讓你在眾多求職者中脫穎而出。O'Reilly公司的調(diào)研表明,軟件、咨詢及銀行金融是對數(shù)據(jù)科學(xué)人才需求最大的三個行業(yè),也是愿意為數(shù)據(jù)科學(xué)家開出最高工資的行業(yè)。不同行業(yè)對數(shù)據(jù)科學(xué)崗位的需求不同。軟件、醫(yī)藥以及電信業(yè)的公司是數(shù)向于招聘數(shù)據(jù)分析師。求職者可以根據(jù)潛在雇主的行業(yè),推斷他們的數(shù)據(jù)科學(xué)需求。求職者還要了解不同行業(yè)、公司及崗位的數(shù)據(jù)科學(xué)面試過程。從事數(shù)據(jù)科學(xué)這一行,必須具備獲取和處理大規(guī)模數(shù)據(jù)集的能力。一般來說,求職者應(yīng)該具備編程能力、數(shù)學(xué)知識及技術(shù)溝通技巧,還要掌握各種數(shù)技能,能夠勝任公司里各類數(shù)據(jù)科學(xué)崗位工作。的一點,求職者要有通過數(shù)據(jù)改變世界的決心和能力,不能輕易被困難擊倒。數(shù)據(jù)科學(xué)面試就是為了測試這些技能以及求職者的適應(yīng)能力,準備迎接來自各個維度的挑戰(zhàn)吧!科學(xué)面試機會科學(xué)面試的第一步不是應(yīng)對面試,而是爭取面試機會,僅這點可能就需要幾個月的努力。作為本書研究的一部分,我們咨詢了20個人,想了解他們認為數(shù)據(jù)科學(xué)面試里哪個環(huán)節(jié)最難,本來我們認為他們會說技術(shù)問題最難,但調(diào)查結(jié)果并非如此。只有68%的人認為技術(shù)問題最難,名列第二;多達%的人認為得到數(shù)據(jù)科學(xué)面試的機會最難。怎樣才能得到面試機會,特別是轉(zhuǎn)行做數(shù)據(jù)科學(xué)的人怎樣才能獲得面試機會呢?介紹這方面內(nèi)容的文獻很少。我們想在此基礎(chǔ)上更進一步,研究數(shù)據(jù)科學(xué)面試的真人真事,給大家呈現(xiàn)與眾不同的內(nèi)容,幫助求職到面試機會。5.2.通往數(shù)據(jù)科學(xué)面試的九條途徑在數(shù)據(jù)科學(xué)領(lǐng)域,我們發(fā)現(xiàn)傳統(tǒng)途徑還有些作用,不過對于創(chuàng)業(yè)公司,新興的、主動出擊式的策略會讓求更多機會。O獲得面試機會的傳統(tǒng)途徑:雖然,我們認為新興的策略對獲得面試機會更有效,不過,本著物盡其用的精神,了解下傳統(tǒng)途徑也沒有8育培訓(xùn)有限公司1)官網(wǎng)招聘版塊與標準求職求職者通過公司官網(wǎng)的招聘版塊提交簡歷與求職信,然后就等著吧。不是說別用這種方法,不過它真不靠譜。譜可以到Indeed和Careerbuilder上查找數(shù)據(jù)科學(xué)的帖子,也可以去專業(yè)網(wǎng)站的數(shù)據(jù)科學(xué)招聘版塊找找機會,比如Kaggle的招聘版塊。2)第三方招聘公司聯(lián)系第三方招聘公司,請他們幫忙聯(lián)系適合的公司。他們在數(shù)據(jù)科學(xué)與技術(shù)領(lǐng)域中非常專業(yè),經(jīng)常能收到未公開發(fā)布的招聘信息。在領(lǐng)英上查找數(shù)據(jù)科學(xué)招聘,聯(lián)系身邊的第三方招聘公司,或許能幫你找到合適。3)參加招聘會數(shù)據(jù)科學(xué)類招聘會很少,雖然哈佛大學(xué)與斯坦福大學(xué)舉辦的計算機科學(xué)招聘會為在校生提供了不少數(shù)據(jù)科但是就算參加當?shù)財?shù)據(jù)科學(xué)社區(qū)主辦的聚會也比參加招聘會強得多。O獲得面試機會的主動途徑上述傳統(tǒng)途徑是求職的默認項?,F(xiàn)在,要想拿到Offer,還要有主動出擊的拼搏精神與勇氣。創(chuàng)業(yè)公司提供了大量數(shù)據(jù)科學(xué)崗位,他們的企業(yè)文化與招聘策略大多源于那些十年前也是創(chuàng)業(yè)公司的大型公司,創(chuàng)業(yè)公司的決策者在創(chuàng)建公司時靠的就是拼搏和勇氣,他們的招聘理念也如是,所以,求職者必須同樣也要有搏精神和勇氣,主動出擊和他們?nèi)〉寐?lián)系。4)組織或參加數(shù)據(jù)科學(xué)活動大型會議與小型社區(qū)聚會。p會議Strata大會:Strata大會是在世界各地巡回舉辦的大型數(shù)據(jù)科學(xué)會議,演講者來自各大學(xué)院與業(yè)內(nèi)企業(yè)。大會的主題關(guān)注于數(shù)據(jù)科學(xué)發(fā)展最前沿的趨勢。在這里,可以學(xué)習(xí)數(shù)據(jù)科學(xué)背后的技術(shù)。Strata大會還經(jīng)常組織網(wǎng)上活動。KDD大會:KDD,全稱數(shù)據(jù)科學(xué)知識探索大會,也是大型數(shù)據(jù)科學(xué)會議,還是引領(lǐng)數(shù)據(jù)科學(xué)理論研討與組織。參加這樣的大會,成為其中的會員是為數(shù)據(jù)科學(xué)發(fā)展做出貢獻的超凡途徑。9育培訓(xùn)有限公司NIPS大會:NIPS,全稱神經(jīng)信息處理系統(tǒng)大會,是大型學(xué)院派數(shù)據(jù)科學(xué)會議,側(cè)重于評估數(shù)據(jù)科學(xué)的前。參加該大會可以一覽數(shù)據(jù)科學(xué)的未來發(fā)展。我們列出了不少數(shù)據(jù)科學(xué)大會,但還有更多服務(wù)于本地數(shù)據(jù)科學(xué)社區(qū)的小型聚會。美國大多數(shù)城市都有數(shù)據(jù)科學(xué)社區(qū)聚會,但是舊金山海灣地區(qū)的數(shù)據(jù)聚會最多??梢酝ㄟ^M查詢附近的數(shù)據(jù)科學(xué)聚會,有些大型數(shù)據(jù)科學(xué)聚會的成員超過4000多名,比如,舊金山數(shù)據(jù)發(fā)掘聚會、華灣區(qū)R用戶群。當年就是靠做過數(shù)據(jù)科學(xué)社區(qū)聯(lián)絡(luò)人找到的工作。他主持過一次亞特蘭大數(shù)據(jù)科學(xué)聚會,當時邀請了不少輕輕松松地就應(yīng)聘成功了。5)打造自己的作品集SundeepPattem是多門數(shù)據(jù)科學(xué)教程的導(dǎo)師。作為數(shù)據(jù)科創(chuàng)建了一整套提取數(shù)據(jù)價值的解決方案,還在個人網(wǎng)站上列出了多個方向的數(shù)據(jù)科學(xué)項目。通過解決可持續(xù)性的能源問題,他的數(shù)據(jù)科學(xué)技能突飛猛進,很快就成為了知名學(xué)術(shù)大會的出版作家,不還找到了數(shù)據(jù)科學(xué)家的工作。不知道分析什么數(shù)據(jù)?我們提供了19個免費開源數(shù)據(jù)集供你探索。找到感興趣的數(shù)據(jù)問題,提出解決方案,記下每步操作,打造自己的作品集,講述解決問題的經(jīng)歷,展示科學(xué)的追求。6)參與開源項目或開放數(shù)據(jù)項目世界上最酷的數(shù)據(jù)項目早就不再是大公司秘密數(shù)據(jù)庫里的專利了,Github的開源庫才是項目寶地,比如,這里有把人類語言當作數(shù)據(jù)源的NLTK自然語言工具箱,還有各種Python數(shù)據(jù)科學(xué)與機器學(xué)習(xí)庫。另外,CTO源項目的經(jīng)歷可以證明求職者能和團隊一起合作開發(fā)高水平的作品。開源項目就像透明的玻璃瓶一樣,讓勢一覽無余。7)參加數(shù)據(jù)科學(xué)競賽喜歡的開源項目也沒關(guān)系,還有更廣闊的天地可以讓你發(fā)揮創(chuàng)造力,比如參加數(shù)據(jù)科學(xué)競賽。數(shù)據(jù)科學(xué)競賽平臺有Kaggle,Datakind和Datadriven,這些平臺提供了解決現(xiàn)實世界里企業(yè)與社會問育培訓(xùn)有限公司題的機會。好好表現(xiàn)數(shù)據(jù)科學(xué)技能,告訴大家你是多么的與眾不同,積累最強大的面試資本:熱愛實戰(zhàn)。8)喝杯咖啡,信息化約談廣泛的人脈能為你帶來大量的工作機會。想知道公司要解決什么樣的數(shù)據(jù)問題?哪些問題你能解決?想知,就得多認識些這個圈子的人。對付這種人有一套,能邀請他們和你一起喝咖啡。你可以給他們待解決的問題提出新想法,找到解決問題和數(shù)據(jù)科學(xué)家約談時,可以聽取他們的建議,了解最新的業(yè)內(nèi)動態(tài),還可以擴大數(shù)據(jù)科學(xué)人脈圈,了解業(yè)9)數(shù)據(jù)駭客松順應(yīng)實戰(zhàn)潮流,數(shù)據(jù)駭客松提供了獨一無二的,與精英團隊共同錘煉數(shù)據(jù)科學(xué)本領(lǐng)的機會。幾天內(nèi)解決一的數(shù)據(jù)問題,這可不簡單。DataWeek可行的解決方案,一下子就把你和其他求職者區(qū)別開來了。很多公司都關(guān)注駭客松,還會提供獎項贊助,以期能在這里找到下一位科學(xué)家。育培訓(xùn)有限公司育培訓(xùn)有限公司5.3.與第三方招聘公司合作k與AnnaMeyer合作,她就職于RobertWalters,這是一家專注于數(shù)據(jù)科學(xué)領(lǐng)域的第三方招聘公司,她公司的招聘主管。5.4.如何提出求職申請O簡歷VS領(lǐng)英哪種提交求職申請的方式更好?現(xiàn)在還有不少人傾向于傳統(tǒng)思路,不過他們忽略了一個大問題:傳統(tǒng)思路。學(xué)院派與實干家的基本區(qū)別就是怎么介紹自己。在校學(xué)生,還有招聘經(jīng)理都交流過,他們普遍認為領(lǐng)英已經(jīng)是招聘的黃金標準。允許第三方招聘公司瀏覽優(yōu)化過的簡歷,他們能幫你找到合適的工作機會。在領(lǐng)英上給自己造勢,你就已經(jīng)輸給這么干的人了。雖然現(xiàn)在面試還要求提供簡歷,但簡歷已經(jīng)不是面試成功的重點了。提交簡歷之后,招聘人員會快速瀏覽的簡歷,然后就完了,而偉大的領(lǐng)英可以不斷地給你提供求職機會。和學(xué)院派不同,寫幾篇令人印象深刻的論文,再有幾年高校工作經(jīng)驗,這是學(xué)院派找工作的關(guān)鍵。到業(yè)界的公司求職,簡歷寫的越簡單越好,列出以前為公司做過什么貢獻就可以了。記住,招聘人員對簡歷就是歷的重要建議歷的人愿意深入了解你之前,首先要找到對你的興趣點。亮或加粗顯示。招聘人員或招聘經(jīng)理會先看你是否具有崗位所需的技能。關(guān)就可以。4)使用數(shù)字說明影響力!不要只寫做過什么工作,要寫清楚做過的工作產(chǎn)生了多大影響。比如說,寫“開發(fā)了自益”。英的重要建議。前的工作崗位相匹配。技術(shù)能力以及與企業(yè)文化的匹配度。說明你獨特的世界觀,能增添不少個人價值,脫穎而出。育培訓(xùn)有限公司楚這一點。要想求職成功,編寫個人檔案時要非常慎重。如果不想只得到入門級的Offer,就別說自據(jù)科學(xué)新人。要是你專注于處理某些特定類型的問題,要說清楚這類問題涉及的行業(yè)。搞清楚應(yīng)聘崗位和行業(yè)以及相關(guān)技能的關(guān)鍵字。對金融類數(shù)據(jù)科學(xué)崗位感興趣?別客氣,盡量在簡歷與領(lǐng)英里多提提這些行業(yè)的術(shù)語。如果你的技能正好與求職崗位相關(guān),一定要說清楚!最好研究一下要應(yīng)聘公使用的技術(shù)。YelpAirbnb位要求使用Python或R,就得在簡歷和領(lǐng)英里說清楚你會不會這些技術(shù)。要是有人能在領(lǐng)英幫你做背書,也是非常有利的事情,所意思,邀請同事證明你的技術(shù)實力吧。很多第三方招聘人員和招聘經(jīng)理不怎么看簡歷,更喜歡看領(lǐng)英。招聘人員看簡歷的時間一般也就30秒,然后就把簡歷扔到一邊去了。用強有力的語言描述你為公司帶來的影響,如果想讓簡歷或領(lǐng)英引人注目,得一定要使用正確的關(guān)鍵字。都排隊等著入職呢。你得干得更漂亮才能找到滿意的工作。不管怎么說,優(yōu)化求職的每一步,包括簡歷和,這兩樣都是你的新老板肯定會看的東西。O求職信VS電子郵件求職信以前是學(xué)術(shù)進步的標準?,F(xiàn)在這個年代,招聘人員很少會看求職信。要是想表現(xiàn)得與其他人不同,或領(lǐng)英里附上吧。要表現(xiàn)的更積極主動,就把工作經(jīng)歷好好提煉一下,整理成簡明的文字,發(fā)個電子郵件給招聘經(jīng)理,方便他向公司里其他人介紹你。這封郵件一定要簡單明了,最好別超過一段,內(nèi)容也不要超過三點,就說最重事情,能說明你給公司帶來的影響就可以了。O請人推薦,讓人脈為你服務(wù)大多數(shù)人都沒意識到人脈圈子的重要性,好的人脈圈子可以讓你順順利利地邁進數(shù)據(jù)科學(xué)面試的大門。很多公司都極其重視人才推薦,特別是內(nèi)部推薦。要是公司里能有人大力推薦你,最起碼能保證有人去看你跳過面試的很多環(huán)節(jié)。率獲得面試機會;僅通求職成功的可能性大幅提高。我們的校友還說,不一定非得是朋友才能做人才推薦,也可以找公司里的員工幫你推薦,起碼能電話面試的機會。長遠來看,你得結(jié)交不同類型的人,不管是曾向你學(xué)習(xí)的人,還是喜歡給你介紹朋友認識的人,他們都會你推薦工作的人。育培訓(xùn)有限公司假如人脈圈子幫不上忙,又著急找人推薦,那你可以利用信息化約談這招。接觸在這行工作的人,了解他能證明你對他們的事業(yè)感興趣,而且還幫得上忙。去處,領(lǐng)英、Angellist和FounderDating這樣的網(wǎng)絡(luò)平臺也可以。只要表現(xiàn)的真心誠意,再展示出你對他們就職的公司和數(shù)據(jù)科學(xué)的興趣,就可以試著約他們出來喝杯咖啡,聊聊他司,看看能不能為他們手頭上的難題提點解決方案。下面是個郵件樣稿(你也可以在領(lǐng)英上添加朋友,還可以在FounderDating或Angellist上直接給人發(fā)信提出些有創(chuàng)意的想法,幫你們強化信任。希望能有幸請您一起喝杯咖啡,了解下Airbnb面對的問題,說不定我能幫上忙,不知道您下周是否有時間能一起坐坐?前項目的鏈接。如果人脈圈子夠大,通過朋友介紹,就有可能約談任何公司的人。看下領(lǐng)英里的二度好友,看看別人是怎么和你關(guān)聯(lián)上的,同樣,你也可以輕易地關(guān)注任何一家公司的領(lǐng)英頁面。這里是Airbnb在領(lǐng)英的頁面,看。約好以后,一定要好好了解約談的人及其就職的公司,相關(guān)信息在公司網(wǎng)站就能找到,也可以看看能否通源了解??傊?,最好了解清楚該公司的日常問題。信息化約談提供了絕佳的機會,可以讓你了解應(yīng)聘公司到底是什么樣,他們的優(yōu)先級是什么的,這些在面試時有很大幫助。如果準備充足,把自己定位成為幫助公司解決問題的人,這個和你喝咖啡的人就會變成部舉薦你的強大助力,幫你跳過一些招聘環(huán)節(jié),助你進入第一輪面試。育培訓(xùn)有限公司試希望為爭取數(shù)據(jù)科學(xué)面試機會所做的一切都有回報,收到代表開啟面試流程的郵件,或者有公司打電話叫試。以下就是即將發(fā)生的事情,要準備好哦。6.1.面試內(nèi)容需要通過許多技術(shù)挑戰(zhàn);另一些公司則會考慮企業(yè)文化匹配。如果有人推薦,你有可能會直接進入最后一試。最嚴謹?shù)拿嬖嚳赡苁沁@個樣子:O電話面試一般來說,為了節(jié)約招聘經(jīng)理的時間,人力資源的員工會通過電話面試初步篩選求職者。有時會詢問些基本的技術(shù)問題,篩掉完全不合格的人。大多數(shù)情況下,從電話面試開始,公司就已經(jīng)在考察求職者是否和的企業(yè)文化相匹配了,求職者要有較好的溝通技巧,才能面試成功。本次通話可以讓你初步了解數(shù)據(jù)團隊的問題及其組織架構(gòu)。準備好一些有深度的問題,展示你對業(yè)務(wù)和數(shù)的理解,快結(jié)束時也可以提些關(guān)于公司的問題。O家庭作業(yè)電話面試后,有的公司會給求職者布置任務(wù),要求限時完成。這個環(huán)節(jié)能有效地篩掉技術(shù)差、不愿下人。大部分公司不會這么干,但也有不少公司喜歡用家庭作業(yè)這種測試方法節(jié)約招聘經(jīng)理的時間。好的家庭作業(yè)設(shè)計也是了解公司的好機會,可以了解到這份工作要解決什么問題。家庭作業(yè)可能會讓你深度分析給定的數(shù)據(jù)集,從數(shù)據(jù)中推導(dǎo)出洞察結(jié)果,并進行說明;也有可能是讓你清理有明顯錯誤的數(shù)還有可能讓你處理某些業(yè)務(wù)問題,比如基于職位描述中的數(shù)據(jù)為求職者開發(fā)職位推薦系統(tǒng)?;c時間完成家庭作業(yè),了解這家公司有什么樣的數(shù)據(jù)問題。通過家庭作業(yè),可以知道公司側(cè)重于測試哪種技能,以及他們?nèi)绾慰创@個崗位,搞清楚這些問題,能讓你更好地利用時間應(yīng)對面試。做好這項可以充分體現(xiàn)實力,讓你與眾不同。O招聘經(jīng)理電話面試育培訓(xùn)有限公司這可能是現(xiàn)場面試前的最后一輪評測。一般為三部分,有時可能一個電話搞定,通話時間會比較長;通常三次電話面試,每次三十分鐘。p數(shù)學(xué)與統(tǒng)計學(xué)學(xué)與統(tǒng)計學(xué)核心概念知識,面試的公司和崗位不同,具體的面試內(nèi)容也不同。網(wǎng)絡(luò)公司側(cè)重于評測ABP計顯著性均值的概念。能源公司則側(cè)重于測試對回歸概念和線數(shù)的理解。不管面對哪種的面試,都要能描繪解決問題的整體思路。BAB要像對待數(shù)學(xué)驗證與統(tǒng)計推理一樣,不要擔心過度關(guān)注細節(jié),要能條理清晰地回答問題。p編程本次面試和其它技術(shù)面試非常相似。主要是評測技術(shù)能力,一般會要求用偽代碼解決編程問題,復(fù)雜一些面試官可能會用HackerRank或Collabedit這樣的工具在線評測。使用這些工具,招聘經(jīng)理可以實時查看能會用HackerRank或Collabedit這樣的工具在線評測。使用這些工具,招聘經(jīng)理可以實時查看求職者輸決方案,準備好應(yīng)對這種形式的測試,有可能的話去這類網(wǎng)站做些專項訓(xùn)練。破解編程面試這樣的書或InterviewCake這樣的網(wǎng)站為求職者提供了很多應(yīng)對編程面試的資源,利用好這對求職者有很大幫助。要想順利通關(guān)編程面試,就得勤做練習(xí),熟,才能生巧。寫代碼時最好能找個舒適、安靜的環(huán)境。不過大育培訓(xùn)有限公司多數(shù)情況是接到電話后,手忙腳亂地在紙上寫下代碼,然后匆匆忙忙地在電話里解釋;有的時候,面試官會要求使用在線測試工具進行編程測試,這時可別說自己不會用??傊?,要對各種可能發(fā)生的情況做好準。這種面試經(jīng)常會問到數(shù)據(jù)結(jié)構(gòu),要好好學(xué)習(xí)哈希映射、決策樹、堆棧、隊列這些概念。像軟件工程師應(yīng)對試一樣,你就能成功。O招聘經(jīng)理電話面試終于輪到招聘經(jīng)理了,他會面試求職者的溝通能力,考核求職者能否與公司的團隊融洽相處。這次面試通個性、求職動機、團隊匹配度及思維天賦。絕大多數(shù)招聘經(jīng)理心里都會有目標人選的預(yù)期,越接近招聘經(jīng)預(yù)期,就越可能獲得現(xiàn)場面試的機會。標,可以針對該崗位定制溝通內(nèi)容,盡量表現(xiàn)得自信,再能表述清晰的話,順利通關(guān)的可能性就會很大。還要處理好“航行測試”這樣的情景問題,試想一下,和招聘經(jīng)理一起坐幾個小時的飛機,怎么能讓他覺得你不是個無聊的人。這項測試非常重竟今后要天天和團隊同事一起工作至少八小時,這時最好能表現(xiàn)出和領(lǐng)導(dǎo)融洽相處的本事。O招聘經(jīng)理現(xiàn)場面試恭喜你通過了電話面試,終于可以和招聘經(jīng)理面談啦。招聘經(jīng)理會從技術(shù)和非技術(shù)角度兩方面進行確認求職者適不適合應(yīng)聘的崗位,甚至?xí)O(shè)定不同場景讓求職者使用白板現(xiàn)場講說,測試求職者的長。O技術(shù)挑戰(zhàn)如果現(xiàn)場面試沒有考核技術(shù)能力,就會在本環(huán)節(jié)進行各種技術(shù)測試,特別是數(shù)據(jù)工程師這個崗位。這個環(huán)工程師面試非常相似,通常會要求在白板上寫出應(yīng)用的算法,解決特定的問題。O說就不難。O總監(jiān)面試級總監(jiān)面試。創(chuàng)業(yè)公司一般會由聯(lián)合創(chuàng)始人或CEO親自面試。育培訓(xùn)有限公司恭喜你!終于到了這一關(guān)了。一般來說,通過了技術(shù)考核的求職者才有可能到這一關(guān)。雖然,到了這關(guān)基本上就說明公司會給你發(fā)Offer,不過也別得意忘形?,F(xiàn)階段只需著重說明怎么推動業(yè)務(wù)工作進展,怎么司的問題就可以了,不用再證明自己什么,反倒要注意別犯低級錯誤。6.2.數(shù)據(jù)科學(xué)崗位技能矩陣/統(tǒng)計學(xué)庫工程[1]領(lǐng)域?qū)iL產(chǎn)品科學(xué)家[2]中中中高高中工程師低中低高高低科學(xué)家高中高低低高專家中高中低低高分析師低高低低低高op不同的數(shù)據(jù)科學(xué)崗位對技能組合要求不一樣。數(shù)據(jù)工程師不用具備太強的業(yè)務(wù)演示能力,但要能解決各種用好SQL就行了,不過卻要是個優(yōu)秀的演說家。本表從高至低列出了業(yè)界對數(shù)據(jù)科學(xué)崗位的需求與標準。以最熱門產(chǎn)品數(shù)據(jù)科學(xué)家為例說明了各崗位的專度水平。搞清楚要應(yīng)聘哪個崗位,了解應(yīng)聘公司需要哪個崗位的人員,招聘崗位適不適合自己,有助于預(yù)估數(shù)據(jù)科程。6.3.數(shù)據(jù)科學(xué)崗位縱覽數(shù)據(jù)產(chǎn)品科學(xué)家:具備數(shù)據(jù)產(chǎn)品開發(fā)能力的全能型數(shù)據(jù)科學(xué)家。數(shù)據(jù)產(chǎn)品科學(xué)家?guī)ьI(lǐng)團隊開發(fā)數(shù)據(jù)產(chǎn)品,法,精通用數(shù)據(jù)服務(wù)終端客戶,具備開發(fā)能力,能規(guī)劃各種數(shù)據(jù)產(chǎn)品。數(shù)據(jù)科學(xué)家:技術(shù)、業(yè)務(wù)與數(shù)學(xué)的獨角獸能力混合體。數(shù)據(jù)科學(xué)家懂得怎樣創(chuàng)建與優(yōu)化數(shù)據(jù)算法,能夠解釋說明數(shù)據(jù)發(fā)掘到的內(nèi)容。相對數(shù)據(jù)工程師而言,數(shù)據(jù)科學(xué)家不需要太懂編程,但是要能完美解析各種規(guī)數(shù)據(jù)。商務(wù)智能專家:關(guān)注從數(shù)據(jù)中提取商務(wù)洞察結(jié)果,精通統(tǒng)計學(xué),與數(shù)據(jù)分析師的不同之處在于,能夠掌握種機器學(xué)習(xí)算法,編制各類數(shù)據(jù)儀表盤,進行各種數(shù)據(jù)分析,幫助公司各團隊制定更好的決策。工程師:不必過多了解統(tǒng)計學(xué)或數(shù)學(xué),但要能處理各類技術(shù)難題,針對大規(guī)模數(shù)據(jù)實現(xiàn)各種算法。育培訓(xùn)有限公司試題7.1.行為試題與其它崗位的面試類似,數(shù)據(jù)科學(xué)面試也包括大量行為試題,面試官會考核求職者的軟技能,了解求適應(yīng)公司的企業(yè)文化。O請說明你以前做過的數(shù)據(jù)科學(xué)項目?了解求職者對相關(guān)知識的理解程度,曾做過什么樣的貢獻。測試描述工作內(nèi)容的能力,以及能否把數(shù)據(jù)科歷與對公司產(chǎn)生的影響聯(lián)系起來。應(yīng)答思路:與工程經(jīng)驗的數(shù)據(jù)項目,例如,提供數(shù)據(jù)分析并將分析結(jié)果產(chǎn)品化的數(shù)據(jù)項目。舉例來說,通過主題提取技術(shù)識別文本數(shù)據(jù)集中的核心主題,說明主題識別的數(shù)據(jù)產(chǎn)品對促進公司業(yè)務(wù)增長什么效果。目標角度,詳細描述對這個數(shù)據(jù)項目的貢獻和產(chǎn)出結(jié)果。面試官希望在了解該項目總體目標的同O對以前的崗位,你喜歡什么?反感什么?合面試的崗位,了解你離職的原因。應(yīng)答思路:1.差:我就受不了數(shù)據(jù)科學(xué)家總是矮工程師一頭,公司高管對企業(yè)發(fā)展方向一點頭緒都沒有!2.好:我想在數(shù)據(jù)科學(xué)是企業(yè)戰(zhàn)略核心、企業(yè)發(fā)展方向清晰的公司工作。的職責、團隊成員、發(fā)展歷史及核心業(yè)務(wù)目標等諸多信息。4.注意在討論反感的事情時,要對事不要對人,表現(xiàn)出專業(yè)的素養(yǎng)。在討論喜歡的事情時,仔細反思、論證哪些事情讓你充滿激情。比如,可以說喜歡的事情是從數(shù)據(jù)中分析出重要結(jié)果,匯報給管理層后能優(yōu)化流程、促進業(yè)務(wù)。也可以說在公司里推行數(shù)據(jù)科學(xué)時可以學(xué)到新技術(shù),同時又能讓工作的效果更好??梢员硎緦緵]把數(shù)據(jù)科學(xué)作為戰(zhàn)略核心的不滿,也可以說公司高層的內(nèi)耗,團隊方向不清晰,但是一定要極地、有指向性的角度來說,千萬不要帶上個人色彩。育培訓(xùn)有限公司O請說明,當必須說服別人認同你的觀點時,你是怎么做的,效果如何?人的能力。應(yīng)答思路:舉例說明你曾經(jīng)成功地改變現(xiàn)狀,量化這些改變帶來的影響。如果可以的話,舉出數(shù)據(jù)科學(xué)類出溝通技巧與領(lǐng)導(dǎo)能力非常重要。7.2.數(shù)學(xué)試題科學(xué)家崗位的數(shù)學(xué)問題,不僅需要求職者能執(zhí)行算法,還要能根據(jù)特定目的調(diào)整算法。O如何使用線性回歸算法求解最優(yōu)系數(shù)?(C3能源的數(shù)據(jù)科學(xué)家面試時曾問過這個問題)原理:了解求職者對線性回歸理論的理解程度,線性回歸理論對很多數(shù)據(jù)科學(xué)崗位都十分重要,數(shù)據(jù)科學(xué)家不能把算法視為黑箱,不僅要能執(zhí)行算法,還要能理解算法。這類問題(各種算法)測試求職者對算法的理解。應(yīng)答思路:一步思路,列出方程式。描述思路的同時,還要詳細說明解決方案。答案:在最高水平上,系數(shù)是最小化殘差平方和的函數(shù)。下一步,列出方程,說明什么是殘差。想要更進一步的話,可以考慮如下內(nèi)容:1.用給定的線性回歸模型,列出殘差平方和的最小化目標,最好用線性代數(shù)(矩陣)表示法。2.殘差平方和是可求微分的凸函數(shù),將微分設(shè)為0,求解該方程,可導(dǎo)出系數(shù),解出最小化方程式。較復(fù)雜;還有一種常見的案,通過觀測可以發(fā)現(xiàn)該方程式是凸性的,因此用梯度下降這樣的數(shù)值算法求解效率會更高。7.3統(tǒng)計學(xué)試題統(tǒng)計學(xué)知識對解決數(shù)據(jù)科學(xué)問題至關(guān)重要。統(tǒng)計推理能力和統(tǒng)計學(xué)理論測試十分常見。一定要牢記常用的III概念。OI型錯誤與II型錯誤的區(qū)別是什么?(Niraj,我們的校友就遇到了這個問題)原理:統(tǒng)計學(xué)基本概念的掌握程度、統(tǒng)計學(xué)基礎(chǔ)水平,評測怎么使用統(tǒng)計學(xué)專業(yè)術(shù)語溝通各方人員的能力。應(yīng)答思路:有據(jù),準確說明問題里的名詞定義。答案:育培訓(xùn)有限公司欺詐監(jiān)測業(yè)務(wù)對假陽性的容忍度特別高,客戶不會因為收到提醒小心受騙的郵件發(fā)火;可要是真被騙了,卻沒監(jiān)測到,這種假陰性就麻煩大了。O這是一家大型保險公司的數(shù)據(jù)科學(xué)面試題。將總體分為兩組:,a)他是暴脾氣司機的概率是多少?b)他是好脾氣司機的概率是多少?原理:很多公司通過貝葉斯推理測試求職者的統(tǒng)計思維能力。說明貝葉斯概率與統(tǒng)計學(xué)的頻率解釋的區(qū)別,展示種貝葉斯問題的能力,可以讓面試官快速了解你對統(tǒng)計概念的掌握水平和心算能力。應(yīng)答思路:率的理解水平,要邏輯清晰、條理分明地說明所有假設(shè)與計算過程。答案:首先,列出已知項:或0.6需要理解貝葉斯方程式中先驗條件與后驗條件的概念。先驗條件是在問題出現(xiàn)前給定的數(shù)據(jù)。某人在總體中屬于暴脾氣司機的概率就是給定的先驗假設(shè),不能改變。后驗條件是根據(jù)貝葉斯定理的假設(shè)(P(A/B))得第一個問題是“如果張三一年內(nèi)發(fā)生了3起事故,他是暴脾氣司機的可能性是多少?”?#先驗條件aggDriver=0.4AggDriver育培訓(xùn)有限公司reeAccAggDriverreeAccNonAggDriver#某人一年內(nèi)發(fā)生3起事故,他是暴脾氣司機的概率是多少?#暴脾氣司機占總體的比例乘以一年內(nèi)發(fā)生3起事故的暴脾氣司機的概率AaggDriverthreeAccAggDriver)"""分子"""分子(即A)加好脾氣司機占總體的比例乘以一年內(nèi)發(fā)生3起事故的好脾氣司機的概率。"""rthreeAccAggDrivernonAggDriverthreeAccNonAggDriver"""用一年內(nèi)發(fā)生3起事故的暴脾氣司機的概率除以一年內(nèi)發(fā)生3起事故的好脾氣與壞脾氣司機的概率之和,得出后驗概率"""#把小數(shù)轉(zhuǎn)換為百分數(shù)printfformatposterior*100))66=0.3333,即33%。O什么是概率分布類型(說明概率分布函數(shù)的推導(dǎo))?用隨機變量描述。a.T分鐘內(nèi),某餐館進來K個客人的概率b.一群人中,身高至少為X英寸的概率c.兩個六面骰子,點數(shù)和為Y的概率dN次硬幣,人像朝上為K次的概率原理:概率分布的知識及使用什么模型分析給定的數(shù)據(jù)。應(yīng)答思路:說明數(shù)據(jù)假設(shè),詳細說明某模型是如何適用于某個概率分布的。對概率分布進行可視化,向面試官說明為用該模型對某個概率分布進行可視化。答案:a.泊松分布。假設(shè)每個客人的到店行為都是完全獨立的,與其他人沒有關(guān)系。育培訓(xùn)有限公司b.正態(tài)分布。注意,在連續(xù)分布中,精確到X英寸的可能性為零。c.根據(jù)公式XY與連續(xù)概率分布函數(shù)之間的關(guān)系。d.二項分布。P(k是拋N次硬幣頭像朝上的次數(shù)):tlibinlinetmatplotlibasplotipylinspaceinompmfxpylablabplotxpmf育培訓(xùn)有限公司7.4編程試題面試數(shù)據(jù)科學(xué)崗位,尤其是數(shù)據(jù)工程師崗位,算法編程是必考項。這個環(huán)節(jié)可以參考軟件工程師的面試,用開發(fā)工具和編程綜合理論是??嫉膬?nèi)容。OSQL問題—給定交易表(Transaction_ID,Item_ID,Quantity,Purchase_Date(MM/DD/YY))和售價表(Item_ID,Price),請?zhí)峁┮韵滦畔ⅲ嚎偸杖?)工作日(星期一至星期五)交易的總量、平均值與標準差,按購買量降序排列mID交易樣表(表名為transactions):ansactionIDmID11516223163251642116在SQLFiddle中創(chuàng)建transactions表intItemIDintQuantityintPurchaseDatedatetime;tionsDQuantityPurchaseDate6-06-2800:00:00'),6-06-2700:00:00'),6-06-2700:00:00'),6-06-2600:00:00');價格樣表(表名為prices):mID1223育培訓(xùn)有限公司在SQLFiddle中創(chuàng)建prices表ntPricevarchar;srice;原理:大型創(chuàng)業(yè)公司和成熟公司普遍使用SQL查詢數(shù)據(jù)庫。如果面試的是數(shù)據(jù)分析師,技術(shù)面試主要以SQL問。懂得如何正確提取數(shù)據(jù),對面試成功很重要。應(yīng)答思路:面試時,會讓求職者在紙上寫出代碼,或使用HackerEarth等協(xié)同編碼工具,這樣面試官就可以在解釋器了。盡量在最短時間內(nèi),最有效的完成任務(wù),并且盡量少犯錯誤??梢杂肧QLFiddle等工答案:1)總收入LECTsumaquantitybpricectionsASaJOINpricesASbONa.item_ID=b.item_ID這段代碼用于關(guān)聯(lián)價格表與交易表,將每個產(chǎn)品的數(shù)量與價格相乘,進行匯總。計算得出總收入為37美育培訓(xùn)有限公司2)工作日交易的總量、平均值與標準差tityntityEDAYOFWEEKpurchasedateBETWEENAND3)LeftJoinVSGroupBya.LeftJoin方法countdistinctAitemid(LECTEDAYOFWEEKpurchasedateBETWEENAND育培訓(xùn)有限公司))ASBtemIDBItemIDHEREISNULLBpurchasedateb.Groupby方法[1]T(IDEDAYOFWEEKPurchaseDateBETWEENANDmID)ASB能計算出工作日未交易過的產(chǎn)品數(shù)量。SQL答題技巧:O整個問題分解成特定的中表,先為中間表寫好查詢語句;O算法問題—從0開始,編寫K近鄰算法原理:在規(guī)定時間內(nèi),寫出算法背后的思想,并進行有效布署,這是評估數(shù)據(jù)開發(fā)能力的關(guān)鍵。這類問題一般會用來考核數(shù)據(jù)科學(xué)家的算法與技術(shù)實現(xiàn)能力,也會用來考核數(shù)據(jù)工程師的技術(shù)能力,通常會要求在給定條算法,但大多數(shù)情況下以K近鄰算法為主,因為這種算法比較實現(xiàn)。應(yīng)答思路:清楚問題。給定一個特征向量,找出該向量到所有其它已知向量的歐式距離,并找出最接近的K個向量中的大多數(shù)向量屬于哪一類。這個問題測試對矩陣計算的理解,還測試處理向量和矩陣的方法?;卮疬@個問題,要從核對輸入輸出樣本集開始,動手推導(dǎo)答案。另外,還要注意時空復(fù)雜度。下面的方案中,每個預(yù)測都是關(guān)于O(2N+NlogN)O(2N+NlogN)O(2N+NlogN)的時間復(fù)雜度,其中,N是訓(xùn)練的行數(shù)。給出解決方案。寫清楚語法很重要,還有要注意避免各種讓代碼不能正常編譯的錯誤,但最重要的是說清的邏輯,要證明你能將算法應(yīng)用到計算機科學(xué)層面。ollections育培訓(xùn)有限公司umpyasnpNearNeighborobjectfinteffitXyNXtestmatrixarrayXtestself.X.shape[0])#將X_test復(fù)制為N行istancevectornpsqrtnpsumabsXtestmatrixselfXaxis#此行是為了獲取每個訓(xùn)練向量的距離#注意這里是使用**2和np.sum獲取距離Sortindexnpargsort[Distance_vector]Close_k_Classes=y[Sort_index][0:k]#提取一組K個最鄰近的向量ncollectionsCounterClosestkClassmostcommon#返回出現(xiàn)最多的類解決方案:大數(shù)據(jù)相關(guān),比如,應(yīng)聘崗位需要分析超大規(guī)模數(shù)據(jù)集,就會問到MapReduce。包括,如何利用大規(guī)模數(shù)據(jù)集,查找事件流中的最頻繁事件。O如何在Hadoop上使用MapReduce實現(xiàn)字數(shù)統(tǒng)計?原理:有使用Hadoop或大數(shù)據(jù)工具的相關(guān)經(jīng)驗,或應(yīng)聘的公司有處理大規(guī)模數(shù)據(jù)集的需求,創(chuàng)業(yè)公司,會考核求職者MapReduce實戰(zhàn)經(jīng)驗。要學(xué)習(xí)MapReduce,可以到Horton網(wǎng)站查找相關(guān)資源。應(yīng)答思路:HadoopMapReduceJavaadoop答案:育培訓(xùn)有限公司xt和IntWritables,這樣做是因為序列化字節(jié)數(shù)組比Strings和Ints這樣的原始類型更加高效。接著,將Mapper的輸出采集到Executor里,執(zhí)行Combiner任務(wù)。Combiner是本地聚合器,能減少MappercerMapper才會進入混洗階段。如果發(fā)現(xiàn)Reducer運行到33%時卡住了,就說明混洗階段正在等待Mapper完成任務(wù)。在混洗階段,當所有的鍵都發(fā)送到Reducer后,Reducer才開始進入排序常見的后續(xù)問題是估算這種算法的時間復(fù)雜性,還要注意系統(tǒng)在機器之間寫入與通信的數(shù)據(jù)量。別忽略冗Hadoop常會在機器出現(xiàn)故障時生成多個數(shù)據(jù)副本。7.5.場景試題O假如你是一家鞋品電子商務(wù)公司的數(shù)據(jù)科學(xué)家,如何搭建一個鞋品訪客推薦系統(tǒng)? (Verizon公司面試數(shù)據(jù)科學(xué)家時問過這個問題)原理:這個問題旨在測試求職者提交整體產(chǎn)品的思路。情景問題不測試各領(lǐng)域的知識細節(jié),但是需要求職者描述設(shè)計產(chǎn)品的全面知識,還要測試求職者的團隊管理能力與協(xié)同能力。面試官經(jīng)常會問數(shù)據(jù)科學(xué)家這個問題,數(shù)據(jù)工程師或數(shù)據(jù)分析師只要回答這種情景問題的部分內(nèi)容就可以了。一般情況下,會問數(shù)據(jù)工程師如何實現(xiàn)相關(guān)算法,而不用考慮算法本身;還會問數(shù)據(jù)分析師查詢哪些以確定用戶對鞋品的歷史偏好。應(yīng)答思路:坦誠地說明自己哪些方面比較拿手,哪些方面不太熟悉,但重點要說明有經(jīng)驗的內(nèi)容,如果有不熟悉的內(nèi)容,也別不好意思,該問就問。盡量把技術(shù)知識與業(yè)務(wù)成果聯(lián)系起來,說明做出選擇的思路和假設(shè)。如果好地解決方案,別猶豫,多提問,一定要把問題理解透徹。答案:這個問題分解為數(shù)據(jù)科學(xué)與數(shù)據(jù)開發(fā)兩部分。先探討數(shù)據(jù)科學(xué)部分,對于沒有多少用戶歷史數(shù)據(jù)的新公司,可以用近似項目法解決。如果其它項目和鞋用矩陣分解技術(shù)降維處理。假設(shè)有鞋品評級等用戶偏好歷史數(shù)據(jù),可以用協(xié)同過濾類型法。特別要說明生成矩陣的行和列。然后,再哪種相似性指標,比如,歐式距離,相似度或余弦距離。能實時生成推薦信息。例如,將用戶數(shù)據(jù)以數(shù)據(jù)流的形式傳輸?shù)絊3存儲桶。設(shè)計該系統(tǒng)要基于所有個體進行矩陣分析,預(yù)計算整個數(shù)據(jù)集的推薦信息,將結(jié)果存儲在Redis這樣的內(nèi)存數(shù)育培訓(xùn)有限公司RESTAPI個給定的用戶標識進行響應(yīng)式推薦。OC在Facebook上每分享一次請愿書有多少貨幣價值?原理:本題旨在了解求職者對業(yè)務(wù)的理解,以及將復(fù)雜問題分解為基礎(chǔ)概念,再根據(jù)有效數(shù)據(jù)將這些概念轉(zhuǎn)換為應(yīng)答思路:仔細研究應(yīng)聘公司,特別是其盈利模式。了解該公司使用哪些重點指標跟蹤績效,搞明白該公司如何實現(xiàn)盈收。問清楚要解決的問題,提出假設(shè)?;卮饐栴}時,別緊張、要自信,像給平時給領(lǐng)導(dǎo)匯報工作一樣就答案:回答這個問題要對C的業(yè)務(wù)有一定了解。分享一次請愿書可以通過兩種方式產(chǎn)生收入:非注冊用戶點擊廣告,比如,簽署付費請愿書2)2)注冊用戶在其生命周期內(nèi)點擊廣告第一步先找出求解這兩種方式產(chǎn)出價值的方法。訣竅是把一個大問題拆分成多個小問題,簡化價值計算方程:1)分享一次的價值=點擊一次廣告的預(yù)期收益+新注冊用戶分享每次活動的平均數(shù)量*新注冊用戶的期價值2)點擊一次廣告的預(yù)期收益=點擊廣告的幾率*平均每次點擊向發(fā)布者收取的費用3)點擊一次廣告的幾率根據(jù)歷史數(shù)據(jù)在時間窗口(一年或一個月)內(nèi)的平均轉(zhuǎn)化率得出,類似值通過每次的平均成本得出。,要得出整個生命周期內(nèi)用戶產(chǎn)生的總收益,通常使用隊列分析或保留分析等方法。按指定月份對注冊用戶進行分組,查看注冊后十二個月內(nèi)用戶點擊廣告的次數(shù)。根據(jù)十二個不同隊列月份,得出用戶生命周期的平均收益。至此,可以將分析時限設(shè)置為任意時段,其因果關(guān)系可忽略不計,即由于初次分享且注冊用戶不管怎樣都會在該時間窗口之外注冊,因此,不能認為是分享行為帶來的。將求出的生命周期價值代入原始公式,就能得出分享一次請愿書的價值。還可以考慮更多元素,例如新注冊用戶分享自己的內(nèi)容帶來其他用戶加入而產(chǎn)生的收益。要在答案里加入更多元素的話,注意不要沖淡核。專注回答最初的問題,就算有不同的想法,留著最后再說。O給定一組分好類的新聞,如體育、政治、經(jīng)濟等類別,怎樣為新文章分類?原理:的在于測試求職者對數(shù)據(jù)科學(xué)方法論的理解,了解求職者處理非結(jié)構(gòu)化文本數(shù)據(jù)的經(jīng)驗,這是了解求職沒有能力與信心處理復(fù)雜數(shù)據(jù)的重要測試。育培訓(xùn)有限公司應(yīng)答思路:么組織文本,以及如何看待分類系統(tǒng)?;舅悸?探索數(shù)據(jù),理解關(guān)鍵元素a.繪制訓(xùn)練集里的新聞分布,確定是否存在標簽失衡。b.查看文本,識別異常,如非英文文本,重度縮寫及拼寫錯誤。地體現(xiàn)關(guān)聯(lián)性。2)通過清理文本得出訓(xùn)練集。刪除標點符號、縮寫和Unicode字符這種信息量少的元素。還可以通過轉(zhuǎn)字母、詞形還原與詞干提取進一步清理數(shù)據(jù)。TFIDFTFIDFAUCF指標的性能。還可以使用柵格實現(xiàn)自動交叉驗證。PythonPickledJavaPOJO。這個模型還可的流程進行清理即可。O設(shè)計評估網(wǎng)頁設(shè)計替代方案的實驗。假設(shè)沒有其它實驗結(jié)果支持,也沒有采集用戶行為知識。討論這一結(jié)論可能導(dǎo)致的潛在問題,以及如何避免這些問題。原理:網(wǎng)絡(luò)公司大多會測試這個問題,因為優(yōu)化網(wǎng)站爭取更好的業(yè)績是他們的生存之本。比如,F(xiàn)acebook就經(jīng)常優(yōu)化主頁,刺激用戶發(fā)布更多帖子。數(shù)據(jù)科學(xué)家的職責是幫助產(chǎn)品經(jīng)理設(shè)計實驗,解釋實驗結(jié)果。這個題的認知水平。解決方案:率與Facebook的平均分享次數(shù)。接下來確定達到統(tǒng)計顯著性(例如95%)的必要樣本和訪問次數(shù)??梢允褂每ǚ綑z驗(使用是否點擊這樣的二項式隨機變量)或Z檢驗(使用正態(tài)分布隨機變量)。然后,評估P值,確定B檢驗的指標與基準A檢驗的指標是否在統(tǒng)計上有顯著不同,如果存在顯著不同,且新版指標優(yōu)于基準指標,則新版網(wǎng)站是最好?;卮饐栴}時,要考慮的問題:本無法測試出改版的本質(zhì)。)對兩個訪客隨機樣本進行A/A測試,檢查選擇的分布和指標是否未具備統(tǒng)計顯著差異。這是為了保證性。值,這樣的話,平均值就不宜作為評估指標,此時,分布也可能會出現(xiàn)高度偏差。雖然根據(jù)中心極限定理可以假設(shè)平均值作為比較指標,但有時這種假設(shè)也可能不成立。因此,要核查育培訓(xùn)有限公司指標,確保在對比不同方案時,轉(zhuǎn)換率或用戶分享次數(shù)的平均值是理想的指標。如果某個用戶的分享次數(shù)使用每個用戶的分享率就不是最佳的性能指標了。到這種問題時,盡量充分展示分析各類問題的能力。7.6.面試提示行面試,最好穿西裝,打領(lǐng)帶。要是不確定穿什么就提前問一下人力資源的人。2)面試前,了解一下面試官和公司,想清楚要問的問題。3)精神飽滿。吃飽喝足,鍛煉身體,盡量提前做好準備。4)回答問題要詳細,思路要清晰。5)微笑,信心。用各種方式減緩壓力,做做瑜伽、伸伸懶腰、讀點閑書—盡可能保持巔峰狀態(tài)。7.7.結(jié)論數(shù)據(jù)科學(xué)面試是個多面獸,求職者會面對各種挑戰(zhàn),現(xiàn)場編程、設(shè)計算法、統(tǒng)計知識、數(shù)學(xué)問題、領(lǐng)導(dǎo)能技巧、說服力和影響力,真是不勝其煩。數(shù)據(jù)科學(xué)面試很難,好在我們總結(jié)了求職成功者和招聘經(jīng)理的想法與理念,將之整理成系統(tǒng)、可行的思路大家參考。招聘經(jīng)理的想法8.1WillKurt(QuickSprout公司)訪談個人簡介:WillKurt是QuickSprout的數(shù)據(jù)科學(xué)家。他的興趣是概率論、寫作和Haskell。他的博客地witterO招聘新人的時候,你關(guān)注哪些方面?對我來說,把創(chuàng)造力和好奇心這兩種心態(tài)結(jié)合起來最重要。在創(chuàng)業(yè)公司里,每天不同職能領(lǐng)域都會出現(xiàn)各育培訓(xùn)有限公司又有可能幫營銷團隊重組測試設(shè)置。最理想的求職者要對公司里所有與數(shù)據(jù)相關(guān)的問題都感興趣,能不斷種類型的數(shù)據(jù)解決方案。O你對參加數(shù)據(jù)科學(xué)面試的人有什么好建議?根據(jù)我的經(jīng)驗,所有值得效力的小公司和創(chuàng)業(yè)公司都對數(shù)據(jù)科學(xué)家的加入感到開心。他們希望新人的數(shù)據(jù)科學(xué)技能和經(jīng)驗?zāi)芙鉀Q一直以來讓人頭疼的問題。搞清楚面試問題,和他們一起解決問題,調(diào)動他們的興奮點。抓住機會詢問他們在解決什么問題,讓他們和你一起頭腦風(fēng)暴,找出解決問題的方法,證明你有能力讓他們的日子更好過。要知道,技術(shù)高超的求職者很多,但是關(guān)心應(yīng)聘公司的問題,對之感興趣的人很讓面試你的每個人都喜歡和你一起工作,他們就得求著你入職了。O面試時,你喜歡問什么樣的問題?你想考核的是什么?單,構(gòu)建一個分類器就可以了,我和求職者說了這一點,不過,我還告訴他們,我還想通過這個測試看看他們能不能搞點標新立異的東西出來。這個任務(wù)的答案不一定很長,或很復(fù)雜。我想要的是,求職者要進流,表現(xiàn)出好奇心,找出有價值的東西。這些求職者都會編程,對線性代數(shù)、微積分和概率論也很了解,具有學(xué)習(xí)相關(guān)知識的基礎(chǔ),技術(shù)從來都不題,但是教他們創(chuàng)造性思維,讓他們積極主動地解決問題就非常困難了。OKissmetrics和QuickSprout招聘數(shù)據(jù)科學(xué)家時有什么不同?人應(yīng)該知道許多創(chuàng)業(yè)公司或小公司一直都在招數(shù)據(jù)科學(xué)家,只是因為招聘過程太浪費精力,所以暫時沒有開始正式的招聘工作而已。我在Kissmetrics遇到過一個人,他是我見過的最贊的求職者,有一天,他跑到公司門口,跟我們說:“我想來你們這里工作!”。學(xué)術(shù)界或大公司的人可能不知道創(chuàng)業(yè)公司和小公司的招聘有多靈活。如果你認為一家公司的業(yè)務(wù)很酷,就他們聯(lián)系。對于一幫熱愛自己事業(yè)的人來說,告訴他們你喜歡他們干的事,真心想加入他們的團隊,沒有什么比這個更讓人印象深刻的了。就算這家公司暫時不打算招人,等他們開始招聘的時候,你肯定會是第選。8.2MattFornito(OpsVisionSolutions公司)訪談育培訓(xùn)有限公司MattFornito數(shù)據(jù)分析和管理領(lǐng)域有十多年的經(jīng)進步。這篇訪談根據(jù)和Matt的電話記錄整理。O招聘新人時,你關(guān)注的重點是什么?我喜歡招聘有量化知識背景的人,他們可以學(xué)習(xí)編程,但是不用再學(xué)這些專業(yè)知識了。對我來說,碩士或博士學(xué)位非常重要,本科生達不到我的要求,考個本科對大多數(shù)人來說都不是什么難事。我喜歡招聘能編程、會溝通的人,能明白技術(shù)問題是制定、執(zhí)行方案和溝通想法的關(guān)鍵。我認為,數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析主要差別就在于,數(shù)據(jù)科學(xué)家能深刻理解數(shù)據(jù)問題,還知道怎么解決這些問題。我還喜歡招聘數(shù)學(xué)、統(tǒng)計學(xué)、化學(xué),物理學(xué)、生物信息學(xué)和工程學(xué)專業(yè)的碩士或博士。只有少數(shù)MBA專業(yè)的人和能我配合好。其實我本人是組織心理學(xué)專業(yè)的博士,所以,盡管我喜歡有STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué)英文首字母縮寫)背景的人,但也不一定非得局限于這些專業(yè)。O你對參加數(shù)據(jù)科學(xué)面試的人有什么建議?招聘人員在意的是教育程度、簡歷上列出的最后兩份工作,還有行業(yè)背景。人力資源的人看簡歷非???,秒鐘內(nèi)吸引住他們的眼球。條件允許的話,我建議最好去Facebook這樣的一流大作,或者去創(chuàng)業(yè)公司當個高管,這種行業(yè)背景能讓人輕松地脫穎而出,找到高端數(shù)據(jù)科學(xué)工作。對于“給我講講你做過的項目”這樣的問題,招聘經(jīng)理經(jīng)常會問求職者曾經(jīng)做過什么—處理過什么樣的數(shù)據(jù),使用過什么樣的工具,產(chǎn)出了什么樣的成果,說清楚這些問題十分重要。成功的求職者對做過的工握的很準,能清晰地講述項目經(jīng)歷,還能說清楚他們對業(yè)務(wù)產(chǎn)生的影響。O你會考察哪些內(nèi)容?面試時,我一般會圍繞一個項目測試求職者解決問題的能力和溝通技巧。我還會評估求職者對我們公司和堅持學(xué)習(xí)的動力、熱衷于解決問題是我考察的關(guān)鍵。在技術(shù)方面,我對能用HadoopSpark的求職者感興趣。他們能不能像數(shù)據(jù)科學(xué)家一樣思題?做沒做過數(shù)據(jù)科學(xué)工作?這些都是我希望通過面試了解的主要問題。我還會問些數(shù)學(xué)問題,比如,梯度下降、統(tǒng)計技巧,還有隨機森林。我還會設(shè)計情景問題,提出客戶情景HackerRank蹤解決方案的方式;我寧愿測試求職者對從未用過的編程語言的接受程度,育培訓(xùn)有限公司。我招聘的人必須能學(xué)習(xí)新技能,這是我考察的重點。8.3AndrewMaguire(PMC/谷歌/Accenture)訪談Penske用業(yè)務(wù)分析工作。此前,他曾在谷歌(市場分析、數(shù)據(jù)質(zhì)量)、埃森哲創(chuàng)新分析中心(顧問),還有怡安創(chuàng)新分析中心(產(chǎn)品開發(fā)團隊)工作。O招聘新人時,你關(guān)注的重點什么?很重要,如果求職者能把自己的優(yōu)缺點都說清楚,我覺得這樣就很好,我不喜歡太能吹的人,謙虛才是美常重要。O你對參加數(shù)據(jù)科學(xué)面試的人有什么建議?對于技術(shù)問題,要多花點心思,寫清楚解答思路,還有就是一定要把面試問題搞清楚。另外,有問題問,別害怕告訴面試官沒接觸過某些領(lǐng)域,或者不熟悉某些算法,他們不會因為這個就篩掉你。作為數(shù)據(jù)科學(xué)認自己知識有限非常重要,堅持學(xué)習(xí)才是最重要的能力。準備兩到三個數(shù)據(jù)科學(xué)項目的“故事”,和面試官聊聊問題規(guī)劃、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化,以這些“故事”可以是以前公司里干過的工作,上大學(xué)時的作業(yè),甚至還可以是業(yè)余做過的項目。要學(xué)會從我發(fā)現(xiàn)了解求職者最好的辦法是讓他們詳細介紹以前做過的項目,所以,一定要想辦法讓面試官對你在簡歷上提目感興趣,愿意主動了解你做過的事情。O面試時,你喜歡問什么樣的問題?你想考察的是什么?處理過最大、最復(fù)雜的數(shù)據(jù)集是什么樣的?處理數(shù)據(jù)時遇到過什么問題?我一般會探討這些問題,了解求據(jù)清洗技能與經(jīng)驗。舉例說明,如何分析數(shù)據(jù)集?如何與業(yè)務(wù)方溝通分析結(jié)果?數(shù)據(jù)分析時遇到過哪些問題?產(chǎn)出了什么成育培訓(xùn)有限公司業(yè)務(wù)產(chǎn)生了什么影響?要說明提取業(yè)務(wù)洞察和與相關(guān)方溝通等方面。我的問題主要和簡歷相關(guān),要是問以前工作中做過的項目,我會問解決過什么問題,使用過哪些數(shù)據(jù),怎么使用數(shù)據(jù),分析結(jié)果是什么,怎么把分析結(jié)果擴展到其它業(yè)務(wù)領(lǐng)域。所以,一定要謹慎選擇在簡歷上寫容。如果覺得內(nèi)容太多,兩頁紙寫不完的話,就得考慮針對不同類型的崗位定制不同的簡歷。最后,我會讓求職者講個失敗的例子,說說什么地方做錯了,以后遇見類似事情怎么改進。這個問題是我從《人力資源百問百答》里看到的,不過我也喜歡看求職者如何回答這個問題:)O谷歌招聘數(shù)據(jù)科學(xué)家和業(yè)界其它公司有什么不同?我覺得都差不多,總的來說還是看具體崗位。要是非常專業(yè)的崗位,比如研發(fā)崗或研究員,問的技術(shù)問題就會更細,對專業(yè)領(lǐng)域問題也會鉆得更深。對于通用崗或業(yè)務(wù)崗,主要關(guān)注技術(shù)水平、業(yè)務(wù)理解力、團隊及溝通能力的合理搭配。的不同就是面試次數(shù)多,面試官的人數(shù)也多,至少有6個人參與面試,從各個方面考察求職者。這些人會從不同角度評判求職者的優(yōu)缺點,而且必須綜合考量求職者的能力和水平,給出是否同意招聘的結(jié)論。表現(xiàn)出良好的綜合能力,比偏科要好的多。這時候,求職者的態(tài)度和親和力非常重要,某些方面有短板,只要面試官欣賞你,覺得你能在幾個月內(nèi)快速跟進,工作就有戲了。8.4HirstoGyoshev(MasterClass公司)訪談的創(chuàng)業(yè)公司,致力于普及天才教育、重塑在線教育。他曾在消費型網(wǎng)站(雅虎)和企業(yè)級SaaS公司從事公司戰(zhàn)略、商務(wù)運營及產(chǎn)品戰(zhàn)略等工作。MasterClass長期招聘數(shù)據(jù)科學(xué)家和相關(guān)崗位,詳情可登錄查看。O招聘新人時,你重點關(guān)注什么?計與商務(wù)智能分析都要能夠勝任。他們還要樂于學(xué)習(xí),遇到瓶頸時,能積極推動項目的進展。要說教育背景與工作經(jīng)驗,我們希望求職者首先要有足夠的統(tǒng)計學(xué)知識,能判斷統(tǒng)計推斷是否有效,能識別并且避免偏差;第二點是,要有滿世界采集數(shù)據(jù)的能力,采集回來的數(shù)據(jù)基本上都有一大堆問題,他們意愿、有能力處理這些數(shù)據(jù),并分析出可行的洞察結(jié)果。育培訓(xùn)有限公司市場/用戶研究的經(jīng)驗(學(xué)術(shù)或工作經(jīng)驗都可以),進行商務(wù)分析和撰寫數(shù)據(jù)報告的經(jīng)驗也是必須的,我心要具備這些條件。O你對參加數(shù)據(jù)科學(xué)面試的人有什么建議?盡量理解面試問題,搞清楚問題背后更高層面的背景知識。面試時,對數(shù)據(jù)分析、構(gòu)建模型的考核,一般都源于公司希望求職者能幫我們解決特定的問題。有時你會發(fā)現(xiàn)你解決不了這些問題,有時你恰巧能提出更好地建議。如果一開始就能清楚地理解我們這些“客戶”到底要分析什么,你給出的分析、模型或產(chǎn)品更切題。一旦應(yīng)聘成功,面試時問到的這些問題很可能就是日常要做的工作。O面試時,你喜歡問什么樣的問題?你想考察的是什么?我們想了解求職者以前都干過哪些類型的工作,看看這些工作經(jīng)歷和我們招聘的崗位是否相關(guān)。我們還會了解求職者以前做過的項目,讓他們講講解決問題的方法、思路、用過的工具、遇到過什么難題,還有就是怎么解決這些問題。我們還會讓求職者做些小項目,看他們怎么處理特定的問題,當然,這也是為了考們的工作質(zhì)量。OMasterClass招聘數(shù)據(jù)科學(xué)家和別的公司有什么不同?和其它公司相比,我們很少用到機器學(xué)習(xí)和算法,數(shù)據(jù)清洗的工作也不多,主要是圍繞公司的產(chǎn)品、業(yè)務(wù)和運營部門,為他們提供各種分析決策支持。工作內(nèi)容主要包括導(dǎo)入、處理、分析來自不同系統(tǒng)的數(shù)據(jù),構(gòu)建各種預(yù)測模型;設(shè)計、實施、分析各種調(diào)研與測驗;協(xié)助業(yè)務(wù)部門定義、設(shè)計數(shù)據(jù)報告與指標;為業(yè)他們能熟練掌握數(shù)據(jù)分析的各方面知識,能處理各種數(shù)據(jù)分析工作。還有,我們希望求職者具有學(xué)習(xí)新工、新方法的意愿和能力。9.5結(jié)論招聘經(jīng)理希望求職者能夠展示:1)對該公司的興趣和對數(shù)據(jù)科學(xué)的熱愛;2)合群,這點甚至能彌補技術(shù)能力不足的弱項;3)強烈的學(xué)習(xí)意愿,快速學(xué)習(xí)的能力;4)以往項目的成功經(jīng)驗,對項目的影響力;強大的分析能力。育培訓(xùn)有限公司的成功經(jīng)驗9.1SaraWeinsteinO你對通關(guān)數(shù)據(jù)科學(xué)面試有什么建議?首先說一下面試準備,我覺得當初應(yīng)該多了解一下分析策略。當時,我在統(tǒng)計學(xué)、概率論、機器學(xué)習(xí)、Python/R這些技術(shù)方面下了很大功夫,結(jié)果卻被一個處理指定數(shù)據(jù)集的問題搞得束手無策,這個問題其但我沒有發(fā)揮出正常水平。我太在意“硬”技能了,沒重視更高層面的方法論和策略。O讓你覺得意外或很難的是什么?面試過程太長了。當時我已經(jīng)猜到會有多次面試,實際上整個流程下來一共面試了三次,每次面試間隔一個禮拜,再加上背景調(diào)查,從開始接觸到拿到Offer一共用了一個月。搞得我壓力山大,整整一個月都要積極應(yīng)對、保持自信、做好各種面試準備,這可是個不小的挑戰(zhàn)。要是早知道耗這么長時間,我就能輕松點了。我給參加漫長、多重面試的朋友的建議是,冥想是個好東西。冥想能讓你晚上睡個好覺,還可以讓前保持冷靜和自信。9.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《肺特殊CT征象》課件
- 《電能計量技術(shù)》課件
- 《家具的加工工藝》課件
- 第19課 七七事變與全民族抗戰(zhàn)(解析版)
- 《衛(wèi)生經(jīng)濟管理系統(tǒng)》課件
- 寒假自習(xí)課 25春初中道德與法治八年級下冊教學(xué)課件 第一單元 大單元整體設(shè)計
- 銀行宣傳推廣總結(jié)
- 《皮膚生理學(xué)》課件
- 素描藝術(shù)探索
- 風(fēng)險監(jiān)測與追蹤培訓(xùn)
- 廣東省廣州市名校聯(lián)盟重點名校2024屆中考化學(xué)全真模擬試卷含解析
- 中考語文-排序題(30題含答案)-閱讀理解及答案
- 大學(xué)校園交通安全現(xiàn)狀調(diào)查分析
- (高清版)TDT 1013-2013 土地整治項目驗收規(guī)程
- 我國農(nóng)村社會保障制度存在的問題分析及對策樣本
- 西晉的短暫統(tǒng)一和北方各族的內(nèi)遷 一等獎
- 語文新課標背景下單元整體教學(xué):六下第4單元大單元設(shè)計
- 最高人民法院民事審判第一庭裁判觀點侵權(quán)責任卷
- 提高自我意識的方法
- 長租公寓課件
- 《康復(fù)護理??啤氛n件
評論
0/150
提交評論