大數(shù)據(jù)開(kāi)發(fā)工程師筆試試題(無(wú)答案)_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)工程師筆試試題(無(wú)答案)_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)工程師筆試試題(無(wú)答案)_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)工程師筆試試題(無(wú)答案)_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)開(kāi)發(fā)工程師筆試試題(無(wú)答案)1、請(qǐng)?jiān)O(shè)計(jì)一個(gè)流式計(jì)算方法,對(duì)于源源不斷輸入的數(shù)值,實(shí)現(xiàn)以下功能(系統(tǒng)開(kāi)銷越小越好):[多項(xiàng)簡(jiǎn)答題]1)統(tǒng)計(jì)當(dāng)前已經(jīng)輸入的全部數(shù)值中,最大的k(k>0,n>=k)個(gè)值________________________2)統(tǒng)計(jì)當(dāng)前已經(jīng)輸入的全部數(shù)值中的中位數(shù)(1個(gè)或2個(gè))(寫出偽代碼或描述)________________________2、100維的單位向量,最大均值是多少,什么時(shí)候方差最大?(寫出數(shù)學(xué)推導(dǎo)過(guò)程)3、有n步臺(tái)階,

1)一次可以且僅可以向上走1或2步,一共有多少種走法?

2)一次可以且僅可以向上走X或y步,且滿足以下條件:

n>0,x>0,y>0

n>=x,n>=y

n%x=0,n%y=0

請(qǐng)問(wèn)一共有多少種走法?(寫出偽代碼或描述)4、找到最長(zhǎng)公共子序列(提示:子序列可以不連續(xù)),示例如下:

字符串1:cxn1ewhixope

字符串2:aneewhuovp33e

最長(zhǎng)公共子序列:newhope

利用動(dòng)態(tài)規(guī)劃算法求解該問(wèn)題(寫出偽代碼或描述)5、將6個(gè)完全相同的乒乓球放入3個(gè)完全相同的抽屜,一共有多少種放法?(給出解答過(guò)程及答案)

提示:抽屜可以為空。6、假設(shè)某服務(wù)器集群上存有20億條用戶瀏覽的商品記錄,每條記錄的大小固定為1KB,則整體的記錄大小約為1.86T。當(dāng)前可操作的機(jī)器內(nèi)存為2G,磁盤空間512G??梢酝ㄟ^(guò)內(nèi)網(wǎng)訪問(wèn)服務(wù)器集群,查詢或獲取相關(guān)記錄。

請(qǐng)?jiān)O(shè)計(jì)方法分別滿足以下需求:

a)快速的對(duì)這20億條記錄按字母進(jìn)行升序排序。

b)快速統(tǒng)計(jì)TOP100的商品ID。PART2|【計(jì)算機(jī)原理與操作系統(tǒng)】PART3|【概率與統(tǒng)計(jì)】

1、抽查產(chǎn)品質(zhì)量時(shí),發(fā)現(xiàn)一件次品(不合格產(chǎn)品),這件次品來(lái)自哪條生產(chǎn)線的概率最大?2、抽查產(chǎn)品質(zhì)量時(shí),發(fā)現(xiàn)一箱當(dāng)中有2件次品,這箱產(chǎn)品來(lái)自哪條生產(chǎn)線的概率最大?3、已知合格產(chǎn)品重量都相等,而次品重量比合格產(chǎn)品輕。抽出n件產(chǎn)品,其中有一件次品,現(xiàn)在用一個(gè)無(wú)砝碼、無(wú)標(biāo)尺的天平從這n件產(chǎn)品中找到這件次品,最少需要多少次(假設(shè)天平秤盤足夠大)?4、一件次品會(huì)被檢驗(yàn)口(共三道)成功檢出的概率有多大(即三道檢驗(yàn)口對(duì)次品識(shí)別的整體召回率)?5、有多大概率能保證該車間每天生產(chǎn)的產(chǎn)品最終出廠后的次品件數(shù)小于2件?6、該車間對(duì)A生產(chǎn)線進(jìn)行了改造,改造后用該生產(chǎn)線生產(chǎn)了50件產(chǎn)品,其中有41件合格,是否可以認(rèn)為改造后的合格率顯著高于改造前(可以自己定義“顯著”的概念,一些數(shù)值可以用字符替代)?PART4|【機(jī)器學(xué)習(xí)】1、列出幾種常用的loss函數(shù),簡(jiǎn)述其形式、優(yōu)缺點(diǎn)和應(yīng)用場(chǎng)景。2、在NLP或CV領(lǐng)域,有哪些主要的任務(wù),各有什么樣的應(yīng)用場(chǎng)景,分別有哪些常用算法。(NLP和CV選其中之一回答即可)。2、在分類任務(wù)中,當(dāng)樣本極不均衡時(shí),會(huì)有什么樣的風(fēng)險(xiǎn),有哪些解決辦法。3、在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,RNN、CNN、GNN、attention等結(jié)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論