阿里巴巴筆試記(五)_第1頁(yè)
阿里巴巴筆試記(五)_第2頁(yè)
阿里巴巴筆試記(五)_第3頁(yè)
阿里巴巴筆試記(五)_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、阿里巴巴筆試記(5)分布式搜索引擎是根據(jù)地域、主題、ip地址及其它的劃分標(biāo)準(zhǔn)將全網(wǎng)分成若干個(gè)自治區(qū)域,在每個(gè)自治區(qū)域內(nèi)設(shè)立一個(gè)檢索服務(wù)器,而每個(gè)檢索服務(wù)器由信息搜索機(jī)器人、索引搜索軟件數(shù)據(jù)庫(kù)和代理三部分組成。信息搜索機(jī)器人負(fù)責(zé)本自治區(qū)域內(nèi)的信息搜索,并建立索引信息存入索引數(shù)據(jù)庫(kù)。代理負(fù)責(zé)向用戶提供查詢接口,并與其它代理進(jìn)行互換,實(shí)現(xiàn)檢索服務(wù)器之間的信息交換,且查詢可以重定向,即如果一個(gè)索引數(shù)據(jù)庫(kù)沒有滿足查詢要求,它可以將查詢請(qǐng)求發(fā)送到其它檢索服務(wù)器上。它與集中式搜索引擎相比有以下優(yōu)點(diǎn):各檢索服務(wù)器之間相互共享資源,站點(diǎn)只向本自治區(qū)域內(nèi)的信息搜索機(jī)器人提供信息,減輕了網(wǎng)絡(luò)及各站點(diǎn)的負(fù)載。各代理之

2、間的相互協(xié)作及查詢重定向使得提供的服務(wù)更完善。與Web本身的分布式特性相適應(yīng),具有良好的可擴(kuò)充性,便于維護(hù)。索引信息劃分到各自的索引數(shù)據(jù)庫(kù)中,使得各索引數(shù)據(jù)庫(kù)相對(duì)較小,查詢的響應(yīng)時(shí)間相對(duì)較短。部分檢索服務(wù)器發(fā)生故障時(shí),其它部分能正常工作。Web服務(wù)器集群是一種典型的分布式處理系統(tǒng)。所謂Web集群就是采用高速網(wǎng)絡(luò),將原來(lái)獨(dú)立的若干個(gè)服務(wù)器聯(lián)結(jié)起來(lái),作為一個(gè)整體提供服務(wù),把到達(dá)的請(qǐng)求分配到集群中的各個(gè)后臺(tái)服務(wù)器上,讓它們分?jǐn)傌?fù)載及I/O,通過(guò)并行處理提高性能。此時(shí)涉及到請(qǐng)求分配器及負(fù)載平衡的技術(shù)問(wèn)題。開發(fā)垂直門戶的分布式搜索引擎系統(tǒng)時(shí),發(fā)現(xiàn)有四種不同應(yīng)用的分布式搜索引擎:1.分布式元搜索:2.散列

3、分布搜索引擎3.Peer2peer搜索引擎4.局部遍歷型搜索引擎.分布式元搜索:14.32位系統(tǒng)32位系統(tǒng)指機(jī)內(nèi)數(shù)據(jù)長(zhǎng)度,指令長(zhǎng)度,地址長(zhǎng)度是二進(jìn)制32位。64位系統(tǒng)指機(jī)內(nèi)數(shù)據(jù)長(zhǎng)度,指令長(zhǎng)度,地址長(zhǎng)度是二進(jìn)制64位。64位系統(tǒng)速度快。32位系統(tǒng)系統(tǒng)要尋高于32位的地址就要用到復(fù)雜一點(diǎn)的運(yùn)算,用兩個(gè)32位單元組合成(好幾步才能到位)。64位系統(tǒng)直接尋址(一步到位)。JAVA:I.Servlet中怎樣控制頁(yè)面在客戶端的緩存策略;2.執(zhí)行存儲(chǔ)過(guò)程;3.JSP;4.Thread.wait()可否設(shè)置超時(shí);5.注釋XML內(nèi)容:CDATA;6.IOC;7.Open-Closed原則含義;8.JUnitTe

4、stCase基類中的代碼;9.javax.servle. HYPERLINK http:/http.HttpServlet http.HttpServlet;10.JDBC連接池功能;11.XMLSchema:xs:choicxs:sequence;12.領(lǐng)域模型;13.Servlet生命周期。還有綜合類的,就有點(diǎn)類似公務(wù)員考試的題目,還有一些關(guān)于計(jì)算機(jī)的題目,例如考點(diǎn):軟件測(cè)試的對(duì)象;2.用戶進(jìn)程的跟蹤信息存在于什么目錄;3.how使普通用戶可執(zhí)行超級(jí)用戶文件;4.向有限空間輸入超長(zhǎng)字符串是什么攻擊,等等。大題就兩道:1.隱馬爾科夫模型(HMM)的3個(gè)基本問(wèn)題;2.(寫函數(shù)的)。其實(shí)看到這些

5、題目,我就蒙了,有些根本就沒見過(guò)。但是別怕,是否做出這些題目,并不是他們是否選擇你的標(biāo)準(zhǔn)(我覺得),都是摸一下底而已。我相信,大部分的人都是做不出來(lái)的,里面涉及的知識(shí)點(diǎn),也不是全能從課本學(xué)來(lái),靠的是積累。當(dāng)然,這些也只是我個(gè)人的看法,因?yàn)槲乙矝]過(guò)這個(gè),不過(guò)我覺得我還是有收獲的。這是我第一個(gè)參加的筆試,重在過(guò)程,所以我列下了這兩個(gè)方向的考點(diǎn),可能還是有點(diǎn)參考價(jià)值吧!隱馬爾科夫模型(hiddenMarkovmodel,縮寫為HMM)的提出最初是在語(yǔ)音處理領(lǐng)域。HMM是在Markov鏈的基礎(chǔ)上發(fā)展起來(lái)的一種統(tǒng)計(jì)模型。由于實(shí)際問(wèn)題比Markov鏈模型所描述的更為復(fù)雜,因此在HMM中觀察到的事件與狀態(tài)并不是對(duì)應(yīng),而是與每個(gè)狀態(tài)的一組概率分布相聯(lián)系。它是一個(gè)雙重隨機(jī)過(guò)程,其中之一是Marko

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論