阿里巴巴筆試記(5)_第1頁
阿里巴巴筆試記(5)_第2頁
阿里巴巴筆試記(5)_第3頁
阿里巴巴筆試記(5)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、阿里巴巴筆試記(5)分布式搜索引擎是根據(jù)地域、主題、ip地址及其它的劃分標(biāo)準(zhǔn)將 全網(wǎng)分成若干個(gè)自治區(qū)域,在每個(gè)自治區(qū)域內(nèi)設(shè)立一個(gè)檢索服務(wù)器, 而每個(gè)檢索服務(wù)器由信息搜索機(jī)器人、索引搜索軟件數(shù)據(jù)庫和代理三 部分組成。信息搜索機(jī)器人負(fù)責(zé)本自治區(qū)域內(nèi)的信息搜索, 并建立索 引信息存入索引數(shù)據(jù)庫。代理負(fù)責(zé)向用戶提供查詢接口,并與其它代 理進(jìn)行互換,實(shí)現(xiàn)檢索服務(wù)器之間的信息交換,且查詢可以重定向, 即如果一個(gè)索引數(shù)據(jù)庫沒有滿足查詢要求,它可以將查詢請求發(fā)送到 其它檢索服務(wù)器上。它與集中式搜索引擎相比有以下優(yōu)點(diǎn):各檢索服務(wù)器之間相互共 享資源,站點(diǎn)只向本自治區(qū)域內(nèi)的信息搜索機(jī)器人提供信息,減輕了網(wǎng)絡(luò)及各站

2、點(diǎn)的負(fù)載。各代理之間的相互協(xié)作及查詢重定向使得提供 的服務(wù)更完善。 與Web本身的分布式特性相適應(yīng),具有良好的可 擴(kuò)充性,便于維護(hù)。索引信息劃分到各自的索引數(shù)據(jù)庫中,使得各索i引數(shù)據(jù)庫相對較小,查詢的響應(yīng)時(shí)間相對較短。部分檢索服務(wù)器發(fā)生 故障時(shí),其它部分能正常工作。Web服務(wù)器集群是一種典型的分布 式處理系統(tǒng)。所謂 Web集群就是采用高速網(wǎng)絡(luò),將原來獨(dú)立的若干 個(gè)服務(wù)器聯(lián)結(jié)起來,作為一個(gè)整體提供服務(wù),把到達(dá)的請求分配到集 群中的各個(gè)后臺服務(wù)器上,讓它們分?jǐn)傌?fù)載及I/O,通過并行處理提高性能。此時(shí)涉及到請求分配器及負(fù)載平衡的技術(shù)問題。開發(fā)垂直門戶的分布式搜索引擎系統(tǒng)時(shí),發(fā)現(xiàn)有四種不同應(yīng)用的分布式

3、搜索引 擎:1.分布式元搜索:2.散列分布搜索引擎3. Peer 2 peer 搜索 引擎4.局部遍歷型搜索引擎分布式元搜索:14.32位系統(tǒng)32位系統(tǒng)指機(jī)內(nèi)數(shù)據(jù)長度,指令長度,地址長度是二進(jìn)制 32 位。64位系統(tǒng)指機(jī)內(nèi) 數(shù)據(jù)長度,指令長度,地址長度是二進(jìn)制 64 位。64位系統(tǒng)速度快。32位系統(tǒng)系統(tǒng)要尋高于32位的地址就要用 到復(fù)雜一點(diǎn)的運(yùn)算,用兩個(gè) 32位單元組合成(好幾步才能到位)。 64位系統(tǒng)直接尋址(一步到位)。JAVA: I.Servlet中怎樣控制頁面在客戶端的緩存策略;2.執(zhí)行 存儲過程;3.JSP; 4.Thread.wait()可否設(shè)置超時(shí);5.注釋XML內(nèi)容: CDAT

4、A; 6.I0C ; 7.0pen-Closed 原則含義;8.JUnit TestCase 基類 中的代碼;9.javax.servle.http.HttpServlet ; 10.JDBC 連接池 功能; 11.XML Schema : xs:choic xs:sequenee ; 12.領(lǐng)域模型; 13.Servlet生命周期。還有綜合類的,就有點(diǎn)類似公務(wù)員考試的題目,還有一些關(guān)于計(jì) 算機(jī)的題目,例如考點(diǎn):軟件測試的對象;2.用戶進(jìn)程的跟蹤信息存在于什么目錄;3.how使普通用戶可執(zhí)行超級用戶文件;4.向有限空間輸入超長字符 串是什么攻擊,等等。大題就兩道:1.隱馬爾科夫模型(HMM )

5、的 3個(gè)基本問題;2.(寫函數(shù)的)。其實(shí)看到這些題目,我就蒙了,有些 根本就沒見過。但是別怕,是否做出這些題目,并不是他們是否選擇 你的標(biāo)準(zhǔn)(我覺得),都是摸一下底而已。我相信,大部分的人都是 做不出來的,里面涉及的知識點(diǎn),也不是全能從課本學(xué)來,靠的是積 累。當(dāng)然,這些也只是我個(gè)人的看法,因?yàn)槲乙矝]過這個(gè),不過我覺 得我還是有收獲的。這是我第一個(gè)參加的筆試,重在過程,所以我列 下了這兩個(gè)方向的考點(diǎn),可能還是有點(diǎn)參考價(jià)值吧!隱馬爾科夫模型(hidden Markov model,縮寫為HMM)的提出最初是在語音處理領(lǐng)域。HMM是在Markov鏈的基礎(chǔ)上發(fā)展起來的 一種統(tǒng)計(jì)模型。由于實(shí)際問題比 Markov鏈模型所描述的更為復(fù)雜, 因此在HMM 中觀察到的事件與狀態(tài)并不是對應(yīng),而是與每個(gè) 狀態(tài)的一組概率分布相聯(lián)系。它是一個(gè)雙重隨機(jī)過程,其中之一是 Markov

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論