下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、阿里巴巴筆試記(5)分布式搜索引擎是根據(jù)地域、主題、ip地址及其它的劃分標(biāo)準(zhǔn)將 全網(wǎng)分成若干個(gè)自治區(qū)域,在每個(gè)自治區(qū)域內(nèi)設(shè)立一個(gè)檢索服務(wù)器, 而每個(gè)檢索服務(wù)器由信息搜索機(jī)器人、索引搜索軟件數(shù)據(jù)庫和代理三 部分組成。信息搜索機(jī)器人負(fù)責(zé)本自治區(qū)域內(nèi)的信息搜索, 并建立索 引信息存入索引數(shù)據(jù)庫。代理負(fù)責(zé)向用戶提供查詢接口,并與其它代 理進(jìn)行互換,實(shí)現(xiàn)檢索服務(wù)器之間的信息交換,且查詢可以重定向, 即如果一個(gè)索引數(shù)據(jù)庫沒有滿足查詢要求,它可以將查詢請求發(fā)送到 其它檢索服務(wù)器上。它與集中式搜索引擎相比有以下優(yōu)點(diǎn):各檢索服務(wù)器之間相互共 享資源,站點(diǎn)只向本自治區(qū)域內(nèi)的信息搜索機(jī)器人提供信息,減輕了網(wǎng)絡(luò)及各站
2、點(diǎn)的負(fù)載。各代理之間的相互協(xié)作及查詢重定向使得提供 的服務(wù)更完善。 與Web本身的分布式特性相適應(yīng),具有良好的可 擴(kuò)充性,便于維護(hù)。索引信息劃分到各自的索引數(shù)據(jù)庫中,使得各索i引數(shù)據(jù)庫相對較小,查詢的響應(yīng)時(shí)間相對較短。部分檢索服務(wù)器發(fā)生 故障時(shí),其它部分能正常工作。Web服務(wù)器集群是一種典型的分布 式處理系統(tǒng)。所謂 Web集群就是采用高速網(wǎng)絡(luò),將原來獨(dú)立的若干 個(gè)服務(wù)器聯(lián)結(jié)起來,作為一個(gè)整體提供服務(wù),把到達(dá)的請求分配到集 群中的各個(gè)后臺服務(wù)器上,讓它們分?jǐn)傌?fù)載及I/O,通過并行處理提高性能。此時(shí)涉及到請求分配器及負(fù)載平衡的技術(shù)問題。開發(fā)垂直門戶的分布式搜索引擎系統(tǒng)時(shí),發(fā)現(xiàn)有四種不同應(yīng)用的分布式
3、搜索引 擎:1.分布式元搜索:2.散列分布搜索引擎3. Peer 2 peer 搜索 引擎4.局部遍歷型搜索引擎分布式元搜索:14.32位系統(tǒng)32位系統(tǒng)指機(jī)內(nèi)數(shù)據(jù)長度,指令長度,地址長度是二進(jìn)制 32 位。64位系統(tǒng)指機(jī)內(nèi) 數(shù)據(jù)長度,指令長度,地址長度是二進(jìn)制 64 位。64位系統(tǒng)速度快。32位系統(tǒng)系統(tǒng)要尋高于32位的地址就要用 到復(fù)雜一點(diǎn)的運(yùn)算,用兩個(gè) 32位單元組合成(好幾步才能到位)。 64位系統(tǒng)直接尋址(一步到位)。JAVA: I.Servlet中怎樣控制頁面在客戶端的緩存策略;2.執(zhí)行 存儲過程;3.JSP; 4.Thread.wait()可否設(shè)置超時(shí);5.注釋XML內(nèi)容: CDAT
4、A; 6.I0C ; 7.0pen-Closed 原則含義;8.JUnit TestCase 基類 中的代碼;9.javax.servle.http.HttpServlet ; 10.JDBC 連接池 功能; 11.XML Schema : xs:choic xs:sequenee ; 12.領(lǐng)域模型; 13.Servlet生命周期。還有綜合類的,就有點(diǎn)類似公務(wù)員考試的題目,還有一些關(guān)于計(jì) 算機(jī)的題目,例如考點(diǎn):軟件測試的對象;2.用戶進(jìn)程的跟蹤信息存在于什么目錄;3.how使普通用戶可執(zhí)行超級用戶文件;4.向有限空間輸入超長字符 串是什么攻擊,等等。大題就兩道:1.隱馬爾科夫模型(HMM )
5、的 3個(gè)基本問題;2.(寫函數(shù)的)。其實(shí)看到這些題目,我就蒙了,有些 根本就沒見過。但是別怕,是否做出這些題目,并不是他們是否選擇 你的標(biāo)準(zhǔn)(我覺得),都是摸一下底而已。我相信,大部分的人都是 做不出來的,里面涉及的知識點(diǎn),也不是全能從課本學(xué)來,靠的是積 累。當(dāng)然,這些也只是我個(gè)人的看法,因?yàn)槲乙矝]過這個(gè),不過我覺 得我還是有收獲的。這是我第一個(gè)參加的筆試,重在過程,所以我列 下了這兩個(gè)方向的考點(diǎn),可能還是有點(diǎn)參考價(jià)值吧!隱馬爾科夫模型(hidden Markov model,縮寫為HMM)的提出最初是在語音處理領(lǐng)域。HMM是在Markov鏈的基礎(chǔ)上發(fā)展起來的 一種統(tǒng)計(jì)模型。由于實(shí)際問題比 Markov鏈模型所描述的更為復(fù)雜, 因此在HMM 中觀察到的事件與狀態(tài)并不是對應(yīng),而是與每個(gè) 狀態(tài)的一組概率分布相聯(lián)系。它是一個(gè)雙重隨機(jī)過程,其中之一是 Markov
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 波浪中船載液氫晃蕩機(jī)理研究
- SDGs背景下綠色農(nóng)產(chǎn)品消費(fèi)行為影響機(jī)理研究
- 二零二五年度藥店藥品廣告宣傳合作協(xié)議
- 二零二五年度銷售人員勞動協(xié)議書(含團(tuán)隊(duì)協(xié)作與激勵措施)
- 2025年度二零二五年度診所護(hù)士專業(yè)成長聘用合同
- 二零二五年度退休返聘人員知識產(chǎn)權(quán)授權(quán)使用合同
- 二零二五年度電子商務(wù)平臺電子協(xié)議與支付安全合同
- 二零二五年度客戶關(guān)系管理系統(tǒng)軟件購銷合同
- 2025年度酒店客房裝飾裝修工程承攬合同
- 2025年度理發(fā)店入股及品牌形象設(shè)計(jì)合作書
- 2025年上半年江蘇連云港灌云縣招聘“鄉(xiāng)村振興專干”16人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- DB3301T 0382-2022 公共資源交易開評標(biāo)數(shù)字見證服務(wù)規(guī)范
- 人教版2024-2025學(xué)年八年級上學(xué)期數(shù)學(xué)期末壓軸題練習(xí)
- 江蘇省無錫市2023-2024學(xué)年八年級上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 俄語版:中國文化概論之中國的傳統(tǒng)節(jié)日
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 婦科一病一品護(hù)理匯報(bào)
- 哪吒之魔童降世
- 2024年全國統(tǒng)一高考數(shù)學(xué)試卷(新高考Ⅱ)含答案
- 繪本《汪汪的生日派對》
- 助產(chǎn)護(hù)理畢業(yè)論文
評論
0/150
提交評論