




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、檔案信息全文檢索系統(tǒng)技術(shù)體系說明3 / 9、需求場景分析功能:中文單字檢索英文單詞檢索中文二分詞、三分 詞、四分詞精確檢索 支持在結(jié)果中查詢 J顯示1 .突出顯示查詢關(guān)鍵字2 .顯示結(jié)果數(shù)、搜索用時、頁數(shù)、頁碼鏈接、上 下頁3 .顯示標題、關(guān)鍵字上下文、鏈接、4.在結(jié)果中打開站內(nèi)文件突出顯示關(guān)鍵字1.查詢需求功能中文單字檢索:把漢字關(guān)鍵詞分割為單字,以單字為最小檢索單位,如您好分 為:您、好英文單詞檢索:英文以單詞為最小檢索單位中文二分詞、三分詞、四分詞精確檢索:對于兩個、三個、四個漢字組成的關(guān)鍵 詞進行精確檢索,五個以上漢字組成的關(guān)鍵詞作二二分割,如“振興中華民族” 分割為:振興、興中、中華
2、、華民、民族,再進行精確檢索根據(jù)場景對方鍵工、詞根據(jù)上述規(guī)則進行智能搭配后檢索:如“我愛你”分割為:、我愛、愛你 支持在結(jié)果中查詢顯示突出顯示查詢關(guān)鍵字:在結(jié)果顯示頁的標題、上下文摘要中用紅色和加粗顯示關(guān) 鍵字、詞顯示結(jié)果數(shù)、搜索用時、頁數(shù)、頁碼鏈接、上下頁:及時顯示直接查詢或在結(jié)果 中再查的準確結(jié)果數(shù)量、即時查詢的用時、總頁數(shù),并以當前頁為中心顯示前后 頁的頁碼鏈接及智能顯示上一頁、下一頁鏈接顯示標題、關(guān)鍵字上下文、鏈接:顯示查詢結(jié)果的標題、以關(guān)鍵詞為中心的上下 文及精確定位后的鏈接在結(jié)果中打開站內(nèi)文件突出顯示關(guān)鍵字:通過鏈接打開站內(nèi)文件后用紅色和加粗顯示關(guān)鍵字、詞2. 索引源站內(nèi)目錄本地站
3、內(nèi)目錄(能用*訪問的包含文件資源的目錄)安裝在同一服務(wù)器的其他資源目錄(如資源)資源地址存放在數(shù)據(jù)庫的資源,根據(jù)表中的記錄對資源進行索引,并取回標題、責任者和成文日期字段智能區(qū)分特定的單表記錄或復(fù)表記錄資源3. 文件類型能索引類型的文檔、架構(gòu)設(shè)計、程序代碼設(shè)計、系統(tǒng)環(huán)境環(huán)境初始化文件: 位置在系統(tǒng)類目錄下的包中,為系統(tǒng)的正常運行提供基本環(huán)境變量,參數(shù)信息如下表參數(shù)名稱參數(shù)值(參考)說明索引源中的站內(nèi)目錄,“”號后的值表示打開該目錄下 的文件時用的路徑。多目錄時用“,”號分開索引庫存放的目錄:定時啟動索引管理員用戶名:管理員密碼打開查找的資源時用后面的路徑替換前面的路徑, 用于實現(xiàn)關(guān)鍵字著重顯示
4、環(huán)境構(gòu)造器:類從上面的文件中構(gòu)造了基本環(huán)境變量對象,代碼說明如下位置(行)功能到語句定義基本環(huán)境變量到構(gòu)造函數(shù)從文件中讀取信息,并根據(jù)標志進行分析,把對應(yīng)的值分別賦于變量,實現(xiàn) 配置對象的構(gòu)造到函數(shù)和方法通過中常用的“”方法和“”函數(shù)對變量進行讀寫到函數(shù)把對象中的變量值按格式寫回文件編輯:類擴展,響應(yīng)管理員提交的基本環(huán)境配置信息,通過操作環(huán)境構(gòu)造器 實現(xiàn)配置信息存盤位置(行)功能到語句判斷管理員是否登錄到語句;取環(huán)境構(gòu)造器(調(diào)用)和參數(shù)到語句循環(huán)分析參數(shù),把結(jié)果賦于 環(huán)境構(gòu)造器 中的對應(yīng)變量到語句保存到文件、查詢查詢首頁:為系統(tǒng)查詢首頁,提供查詢表單顯示查詢結(jié)果類擴展,響應(yīng)用戶提交的查詢關(guān)鍵字
5、,進行查詢并顯示查詢結(jié)果位置(行)整功能到語句顯示查詢表單到語句從取查詢參數(shù)到語句判斷是查詢或顯示分頁,若是查詢則調(diào)用執(zhí)行。取回結(jié)果數(shù)組到語句判斷是否為在結(jié)果查詢,是則調(diào)用函數(shù)執(zhí)行到語句顯示查詢結(jié)果統(tǒng)計信息,包括:關(guān)鍵字、結(jié)果數(shù)、用時、頁碼及“在結(jié)果中 找”動作到語句顯示條以內(nèi)查詢結(jié)果,包括:標題、關(guān)鍵字上卜文、位置到語句顯示分頁信息及上卜貞鏈接到函數(shù)根據(jù)新的關(guān)鍵字對查詢結(jié)果進行再分析,排除不需要的條目,返回分析后的 數(shù)組到函數(shù)智能實現(xiàn)分頁顯示,返回分貢字符串顯示一個文件 類擴展,打開查詢結(jié)果中的一條文檔,實現(xiàn)著重顯示4 / 9位置(行)整功能到方法初始化數(shù)據(jù)引擎到語句根據(jù)文檔參數(shù)和用戶名查詢
6、權(quán)限表,判斷用戶能否打開文檔到語句調(diào)用的構(gòu)造函數(shù)()取文檔的相對和物理路徑到語句判斷文件類型,排出不能著重顯示的文件語句調(diào)用的函數(shù)()智能分析參數(shù),返回分割數(shù)組到語句實現(xiàn)關(guān)鍵字著重顯示為查詢核心類,調(diào)用檢索引擎實現(xiàn)查詢,集成關(guān)鍵字分析器、內(nèi)容分析器,返回精確的 結(jié)果數(shù)組位置(行)整功能到構(gòu)造函數(shù)調(diào)用的工具取文件的物理路徑到構(gòu)造函數(shù)讀文件,取索引目錄()、站內(nèi)資源目錄()、資源()基本環(huán)境變量到函數(shù)關(guān)鍵字分析器:智能分割中英文字符串為最小單位,返回分割后的數(shù)組到函數(shù)關(guān)鍵字分析器:智能對中文單字符進行兩兩組詞,返回組詞后的數(shù)組到函數(shù)關(guān)鍵字分析器:智能對二分詞、三分詞、四分詞以及中英文混和字符串作出
7、 判斷,根據(jù)情況調(diào)用上述分析器進行綜合分析后返回數(shù)組到函數(shù)調(diào)用檢索引擎實現(xiàn)查詢,調(diào)用關(guān)鍵字分析器 和內(nèi)容分析器 對查詢結(jié)果進行智 能分析,返回精確的結(jié)果數(shù)組到函數(shù)內(nèi)容分析器:根據(jù)關(guān)鍵字分析結(jié)果和檢索引擎返回的內(nèi)容進行分析,排出不 精確的記錄,返回關(guān)鍵字上卜義摘要到函數(shù)內(nèi)容分析器:用路徑替換空標題,并返回著重關(guān)鍵字的標題到函數(shù)內(nèi)容分析器:用著重路徑替換資源路徑或站內(nèi)目錄,返回替換后的、索引管理員登錄:,顯示管理員輸入用戶名和密碼框表單,提交到,檢查用戶名和密碼,通過后轉(zhuǎn)到系統(tǒng)配置:類擴展,實現(xiàn)對文件的修改位置(行)功能到語句顯示配置頁標題和數(shù)據(jù)庫管理鏈接到語句檢查用戶權(quán)限到語句調(diào)用構(gòu)造環(huán)境對象到
8、語句顯示站內(nèi)目錄資源編輯框到語句顯示索引庫存放目錄、定時器、用戶名及密碼編輯框到語句顯示資源信息編輯框數(shù)據(jù)庫資源配置:目錄卜存放的資源配置數(shù)據(jù)庫的詳細信息文件文件名稱功能根節(jié)點存放數(shù)據(jù)庫的訪問信息:數(shù)據(jù)庫名、中文名、驅(qū)動類名、鏈接字符 串、用戶名、密碼,二級節(jié)點為任務(wù)名稱和表名,以及可選的子表名、關(guān)聯(lián) 字段、指針字段,三級節(jié)點為字段信息資源引擎數(shù)據(jù)庫展示:,集成 資源引擎,實現(xiàn)對站內(nèi)資源的讀寫,展示并編輯存放資源的數(shù)據(jù)庫信息文件名稱功能資源數(shù)據(jù)庫管理主頁,左邊顯示庫結(jié)構(gòu)樹,右邊顯示對應(yīng)節(jié)點信息,并 在左辿顯示庫樹節(jié)點顯示任務(wù)表樹節(jié)點顯示字段表樹節(jié)點顯示法編輯庫節(jié)點信息:數(shù)據(jù)庫名、數(shù)據(jù)庫中文名、
9、驅(qū)動類名、鏈接字 符串、用戶名、密碼顯示第5編輯任務(wù)式節(jié)點信息:任務(wù)名稱、表名,若包含子表時顯示子表 名、主子表的關(guān)聯(lián)字段、子表中的指針字段顯示普編輯字段節(jié)點估息:字段名稱、字段中文名、字段類型顯示添加任務(wù)表單,信息與任務(wù)表節(jié)點信息相同顯示添加字段表單,信息與字段節(jié)點信息相同索引接口定時器:類實現(xiàn)定時索引位置(行)功能到構(gòu)造函數(shù)構(gòu)造定時器,啟動線程到函數(shù)調(diào)用取出定時變量,轉(zhuǎn)換為返回到方法運行定時線程,周期性檢查定時,達到條件時調(diào)用實現(xiàn)增量索引到方法從控制臺執(zhí)行定時器接口:位置(行)功能到方法調(diào)用取出基本環(huán)境變量中的索引參數(shù),根據(jù)參數(shù)調(diào)用實現(xiàn)站內(nèi)目錄的全額索 引到方法調(diào)用取出基本環(huán)境變量中的索引
10、參數(shù),根據(jù)參數(shù)調(diào)用實現(xiàn)站內(nèi)目錄的增量索 弓1,然后調(diào)用實現(xiàn)資源的土曾量索引到方法從控制臺執(zhí)行站內(nèi)目錄全額索引目錄分析文件類型識別追加索引:類實現(xiàn)目錄分析、文件類型識別和索引引擎調(diào)用位置(行)功能到變量定義內(nèi)部全局的對象變量,可以在每個方法中使用到方法根據(jù)上一級的調(diào)用參數(shù)調(diào)用索引引擎 中的,為全局變量構(gòu)造對象,調(diào)用 ()方法到方法調(diào)用索引引擎中的,取出所有索引庫的,調(diào)用()方法到方法分析資源目錄,遞歸調(diào)用自己。根據(jù)索引庫的排除已索引文檔,調(diào)用()方法分析未索引文檔到方法根據(jù)擴展名識別文檔類型,調(diào)用分析,調(diào)用分析,調(diào)用實現(xiàn)向轉(zhuǎn)換。調(diào)用索引引擎中的對分析結(jié)果實現(xiàn)索引全額索引:類基本結(jié)構(gòu)和功能類似于文
11、檔轉(zhuǎn)換引擎轉(zhuǎn)換接口:類調(diào)用服務(wù)實現(xiàn)文檔向文檔轉(zhuǎn)換位置(行)功能到函數(shù)判斷本文件是否已轉(zhuǎn)換,未轉(zhuǎn)換則調(diào)用服務(wù)實現(xiàn)轉(zhuǎn)換,然后調(diào)用文本剝離器()分析轉(zhuǎn)換后的文檔,返回索引文檔服務(wù)器:,安裝,并在系統(tǒng)環(huán)境變量中添加程序目錄,啟動服務(wù)提供文檔向文檔轉(zhuǎn)換服務(wù):在啟動組中 加上""項文檔分析引擎接口:類為 分析引擎 入口,調(diào)用 分析引擎 進行文本提取,然后調(diào)用 索引引擎 把文件的文本進行索引 分析引擎:,對文件進行格式和編碼分析,提出其中的文本內(nèi)容。原包對中文字符支持不好,經(jīng)改動包 內(nèi)的文件中行為: (, (),);就能完全支持中文分析:位置(行)1 類型功能語句根據(jù)資源構(gòu)造引擎對象到語
12、句遍歷任務(wù)表,調(diào)用 引擎查詢資源數(shù)據(jù)庫,根據(jù)返回資源數(shù)組調(diào)用實現(xiàn)資源 索引到語句根據(jù)資源智能生成查詢語句到語句用數(shù)據(jù)庫查詢結(jié)果數(shù)組調(diào)用實現(xiàn)索引引擎:以中的信息為配置參數(shù),實現(xiàn)對數(shù)據(jù)庫的高效訪問追加索引:類基本結(jié)構(gòu)和功能類似于文本剝離器、文本索引接口類對文件或進文本剝離,并調(diào)用 索引引擎實現(xiàn)索引位置(行)功能到函數(shù)索引無標題等參數(shù)的文檔到函數(shù)調(diào)用索引引擎的文本索引接口 ,構(gòu)造索引文檔對象,賦于站內(nèi)文件信息,再 調(diào)用()函數(shù),剝離文本,賦于文檔對象后返回文檔對象到函數(shù)調(diào)用索引引擎的文本索引接口 ,構(gòu)造索引文檔對象,賦于資源文件信息,再 調(diào)用()函數(shù),剝離文本,賦于文檔對象后返回文檔對象到函數(shù)按行從
13、文件中讀出字符串,再調(diào)用()函數(shù),剝離文本,返回剝離后的文本字符串到函數(shù)根據(jù)文件名和文本內(nèi)容分析文本,過濾掉標簽,返回文本字符串到兩個函數(shù)停止使用9 / 9四、資源列表包名來源用途修改否對文件進行格式和編(可分 析,提出其中的文本內(nèi)容原包為中乂字符支持不好,經(jīng)改動包內(nèi)的文件中行為:(,(),);就能完全支持中文是一個用寫的全文索引引 擎工具包,它可以方便的 嵌入到各種應(yīng)用中實現(xiàn)針 對應(yīng)用的全文索引檢索功 能驅(qū)動程序連接到.用實現(xiàn)文檔轉(zhuǎn)換成文件完全封裝以上資源全部合并為下列三個包以上所有功能五、安裝和配置1、安裝或更高版本默認安裝到目錄建立環(huán)境變量:在環(huán)境變量中加上建立環(huán)境變量.、安裝 或更高版本(下載地址:)安裝到 :建立環(huán)境變量:在環(huán)境變量中加上在程序啟動組中添加""
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物理-山東省淄博市濱州市2024-2025學(xué)年度2025屆高三模擬考試(淄博濱州一模)試題和答案
- 院感知識崗前培訓(xùn)課件
- 2025年中考道德與法治全真模擬卷 3套(含答案)
- 夏縣財稅知識培訓(xùn)課件
- 個人醫(yī)療合同范例
- 新版PEP小學(xué)五年級英語My-favourite-season-My-favourite-season-教學(xué)設(shè)計
- 倉儲合同范例案例
- 秘書職業(yè)生涯的長期規(guī)劃計劃
- 反思與總結(jié)的實踐計劃
- 新聞傳播社團內(nèi)容創(chuàng)作規(guī)劃計劃
- 放射科未來五年發(fā)展規(guī)劃(2021-2025)
- 中學(xué)生預(yù)防性侵主題班會
- 不良資產(chǎn)項目律師法律盡調(diào)報告(模板)
- 2023年人力資源和社會保障部公開招聘工作人員筆試參考題庫(共500題)答案詳解版
- 高級技校電氣自動化設(shè)備安裝與維修教學(xué)計劃
- 《長征之戰(zhàn)役》課件
- 心電監(jiān)護操作評分標準
- 保健品概念及分類
- 水土保持監(jiān)理實施細則
- 自體血液回收機使用(精京3000P型)課件
- 非法捕撈水產(chǎn)品罪
評論
0/150
提交評論