互聯(lián)網(wǎng)信息采集系統(tǒng)用戶手冊(cè)_第1頁(yè)
互聯(lián)網(wǎng)信息采集系統(tǒng)用戶手冊(cè)_第2頁(yè)
互聯(lián)網(wǎng)信息采集系統(tǒng)用戶手冊(cè)_第3頁(yè)
互聯(lián)網(wǎng)信息采集系統(tǒng)用戶手冊(cè)_第4頁(yè)
互聯(lián)網(wǎng)信息采集系統(tǒng)用戶手冊(cè)_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、軍犬互聯(lián)網(wǎng)信息采集系統(tǒng)用戶手冊(cè)V5.0第一章:系統(tǒng)介紹31.1軟件簡(jiǎn)介31.2互聯(lián)網(wǎng)信息采集與挖掘31.3互聯(lián)網(wǎng)采集系統(tǒng)流程圖31.4系統(tǒng)應(yīng)用領(lǐng)域:41.5 軟件特點(diǎn)41.6 系統(tǒng)配置要求131.7 系統(tǒng)性能13第二章:使用手冊(cè)142.1綜合設(shè)置142.1.1數(shù)據(jù)庫(kù)管理142.1.2表單管理142.1.3頻道管理182.1.4模板管理192.2信息采集192.2.1站點(diǎn)基本屬性192.2.2提交訪問數(shù)據(jù)202.2.3站點(diǎn)鏈接預(yù)覽212.2.4 采集過濾222.2.5 分頁(yè)模板222.2.6 附件采集設(shè)置232.2.7新聞自動(dòng)識(shí)別232.2.8字段提取設(shè)置242.2.9 字段采后處理252.3站

2、點(diǎn)管理252.3.1 采集站點(diǎn)管理252.3.2掃描采集源252.3.3采集日志262.4 信息管理262.4.1信息管理262.4.2附件管理272.4.3記錄導(dǎo)入272.4.4信息導(dǎo)出282.5信息發(fā)布282.5.1登錄發(fā)布服務(wù)器282.5.2獲取發(fā)布權(quán)限的信息292.5.3新建發(fā)布表單發(fā)布映射292.5.4發(fā)布表單映射管理292.5.5發(fā)布頻道映射管理30第一章:系統(tǒng)介紹1.1軟件簡(jiǎn)介信息采集是指利用計(jì)算機(jī)軟件技術(shù),針對(duì)定制的目標(biāo)數(shù)據(jù)源,實(shí)時(shí)進(jìn)行信息采集、抽取、挖掘、處理,從而為各種信息服務(wù)系統(tǒng)提供數(shù)據(jù)輸入的整個(gè)過程。軍犬信息采集專家是一款基于人工智能的自動(dòng)學(xué)習(xí)技術(shù),功能強(qiáng)大、簡(jiǎn)單實(shí)用的

3、互聯(lián)網(wǎng)信息采集與監(jiān)控軟件。1.2互聯(lián)網(wǎng)信息采集與挖掘要求從互聯(lián)網(wǎng)上對(duì)特定目標(biāo)數(shù)據(jù)源或不特定目標(biāo)數(shù)據(jù)源進(jìn)行采集與監(jiān)控,并對(duì)信息進(jìn)行結(jié)構(gòu)化抽取保存為本地結(jié)構(gòu)化數(shù)據(jù)庫(kù),然后按業(yè)務(wù)流程需求與其它模塊結(jié)合,導(dǎo)入與應(yīng)用并服務(wù)于到電子行業(yè)平臺(tái)?;ヂ?lián)網(wǎng)數(shù)據(jù)采集與挖掘技術(shù)是指利用計(jì)算機(jī)軟件技術(shù),針對(duì)定制的目標(biāo)數(shù)據(jù)源,實(shí)時(shí)進(jìn)行信息采集、抽取、挖掘、處理,從而為各種信息服務(wù)系統(tǒng)提供數(shù)據(jù)輸入,并按業(yè)務(wù)所需,進(jìn)行數(shù)據(jù)發(fā)布、分析的整個(gè)過程。1.3互聯(lián)網(wǎng)采集系統(tǒng)流程圖第一步:確定采集任務(wù)。第二步:每個(gè)采集任務(wù),我們有多個(gè)目標(biāo)數(shù)據(jù)源可供采集。第三步:針對(duì)不同的目標(biāo)數(shù)據(jù)源,進(jìn)行不同的采集配置,以確保能采集到數(shù)據(jù)。第四步:調(diào)度采

4、集任務(wù),與目標(biāo)站點(diǎn)同步更新,增量采集。第五步:采集到數(shù)據(jù)結(jié)果,完成數(shù)據(jù)異構(gòu)到同構(gòu)的過程。第六步:通過發(fā)布服務(wù)器,將數(shù)據(jù)發(fā)布到應(yīng)用平臺(tái)。1.4系統(tǒng)應(yīng)用領(lǐng)域:1、搜索引擎與垂直搜索2、綜合門戶與行業(yè)門戶3、電子政務(wù)與電子商務(wù)4、知識(shí)管理與知識(shí)共享5、企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)6、BI商業(yè)智能系統(tǒng)7、信息咨詢與信息增值8、信息安全和信息監(jiān)控1.5 軟件特點(diǎn)(1)、過濾干凈,智能化抽取正文,且圖文關(guān)聯(lián)圖:采集的目標(biāo)源圖:采集后“干凈”的正文結(jié)果(2)、數(shù)據(jù)導(dǎo)出接口豐富,可以將數(shù)據(jù)導(dǎo)出成各種主流關(guān)系型數(shù)據(jù)結(jié)構(gòu)。(3)、配置簡(jiǎn)單對(duì)于新聞資訊采集,只需輸入待采集目標(biāo)網(wǎng)站的地址或某個(gè)主題頁(yè)面地址,軟件即會(huì)自動(dòng)學(xué)習(xí)網(wǎng)站的

5、風(fēng)格,并自動(dòng)提取網(wǎng)站的資訊,無(wú)需配置模板,目標(biāo)網(wǎng)站風(fēng)格發(fā)生變化,軟件自動(dòng)學(xué)習(xí)。對(duì)于數(shù)據(jù)采集軟件提供了通俗易懂的站點(diǎn)配置向?qū)?,維護(hù)人員稍加培訓(xùn)即可配置出任何的信息采集。對(duì)于復(fù)雜的采集過程,通過一張采集卡腳本即可實(shí)現(xiàn)信息的自動(dòng)采集與監(jiān)控。 圖:輸入“網(wǎng)址”,完成配置工作圖:支持關(guān)鍵字采集,直接輸入關(guān)鍵字,一步設(shè)置輸入“關(guān)鍵字”,完成配置工作(4)、所采即所得,所采即可見圖:所采即所得,所采即可見(5)、增量采集與自動(dòng)更新增加采集:對(duì)于初次采集目標(biāo)網(wǎng)站,軟件支持完全采集;而對(duì)于已采集過的站點(diǎn)支持增量采集。 支持自動(dòng)更新:自動(dòng)檢測(cè)站點(diǎn)是否發(fā)生更新,并不會(huì)遺漏任何一個(gè)重要的信息。 (6)、采集結(jié)果自動(dòng)排

6、重不是利用簡(jiǎn)單的規(guī)則判斷,而是利用內(nèi)容的相似性進(jìn)行排重判斷,準(zhǔn)確性高,不會(huì)因?yàn)闃?biāo)題或內(nèi)容的少許變化而產(chǎn)生漏判,即使把標(biāo)題進(jìn)行了改頭換面,系統(tǒng)也會(huì)正確判定。(7)、內(nèi)置強(qiáng)大的信息監(jiān)控可以通過一個(gè)關(guān)鍵字廣域監(jiān)控互聯(lián)網(wǎng)上任何一個(gè)站點(diǎn)上的相關(guān)信息。也可以通過設(shè)置監(jiān)控頻道監(jiān)控任何站點(diǎn)所采集到含有關(guān)鍵字的信息。對(duì)于數(shù)值字段可以設(shè)置監(jiān)控誤差監(jiān)控?cái)?shù)值出現(xiàn)在一定范圍內(nèi)的信息。信息監(jiān)控達(dá)到字段級(jí)。您可以對(duì)任何一個(gè)采集目標(biāo)網(wǎng)站設(shè)置監(jiān)控屬性,監(jiān)控周期達(dá)到了秒級(jí)。對(duì)于發(fā)生變化的信息可以在短時(shí)間內(nèi)采集到本地。圖:獨(dú)有的監(jiān)控功能,可能對(duì)采集后的結(jié)果進(jìn)行進(jìn)一步監(jiān)控與過濾強(qiáng)大的站點(diǎn)管理工具可以對(duì)所有采集對(duì)象進(jìn)行集中管理和各種操

7、作圖:對(duì)所有采集對(duì)象進(jìn)行集中管理和各種操作圖:隨心所欲自定義導(dǎo)航與分類圖:綜全的選項(xiàng)配置,提升采集的性能圖:對(duì)采集后的結(jié)果可以馬上進(jìn)行修改與編輯(8)、支持多種編碼支持多種網(wǎng)站的信息的編碼,GBK、BIG5、UNICODE、UTF8,軟件會(huì)自動(dòng)轉(zhuǎn)換成GBK碼進(jìn)行統(tǒng)一的處理。軟件即會(huì)自動(dòng)識(shí)別網(wǎng)站的組織結(jié)構(gòu),自動(dòng)識(shí)別網(wǎng)站的編碼。 表單管理,隨心所欲自定義表單,方便采集不同的內(nèi)容,如采集軟件用單獨(dú)的表單,采集圖片用圖片表單。(9)、信息導(dǎo)入導(dǎo)出隨心所欲提供信息導(dǎo)入導(dǎo)出與其它軟件可作無(wú)縫連接 ,如CRM OA 軟件提供有強(qiáng)大的信息記錄導(dǎo)入導(dǎo)出功能,您可以對(duì)任何一個(gè)頻道、一條記錄進(jìn)行導(dǎo)入與導(dǎo)出??梢詫?dǎo)成

8、Excel/Access等,也可以直接導(dǎo)到指定的數(shù)據(jù)庫(kù)。與信息發(fā)布服務(wù)器結(jié)合使用可以將信息發(fā)布到任何一個(gè)地方。 (10)、支持閱讀模板任何一種信息類型,軟件都會(huì)自動(dòng)創(chuàng)建一個(gè)閱讀模板方便了您快速閱讀;任何信息您可以對(duì)任何一種信息表單定制一款漂亮的閱讀模板,也可以對(duì)任何一個(gè)頻道設(shè)置不同的閱讀模板。 (11)、支持多頁(yè)面內(nèi)容重組對(duì)于目標(biāo)數(shù)據(jù)源的一篇文章在目標(biāo)網(wǎng)站上分頁(yè)顯示,系統(tǒng)能自動(dòng)對(duì)其重組.軟件運(yùn)行穩(wěn)定、采集速度快、占用系統(tǒng)資源少歷經(jīng)多次改造的軟件采集底層模塊運(yùn)行穩(wěn)定、采集速度快,點(diǎn)用系統(tǒng)資源少??啥嗑€程并發(fā)運(yùn)行,而不占有過多的系統(tǒng)資源。采集速度快到瞬間到位。軟件完全可以實(shí)現(xiàn)7*24小時(shí)不間斷無(wú)人

9、值守的信息采集。更多細(xì)節(jié)功能有待于您在使用中去體驗(yàn)。 (12)、其它特點(diǎn)列表:、支持多種語(yǔ)言:支持簡(jiǎn)體中文、繁體中文、英文、日文、韓文等多國(guó)語(yǔ)言、支持多種站點(diǎn)類型:包括html與rss、支持登錄、驗(yàn)證后采集、軟件支持需要登錄與需要驗(yàn)證碼的網(wǎng)站信息采集,采集過程完全仿人工。 、支持附件采集包括圖片附件采集、多媒體附件采集、音視頻附件采集、附件與正文自動(dòng)映射與關(guān)聯(lián)、完全結(jié)構(gòu)化抽取將網(wǎng)頁(yè)的非結(jié)構(gòu)化數(shù)據(jù)抽取成特定的結(jié)構(gòu)化信息數(shù)據(jù)。網(wǎng)頁(yè)搜索是以網(wǎng)頁(yè)為最小單位,基于視覺的網(wǎng)頁(yè)塊分析是以網(wǎng)頁(yè)塊為最小單位,垂直搜索是以結(jié)構(gòu)化數(shù)據(jù)為最小單位。然后將這些數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù),進(jìn)行進(jìn)一步的加工處理,如:去重、分類等,最

10、后分詞、索引再以搜索的方式滿足用戶的需求。整個(gè)過程中,數(shù)據(jù)由非結(jié)構(gòu)化數(shù)據(jù)抽取成結(jié)構(gòu)化數(shù)據(jù),經(jīng)過深度加工處理后以非結(jié)構(gòu)化的方式和結(jié)構(gòu)化的方式返回給用戶。 、數(shù)據(jù)保存到本地,您可以隨時(shí)查閱信息。 采集到信息自動(dòng)保存到本地?cái)?shù)據(jù)庫(kù),您可以隨時(shí)查閱信息。 、多線層、多任務(wù)、支持海量數(shù)據(jù)采集10、軟件實(shí)用、易用、功能強(qiáng)大11、可移植、可擴(kuò)展、可定制1.6 系統(tǒng)配置要求² 需要WindowsNT4/ Windows 2000 Server 或更新的操作系統(tǒng)。² 需要 Microsoft SQL Server 7/ 2000或其它ODBC接口² 硬件平臺(tái):intel xeon 1

11、G 以上CPU,1000M 以上RAM,硬盤空間40GM 以上1.7 系統(tǒng)性能l 支持多線程采集。l 單機(jī)在數(shù)據(jù)采集在G級(jí)以上。l 數(shù)據(jù)與數(shù)據(jù)源同步更新小于10秒級(jí)。l 數(shù)據(jù)同步發(fā)布小于10秒級(jí)。第二章:使用手冊(cè)2.1綜合設(shè)置2.1.1數(shù)據(jù)庫(kù)管理新建數(shù)據(jù)庫(kù)通過“系統(tǒng)(S)”主菜單下的“新建數(shù)據(jù)庫(kù)”功能菜單,您可以創(chuàng)建一個(gè)全新的信息采集與管理數(shù)據(jù)庫(kù)。新建的數(shù)據(jù)庫(kù),默認(rèn)會(huì)創(chuàng)建一個(gè)新聞表單,該表單主要用于文章、新聞等資訊信息管理,該表單不允被刪除。我們建議:您在新建數(shù)據(jù)庫(kù)時(shí)希望能將數(shù)據(jù)庫(kù)文件存儲(chǔ)在與操作系統(tǒng)不同的驅(qū)動(dòng)盤下,這樣數(shù)據(jù)庫(kù)中的信息內(nèi)容會(huì)更安全一些。備份數(shù)據(jù)庫(kù)通過備份數(shù)據(jù)庫(kù)的功能,您可以將當(dāng)

12、前正在使用的數(shù)據(jù)庫(kù)壓縮并備份到另一個(gè)目錄下。以備以后的使用。壓縮數(shù)據(jù)庫(kù)由于桌面版的軟件版本使用了微軟的ACCESS數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)在您刪除記錄時(shí)不會(huì)自動(dòng)釋放已刪除記錄所占用的空間。所以需要您不定期地對(duì)當(dāng)前正在使用的數(shù)據(jù)庫(kù)進(jìn)行壓縮,以減少數(shù)據(jù)庫(kù)占用硬盤資源的空間。對(duì)于SQL Server版本的軟件,則無(wú)需使用壓縮數(shù)據(jù)庫(kù)的功能。軟件也將該功能屏蔽。2.1.2表單管理表單的概念互聯(lián)網(wǎng)信息采編發(fā)系統(tǒng)中的表單等同于數(shù)據(jù)庫(kù)中的表。通俗地說需要為每種信息類型創(chuàng)建一個(gè)存儲(chǔ)空間。不同的是為了能夠?qū)?shù)據(jù)庫(kù)中的所有表單記錄進(jìn)行統(tǒng)一的管理,需要在各個(gè)表單中預(yù)置一些字段,通常這些字段含以下幾個(gè)部分:顯示控制信息字段:

13、密碼字段、文字顏色字段、文字背景顏色字段、顯示圖標(biāo)字段后續(xù)跟蹤信息字段:信息來(lái)源地址字段頻道信息字段:頻道信息,監(jiān)控頻道信息 創(chuàng)建表單下面以創(chuàng)建一個(gè)圖書管理表單為例,逐步向您說明如何創(chuàng)建一個(gè)屬于自己的管理表單。找到主菜單欄中的“工具”=>"系統(tǒng)表單管理"菜單,在彈出的在表單管理器中點(diǎn)擊“新建表單”按鈕。在“表單標(biāo)題”編輯框中輸入“圖書表單”,在“表單名稱”編輯框中輸入“tblBookSheet”。注意:如果“表單名稱”或“表單標(biāo)題”為空將不能成功地創(chuàng)建表單。 點(diǎn)擊“保存”按鈕,這時(shí)系統(tǒng)會(huì)提示您已成功地創(chuàng)建了一個(gè)名稱“圖書表單”的表單,并在圖書表單下下掛三個(gè)字段“記錄編

14、號(hào)”、“頻道名稱”、“源文地址”。這個(gè)三個(gè)字段是軟件中對(duì)一個(gè)表單中任何一條記錄進(jìn)行管理的必要的字段。您不可刪除或更改名稱或?qū)傩?。記錄編?hào)用于標(biāo)識(shí)表單中任何一條記錄的唯一的標(biāo)識(shí)。頻道名稱用于標(biāo)識(shí)該記錄從屬于哪個(gè)頻道;而源文地址則用于標(biāo)識(shí)信息來(lái)源于何處。表單標(biāo)題該字段用于通俗易懂地標(biāo)示表單。必須輸入,我們建議您表單標(biāo)題做到整個(gè)數(shù)據(jù)庫(kù)是唯一的。表單名稱該字段用于在數(shù)據(jù)庫(kù)中創(chuàng)建對(duì)應(yīng)表單的名稱,該字段的值不能與數(shù)據(jù)庫(kù)中其它的表單名稱重復(fù)需要在數(shù)據(jù)庫(kù)中唯一。字段值長(zhǎng)度不能超過20個(gè)漢字(40個(gè)英文字母),命名規(guī)則同Windows中的文件命名規(guī)則相同??梢匀∨c表單標(biāo)題相同的名稱,但建議采用tblXXXShe

15、et作為命名規(guī)范。閱讀模板該字段用于標(biāo)識(shí)該表單的信息內(nèi)容閱讀模板的路徑,可以是文件路徑名稱如:e:Quickreaderreadmodeltblbooksheet.html,也可以是網(wǎng)絡(luò)上的某個(gè)路徑名如: Files采集軟件QuickReader,那么該相對(duì)路徑相當(dāng)于cPrograme Files采集軟件QuickReaderreadmodeltblbooksheet.html)如果沒有該表單對(duì)應(yīng)的閱讀模板,“閱讀模板”字段可以不輸入任何值。等最后創(chuàng)建完該表單所有字段后利用軟件提供的“創(chuàng)建模板”進(jìn)行創(chuàng)建。 添加字段以創(chuàng)建圖書信息管理表單為例,假設(shè)管理圖圖需要以下字段:字段標(biāo)題 字段名稱 說明

16、屬性 圖書名稱 fldBookName 用于保存圖書的名稱 字符型,長(zhǎng)度40,查重鍵,主題鍵 作者 fldBookAuthor 圖書作者 字符型,長(zhǎng)度30 購(gòu)買日期 fldPurchaseDate 可用于控制或統(tǒng)計(jì) 日期型 圖書價(jià)格 fldBookPrice 價(jià)格 浮點(diǎn)型 借閱人 fldUserName 當(dāng)前借閱用戶名稱 字符型,長(zhǎng)度40 借閱日期 fldBrowDate 借閱日期 日期型 圖書簡(jiǎn)介 fldBookMemo 有關(guān)該圖書的說明 備注型 選中剛才新建的“圖書表單”后,點(diǎn)擊“新建字段”按鈕,將在“圖書表單”下增加一個(gè)結(jié)點(diǎn),編輯框中預(yù)輸入了“新字段”,你可以在這里輸入字段標(biāo)題,也可以在

17、列表中的“字段標(biāo)題”中輸入?,F(xiàn)在,在結(jié)點(diǎn)編輯中輸入“圖書名稱”后,點(diǎn)擊列表中的“字段名稱”在編輯框中輸入“fldBookName”。選擇“字段類型”為“字符”,“長(zhǎng)度”輸入40,“設(shè)為查重鍵”選擇“是”,“允許為空”選擇“否”。點(diǎn)擊“保存”按鈕。如果沒有報(bào)錯(cuò)表明系統(tǒng)已成功地圖書表單上增加了“圖書名稱”字段??砂凑丈鲜鰣D書管理的需求表格,完成在圖書表單的創(chuàng)建工作。 下面將對(duì)表單各個(gè)屬性進(jìn)行詳細(xì)地說明。 字段標(biāo)題 該字段用于通俗顯式地標(biāo)示字段的名稱,在同一個(gè)表單中字段名稱不能重復(fù)。最大長(zhǎng)度不能超過50個(gè)字節(jié)。字段名稱該字段用于在表單中隱式地標(biāo)示字段名稱,在同一個(gè)表單中字段名稱不能重復(fù)。最大長(zhǎng)度不能

18、超過50個(gè)字節(jié),命名規(guī)則同Windows中的文件命名。建議采用fldXXX作為該值的輸入規(guī)范。字段類型目前字段類型有:字符型、日期型、整型、浮點(diǎn)型和備注型5種字段類型,可以根據(jù)實(shí)際需要從這5種類型中選擇。不同類型的字段在輸入字段值時(shí)將有不同的控件和限制??梢栽谝院髮?duì)其進(jìn)行修改。字段長(zhǎng)度 字段長(zhǎng)度只能“字符型”的字段有效,其它類型輸入長(zhǎng)度是無(wú)效的,對(duì)于字符型長(zhǎng)度值默認(rèn)為50個(gè)字節(jié)。設(shè)為查重鍵該字段可以選擇為“是”或“否”??筛鶕?jù)實(shí)際需要設(shè)置一些字段為查重鍵。如我們?cè)凇皥D書表單”中設(shè)置“圖書名稱”為查重鍵,這樣,以后在輸入每一本書的屬性時(shí),系統(tǒng)將查找是否存在有相同圖書名稱的記錄。主題字段該字段可以

19、選擇為“是”或“否”。用于標(biāo)識(shí)一條信息中的最主要的信息的字段。如新聞表單中的新聞標(biāo)題。我們?cè)凇皥D書表單”中可以設(shè)置“圖書名稱”為主題字段。識(shí)別標(biāo)簽該字段將用于文檔識(shí)別、網(wǎng)絡(luò)信息采集時(shí)對(duì)該字段值的自動(dòng)識(shí)別。如以后需要自動(dòng)從文本中識(shí)別“圖書名稱”的值,則可以輸入“圖書名稱;名稱;圖書;BOOKNAME;”等作為圖書名稱字段的識(shí)別標(biāo)簽,各個(gè)標(biāo)簽之間以“;”或“;”分隔。默認(rèn)值 該值將用于在識(shí)別、錄入或采集時(shí)沒有得到該字段的值是將用默認(rèn)值填入。如有字段“性別”,在沒有識(shí)別到“性別”字段的值時(shí),將用默認(rèn)值“女”或“男”作為“性別”的值。在列表中顯示用于控制屬性字段在概覽表單內(nèi)容時(shí)是否在列表中顯示。列表寬

20、度用于控制屬性字段在概覽表單時(shí)顯示在列表中的長(zhǎng)度。對(duì)齊格式用于控制屬性字段在概覽時(shí)在列表中的對(duì)齊格式,有三種選擇:左對(duì)齊、居中對(duì)齊和右對(duì)齊??蛇x擇以前的值用于控制在錄入該表單的資訊時(shí),該屬性字段可否從以前錄入的值中選擇一個(gè)。如有屬性字段“民族”,則在錄入記錄信息時(shí)遇到該屬性字段既可以手工輸入也可以從以前的值中選取一個(gè)。允許為空用于控制屬性字段是否允許為空,如果設(shè)置不空時(shí),在錄入或采集該表單的資訊記錄時(shí),發(fā)現(xiàn)該字段沒有值的記錄將被丟棄或要求錄入該字段。如“圖書表單”中要求“圖書名稱”不為空,那么如果“圖書名稱”為空的話,該記錄就變得沒必要了。修改屬性在使用表單的過程中,還可以表單的屬性進(jìn)行修改與

21、編輯,但不能修改表單名稱和字段名稱。修改后的屬性可以立即在使用中生效。特別提示:在信息采集的過程中軟件不允許您對(duì)表單進(jìn)行修改。刪除表單通過“刪除表單”按鈕可以刪除掉一些不再使用的表單。注意:刪除表單時(shí),表單中的所有記錄將被同時(shí)刪除,另外建立在該表單基礎(chǔ)上的所有欄目也將被刪除。刪除字段通過“刪除字段”按鈕可以刪除掉一些不再使用的屬性字段。注意:刪除字段時(shí)將同時(shí)刪除表單中該字段的所有數(shù)據(jù)。上移下移字段您可以通過“上移”按鈕將表單中的一個(gè)字段上移或下移到到一個(gè)指定的位置。以改變字段在列表與閱讀模板中顯示順序。 創(chuàng)建閱讀模板您可以隨時(shí)使用“表單管理器”中的“創(chuàng)建模板”功能為某個(gè)表單創(chuàng)建一個(gè)由系統(tǒng)生成的

22、閱讀模板。閱讀模板主要是便于您快速閱讀信息。您也可以自己一個(gè)漂亮的閱讀模板。如何創(chuàng)建閱讀模板,請(qǐng)參照閱讀模板一節(jié)。遠(yuǎn)程表單管理遠(yuǎn)程表單管理對(duì)于使用了互聯(lián)網(wǎng)信息采編發(fā)系統(tǒng) 的用戶才會(huì)顯示。對(duì)于普通的用戶不會(huì)顯示有該節(jié)點(diǎn)。主要用于管理遠(yuǎn)程發(fā)布服務(wù)器上的分配給指定用戶允許使用的發(fā)布表單。只有在發(fā)布服務(wù)器上分配給用戶允許發(fā)布的表單后才會(huì)在該節(jié)點(diǎn)下顯示有相關(guān)的表單信息。用戶可以通過表單管理器來(lái)瀏覽遠(yuǎn)程表單的信息。但不能修改表單屬性。2.1.3頻道管理 創(chuàng)建頻道選中一個(gè)結(jié)點(diǎn)作為新建頻道的父目錄,點(diǎn)擊右鍵,在彈出的右鍵菜單上選擇“新建頻道”,在彈出的“頻道屬性”對(duì)話框中輸入頻道的名稱,并選擇一個(gè)表單,默認(rèn)為

23、“新聞表單”,我們選擇前面表單管理中創(chuàng)建的“圖書表單”。如果存在有該頻道的閱讀模板,可以瀏覽輸入模板的路徑。最后,還可以為該頻道選擇一個(gè)適合的圖標(biāo)。如果圖標(biāo)列表中沒有合適的圖標(biāo),也可以找到一個(gè)合適的圖標(biāo)文件,并將圖標(biāo)文件放置于安裝目錄的Icon目錄下。重啟軟件,就可以更新該欄目的圖標(biāo)為您剛才放置的圖標(biāo)。修改頻道屬性可以通過右鍵菜單或雙擊某個(gè)頻道,都可以彈出頻道屬性對(duì)話框,可以在屬性對(duì)話框中修改頻道的各個(gè)屬性(不能修改欄目所對(duì)應(yīng)的表單)后保存即可。刪除頻道通過右鍵菜單可以刪除選中的頻道,注意刪除頻道時(shí)將同時(shí)刪除其子頻道的所有信息。如果該頻道及其子頻道下的記錄比較多,刪除可能需要一段時(shí)間,請(qǐng)耐心等

24、待。隱藏頻道在頻道較多的時(shí)候,可以通過隱藏頻道功能隱藏一些欄目在導(dǎo)航樹上的顯示。刷新頻道通過刷新頻道,可以重新在導(dǎo)航樹上顯示那些被隱藏的子頻道。清空頻道清空頻道,將會(huì)將頻道中的所有記錄都清空,但不會(huì)影響到其子頻道的信息。設(shè)置頻道密碼設(shè)置了頻道密碼后,可以控制頻道的訪問權(quán)限,再次訪問需要輸入密碼才可以訪問。設(shè)置標(biāo)記還可以將頻道標(biāo)記為重要(或一般)的狀態(tài),標(biāo)記為重要狀態(tài)的頻道文字將以加粗的方式顯示,相反標(biāo)記為一般的頻道則以非加粗的方式顯示。還可以設(shè)置或取消頻道結(jié)點(diǎn)的文字顏色。而也可以通過"取消所有文字顏色"來(lái)取消所有已設(shè)置文字顯示顏色的頻道的顏色。拖動(dòng)頻道通過將選中的頻道拖動(dòng)到

25、其它頻道下,可以改變頻道的父結(jié)點(diǎn)。下次生成導(dǎo)航樹時(shí)將會(huì)把被拖動(dòng)的頻道顯示在新的父頻道下,以改變信息分類結(jié)構(gòu)。2.1.4模板管理閱讀模板的作用通過閱讀模板可以將表單中的信息內(nèi)以網(wǎng)頁(yè)的形式快速展現(xiàn),以便讓您快速閱讀?;ヂ?lián)網(wǎng)信息采編發(fā)系統(tǒng)可以支持對(duì)每個(gè)頻道定義一個(gè)不同的模板也可以是同一表單共用一個(gè)閱讀模板。 如何設(shè)計(jì)模板下面以一個(gè)新聞閱讀模板作為示例,說明如何設(shè)計(jì)模板。模板中必須包含您要為哪個(gè)信息表單中要快速閱讀的字段設(shè)置的閱讀模板。如上述模板中要顯示新聞作者,新聞來(lái)源,所屬頻道,收錄日期和新聞內(nèi)容以及新聞相關(guān)附件等。設(shè)計(jì)好的模板中主要在各位單元格中放置“表單管理”中各個(gè)要顯示的字段的字段名稱。主要

26、放置 id="字段名稱" name="字段名稱" 。這里要特別說明是放置字段名稱,而非字段標(biāo)題2.2信息采集2.2.1站點(diǎn)基本屬性在增加或編輯站點(diǎn)屬性時(shí),需要設(shè)置站點(diǎn)的的第一步就是設(shè)置采集站點(diǎn)的基本屬性。站點(diǎn)基本信息包括:站點(diǎn)地址站點(diǎn)地址設(shè)定了從該站點(diǎn)哪個(gè)頁(yè)面開始采集??梢砸恍┚W(wǎng)站的首頁(yè),可以是網(wǎng)站中某個(gè)主題的頁(yè)面地址,也可以是某個(gè)論壇的地址。還可以是某個(gè)RSS站點(diǎn)的鏈接地址。站點(diǎn)名稱站點(diǎn)名稱主要用于顯示地標(biāo)識(shí)該站點(diǎn),以便于以后站點(diǎn)維護(hù)與管理。特別說明:當(dāng)您在輸入了站點(diǎn)的地址后,可以點(diǎn)擊旁邊的小球。該功能既可以幫您取得站點(diǎn)的名稱,也可以取得下面要說到的站

27、點(diǎn)類型和站點(diǎn)編碼。站點(diǎn)類型您可以手工設(shè)置站點(diǎn)的類型,也可以由軟件自動(dòng)識(shí)別。目前有兩種類型的站點(diǎn)類型:普通HTML站點(diǎn)和聚類RSS站點(diǎn)。目前大部的站點(diǎn)還是普通的HTML站點(diǎn),軟件會(huì)自動(dòng)識(shí)別出該站點(diǎn)上所有的信息鏈接;聚類RSS站點(diǎn)是近幾年興起的一種信息聚合方式,這里面可能包含了多個(gè)不同網(wǎng)站相同或相關(guān)主題的信息鏈接。只要您輸入一個(gè)地址,軟件自動(dòng)識(shí)別站點(diǎn)類型。站點(diǎn)編碼站點(diǎn)編碼用于顯示地告訴軟件該站點(diǎn)的網(wǎng)頁(yè)采用了哪種編碼模式,如繁體網(wǎng)頁(yè)一般采用BIG5編碼;一些網(wǎng)站的網(wǎng)頁(yè)則采用UTF8編碼。對(duì)于不同的編碼網(wǎng)頁(yè)軟件需要進(jìn)行統(tǒng)一的編碼轉(zhuǎn)換處理后再進(jìn)行提取。一般軟件會(huì)自動(dòng)識(shí)別網(wǎng)站的編碼模式。而對(duì)于不能識(shí)別出站

28、點(diǎn)的編碼模式,則需要用戶手工設(shè)定采集站點(diǎn)的編碼模式。這樣,可以最大地保證網(wǎng)站的信息采全。需要使用代理有些站點(diǎn)可能需要設(shè)置代理信息才能訪問與采集,而且其它的站點(diǎn)并不需要代理。而如果所有需采集的網(wǎng)站都需要通過代理,你只需設(shè)置"默認(rèn)采集屬性"中的代理信息后,以后增加每個(gè)站點(diǎn)都會(huì)自動(dòng)采用該代理。不需使用代理的采集一般比使用代理采集速度要快。該網(wǎng)站需要登錄在采集一些如論壇或其它需要您輸入登錄賬號(hào)的站點(diǎn)時(shí),需要設(shè)置登錄用戶名和密碼。登錄時(shí)需要輸入驗(yàn)證碼 有些網(wǎng)站在采集時(shí)除了需要登錄外,還要求登錄時(shí)輸入一個(gè)圖片或文字形式的驗(yàn)證碼才能采集。這里就需要您設(shè)置如何提取與識(shí)別驗(yàn)證碼。需要使用代理

29、、網(wǎng)站需要登錄詳見登錄目標(biāo)網(wǎng)站;登錄時(shí)需要輸入驗(yàn)證碼,詳見驗(yàn)證碼識(shí)別允許自動(dòng)周期檢測(cè)該站的更新并采集對(duì)于一些需要長(zhǎng)期采集其發(fā)布的最新信息,適當(dāng)?shù)卦O(shè)置每個(gè)站點(diǎn)的更新周期,可以加快每次的更新速度。因?yàn)橛行┱军c(diǎn)是1個(gè)星期更新一次,而有些站點(diǎn)幾分鐘就更新一次。通過設(shè)置的周期獵手可以快速檢測(cè)并更新達(dá)到更新周期的站點(diǎn)。2.2.2提交訪問數(shù)據(jù)為什么要提交數(shù)據(jù)有些時(shí)候,我們?yōu)榱藴?zhǔn)確地控制采集頁(yè)面,或是為了登錄等的要求,需要在訪問網(wǎng)頁(yè)時(shí)提交一些數(shù)據(jù)給目標(biāo)網(wǎng)站。目標(biāo)網(wǎng)站在解析了這些數(shù)據(jù)后就會(huì)按照數(shù)據(jù)中的要求返回相應(yīng)的頁(yè)面。您只需把要提交的訪問數(shù)據(jù)拷貝到該頁(yè)面的頂端最大的編輯框中,軟件就會(huì)自動(dòng)解析這些數(shù)據(jù)。您可以修

30、改解析后的參數(shù)列表中的某些參數(shù)值。比如username=abcd&userpswd=134&classid=23&pageno=2可以解釋成這樣的:用戶名:abcd 密碼134 要訪問類別ID為23 的第二頁(yè)上的信息。只要這些信息 符合目標(biāo)網(wǎng)站的要求,就會(huì)返回相應(yīng)的頁(yè)面。如何獲得訪問數(shù)據(jù) 我們知道了訪問數(shù)據(jù)的重要性,我們就要知道如何才能獲得訪問數(shù)據(jù)。獲得訪問數(shù)據(jù)的方法有很多,我們?cè)诖送扑]一種最可靠最有效的獲取訪問數(shù)據(jù)的方法。您可以在互聯(lián)網(wǎng)上下載一些捕包工具,然后先手工訪問目標(biāo)網(wǎng)站。然后在捕包工具中找到需要提交的數(shù)據(jù),并拷貝出來(lái)。2.2.3站點(diǎn)鏈接預(yù)覽 站點(diǎn)鏈接預(yù)覽與設(shè)置

31、進(jìn)入該頁(yè)面后,軟件會(huì)解析采集目標(biāo)頁(yè)面上所有的鏈接信息,并以樹狀的形式顯示。用戶選擇任何一點(diǎn)條記錄后,點(diǎn)擊右鍵,可以彈出控制菜單。復(fù)制鏈接地址 拷貝當(dāng)前選中的鏈接信息中的鏈接地址。復(fù)制鏈接標(biāo)題 拷貝當(dāng)前選中的鏈接信各的鏈接標(biāo)題。瀏覽原文件 在網(wǎng)頁(yè)瀏覽器中打開原文查看。打開該鏈接 將會(huì)在軟件的鏈接預(yù)覽窗口選中的鏈接下展開該鏈接記錄的子鏈接信息。設(shè)為典型頁(yè)面 設(shè)置為您要采集的感興趣的鏈接信息。您可以多設(shè)置幾個(gè),以作后面的字段信息提取測(cè)試的測(cè)試頁(yè)面。采集深度采集深度是指您要對(duì)該目標(biāo)鏈接采集到第幾層。設(shè)置提取特殊的鏈接地址在采集過程中經(jīng)常會(huì)遇到一些信息內(nèi)容是在彈出式的窗口上顯示的,其腳本類似于:java

32、script:privateWin('200708766')的鏈接地址,而該鏈接地址的實(shí)際地址可能是這樣的:那么這個(gè)時(shí)候您就要告訴軟件說,您要提取出這類特殊的鏈接地址,并把這些鏈接地址轉(zhuǎn)換成真實(shí)的鏈接地址。那么鏈接地址特征:就輸入:privateWin('1')真實(shí)的鏈接地址請(qǐng)輸入:這樣軟件就會(huì)自動(dòng)提取中所有鏈接中符合privateWin('')的鏈接變量,并轉(zhuǎn)換成真實(shí)的鏈接地址。這種情況,一般的用戶可以跳過該節(jié)。2.2.4 采集過濾采集過濾控制設(shè)置為了加快采集有效信息,直接過濾或不采集明顯地?zé)o效信息,我們就需要在采集過濾控制中設(shè)置一些過濾控制條

33、件。您可以從“鏈接地址”、“鏈接標(biāo)題”和“信息正文”中“包含”或“不包含”某個(gè)關(guān)鍵字的鏈接進(jìn)行控制,控制動(dòng)作有:不采集,采集不提取,采集并提取。如設(shè)置鏈接地址中包含有"123"的不采集。而采集不提取的概念是,只采集到符合條件的鏈接地址的信息,并根據(jù)采集深度分析出子鏈接,但不會(huì)提取該頁(yè)面上的信息。而采集并提取,則不但會(huì)分析子鏈接而且還會(huì)提取該頁(yè)面的信息。設(shè)置信息鏈接提取范圍 為了更精確地控制采集,比如我們只要采集圖2中的社會(huì)新聞中的鏈接信息。我們就要用設(shè)定信息鏈接信息范圍。請(qǐng)?jiān)诰W(wǎng)頁(yè)的源文件中找到鏈接的開始標(biāo)識(shí)與結(jié)束標(biāo)識(shí)。更詳細(xì)的設(shè)置,請(qǐng)參閱字段信息提取。鏈接擴(kuò)展名采集控制控制

34、采集提取鏈接的擴(kuò)展名采不采集外網(wǎng)或不同的專內(nèi)容根據(jù)需要設(shè)置需不需要采集外部的網(wǎng)站的信息。2.2.5 分頁(yè)模板為了一次性從目標(biāo)網(wǎng)站上采集更多的信息,我們可以通過配置一些目標(biāo)網(wǎng)站上有規(guī)律的網(wǎng)頁(yè)鏈接,如分頁(yè)信息鏈接。.表示了從第2頁(yè)到第200頁(yè)。當(dāng)然我們可以手工一個(gè)一個(gè)的添加到鏈接模板中,也可以一次性由軟件自動(dòng)生成。自動(dòng)生成的方式如下:2.2.6 附件采集設(shè)置附件識(shí)別方法:使用擴(kuò)展名提取 設(shè)置您要提取的附件擴(kuò)展名,每個(gè)擴(kuò)展名以“;”作分隔,如:jpg;gif;zip;等。 使用特征符提取 您要設(shè)置附件鏈接中必須包含有關(guān)鍵字的附件才要采集。各個(gè)關(guān)鍵字也是以“;”分隔。不采集 就不會(huì)識(shí)別與采集任何附件。

35、 附件保存方式設(shè)置適當(dāng)?shù)母郊4娣绞絹?lái)保存站點(diǎn)中已識(shí)別的附件信息和文件。目前有3種方式可以選擇:保存到數(shù)據(jù)庫(kù):該方式將自動(dòng)下載附件并將附件以壓縮或不壓縮的方式存儲(chǔ)到知識(shí)庫(kù)中的附件表單中。選中"保存前壓縮附件"可以減少附件在數(shù)據(jù)庫(kù)中的占用空間。保存到文件夾:該方式將會(huì)把附件直接下載到指定的文件夾。注意文件夾路徑不能為空,否則將采用第一種方式。保存附件鏈接:該方式將不下載已識(shí)別出的附件,而只是保存附件的鏈接地址。該方式采集速度快。但缺點(diǎn)是一旦目標(biāo)站點(diǎn)的文件被刪除或更改,鏈接地址方法將變得無(wú)效。信息與就失去完整性。2.2.7新聞自動(dòng)識(shí)別軟件具有自動(dòng)學(xué)習(xí)新聞或資訊的目標(biāo)網(wǎng)站,可以自

36、動(dòng)學(xué)習(xí)簡(jiǎn)體中文、繁體中文、英文等多國(guó)語(yǔ)言的新聞資訊。如果您要識(shí)別新聞的作者,則需要作者識(shí)別標(biāo)簽。常見的標(biāo)簽有:記者;編輯;作者;通訊員等。每個(gè)標(biāo)簽以“;”作分隔。同樣要識(shí)別來(lái)源與發(fā)布日期等也要輸入相應(yīng)的標(biāo)簽。只采集最新文章的鏈接地址軟件將只采集目標(biāo)網(wǎng)站的最新信息的鏈接地址和鏈接標(biāo)題,而不會(huì)去識(shí)別鏈接中的正文信息。自動(dòng)重組文章的所有頁(yè)面很多目標(biāo)網(wǎng)站會(huì)將長(zhǎng)的新聞文章分配到多個(gè)頁(yè)面中顯示。勾選該選項(xiàng)后軟件就會(huì)自動(dòng)重組這些類型的新聞信息。正文長(zhǎng)度小于閾值不保存用戶可以設(shè)定閾值來(lái)限制新聞的長(zhǎng)度,如果長(zhǎng)度小于閾值就不保存。文章中的附件數(shù)大于閾值不保存當(dāng)新聞中的附件數(shù)量大于閾值就不保存不采集。2.2.8字段

37、提取設(shè)置通過本節(jié)的學(xué)習(xí)您將學(xué)會(huì)如何從一個(gè)網(wǎng)頁(yè)中提取出每個(gè)字段的信息。提取信息的方法有4種:通過智能標(biāo)簽提取如我們想提取一個(gè)電影信息的片名,可以用“片名;影片;”等識(shí)別標(biāo)簽來(lái)提??;這種方法簡(jiǎn)單適用于多數(shù)的網(wǎng)站。通過正則表達(dá)式提取對(duì)于熟悉正則表達(dá)式的高級(jí)用戶可以使用正則表達(dá)到來(lái)提取頁(yè)面中的信息。指定一個(gè)特定的值您可以直接為某個(gè)表單字段指定鏈接地址、鏈接標(biāo)題、采集日期、采集時(shí)間或者自己指定一個(gè)特定的值。通過前后標(biāo)識(shí)提取這種方法雖然簡(jiǎn)單,但卻經(jīng)常使用。比如我們要提取影片的名稱,影片在頁(yè)面中的信息如下:<td>影片:</td><td>XXXXXXXX</td&g

38、t;那么我們可以采用前標(biāo)識(shí)符為:影片:</td> 后標(biāo)識(shí)符為:</td>來(lái)提取,這樣提取到的內(nèi)容為<td>XXXXXXXX那么我們不勾選“保留字段值中的HTML代碼”,將得到的字段值為:XXXXXXXX提取該字段的附件對(duì)于一些大文本的字段,我們可以勾選“提取該字段的附件”讓采集軟件自動(dòng)識(shí)別與提取字段內(nèi)的附件。如此循環(huán),直到表單中所有的字段信息提取方法都配置完成。2.2.9 字段采后處理用戶可以對(duì)采集到的字段值作以下處理:字段內(nèi)容替換可以查找某個(gè)特征值,替換成另一個(gè)字符串。字段中需要保留HTML標(biāo)簽可以設(shè)定字段中要不要保留HTML標(biāo)簽,及要保留哪些標(biāo)簽。字段值

39、前插 在字段值前面插入一個(gè)指定的特征串字段值后追加 在字段值后追加一個(gè)指定的特征串特殊截取處理可以截取左邊的幾個(gè)字符;可以截取中間的字符,設(shè)定從哪里開始截取,截取幾個(gè);可以取右邊的幾個(gè)字符。字段值的后處理是使得采集到的信息更符合您的要求。2.3站點(diǎn)管理2.3.1 采集站點(diǎn)管理通過站點(diǎn)管理器可以管理所有采集站點(diǎn)列表。 刪除:可以從站點(diǎn)列表中刪除某個(gè)站點(diǎn)。 復(fù)制: 可以復(fù)制一個(gè)相同規(guī)則的站點(diǎn),但是采集的入口地址和一些重要的相關(guān)信息需要改變。 編輯:可以修改站點(diǎn)的采集規(guī)則。如果站點(diǎn)的保存欄目已被刪除,該站點(diǎn)將一直處于禁用狀態(tài)。直到您設(shè)置了一個(gè)有效的保存欄目,并設(shè)置啟用后才會(huì)使該站點(diǎn)使能。向上:可以提

40、高站點(diǎn)的采集優(yōu)先級(jí)。 向下:可以降低站點(diǎn)的采集優(yōu)先級(jí)。 禁用/啟用:可以設(shè)置站點(diǎn)的采集使能或處于禁用狀態(tài)。 復(fù)位:如果站點(diǎn)已經(jīng)采集了,但下一個(gè)采集周期還沒到達(dá)。為了讓該站點(diǎn)加入本次的采集列表中,可以設(shè)置該站點(diǎn)處于復(fù)位狀態(tài)來(lái)實(shí)現(xiàn)。清除日志:清除站點(diǎn)的采集日志。詳細(xì)可參見下節(jié)的采集日志管理一節(jié)。2.3.2掃描采集源選中某個(gè)頻道后,點(diǎn)擊右鍵可以彈出該頻道下所有采集站點(diǎn),如果選擇掃描所有子頻道將列出該頻道下所有子頻道的采集站點(diǎn)。您可以在該對(duì)話框中對(duì)相應(yīng)的采集站點(diǎn)進(jìn)行操作。操作功能同站點(diǎn)管理。點(diǎn)擊掃描將關(guān)閉對(duì)話,并開始根據(jù)設(shè)置對(duì)站點(diǎn)進(jìn)行檢測(cè)更新與采集。2.3.3采集日志采集日志管理軟件在采集每個(gè)一站點(diǎn)都

41、將對(duì)應(yīng)一個(gè)采集日志和學(xué)習(xí)數(shù)據(jù)文件。您可以通過日志管理器來(lái)實(shí)現(xiàn)清除所有采集日志,也可以在日志列表中通過雙擊打開某個(gè)日志鏈接來(lái)閱讀原文。清除采集日志 清除日志功能將清除掉所有站點(diǎn)的采集日志。 建議:如果沒有特殊情況(如全部站點(diǎn)重新采集和學(xué)習(xí))不要使用清除日志功能。因?yàn)檎军c(diǎn)日志被清除后,在下一次采集過程中需要重新學(xué)習(xí),增加了采集時(shí)間。但不會(huì)影響學(xué)習(xí)后的采集時(shí)間。2.4 信息管理2.4.1信息管理添加與編輯信息記錄在添加或編輯信息記錄時(shí),視您當(dāng)前正在使用的表單可以快速?gòu)棾鲣浫牖蚓庉嬓畔⒂涗浀拇翱???梢栽趯?dǎo)航樹上選中某個(gè)欄目后,通過右鍵菜單中的新建文檔(對(duì)于文檔表單)或新記錄記錄(其它表單)來(lái)增加記錄。

42、也可以通過工具欄上的“新建”按鈕來(lái)彈出編輯界面。文檔表單的信息編輯界面采用了仿Word的窗口,可以在上面進(jìn)行文字編輯或插入圖片等。保存時(shí)可以保存成純文本方式也可以保存成多彩格式。建議:如果沒有必要保存成多彩格式的文檔就采用純文本的方式,這是因?yàn)楸4娉啥嗖矢袷降姆椒ㄕ加玫目臻g比后者大。而對(duì)于非文檔類型的表單在新建或編輯時(shí)會(huì)彈出各個(gè)記錄錄入窗口。需要注意的是:如果表單中設(shè)定的字段為數(shù)字型的,只能輸入數(shù)字,而日期型的字段則預(yù)先輸入當(dāng)日的日期。 信息內(nèi)容閱讀在概覽信息記錄時(shí),您可以通過右鍵菜單或通過快捷鍵進(jìn)行快速閱讀。如果正在閱讀的信息記錄所在欄目已設(shè)定有閱讀模板,則軟件將會(huì)先下載模板文件,然后將信息

43、記錄的各個(gè)字段輸入到模板中進(jìn)行顯示。如果沒有設(shè)定閱讀模板,則會(huì)彈出信息記錄的編輯窗口。注意:如果遇到?jīng)]有彈出信息記錄的編輯窗口,而且在瀏覽頁(yè)面中報(bào)找不到文件,這時(shí)需要您檢查一下該欄目的模板文件的路徑是否設(shè)置正確。刪除信息記錄軟件在很多地方提供有刪除功能,可以很方便地刪除掉無(wú)用的記錄。在瀏覽記錄列表中,可以通過右鍵菜單或快捷鍵刪除掉列表上選中的記錄。刪除時(shí)會(huì)提示“您是否確實(shí)要?jiǎng)h除選中的記錄”字樣的警告。如果對(duì)于那些已設(shè)置了密碼的信息記錄在刪除時(shí)會(huì)要求用戶輸入記錄密碼。信息記錄分類您可以在概覽列表中通過將選中的記錄拖動(dòng)到另一個(gè)相同表單的不同欄目下。如果要將資訊記錄拖動(dòng)另一個(gè)表單下的欄目中,改變分類

44、操作將不會(huì)成功的,但不會(huì)改變記錄原來(lái)的分類。瀏覽原文對(duì)于那些從網(wǎng)絡(luò)上采集到的記錄,可以通過右鍵菜單來(lái)瀏覽原文。如果信息記錄設(shè)置了密碼,需要輸入密碼才能允許瀏覽。設(shè)置標(biāo)識(shí) 設(shè)置(取消)密碼用戶可以對(duì)信息記錄設(shè)置密碼,已設(shè)置了密碼的記錄也可解除密碼。密碼雖然已采用了加密的方式。但是信息的安全性更多的還是需要用戶自己保證正在使用計(jì)算機(jī)的安全。設(shè)置其它標(biāo)記互聯(lián)網(wǎng)信息采編發(fā)系統(tǒng)為了突出某些信息記錄的特殊性或重要性可以采用設(shè)置圖標(biāo)、設(shè)置加粗、設(shè)置文字顏色或設(shè)置背景顏色等方式來(lái)實(shí)現(xiàn)。點(diǎn)擊“Ctrl+B”可以快速對(duì)選中的記錄進(jìn)行加粗或取消加粗顯示。2.4.2附件管理 互聯(lián)網(wǎng)信息采編發(fā)系統(tǒng)可以支持對(duì)任何表單任何記錄插入附件,附件格式可以是圖片或文件。增加附件時(shí)可以選擇放置附件到知識(shí)庫(kù)或放置到文件夾中,對(duì)于入庫(kù)的附件還可以選擇采用壓縮或不壓縮的方法。選擇壓縮的方法可以減小占用知識(shí)庫(kù)空間,而選擇不壓縮的方法可以很方便地支持附件在其它應(yīng)用程序中使用。插入的附件,在自動(dòng)發(fā)布時(shí)將隨著信息記錄一起發(fā)布。無(wú)需單獨(dú)發(fā)布。2.4.3記錄導(dǎo)入互聯(lián)網(wǎng)信息采集專家目前可以支持兩種格式的信息導(dǎo)入功能,即從Excel文件導(dǎo)入和Access文件中導(dǎo)入。首先選擇并打開一個(gè)您要記錄所在的EXCEL或ACCES

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論