網(wǎng)站設(shè)計(jì)外文翻譯_第1頁
網(wǎng)站設(shè)計(jì)外文翻譯_第2頁
網(wǎng)站設(shè)計(jì)外文翻譯_第3頁
網(wǎng)站設(shè)計(jì)外文翻譯_第4頁
網(wǎng)站設(shè)計(jì)外文翻譯_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 數(shù)據(jù)挖掘: 小型企業(yè)的網(wǎng)站設(shè)計(jì) 摘要 - 網(wǎng)站是公司用來發(fā)布企業(yè)營銷策略和信息的工具 ,是為了擴(kuò)大銷售范圍以及提供相關(guān)技術(shù)支持等服務(wù)而建立的。為了方便全球的用戶和企業(yè)之間更加方便的溝通和查詢。這個論文將描述智能系統(tǒng)在為小型企業(yè)滿足客戶需求方面而做出的貢獻(xiàn),和智能系統(tǒng)應(yīng)用于web數(shù)據(jù)挖掘的好處。關(guān)鍵詞:提取、知識挖掘、數(shù)據(jù)挖掘。1. 前言介紹 Web挖掘是在萬維網(wǎng)中進(jìn)行數(shù)據(jù)的查找和挖掘;這些數(shù)據(jù)是在web頁面顯示出來的或與查詢信息相關(guān)的一些網(wǎng)絡(luò)數(shù)據(jù);當(dāng)前用戶在使用數(shù)據(jù)挖掘時所面臨的問題是:1- 檢測相關(guān)信息.2- 發(fā)現(xiàn)現(xiàn)有的但是“隱含”的信息。 當(dāng)用戶登錄到網(wǎng)站, 他們想要從網(wǎng)站查詢一些信息.

2、為了解決這個問題,我們需要使用不同地區(qū)的多種方法,。 例如:專家集成技能的系統(tǒng)、人工智能、數(shù)據(jù)庫和信息檢索的方法如結(jié)構(gòu)話語言查詢. 簡而言之,數(shù)據(jù)挖掘就是從web文檔和信息中自動發(fā)現(xiàn)和分析出有價值的信息的一種挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)通過網(wǎng)絡(luò)實(shí)現(xiàn)了新方法和新系統(tǒng)的結(jié)合,并在軟硬件環(huán)境支持下過程中快速發(fā)展 。2. 數(shù)據(jù)挖掘技術(shù)在信息管理使用中的優(yōu)點(diǎn) 為了更好的理解數(shù)據(jù)挖掘技術(shù)的優(yōu)點(diǎn),作者表示,一個戰(zhàn)略型的網(wǎng)站是能夠體現(xiàn)自身長處并且能夠描述影響客戶購買行為的。 2.1 客戶行為 顧客的行為是影響任何一個企業(yè)成功的關(guān)鍵因素??蛻粜袨楸憩F(xiàn)在客戶瀏覽公司的網(wǎng)站的頻率,通過數(shù)據(jù)能使該公司計(jì)算新老客戶的數(shù)量以及

3、獲得的利益, 通過分析老客戶在網(wǎng)站上的訪問量,將客戶購買的數(shù)量與客戶訪問量進(jìn)行比較。例如X是一家銷售電腦硬件的小型公司,并且比其他硬件公司提供了更加具有競爭力的價格,如果購買數(shù)量超過了預(yù)期的數(shù)量也就意味著該硬件公司制作的公司網(wǎng)站的是成功的。web數(shù)據(jù)挖掘的操作十分簡單.但是,如果這個技術(shù)使用上有戰(zhàn)略上的問題,也就不能夠與顧客進(jìn)行有效的溝通。此外,公司也可以通過該網(wǎng)站得到顧客的反饋信息(間接地方式)去了解客戶的購買需求和購買習(xí)慣,通過顧客的瀏覽數(shù)據(jù)來控制和整理顧客需求的類型。2.2 網(wǎng)站的優(yōu)勢 通過分析公司網(wǎng)站中客戶反饋的視圖,發(fā)現(xiàn)網(wǎng)站自身的優(yōu)點(diǎn),并且根據(jù)網(wǎng)站顯示的購買情況來分析有能力購買的客戶

4、所在的地域。作為一個小公司,就要使用web數(shù)據(jù)挖掘技術(shù)在有限的資源中來挖掘有效的信息來節(jié)省開支,也就是說用最低的價格來設(shè)計(jì)出符合商務(wù)戰(zhàn)略的戰(zhàn)略型網(wǎng)站。小企業(yè)在有限的預(yù)算和資源的限制下,相比起大中型企業(yè)來說,在使用web數(shù)據(jù)挖掘中面臨的有形或無形問題更多。3. 使用數(shù)據(jù)挖掘提高站點(diǎn)可用性 在網(wǎng)站中使用數(shù)據(jù)挖掘技術(shù)能夠提高網(wǎng)站站點(diǎn)的可用性 ; 提高可用行的第一個步驟是收集、分析所有的用戶需求。這個分析可以是通過使用關(guān)聯(lián)詞搜索,使公司的管理人員根據(jù)關(guān)聯(lián)規(guī)則來發(fā)現(xiàn)這些技術(shù)規(guī)格的相同點(diǎn)。使用這種分析方式將會增加該公司客戶交互的概率。3.1 為什么要使用數(shù)據(jù)挖掘技術(shù)? 因?yàn)樵诿媾R大量的復(fù)雜的超鏈接和文本文

5、檔時,高效快速的找到相關(guān)信息是在web使用中一大難題。-首先,文本文檔的多樣復(fù)雜增加了搜索的困難性。 其次,從web網(wǎng)頁查找和搜索數(shù)據(jù)的時間較長。因此,查找所需的數(shù)據(jù)需要利用數(shù)據(jù)挖 掘技術(shù)。-互聯(lián)網(wǎng)從不同的智能終端連接了大量的數(shù)據(jù),這些數(shù)據(jù)影響顧客購買行為的關(guān)鍵因素,當(dāng)他們想要購買或者想與其他類型的產(chǎn)品做比較時,可以在網(wǎng)上查詢其他公司的產(chǎn)品的信息.- 為了衡量網(wǎng)站的質(zhì)量,確定出網(wǎng)站中最有價值的部分,其中包含了關(guān)鍵數(shù)據(jù)以及提高用戶檢索能力所需要知識。3.2 電子商務(wù)和數(shù)據(jù)挖掘過程的關(guān)系 為了說明該網(wǎng)站實(shí)現(xiàn)的銷售過程, 見圖一,有四個步驟 7.這個步驟的分析將使開發(fā)人員能夠理解市場的有效因子和在線

6、商店的重要性,業(yè)務(wù)分析師分析報(bào)告基于客戶的日志文件和消費(fèi)者購買的數(shù)量。 通過調(diào)查這些報(bào)告確定網(wǎng)站的長處與弱點(diǎn),從而去提供生產(chǎn)產(chǎn)品,發(fā)展商店盈利6 3.3 設(shè)計(jì)中的挑戰(zhàn)設(shè)計(jì)師在設(shè)計(jì)戰(zhàn)略型智能網(wǎng)站時將在兩個階段面臨兩大挑戰(zhàn):1- 抽象層次 這個層次包括分析、收集數(shù)據(jù)的階段,對那些將影響利潤(利潤損失賬戶)(市場購物欄分析)的組織,如競爭對手,將會創(chuàng)建一個傳統(tǒng)設(shè)計(jì)的網(wǎng)頁,允許客戶大量數(shù)據(jù)訪問3.2- 服務(wù)層次 在這一層面上,組織將為客戶提供更多的智能工具(如專家系統(tǒng)),加快網(wǎng)站在中的搜索,讓智能搜索系統(tǒng)與網(wǎng)站更好的協(xié)作,為各科提供服務(wù)5 和9。 4. 網(wǎng)站挖掘任務(wù) 所有與網(wǎng)站設(shè)計(jì)階段有關(guān)的管理問題都

7、應(yīng)該通過正確使用數(shù)據(jù)挖掘技術(shù)來設(shè)計(jì)智能服務(wù)的業(yè)務(wù)流程,網(wǎng)站挖掘有以下業(yè)務(wù)流程: 圖1.業(yè)務(wù)流程134.1 web文件自動分類 網(wǎng)站中應(yīng)該有搜索引擎作為智能工具來快速服務(wù)客戶需求, 搜索引擎是將關(guān)鍵詞的文檔分類成子文檔查詢,能夠提高查詢速度,節(jié)省查詢時間。 5. 典型分類模式是用獨(dú)特的方式滿足整套業(yè)務(wù)培訓(xùn),并且設(shè)定相同類別的電子檔案分類,有幾個很好的典型工具能夠被開發(fā)商使用,例如,貝氏分類法,關(guān)鍵字關(guān)聯(lián)分析的基礎(chǔ)11。此外數(shù)據(jù)挖掘作為智能工具,它能夠?yàn)槊恳晃蛔缘卿浘W(wǎng)站的客戶直接創(chuàng)建個人檔案,并對他/她的特征進(jìn)行分類,自動識別出他/她的興趣類別2,然后對所有的客戶進(jìn)行分類,通過web分析8和11

8、來判斷他們的購買習(xí)慣,促使經(jīng)營者根據(jù)這些分類來保持良好業(yè)務(wù)流程。4.2 挖掘web頁面的語義結(jié)構(gòu)和頁面內(nèi)容 網(wǎng)站設(shè)計(jì)應(yīng)該知道在一個特定的頁面中有什么樣的結(jié)構(gòu)和語義,需要他們提取網(wǎng)頁中的數(shù)據(jù)包括: 非結(jié)構(gòu)化數(shù)據(jù):文本。 半結(jié)構(gòu)化數(shù)據(jù):html文檔。 結(jié)構(gòu)化數(shù)據(jù)或其他:數(shù)據(jù)組織表格。 大多數(shù)商業(yè)網(wǎng)站數(shù)據(jù)是非結(jié)構(gòu)化的,是不能了解客戶需求的,通過使用數(shù)據(jù)挖掘技術(shù)來組織和整理加工數(shù)據(jù),將整合出的具有特殊含義的信息傳輸給顧客。 綜上而論, 挖掘網(wǎng)頁的內(nèi)容可以觀察到信息檢索的方法和所依賴的數(shù)據(jù)庫。 信息檢索: 能夠幫助顧客提高搜索信息的速度,處理所有類型的web內(nèi)容的數(shù)據(jù)。 數(shù)據(jù)庫: 數(shù)據(jù)庫是在網(wǎng)頁上通過適

9、當(dāng)?shù)姆椒ń?shù)據(jù),它使顧客通過搜索關(guān)鍵詞或相關(guān)查詢來更方便簡單的處理數(shù)據(jù),數(shù)據(jù)庫與信息管理應(yīng)用程序是息息相關(guān)的。 例如: x公司所建立的網(wǎng)站包含5個頁面,頁面 (P) = a, b, c, d, e, 顧客從主頁 (a)進(jìn)入網(wǎng)站, 然后通過超文本鏈接瀏覽其他網(wǎng)頁來找到想要查詢的的信息. 因此,遠(yuǎn)程連接信息 (S)就是S = ae, cd, bde, cecd, etc,通過進(jìn)入主頁(a)直接進(jìn)入到(ae是一個進(jìn)入5頁面的入口. 這里面包含了多種的連接方式。 這些遠(yuǎn)程鏈接信息的序列將會幫助開發(fā)商更好的理解兩個頁面之間的結(jié)構(gòu)和關(guān)聯(lián),從而幫助他們找到更多機(jī)會去合并,增加或者刪除數(shù)據(jù), 從而改善網(wǎng)站的

10、總體結(jié)構(gòu)。.下面的表1中對分析過程中會話的序列做了一個解釋。4.3 挖掘頁面動力學(xué) 識別頁面動力學(xué)是數(shù)據(jù)挖掘的一個重要組成部分,它可以描述網(wǎng)頁的變化,分析網(wǎng)頁中上下文數(shù)據(jù)的語義結(jié)構(gòu),分析頁面內(nèi)容和頁面中使用的存儲模式。 當(dāng)開發(fā)者想要更新網(wǎng)頁的內(nèi)容或檢測出存儲歷史信息的改變時,頁面動力學(xué)就顯得十分重要了。通過使用這種技術(shù), 顧客可以發(fā)現(xiàn)能夠使他們找到更多關(guān)于web頁面訪問模式的計(jì)程儀日志, 這種技術(shù)的成功取決于人們可以挖掘出多少脫離了原始數(shù)據(jù)并且存儲在數(shù)據(jù)庫中的有價值的知識。 因此開發(fā)商和分析員應(yīng)該將原始數(shù)據(jù)過濾和轉(zhuǎn)化成為有價值的信息,使信息的提取過程更加簡單快捷。他們也應(yīng)該創(chuàng)建依賴于URL,數(shù)

11、據(jù)庫,和IP地址的多維視圖的網(wǎng)頁,使顧客在頁面選項(xiàng)的選擇上更加一目了然。5. 網(wǎng)站設(shè)計(jì)成功的概念 為了擁有一個成功的網(wǎng)站,在網(wǎng)站設(shè)計(jì)的時候應(yīng)該注意企業(yè)業(yè)務(wù)策略和企業(yè)目標(biāo)。想要確定網(wǎng)站的目標(biāo),應(yīng)該去測量能夠指定的分析環(huán)境的質(zhì)量。目標(biāo)的特征是,完成成功要素的分析應(yīng)該做到與問題說明步驟相一致。 表1. 分析會話序列編號會話序列1ae(a,1) (e,1)2cd(c,1) (d,1)3bde(b,1) (d,1) (e,1)4cecd(c,1)(e,1)(c,2)(d1)5.1 從網(wǎng)站中提取知識 從網(wǎng)站中提取信息的目標(biāo)在數(shù)據(jù)挖掘中是從網(wǎng)頁中提取出有價值的信息,使顧客的購買或其他行動更加方便輕松 , 這種功能的實(shí)現(xiàn)是需要真正的了解該網(wǎng)頁 , 當(dāng)網(wǎng)站中有大量的數(shù)據(jù)和鏈接時,能夠保證創(chuàng)建有結(jié)構(gòu)的、便于操作的檢索知識時沒有任何沖突。 對于收集信息來說,最有效的系統(tǒng)便是搜集系統(tǒng):它是幫助終端用戶從不同來源收集信息的一套工具 , 這些信息對于顧客甚至是組織用戶來說有可能是龐大的或者有難度的視圖。因此,開發(fā)人員建議網(wǎng)站中應(yīng)該有在線分析工具去分析繁雜的信息,例如,聯(lián)機(jī)分析處理 (OLAP), 這個工具是可以幫助使用者更好更方便的理解復(fù)雜信息的。 6. 總結(jié) 數(shù)據(jù)挖掘根據(jù)開發(fā)的范圍可以被分為3類:內(nèi)容挖掘, 結(jié)構(gòu)挖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論