


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
計(jì)算機(jī)Web數(shù)據(jù)挖掘技術(shù)在現(xiàn)代商業(yè)中的應(yīng)用論文[關(guān)鍵詞]數(shù)據(jù)挖掘人工智能載體
一、web數(shù)據(jù)挖掘概述
web挖掘是從web資源上抽取信息或?qū)W問的過程,它是將傳統(tǒng)的數(shù)據(jù)挖掘的思想和方法應(yīng)用于web,從web文檔和web活動(dòng)中抽取感愛好的、潛在的、有用的模式和隱蔽信息。web挖掘可在多方面發(fā)揮作用,如搜尋引擎結(jié)構(gòu)的挖掘,搜尋引擎的開發(fā),改進(jìn)和提高搜尋引擎的質(zhì)量和效率,確定權(quán)威頁面。web挖掘討論掩蓋了多個(gè)討論領(lǐng)域,包括數(shù)據(jù)庫技術(shù)、信息獵取技術(shù)、統(tǒng)計(jì)學(xué)、人工智能中的機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等。特殊是電子商務(wù)領(lǐng)域,通過對(duì)用戶特征的理解和分析,如對(duì)用戶訪問行為、頻度、內(nèi)容等的分析,提取出用戶的特征,從而為用戶定制共性化的界面,有助于開展有針對(duì)性的電子商務(wù)活動(dòng)。
二、web挖掘流程以及特點(diǎn)
1.web挖掘的流程
web數(shù)據(jù)挖掘就是利用數(shù)據(jù)挖掘技術(shù)從網(wǎng)絡(luò)文檔和服務(wù)中發(fā)覺和提取信息。與傳統(tǒng)數(shù)據(jù)和數(shù)據(jù)倉庫相比,web上的信息是非結(jié)構(gòu)化或半結(jié)構(gòu)化的、動(dòng)態(tài)的、并且是簡單造成混淆的,所以很難直接以web網(wǎng)頁上的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,而必需經(jīng)過必要的數(shù)據(jù)處理。web挖掘的有以下幾個(gè)過程:
(1)資源發(fā)覺。任務(wù)是從目標(biāo)web文檔中得到數(shù)據(jù),值得留意的是有時(shí)信息資源不僅限于在線web文檔,還包括電子郵件、電子文檔、新聞組,或者網(wǎng)站的日志數(shù)據(jù)甚至是通過web形成的交易數(shù)據(jù)庫中的數(shù)據(jù)。wwW.133229.COM
(2)信息選擇和預(yù)處理。任務(wù)是從取得的web資源中剔除無用信息和將信息進(jìn)行必要的例如從web文檔中自動(dòng)去除廣告連接、去除多余格式標(biāo)記、自動(dòng)識(shí)別段落或者字段并將數(shù)據(jù)組織成規(guī)整的規(guī)律形式甚至是關(guān)系表。
(3)模式發(fā)覺。自動(dòng)進(jìn)行模式發(fā)覺。可以在同一個(gè)站點(diǎn)內(nèi)部或在多個(gè)站點(diǎn)之間進(jìn)行。
(4)模式分析。驗(yàn)證、解釋上一步驟產(chǎn)生的模式??梢允菣C(jī)器自動(dòng)完成,也可以是與分析人員進(jìn)行交互來完成。
2.web挖掘的特點(diǎn)
web挖掘技術(shù)具有很多優(yōu)點(diǎn),如不需要用戶供應(yīng)主觀的評(píng)價(jià)信息;可以處理大規(guī)模的數(shù)據(jù)量;用戶訪問模式動(dòng)態(tài)獵取,不會(huì)過時(shí);使用便利等。但是與傳統(tǒng)數(shù)據(jù)庫和數(shù)據(jù)倉庫相比,web是一個(gè)巨大、分布廣泛、全球性的信息服務(wù)中心,涉及經(jīng)濟(jì)、文化、訓(xùn)練、新聞、廣告、消費(fèi)、消遣、金融、保險(xiǎn)、銷售、電子商務(wù)等信息,內(nèi)容極其豐富,數(shù)據(jù)最大特點(diǎn)就是半結(jié)構(gòu)化;而傳統(tǒng)的數(shù)據(jù)庫中的數(shù)據(jù)結(jié)構(gòu)性很強(qiáng),即其中的數(shù)據(jù)為完全結(jié)構(gòu)化的數(shù)據(jù)。明顯,面對(duì)web的數(shù)據(jù)挖掘比面對(duì)單個(gè)數(shù)據(jù)倉庫的數(shù)據(jù)挖掘要簡單得多,會(huì)面臨許多詳細(xì)問題,主要有:
(1)半結(jié)構(gòu)化數(shù)據(jù)。web頁面以某種格式呈現(xiàn)的半結(jié)構(gòu)化數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)不規(guī)章或不完整,簡單程度遠(yuǎn)遠(yuǎn)高于一般的文本文檔,其數(shù)據(jù)結(jié)構(gòu)隱含、模式信息量大、模式變化快。大量的文檔無任何排列次序,無分類索引。
(2)web是一個(gè)異質(zhì)、分布、動(dòng)態(tài)的信息源。web及其數(shù)據(jù)的更新、增長速度極快,也無固定的模式。web上的信息幾乎都是隱蔽的、潛在的、未知的,從web上發(fā)覺這些未知的信息和有用的模式,僅用傳統(tǒng)的基于關(guān)鍵字的檢索方式很難實(shí)現(xiàn),現(xiàn)在的搜尋引擎尚不具備這些功能。
(3)面對(duì)一個(gè)特別廣泛的形形色色的用戶群體。不同的用戶訪問web的愛好、愛好和使用目的千差萬別,面對(duì)一個(gè)特別廣泛的形形色色的用戶群體,能否使用戶依據(jù)自己的愛好愛好定制網(wǎng)頁,甚至能否依據(jù)發(fā)覺的用戶。自動(dòng)為用戶定制網(wǎng)頁,從而供應(yīng)共性化的信息檢索和查詢服務(wù)。
3.web挖掘在電子商務(wù)中的應(yīng)用
目前對(duì)于,web挖掘的對(duì)象和使用的方法層出不窮,但隨著電子商務(wù)網(wǎng)站的興起,電子商務(wù)將是將來web挖掘的主要進(jìn)展方向之一,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價(jià)值。在當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時(shí),企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù),這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ),同時(shí)高性能計(jì)算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)供應(yīng)了堅(jiān)實(shí)的'保障。介紹以下幾個(gè)方面的應(yīng)用:
(1)分析查找獲得潛在客戶。隨著以客戶為中心的經(jīng)營理念不斷深化人心,分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對(duì)電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析,可以按各種客戶指標(biāo)(如自然屬性、收入貢獻(xiàn)交易額、價(jià)值度等)對(duì)客戶分類,然后確定不同類型客戶的行為模式,以便實(shí)行相應(yīng)的營銷措施,促使企業(yè)利潤的最大化。
比如通過數(shù)據(jù)挖掘可以發(fā)覺購買某種商品的消費(fèi)者是男性還是女性,學(xué)歷、收入如何,有什么愛好,是什么職業(yè)等等。甚至可以發(fā)覺不同的人在購買該種商品的相關(guān)商品后多長時(shí)間有可能購買該種商品,以及什么樣的人會(huì)購買什么型號(hào)的該種商品等等?;蛟S許多因素表面上看起來和購買該種商品不存在任何聯(lián)系,但數(shù)據(jù)挖掘的結(jié)果卻證明他們之間有聯(lián)系。在采納了數(shù)據(jù)挖掘后,針對(duì)目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高,推銷的成本將大大降低。
在對(duì)web的客戶訪問信息的挖掘中,利用分類技術(shù)可以在internet上找到將來的潛在客戶,獲得這些潛在的客戶市場。通常的策略是先對(duì)己經(jīng)存在的訪問者進(jìn)行分類,一般分為三種:“nocustomer”、“visitoronce”“visitorregular”。對(duì)于一個(gè)新的訪問者,通過在web上的分類發(fā)覺,識(shí)別出這個(gè)客戶與己經(jīng)分類的老客戶的一些公共的描述,從而對(duì)這個(gè)新客戶進(jìn)行正確的分類。然后從它的分類推斷這個(gè)新客戶是屬于有利可圖的客戶群,還是屬于無利可圖的客戶群,打算是否要把這個(gè)新客戶作為潛在的客戶來對(duì)待??蛻舻念愋痛_定后,就可以對(duì)客戶動(dòng)態(tài)地展現(xiàn)web頁面,頁面的內(nèi)容取決于客戶與銷售商供應(yīng)的產(chǎn)品和服務(wù)之間的關(guān)聯(lián)。
(2)保留客戶。數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類,在每個(gè)類里的客戶擁有相像的屬性,而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶供應(yīng)完全不同的服務(wù)來提高客戶的滿足度。數(shù)據(jù)挖掘還可以發(fā)覺具有哪些特征的客戶有可能流失,這樣挽留客戶的措施將具有針對(duì)性,挽留客戶的費(fèi)用將下降。對(duì)客戶來說,傳統(tǒng)客戶與銷售商之間的空間距離在電子商務(wù)中己經(jīng)不存在了。在網(wǎng)上,每一個(gè)銷售商對(duì)于客戶來說都是一樣的,那么如何使客戶在自己的銷售站點(diǎn)上駐留更長的時(shí)間,對(duì)銷售商來說將是一個(gè)挑戰(zhàn)。為了達(dá)到這一目的,就應(yīng)當(dāng)了解客戶的掃瞄行為,知道客戶的愛好及需求所在,動(dòng)態(tài)地調(diào)整web頁面,以滿意客戶的需要。通過對(duì)客戶訪問信息的挖掘,就能知道客戶的掃瞄行為,從而了解客戶的愛好及需求。在網(wǎng)上的電子商務(wù)中的一個(gè)典型的序列,恰好就代表了一個(gè)購物者以頁面形式在站點(diǎn)上導(dǎo)航的行為,所以可運(yùn)用web數(shù)據(jù)挖掘中的序列模式發(fā)覺技術(shù)。
(3)聚類客戶。在電子商務(wù)中客戶聚類是一個(gè)重要的方面。通過分組具有相像掃瞄行為的客戶,并分析組中客戶的共同特征,可以關(guān)心電子商務(wù)的組織者更好地了解自己的客戶,向客戶供應(yīng)更適合、更面對(duì)客戶的服務(wù)。例如,有一些客戶都花了一段時(shí)間掃瞄“babytoys”“babyfurniture”頁面,經(jīng)過分析這些客戶被聚類成為一組。銷售商依據(jù)分析出來的聚類信息,就知道這是一組“expectingparents”客戶,對(duì)他們所進(jìn)行的業(yè)務(wù)活動(dòng)當(dāng)然也就不行能同于其他被聚類了的客“collegestudents”、“officeladies”。準(zhǔn)時(shí)調(diào)整頁面及頁面內(nèi)容,使商務(wù)活動(dòng)能夠在肯定程度上滿意客戶的要求,對(duì)客戶和銷售商來說更有意義。
(4)交叉銷售與共性服務(wù)。交叉銷售的好處在于,對(duì)于原有客戶,企業(yè)可以比較簡單地得到關(guān)于這個(gè)客戶的比較豐富的信息,大量的數(shù)據(jù)對(duì)于數(shù)據(jù)挖掘的精確?????性來說是有很大關(guān)心的。在企業(yè)所把握的客戶信息,尤其是以前購買行為的信息中,可能正包含著這個(gè)客戶打算他下一個(gè)購買行為的關(guān)鍵,甚至是打算因素。這個(gè)時(shí)候數(shù)據(jù)挖掘的作用就會(huì)體現(xiàn)出來,它可以關(guān)心企業(yè)查找到這些影響他購買行為的因素。
當(dāng)客戶在電子商務(wù)網(wǎng)站注冊(cè)時(shí),客戶將會(huì)看到帶有客戶姓名的歡迎詞”依據(jù)客戶的訂單紀(jì)錄,系統(tǒng)可以向客戶顯示那些可能引起客戶特別愛好的新商品。當(dāng)客戶留意到一件特別的商品時(shí),系統(tǒng)會(huì)建議一些在購買中可以增加的其他商品。一般的產(chǎn)品名目手冊(cè)經(jīng)常簡潔的按類型對(duì)商品進(jìn)行分組,以簡化客戶選擇商品的步驟。然而對(duì)于在線商店,商品分組可能是完全不同的,它經(jīng)常以針對(duì)客戶的商品補(bǔ)充條目為基礎(chǔ),不僅考慮客戶看
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆河北省唐山市高三下學(xué)期第一次模擬考試政治試題(原卷版+解析版)
- 2025年空調(diào)箱總成合作協(xié)議書
- 5.5顯微鏡和望遠(yuǎn)鏡 說課稿 2025年初中人教版物理八年級(jí)上冊(cè)
- 晚上打瞌睡檢討書
- 關(guān)于志愿者的活動(dòng)方案
- 證監(jiān)局回復(fù)函立案
- 《商業(yè)插畫創(chuàng)意與表現(xiàn)》課件-【5】商業(yè)插畫的材料與表現(xiàn)技法
- 一體化污水處理設(shè)備采購安裝及運(yùn)維 投標(biāo)方案(技術(shù)方案)
- 三農(nóng)村基層教育資源配置與優(yōu)化方案
- 教育行業(yè)教師培訓(xùn)與成長計(jì)劃
- FZ∕T 01085-2018 粘合襯剝離強(qiáng)力試驗(yàn)方法
- 白龍江引水工程環(huán)境影響報(bào)告書(公示版)
- 《短視頻拍攝與制作》課件-3短視頻中期拍攝
- 瀏陽煙花術(shù)語大全
- 五星級(jí)酒店前廳管理常用表格
- 居民心理健康知識(shí)講座課件
- 《養(yǎng)老護(hù)理員》-課件:老年人安全防范及相關(guān)知識(shí)
- 2024年英語專業(yè)四級(jí)考試真題及詳細(xì)答案
- 成語故事葉公好龍
- MHT:中小學(xué)生心理健康檢測(含量表與評(píng)分說明)
- 制度修訂培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論