談數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用_第1頁
談數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用_第2頁
談數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用_第3頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

談數(shù)據(jù)挖掘技術(shù)在第三方物流企業(yè)的應(yīng)用內(nèi)容內(nèi)容摘要:數(shù)據(jù)發(fā)掘是商務(wù)智能技術(shù)的主要構(gòu)成部分,是一個新的主要的研究領(lǐng)域。本文介紹了商務(wù)智能技術(shù)應(yīng)用現(xiàn)在狀況和構(gòu)成,論述了數(shù)據(jù)發(fā)掘技術(shù)在第三方物流企業(yè)的應(yīng)用。本文關(guān)鍵詞語:商務(wù)智能數(shù)據(jù)發(fā)掘第三方物流研究在當(dāng)今競爭日益劇烈的市場環(huán)境中,第三方物流企業(yè)都希望能夠從浩如煙海的商務(wù)數(shù)據(jù)以及其他相關(guān)的物流業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)帶來巨額利潤的商機(jī)。只要那些利用先進(jìn)的成功地采集、分析、理解信息并根據(jù)信息進(jìn)行的物流企業(yè)能力獲得競爭優(yōu)勢,才是物流市場的贏家。因而,越來越多的物流管理者開始借助商務(wù)智能技術(shù)來發(fā)現(xiàn)物流運(yùn)營經(jīng)過中存在的問題,找到有利的物流解決方案。商務(wù)智能技術(shù)應(yīng)用現(xiàn)在狀況我們國家參加了wto,在很多領(lǐng)域,如金融、保險、物流等領(lǐng)域?qū)⒅鸩綄ν忾_放,這就意味著很多第三方物流企業(yè)將面臨來自國際大型跨國物流公司的宏大競爭壓力。國外發(fā)達(dá)國家各種企業(yè)采取商務(wù)智能的水平已經(jīng)遠(yuǎn)遠(yuǎn)跨越了我們國家。美國paloalto管理集團(tuán)公司1999年對歐洲、北美和日本375家大中型企業(yè)的商務(wù)智能技術(shù)的采取情況進(jìn)行了調(diào)查。結(jié)果顯示,在金融領(lǐng)域,商務(wù)智能技術(shù)的應(yīng)用水平已經(jīng)到達(dá)或接近70%,在營銷領(lǐng)域也到達(dá)50%,而且在其他應(yīng)用領(lǐng)域?qū)υ摷夹g(shù)的采用水平都提升約50%。如今,很多第三方物流企業(yè)都把數(shù)據(jù)看成難得珍貴的財富,紛紛利用商務(wù)智能發(fā)現(xiàn)其中隱藏的信息,借此獲得巨額的回報。據(jù)idc對歐洲和北美62家采取了商務(wù)智能技術(shù)的企業(yè)的調(diào)查分析發(fā)現(xiàn),這些企業(yè)的3年平均投資回報率為401%,其中25%的企業(yè)的投資回報率跨越600%。調(diào)查結(jié)果還顯示,一個企業(yè)要想在復(fù)雜的環(huán)境中獲得成功,高層管理者必需能夠控制極其復(fù)雜的商業(yè)構(gòu)造,若沒有詳實的事實和數(shù)據(jù)支持,是很難辦到的。因而,隨著數(shù)據(jù)發(fā)掘技術(shù)的不斷改良和日益成熟,它必將被更多的第三方物流企業(yè)采取,使更多的物流管理者得到更多的商務(wù)智能。商務(wù)智能技術(shù)的構(gòu)成詳細(xì)地說,商務(wù)智能技術(shù)有數(shù)據(jù)倉庫(datawarehousing)、聯(lián)機(jī)分析處理(on-lineanalyticalprocessing,簡稱olap)、數(shù)據(jù)發(fā)掘〔datamining〕,包含這三者在內(nèi)的用于綜合、探察和分析商務(wù)數(shù)據(jù)的先進(jìn)的信息技術(shù)的統(tǒng)稱就是商務(wù)智能技術(shù)。數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化的重要用于決策支持的數(shù)據(jù)的集合。一般來說,大的物流公司或企業(yè)內(nèi)存在著各種各樣的信息系統(tǒng),這些應(yīng)用驅(qū)動的操作型信息系統(tǒng)為企業(yè)不同的物流業(yè)務(wù)系統(tǒng)效勞,具有不同接口和不同的數(shù)據(jù)表示方法,相互孤立。利用數(shù)據(jù)倉庫技術(shù)能夠動態(tài)地將各個物流企業(yè)子系統(tǒng)中的數(shù)據(jù)抽取集成到一起,進(jìn)行清洗、轉(zhuǎn)換等處理之后加載到數(shù)據(jù)倉庫中,通過周期性的刷新,為物流用戶提供一個統(tǒng)一的干凈的數(shù)據(jù)視圖,為數(shù)據(jù)分析提供一個高質(zhì)量的數(shù)據(jù)源。對于數(shù)據(jù)倉庫中的數(shù)據(jù),能夠使用一些加強(qiáng)的查詢和報表工具進(jìn)行復(fù)雜的查詢和即時的報表制造,能夠利用olap技術(shù)從多種角度對物流業(yè)務(wù)數(shù)據(jù)進(jìn)行多方面的匯總、統(tǒng)計、計算,還能夠利用數(shù)據(jù)發(fā)掘技術(shù)自動發(fā)現(xiàn)其中隱含的有用的物流信息。數(shù)據(jù)發(fā)掘又稱知識發(fā)現(xiàn)〔knowledgediscoveryindatabase,簡稱kdd〕,是從大量數(shù)據(jù)中抽取有意義的、隱含的、以前未知的并有潛在使用價值的知識的經(jīng)過。數(shù)據(jù)發(fā)掘是一個多學(xué)科穿插性學(xué)科,它牽涉統(tǒng)計學(xué)、數(shù)據(jù)庫、形式辨別、可視化以及高性能計算等多個學(xué)科。利用數(shù)據(jù)發(fā)掘技術(shù)能夠分析各種類型的數(shù)據(jù),例如構(gòu)造化數(shù)據(jù)、半構(gòu)造化數(shù)據(jù)以及非構(gòu)造化數(shù)據(jù)、靜態(tài)的歷史數(shù)據(jù)和動態(tài)數(shù)據(jù)流數(shù)據(jù)等。數(shù)據(jù)發(fā)掘技術(shù)在第三方物流企業(yè)的應(yīng)用分析數(shù)據(jù)發(fā)掘是從大量的、不完全的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的數(shù)據(jù)中發(fā)現(xiàn)其潛在規(guī)律的技術(shù),是當(dāng)下計算機(jī)科學(xué)研究的熱門之一。隨著信息技術(shù)的高速發(fā)展,積累的有關(guān)物流行業(yè)的數(shù)據(jù)量劇增,怎樣從大量的物流數(shù)據(jù)中提取有用的知識成為第三方物流企業(yè)燃眉之急。數(shù)據(jù)發(fā)掘就是為順應(yīng)需要應(yīng)運(yùn)而生發(fā)展起來的數(shù)據(jù)處理技術(shù)。數(shù)據(jù)發(fā)掘的對象關(guān)系數(shù)據(jù)庫(relationaldatabase)中通常存儲和管理的是構(gòu)造化的數(shù)據(jù),它將一個實體的各方面信息通過離散的屬性進(jìn)行描繪敘述。而文本數(shù)據(jù)庫〔textdatabase〕或文檔數(shù)據(jù)庫〔documentdatabase〕則通常存儲和管理的是半構(gòu)造化的數(shù)據(jù),例如新聞稿件、研究論文、電子郵件、書籍以及web頁面等都屬于半構(gòu)造化數(shù)據(jù)??臻g數(shù)據(jù)庫、多媒體數(shù)據(jù)庫中存放的是非構(gòu)造化數(shù)據(jù),例如地圖、圖片、音頻、視頻等都屬于非構(gòu)造化數(shù)據(jù)。相對于半構(gòu)造化和非構(gòu)造化數(shù)據(jù)來說,針對構(gòu)造化數(shù)據(jù)的數(shù)據(jù)發(fā)掘技術(shù)比較成熟,市場上有許多的商品軟件能夠使用,用的較多的包含ibmintelligentminer、sasenterpriseminer、sgimineset、clementinespss以及microsoftsqlserver2000等。關(guān)于半構(gòu)造化和非構(gòu)造化的數(shù)據(jù)發(fā)掘軟件尚不多,相應(yīng)的算法相對還較少。從另一個角度來說,數(shù)據(jù)發(fā)掘的分析對象分為兩種類型:靜態(tài)數(shù)據(jù)和數(shù)據(jù)流〔datastream〕數(shù)據(jù)。如今的多數(shù)數(shù)據(jù)發(fā)掘算法是用于分析靜態(tài)數(shù)據(jù)的。數(shù)據(jù)發(fā)掘的分析無論要分析的數(shù)據(jù)對象的類型怎樣,常用的數(shù)據(jù)發(fā)掘分析包含關(guān)聯(lián)分析、序列分析、分類、預(yù)測、聚類分析以及時間序列分析等。關(guān)聯(lián)分析關(guān)聯(lián)分析是由rakeshapwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類主要的、可被發(fā)現(xiàn)的知識。關(guān)聯(lián)分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個閥值來度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引入興趣度、相關(guān)性等參數(shù),使得所發(fā)掘的規(guī)則更符合需求。關(guān)聯(lián)分析重要用于發(fā)現(xiàn)不同事件之間的關(guān)聯(lián)性,即一個事件發(fā)生的同時,另一個事件也經(jīng)常發(fā)生。關(guān)聯(lián)分析的重點在于快速發(fā)現(xiàn)那些有實用價值的關(guān)聯(lián)發(fā)生的事件。其重要根據(jù)是事件發(fā)生的概率和條件概率應(yīng)該符合一定的統(tǒng)計意義。對于構(gòu)造化的數(shù)據(jù),以物流客戶的采購習(xí)慣數(shù)據(jù)為例,利用關(guān)聯(lián)分析,能夠發(fā)現(xiàn)物流客戶的關(guān)聯(lián)采購需要。例如,對于第三方物流企業(yè)來說,一個托運(yùn)貨物的貨主很可能同時有貨物的包裝、流通加工等物流業(yè)務(wù)的需求。利用這種知識能夠采用積極的物流運(yùn)營策略,擴(kuò)展物流客戶采購物流效勞的范圍,吸引更多的物流客戶。通過調(diào)整效勞的內(nèi)容便于物流顧客采購到各種物流效勞,或者通過降低一種物流業(yè)務(wù)的價格來促進(jìn)另一種物流業(yè)務(wù)的銷售等。分類分析分類分析是通過分析具有類其余樣本的特點,得到?jīng)Q定樣本屬于各種類其余規(guī)則或方法。利用這些規(guī)則和方法對未知類其余樣本分類時應(yīng)該具有一定的精確度。分類分析能夠根據(jù)顧客的消費水安然平靜基本特征對物流顧客進(jìn)行分類,找出對第三方物流企業(yè)有較大利益奉獻(xiàn)的主要的物流客戶的特征,通過對其進(jìn)行個性化物流效勞,提升他們的忠實度。聚類分析聚類分析是根據(jù)物以類聚的原理,將自己沒有類其余樣本聚集成不同的組,而且對每一個這樣的組進(jìn)行描繪敘述的經(jīng)過。其重要根據(jù)是聚到同一個組中的樣本應(yīng)該相互類似,而屬于不同組的樣本應(yīng)該足夠不類似。以第三方物流企業(yè)的客戶關(guān)系管理為例,利用聚類分析,根據(jù)物流客戶的個人特征以及物流業(yè)務(wù)消費數(shù)據(jù),能夠?qū)⒖蛻羧后w進(jìn)行細(xì)分。例如,能夠得到這樣的一個物流業(yè)務(wù)消費群體:生產(chǎn)企業(yè)對物流業(yè)務(wù)中運(yùn)輸需求占41%,對物流業(yè)務(wù)中倉儲業(yè)務(wù)的需求占23%;商業(yè)企業(yè)對物流業(yè)務(wù)中運(yùn)輸需求占59%,對物流業(yè)務(wù)中倉儲業(yè)務(wù)需求占77%。針對不同的客戶群,能夠施行不同的物流效勞方式,進(jìn)而提升客戶的滿意度。數(shù)據(jù)發(fā)掘流程定義問題:第三方物流企業(yè)首先清楚明晰地定義出各種物流業(yè)務(wù)問題,確定數(shù)據(jù)發(fā)掘的目的。數(shù)據(jù)預(yù)備:首先第三方物流企業(yè)在大型數(shù)據(jù)庫和數(shù)據(jù)倉庫目的中提取數(shù)據(jù)發(fā)掘的目的數(shù)據(jù)集進(jìn)行數(shù)據(jù)選擇;其次進(jìn)行數(shù)據(jù)的預(yù)處理,包含檢查數(shù)據(jù)的完好性及數(shù)據(jù)的一致性、填補(bǔ)丟失的域,刪除無效數(shù)據(jù)等。數(shù)據(jù)發(fā)掘:第三方物流企業(yè)根據(jù)數(shù)據(jù)功能的類型和數(shù)據(jù)的特點選擇相應(yīng)的算法,在凈化和轉(zhuǎn)換過的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)發(fā)掘。結(jié)果分析:第三方物流企業(yè)對數(shù)據(jù)發(fā)掘的結(jié)果進(jìn)行解釋和評價,轉(zhuǎn)換成為能夠最終被理解的知識。知識的運(yùn)用:第三方物流企業(yè)將分析所得到的知識集成到物流業(yè)務(wù)信息系統(tǒng)的組織構(gòu)造中去。評價數(shù)據(jù)發(fā)掘軟件需要考慮的問題越來越多的軟件供給商參加了數(shù)據(jù)發(fā)掘這一領(lǐng)域的競爭。第三方物流企業(yè)怎樣正確評價一個商業(yè)軟件,選擇適宜的軟件成為數(shù)據(jù)發(fā)掘成功應(yīng)用的關(guān)鍵。評價一個數(shù)據(jù)發(fā)掘軟件重要應(yīng)從下面四個重要方面:計算性能:如該軟件能否在不同的物流業(yè)務(wù)平臺運(yùn)行;軟件的架構(gòu);能否連接不同的數(shù)據(jù)源;操作大數(shù)據(jù)集時,性能變化是線性的還是指數(shù)的;算的效率;能否基于組件構(gòu)造易于擴(kuò)展;運(yùn)行的穩(wěn)定性等;功能性:如軟件能否提供足夠多樣的算法;能否避免發(fā)掘經(jīng)過黑箱化;軟件提供的算法能否應(yīng)用于多種類型的數(shù)據(jù);第三方物流企業(yè)能否調(diào)整算法和算法的參數(shù);軟件能否從數(shù)據(jù)集隨機(jī)抽取數(shù)據(jù)建立預(yù)發(fā)掘模型;能否以不同的形式表現(xiàn)發(fā)掘結(jié)果等。可用性:如用戶界面能否友好;軟件能否易學(xué)易用;軟件面對的用戶是初學(xué)者、高級用戶還是專家;毛病報告對用戶調(diào)試能否有很大幫助。輔助功能:如能否允許第三方物流企業(yè)更改數(shù)據(jù)集中的毛病值或進(jìn)行數(shù)據(jù)清洗;能否允許值的全局替代;能否將連續(xù)數(shù)據(jù)離散化;能否根據(jù)用戶制訂的規(guī)則從數(shù)據(jù)集中提取子集;能否將數(shù)據(jù)中的空值用某一適當(dāng)均值或用戶指定的值代替;能否將一次分析的結(jié)果反應(yīng)到另

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論