版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)信息知識決策行動利潤MISBIDSS&專家系統(tǒng) 決策支持系統(tǒng)、商務(wù)智能以及專家系統(tǒng)在組織信息管理過程中發(fā)揮的作用BI&DSSMIS(ERP、CRM、SCM)EDPSDSS與BI在組織IS中的地位第一節(jié) 決策支持 1 第二節(jié) 商務(wù)智能2第五章 決策支持和商務(wù)智能第一節(jié) 決策支持決策1 決策支持系統(tǒng)2 群體決策支持系統(tǒng)3專家系統(tǒng)4決策及相關(guān)知識5.1.1管理的重點在于經(jīng)營,經(jīng)營的中心在于決策.決策貫穿管理活動的始終,管理的過程主要是決策及其實施的過程 .決策是企業(yè)最重要、意義最重大的活動之一.由于決策問題的范圍和規(guī)模越來越大,越來越復(fù)雜,變化越來越快,迫切要求引進(jìn)科學(xué)決策方法,以提高決策水平。
2、決策是為了實現(xiàn)特定的目標(biāo),根據(jù)客觀的可能性,在占有一定信息和經(jīng)驗的基礎(chǔ)上,借助一定的工具、技巧和方法,對影響目標(biāo)實現(xiàn)的諸因素進(jìn)行分析、計算和判斷、選擇后,對未來行動做出的決定。決策是人們在政治、經(jīng)濟(jì)、技術(shù)、工作和日常生活中普遍存在的一種行為。決策的概念 1決策的過程四個階段 2情報階段:發(fā)現(xiàn)問題設(shè)計階段:找出可行性方案選擇階段:找出適合的方案實施階段:方案實施返回情報階段返回設(shè)計階段返回選擇階段結(jié)構(gòu)化決策有時也稱為程序化決策,結(jié)構(gòu)化決策問題相對比較簡單、直接,其決策過程和決策方法有固定的規(guī)律可以遵循,能用明確的語言和模型加以描述,并可依據(jù)一定的通用模型和決策規(guī)則實現(xiàn)其決策過程的基本自動化。企業(yè)
3、的訂貨和物資供應(yīng)等,通??捎眠\(yùn)籌學(xué)、計算機(jī)仿真和管理信息系統(tǒng)等來解決。 計算工資選擇商品(簡單的價格比較)決策問題的類型3結(jié)構(gòu)化決策案例:選擇一種新的打包機(jī)所進(jìn)行的結(jié)構(gòu)化決策 非結(jié)構(gòu)化決策問題是指那些決策過程復(fù)雜,其決策過程和決策方法沒有固定的規(guī)律可以遵循,沒有固定的決策規(guī)則和通用模型可依,決策者的主觀行為(學(xué)識、經(jīng)驗、直覺、判斷力、洞察力、個人偏好和決策風(fēng)格等)對各階段的決策效果有相當(dāng)?shù)挠绊?。是否引進(jìn)一條新的生產(chǎn)線是否發(fā)動一場廣告宣傳戰(zhàn)是否改變公司的形象決策問題的類型3非結(jié)構(gòu)化決策案例:為產(chǎn)品的發(fā)展方向做出的決策 半結(jié)構(gòu)化決策問題介于上述兩者之間,其決策過程和決策方法有一定規(guī)律可以遵循,但又
4、不能完全確定,即有所了解但不全面,有所分析但不確切,有所估計但不確定。這樣的決策問題一般可適當(dāng)建立模型,但無法確定最優(yōu)方案。股票市場的投資分析選擇合適的工作決策問題的類型3半結(jié)構(gòu)化決策決策支持系統(tǒng)的目標(biāo)是幫助人們分析信息找出商務(wù)智能,進(jìn)而發(fā)現(xiàn)知識. 術(shù)語“決策支持系統(tǒng)”是指可以輔助人們決策的任何計算機(jī)化的系統(tǒng).決策支持系統(tǒng)5.1.2從狹義上講,決策支持系統(tǒng)是一種高度靈活且具有良好交互性的,主要用于對半結(jié)構(gòu)化和非結(jié)構(gòu)化問題的決策提供輔助支持的信息系統(tǒng)。決策支持系統(tǒng)將決策者具有的經(jīng)驗、直覺、判斷能力等和信息技術(shù)本身特定的功能聯(lián)系在一起,使二者都能發(fā)揮各自的優(yōu)勢。決策支持系統(tǒng)的含義1決策者與決策支持
5、系統(tǒng)的結(jié)合決策者的優(yōu)勢DSS的優(yōu)勢IT的優(yōu)勢經(jīng)驗直覺判斷知識提高生產(chǎn)率增進(jìn)理解加快速度提高靈活性減少問題的復(fù)雜性降低成本速度信息處理能力DSS的主要功能就是通過加強(qiáng)決策者的洞察力來對決策者提供幫助,改善決策者的決策效果。決策者的知識技能與IT的強(qiáng)大功能相結(jié)合,使決策者能更迅速地響應(yīng)市場的變化以及更高效地管理資源早期的管理信息系統(tǒng)主要為管理者提供預(yù)定的報告,而DSS則是在人和計算機(jī)交互的過程中幫助決策者探索可能的方案,為管理者提供決策所需的信息。管理信息系統(tǒng)和決策支持系統(tǒng)各自代表了信息系統(tǒng)發(fā)展過程中的某一階段,但至今它們?nèi)栽诓粩嗟匕l(fā)展,而且是相互交叉的關(guān)系。管理信息系統(tǒng)是面向管理的信息系統(tǒng),決策
6、支持系統(tǒng)則是面向決策的信息系統(tǒng)。決策支持系統(tǒng)在組織中可能是一個獨立的系統(tǒng),也可能作為管理信息系統(tǒng)的一個高層子系統(tǒng)而存在。DSS不同于傳統(tǒng)的管理信息系統(tǒng)一家國有保險公司在給有酒后駕車(DUI)歷史的司機(jī)保險時,利用DSS分析公司遭受風(fēng)險的金額。系統(tǒng)揭示出:以前有一次(DUI)歷史的40歲以上的已婚有房男性很少再次犯規(guī),通過降低這些人的保險費(fèi)率,公司在不增加遭受風(fēng)險損失的情況下,提高了市場占有率。CRM是許多成功的公司戰(zhàn)略的重要組成部分,而DSS是CRM的重要組成部分。華爾街的零售業(yè)經(jīng)濟(jì)公司利用決策支持系統(tǒng)分析客戶行為和目標(biāo),從而展現(xiàn)機(jī)遇并警示經(jīng)紀(jì)人注意最新出現(xiàn)的問題。決策支持系統(tǒng)的應(yīng)用舉例面向組
7、織中上層管理人員經(jīng)常面臨的半結(jié)構(gòu)化問題;把模型和分析技術(shù)與傳統(tǒng)的數(shù)據(jù)存儲技術(shù)及檢索技術(shù)結(jié)合起來;易于為非計算機(jī)專業(yè)人員以交互會話的方式使用;強(qiáng)調(diào)對環(huán)境及用戶決策方法改變的靈活性及適應(yīng)性;支持但不是代替高層決策者制定決策。充分利用先進(jìn)信息技術(shù)快速傳遞和處理信息。決策支持系統(tǒng)的特征3三角式結(jié)構(gòu)是由數(shù)據(jù)庫、模型庫、方法庫等子系統(tǒng)與對話子系統(tǒng)成三角形分布的結(jié)構(gòu),也是DSS最基本的結(jié)構(gòu)。用戶數(shù)據(jù)庫管理子系統(tǒng)方法庫管理子系統(tǒng)模型庫管理子系統(tǒng)數(shù)據(jù)庫方法庫模型庫圖5-1 DSS的四庫邏輯結(jié)構(gòu)圖對話管理子系統(tǒng)決策支持系統(tǒng)的構(gòu)成4三角式結(jié)構(gòu)對話管理子系統(tǒng)是DSS中用戶和計算機(jī)的接口,起著在操作者、模型庫、數(shù)據(jù)庫和
8、方法庫之間傳遞、轉(zhuǎn)換命令和數(shù)據(jù)的重要作用,其核心是人機(jī)界面。數(shù)據(jù)庫管理子系統(tǒng)是存儲、管理、提供與維護(hù)用于決策支持的數(shù)據(jù)的DSS基本部件,是支撐模型庫子系統(tǒng)及方法庫子系統(tǒng)的基礎(chǔ)。數(shù)據(jù)庫管理子系統(tǒng)由數(shù)據(jù)庫、數(shù)據(jù)庫析取模塊、數(shù)據(jù)字典、數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)查詢模塊等部件組成。三角式結(jié)構(gòu)模型庫子系統(tǒng)是構(gòu)建和管理模型的計算機(jī)軟件系統(tǒng),它是DSS中最復(fù)雜與最難實現(xiàn)的部分。方法庫子系統(tǒng)是存儲、管理、調(diào)用及維護(hù)DSS各部件要用到的通用算法、標(biāo)準(zhǔn)函數(shù)等方法的部件。三角式結(jié)構(gòu)串聯(lián)結(jié)構(gòu)的特點是對話子系統(tǒng)不直接與數(shù)據(jù)庫子系統(tǒng)聯(lián)系,而是通過模型庫子系統(tǒng)轉(zhuǎn)達(dá)操作請求。因此模型庫子系統(tǒng)必須設(shè)有用戶操作數(shù)據(jù)庫的轉(zhuǎn)接功能。融合式
9、系統(tǒng)結(jié)構(gòu)數(shù)據(jù)庫子系統(tǒng)與模型庫子系統(tǒng)互不獨立,既可以說是模型庫子系統(tǒng)建立在數(shù)據(jù)庫子系統(tǒng)的基礎(chǔ)上,也可以說是數(shù)據(jù)庫子系統(tǒng)被嵌入模型庫子系統(tǒng)之中,模型庫中的模型運(yùn)行時直接調(diào)用數(shù)據(jù)庫中的數(shù)據(jù)。其他結(jié)構(gòu)群體決策的含義群體決策是指多人在一起討論問題,提出解決問題的若干方案,并通過對這些方案進(jìn)行評價,選擇可用的方案,最后做出決策。一般來說,群體決策問題都是非結(jié)構(gòu)化問題,很難直接用結(jié)構(gòu)化的方法提供支持。 群體決策支持系統(tǒng)5群體決策支持系統(tǒng)的概念所謂群體決策支持系統(tǒng)(Group DSS,GDSS)就是將計算機(jī)技術(shù)、通信技術(shù)和決策支持技術(shù)等結(jié)合在一起,支持群體決策問題的求解。GDSS是對個體決策支持系統(tǒng)的擴(kuò)展,是
10、為群體決策活動提供支持的信息系統(tǒng),它促進(jìn)具有共同責(zé)任的群體求解半結(jié)構(gòu)化和非結(jié)構(gòu)化決策問題。GDSS使多個決策參與者共同進(jìn)行思想和信息的交流,群策群力,尋找一個令人滿意和可行的方案,但在決策過程中只由某個特定的人做出最終決策,并對決策結(jié)果負(fù)責(zé)。 群體決策支持系統(tǒng)的組成主持人決策者決策者人機(jī)接口規(guī)則庫子系統(tǒng)公共顯示設(shè)備局部決策支持系統(tǒng)通信庫子系統(tǒng)公共數(shù)據(jù)庫管理系統(tǒng)公共模型庫管理系統(tǒng)公共方法庫管理系統(tǒng)圖5-2 一種典型的群體決策支持系統(tǒng)的構(gòu)成框架圖群體決策支持系統(tǒng)的類型決策室決策者面對面地集于一室在同一時間進(jìn)行群體決策局域決策網(wǎng)建立在計算機(jī)局域網(wǎng)基礎(chǔ)上的,用于多位決策者在近距離內(nèi)的不同房間(例如:自
11、己的辦公室)里定時或不定時作群體決策的系統(tǒng)群體決策支持系統(tǒng)的類型虛擬會議利用計算機(jī)網(wǎng)絡(luò)通信技術(shù),使分散在各地的決策者在某一時間內(nèi)能以不見面的方式進(jìn)行集中決策。遠(yuǎn)程決策網(wǎng)充分利用廣域網(wǎng)等信息技術(shù)來支持群體決策,它綜合了局域決策網(wǎng)與虛擬會議的優(yōu)點,可使決策參與者異時異地地共同對同一問題做出決策。在企業(yè)中,人是非常有價值的,因為要靠他們完成重要的經(jīng)營任務(wù)。多數(shù)企業(yè)都需要專業(yè)知識,而企業(yè)的專業(yè)知識常常只能存在于某些人的大腦中。專家系統(tǒng)能夠獲取企業(yè)的專業(yè)知識,并將它們提供給那些非專業(yè)人員,以便用它來解決問題或?qū)W習(xí)如何解決問題。專家系統(tǒng)5.1.3專家系統(tǒng)的概念由于各個應(yīng)用領(lǐng)域的特點不同,人們研究專家系統(tǒng)的
12、出發(fā)點不同,看待問題的觀點不同,追求的目標(biāo)不同,導(dǎo)致對專家系統(tǒng)的定義存在不一致的看法。一般認(rèn)為:它是一個智能程序系統(tǒng);它具有相關(guān)領(lǐng)域內(nèi)大量的專家知識;它能應(yīng)用人工智能技術(shù)模擬人類專家求解問題的思維過程進(jìn)行推理,解決相關(guān)領(lǐng)域內(nèi)的困難問題,并且達(dá)到該領(lǐng)域?qū)<业乃健?專家系統(tǒng)的概念概括的說,所謂專家系統(tǒng)是一種在相關(guān)領(lǐng)域中具有專家水平解題能力的智能程序系統(tǒng),它能運(yùn)用領(lǐng)域?qū)<叶嗄攴e累的經(jīng)驗與專門知識,模擬人類專家的思維過程,求解需要專家才能解決的困難問題。1一個醫(yī)學(xué)專家系統(tǒng)就能夠像真正的專家一樣,診斷病人的疾病,判別出病情的嚴(yán)重性,并給出相應(yīng)的處方和治療建議.地質(zhì)專家可以根據(jù)地質(zhì)資料和勘探數(shù)據(jù),判斷什
13、么地方有礦藏,是否有開采價值。例子會計-用于審計、稅務(wù)計劃、管理咨詢和培訓(xùn)方面醫(yī)藥-在兼顧多方面因素(如患者病史、感染源以及現(xiàn)有藥品的價格)情況下開出抗生素處方財務(wù)管理-辨別銀行貸款部門中有拖欠傾向的賬戶生產(chǎn)-知道各類產(chǎn)品的加工制造,如飛機(jī)零部件專家系統(tǒng)的應(yīng)用領(lǐng)域一個非常簡單的專家系統(tǒng)規(guī)則現(xiàn)象或事實是否解釋1綠燈亮了嗎?通過十字路口轉(zhuǎn)到規(guī)則2綠燈亮?xí)r是安全的,否則需要更多的信息2紅燈亮了嗎?轉(zhuǎn)到規(guī)則4轉(zhuǎn)到規(guī)則3應(yīng)停車,不可以通過3在你到達(dá)十字路口前,紅燈很可能要亮嗎?轉(zhuǎn)到規(guī)則4通過十字路口只有黃燈亮?xí)r才會出現(xiàn)這種情況,然后你將有兩種選擇4在進(jìn)入十字路口前,你能停車嗎?停車轉(zhuǎn)到規(guī)則5應(yīng)停車,否則
14、就可能出現(xiàn)問題5是否有輛車正從某側(cè)開過來準(zhǔn)備應(yīng)付撞車事件通過十字路口除非十字路口處沒有車路過,否則很可能相撞一個非常簡單的專家系統(tǒng)綠燈亮了嗎(是/否)?否紅燈亮了嗎(是/否)?否在你到達(dá)十字路口前,紅燈很可能要亮嗎(是/否)?為什么?只有黃燈亮?xí)r才會出現(xiàn)這種情況,然后你將有兩種選擇。在你到達(dá)十字路口前,紅燈很可能要亮嗎(是/否)?否結(jié)論:通過十字路口接上例 如果在接近十字路口時綠燈亮了,你可以直接通過;如果紅燈亮了,就應(yīng)該停車;如果不停車并且某一側(cè)有車經(jīng)過,你可能就會有麻煩了。同樣,若黃燈亮了,你可以在交通燈快要變成紅燈之前通過路口;否則,就有可能發(fā)生交通事故。專家系統(tǒng)的一般結(jié)構(gòu)專家系統(tǒng)通常由
15、知識庫、知識庫管理系統(tǒng)、推理機(jī)、數(shù)據(jù)庫、知識獲取與學(xué)習(xí)系統(tǒng)、解釋系統(tǒng)和用戶接口等部分構(gòu)成。 專家、開發(fā)人員知識獲取與學(xué)習(xí)系統(tǒng)解釋系統(tǒng)推理機(jī)知識庫管理系統(tǒng)用戶接口用戶工作區(qū)間知識庫圖5-3 專家系統(tǒng)的一般體系結(jié)構(gòu)2各部分功能知識庫知識庫是經(jīng)過分類組織的“知識的集合”,知識庫的概念是數(shù)據(jù)庫概念在知識處理領(lǐng)域的拓廣。知識庫以某種知識表示形式存放專家系統(tǒng)所需的各種知識。一般來說,專家系統(tǒng)中的知識庫與專家系統(tǒng)程序是相互獨立的,用戶可以通過改變、完善知識庫中的知識內(nèi)容來提高專家系統(tǒng)的性能。在專家系統(tǒng)中運(yùn)用得較為普遍的知識是產(chǎn)生式規(guī)則。例如,在“動物識別”專家系統(tǒng)中有這樣一條規(guī)則:IF 能做單腿跳嗎=否 A
16、ND 在蘇格蘭嗎=是 AND 高度=大THEN 動物=馬 各部分功能(續(xù))知識庫管理系統(tǒng)知識庫管理系統(tǒng)用于建立原始的知識庫結(jié)構(gòu)和初始數(shù)據(jù),組織知識庫中的內(nèi)容,并對知識庫進(jìn)行例行維護(hù)。人類專家或?qū)<蚁到y(tǒng)管理員通過該子系統(tǒng)向知識庫增加新知識,修改有關(guān)的數(shù)據(jù),刪除已過時的知識。推理機(jī)推理機(jī)是對專家系統(tǒng)推理過程進(jìn)行控制的程序,它從用戶所給的初始條件出發(fā),依據(jù)一定的控制策略,通過使用知識庫中的有關(guān)知識,反復(fù)匹配知識庫中的規(guī)則,得出推理結(jié)論,從本質(zhì)上,可將推理機(jī)理解為對于以某種語言表示的推理規(guī)則的解釋程序。各部分功能(續(xù))數(shù)據(jù)庫數(shù)據(jù)庫又叫工作空間,是一個動態(tài)的存儲區(qū)域。其中包含專家系統(tǒng)運(yùn)行過程中的各種數(shù)據(jù)
17、,如初始條件、中間結(jié)果、推理結(jié)論等。一般來說,數(shù)據(jù)庫中存放著系統(tǒng)當(dāng)前所處理對象的一些事實和系統(tǒng)當(dāng)前的狀態(tài)數(shù)據(jù)。例如,醫(yī)療專家系統(tǒng)的數(shù)據(jù)庫存放當(dāng)前患者的姓名、年齡、病情癥狀以及推理得到的初步診斷結(jié)果。知識獲取與學(xué)習(xí)系統(tǒng)知識獲取與學(xué)習(xí)系統(tǒng)是專家系統(tǒng)中用于維護(hù)更新知識庫的程序部分。專家系統(tǒng)自身通過推理過程或為完成推理在與用戶的交互過程中發(fā)現(xiàn)并學(xué)習(xí)新的知識,然后通過知識庫管理系統(tǒng)更新知識庫。同時,人類專家和系統(tǒng)開發(fā)人員也通過這個系統(tǒng)增加、刪除或修改知識庫的內(nèi)容。各部分功能(續(xù))解釋系統(tǒng)解釋系統(tǒng)的功能是回答用戶有關(guān)推理過程方面的問題,向用戶解釋說明專家系統(tǒng)的推理過程、推理中所使用的知識、所得結(jié)論的緣由、
18、條件和結(jié)論之間的因果關(guān)系等。解釋的內(nèi)容通過用戶接口輸出。用戶接口用戶接口是專家系統(tǒng)與用戶交互的界面,是專家系統(tǒng)中完成系統(tǒng)與用戶對話的程序部分。它直接面向用戶,系統(tǒng)通過用戶界面接收所求解問題的初始數(shù)據(jù),并將推理結(jié)果及相關(guān)的解釋輸出給用戶。 專家系統(tǒng)的特征具有專家水平的專門知識一般問題的求解能力具有解釋功能具有獲取知識的能力知識和推理機(jī)構(gòu)相互獨立3ES利用IT來獲取并利用人類的專業(yè)知識。ES能夠很好地解決具有清晰規(guī)則和程序的問題且具有很高的效率,并給企業(yè)帶來巨大的收益。專家系統(tǒng)的應(yīng)用范疇ES能做的事情處理大量的信息匯集來自各種渠道的信息提供決策的一致性減少完成任務(wù)的人員工作時間減少錯誤改善為顧客提
19、供的服務(wù)提供新的信息降低成本運(yùn)用DSS時,用戶必須對所處理的問題具有相當(dāng)?shù)膶I(yè)知識和專業(yè)技能。DSS是輔助用戶進(jìn)行決策,意味著用戶必須知道如何對問題進(jìn)行推理、應(yīng)該提出哪些問題、如何得到答案以及如何進(jìn)行下一步驟。專家系統(tǒng)自身就具有這些功能,用戶只須向ES提供需要解決問題的事實和癥候,用以實際解決問題的技術(shù)或?qū)I(yè)知識是由某領(lǐng)域內(nèi)的專家提供的。專家系統(tǒng)與DSS的區(qū)別第二節(jié) 商務(wù)智能企業(yè)資源計劃(ERP)、銷售終端(POS)、市場調(diào)查、供應(yīng)商、客戶、網(wǎng)絡(luò)、政府部門等都在不斷地增加信息,據(jù)統(tǒng)計,平均每18個月信息量就翻一番,但據(jù)專家估計目前被利用的數(shù)據(jù)只有5%10%,并且我們能分析的數(shù)據(jù)僅限于數(shù)據(jù)庫中的
20、數(shù)據(jù)。那么怎樣才能把大量的數(shù)據(jù)轉(zhuǎn)換成可靠的、有價值的商務(wù)信息以增加利潤和市場份額,獲得更多的競爭優(yōu)勢,這已成為商業(yè)IT界關(guān)注的問題。由此,商務(wù)智能技術(shù)應(yīng)運(yùn)而生。商務(wù)智能產(chǎn)生的背景企業(yè)的“數(shù)據(jù)監(jiān)獄”(Data Jail)現(xiàn)象。對大部分企業(yè)來說數(shù)據(jù)處理的問題不是數(shù)據(jù)缺乏,而是大量的數(shù)據(jù)冗余和數(shù)據(jù)不一致。龐大的數(shù)據(jù)量和傳統(tǒng)數(shù)據(jù)管理方法的缺陷,使大部分企業(yè)出現(xiàn)了“數(shù)據(jù)擁擠”(數(shù)據(jù)監(jiān)獄)現(xiàn)象,既不利于企業(yè)的管理也不利于信息的有效利用。 “數(shù)據(jù)資產(chǎn)”新企業(yè)觀念的建立。目前大部分大中規(guī)模的企業(yè)都是信息豐富的組織,而一個信息豐富的組織的績效不僅僅依賴于產(chǎn)品、服務(wù)或地點等因素,而更重要的是依賴知識。商務(wù)智能的本
21、質(zhì)正是把數(shù)據(jù)轉(zhuǎn)化為知識,致力于知識發(fā)現(xiàn)和挖掘,使企業(yè)的數(shù)據(jù)資產(chǎn)能帶來明顯的經(jīng)濟(jì)效益,減少不確定性因素的影響,使企業(yè)取得新的競爭優(yōu)勢。 1商務(wù)智能產(chǎn)生的背景(續(xù))企業(yè)運(yùn)營模式的變化。電子商務(wù)正在改變著全球商務(wù)活動的方式,信息在經(jīng)濟(jì)活動中越來越占據(jù)著重要的地位。建立在Internet之上的企業(yè)經(jīng)營模式電子商務(wù):電子郵件、電子數(shù)據(jù)交換、電子支付系統(tǒng)、電子營銷等技術(shù)的發(fā)展和應(yīng)用為商務(wù)智能系統(tǒng)提供了市場和生存環(huán)境。 數(shù)據(jù)庫和人工智能技術(shù)的發(fā)展。商務(wù)智能的發(fā)展也得益于相關(guān)技術(shù)的發(fā)展,并行處理系統(tǒng)、廉價數(shù)據(jù)存儲、新數(shù)據(jù)挖掘算法、神經(jīng)網(wǎng)絡(luò)技術(shù)、人工智能技術(shù)、決策支持技術(shù)、從大量數(shù)據(jù)中發(fā)現(xiàn)其后潛藏的商業(yè)機(jī)會等等
22、技術(shù)的發(fā)展,使企業(yè)能以更低的成本投資商務(wù)智能,并取得更高的投資回報率。1一類由數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的,以幫助企業(yè)決策為目的的技術(shù)。商務(wù)智能(Business Intelligence,BI)是一種知識,它包含了企業(yè)的客戶、競爭對手、合作伙伴、競爭環(huán)境和企業(yè)內(nèi)部運(yùn)作的知識,使企業(yè)有能力制定有效的、重要的和經(jīng)常性的商業(yè)戰(zhàn)略決策。創(chuàng)建商務(wù)智能需要數(shù)據(jù)和信息,人們首先必須收集并合理地組織信息,然后必須使用合理的IT工具(數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘)來定義和分析信息內(nèi)部的各種關(guān)系。決策者利用IT工具從信息中提取商務(wù)智能。商務(wù)智能的定義2構(gòu)建
23、商務(wù)智能的過程商務(wù)智能的典型應(yīng)用 產(chǎn)品銷售管理包括產(chǎn)品的銷售策略、銷售量分析,影響產(chǎn)品銷售的因素分析,以及產(chǎn)品銷售的改進(jìn)方案的預(yù)測。 客戶關(guān)系管理通過客戶關(guān)系管理子系統(tǒng),使企業(yè)可以分析顧客購買習(xí)慣和購買傾向,調(diào)查顧客滿意度,進(jìn)而采取相應(yīng)對策增強(qiáng)顧客保持力,培養(yǎng)忠實顧客,維持良好的顧客關(guān)系。 產(chǎn)品創(chuàng)新和推廣異常處理25.2.2數(shù)據(jù)倉庫(Data Warehouse,DW)技術(shù)產(chǎn)生于20世紀(jì)90年代初,其目標(biāo)是進(jìn)行決策支持。數(shù)據(jù)倉庫的產(chǎn)生是多方面因素綜合作用的結(jié)果,數(shù)據(jù)庫技術(shù)和分布式處理技術(shù)的發(fā)展、企業(yè)對信息的需求和決策支持系統(tǒng)的不足促使數(shù)據(jù)倉庫的產(chǎn)生。 數(shù)據(jù)倉庫 5.2.2 數(shù)據(jù)倉庫是信息的邏輯
24、集合,這些信息來自于許多不同的業(yè)務(wù)數(shù)據(jù)庫,并用于創(chuàng)建商務(wù)智能,以便支持企業(yè)的分析活動和決策任務(wù)什么是數(shù)據(jù)倉庫數(shù)據(jù)倉庫的特征面向主題的集成的穩(wěn)定的與時間相關(guān)的數(shù)據(jù)倉庫具有多維性在關(guān)系數(shù)據(jù)庫模型中,信息是用一系列二維表來表示數(shù)據(jù)倉庫中包含若干層的行和列大多數(shù)數(shù)據(jù)倉庫實際上是一個多維數(shù)據(jù)庫數(shù)據(jù)倉庫中的層根據(jù)不同的維度來表達(dá)信息這種多維度的信息圖表被稱為超立體結(jié)構(gòu)在企業(yè)中,大多數(shù)數(shù)據(jù)庫是面向業(yè)務(wù)的,即大多數(shù)數(shù)據(jù)庫都支持聯(lián)機(jī)事務(wù)處理(OLTP)數(shù)據(jù)倉庫不是面向業(yè)務(wù)的,它們是用來支持企業(yè)中各種決策活動的,因此DW僅支持聯(lián)機(jī)分析處理(OLAP)數(shù)據(jù)倉庫支持決策而非事務(wù)處理MCI電話公司 以customer
25、marketing warehouse進(jìn)行趨勢分析、估算促銷成本、客戶維持率分析,從而能得知采取便宜且更為有效的選擇性促銷方式。 Wal-Mart連鎖零售商店分析顧客每次采購的物品、時間及物品的擺置地點等,找出其中關(guān)聯(lián)性,并據(jù)此決定每一家店的進(jìn)貨方式、促銷戰(zhàn)略與店面貨物的最有效排列方式。美國聯(lián)邦住宅局利用數(shù)據(jù)倉庫將10年來分散于70多個系統(tǒng)中的預(yù)算與會計資料整合起來,供預(yù)算預(yù)測、支出分析、趨勢分析、方案評比及政策分析之用。Visa會員銀行利用數(shù)據(jù)倉庫CRIS(cardholder risk information service)分析,幫助銀行發(fā)現(xiàn)欺詐的行為模式,減少了16%的偽造信用卡損失。
26、數(shù)據(jù)倉庫實用案例數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu)分析工具關(guān)系數(shù)據(jù)庫數(shù)據(jù)文件其他數(shù)據(jù)數(shù)據(jù)倉庫管理工具抽取、轉(zhuǎn)換、裝載元數(shù)據(jù)庫數(shù)據(jù)建模工具綜合數(shù)據(jù)當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)用戶查詢工具C/S工具OLAP工具數(shù)據(jù)挖掘工具源數(shù)據(jù)倉庫管理數(shù)據(jù)倉庫概念模型是對事物的概括和抽象。概念模型獨立于機(jī)器,反映了事物和事物之間的聯(lián)系,具有簡明、易理解的特點。數(shù)據(jù)倉庫的數(shù)據(jù)概念模型是多維數(shù)據(jù)模型。在數(shù)據(jù)倉庫中,維是同類數(shù)據(jù)的集合,是組織數(shù)據(jù)的變量,也是重要的決策因素。數(shù)據(jù)倉庫的組織多維數(shù)據(jù)模型的示例 北京1牛奶面包啤酒可樂黃油商品(工業(yè)-類別-商品)城市(國家-省-市)日期(年-月-日)234567上海廣州天津星型模型大多數(shù)數(shù)據(jù)倉庫都采用星
27、型模型來表示多維數(shù)據(jù)模型。星型模型包括一個事實表和多個維表,其中的事實表和維表都是關(guān)系表。事實表包含數(shù)據(jù)倉庫中的測量數(shù)據(jù)和指向與測量數(shù)據(jù)相關(guān)的其他維表的外鍵指針,每個外鍵指針指向一個維表。維表記錄每一維的主鍵和相關(guān)因素的屬性,每個維表對應(yīng)多維模型中的一維,它們形成了概念模型的多維層次聯(lián)系。 銷售表客房表訂單號銷售員號客戶號產(chǎn)品號日期標(biāo)識地區(qū)標(biāo)識數(shù)量總價訂單號訂貨日期客戶號客戶名稱客戶地址銷售員號銷售員姓名城市產(chǎn)品號產(chǎn)品名稱產(chǎn)品目錄單價日期標(biāo)識日月年地區(qū)名稱省別訂貨表地區(qū)表產(chǎn)品表日期表事實表圖5-9 星型模型星型模型雪花模型雪花模型是對星型模型的擴(kuò)展。它通過對星型模型維表進(jìn)一步細(xì)化,使原有的一些
28、維表被擴(kuò)展為更小的事實表,形成由一些局部星型模型所組成的多層次結(jié)構(gòu)。維表細(xì)化的目的是通過減少數(shù)據(jù)存儲量和聯(lián)合較少的維表來改善查詢性能。 地區(qū)表目錄表客房表事實表年表月表銷售表訂單號銷售員號客戶號產(chǎn)品號日期標(biāo)識地區(qū)標(biāo)識數(shù)量總價訂單號訂貨日期客戶號客戶名稱客戶地址銷售員號銷售員姓名城市產(chǎn)品號產(chǎn)品名稱產(chǎn)品目錄單價日期標(biāo)識日月年地區(qū)名稱省別訂貨表產(chǎn)品表日期表圖5-10 雪花模型產(chǎn)品目錄目錄描述月份年年省表省別雪花模型 數(shù)據(jù)集市(Data Marts)是一種更小、更集中的數(shù)據(jù)倉庫;數(shù)據(jù)集市面向特定應(yīng)用,主要針對具體的、部門級的應(yīng)用。數(shù)據(jù)集市數(shù)據(jù)集市的特征規(guī)模小,面向部門,有特定的應(yīng)用由業(yè)務(wù)部門定義、設(shè)計
29、、開發(fā)、管理和維護(hù)能快速實現(xiàn)購買比較便宜,投資回收快工具集的緊密集成提供更詳細(xì)的、預(yù)先存在的、數(shù)據(jù)倉庫的摘要子集可升級到完整的數(shù)據(jù)倉庫。數(shù)據(jù)倉庫和數(shù)據(jù)庫的比較作業(yè)用數(shù)據(jù)處理特性(數(shù)據(jù)庫)分析用數(shù)據(jù)處理特性(數(shù)據(jù)倉庫)數(shù)據(jù)特性 無重復(fù)數(shù)據(jù)重復(fù)數(shù)據(jù)詳細(xì)、少量匯總(微觀)詳細(xì)、大量匯總(宏觀)數(shù)據(jù)處理量(數(shù)個月)數(shù)據(jù)處理量(510年)經(jīng)常移動不常移動作業(yè)特性 提供作業(yè)階層數(shù)據(jù)處理服務(wù)提供管理階層信息服務(wù)支持每日交易的操作(增添、刪除、查詢、打?。┲С止芾頉Q策的需求(查詢、打印)聯(lián)機(jī)事務(wù)處理(OLTP)聯(lián)機(jī)分析處理(OLAP)要求操作有效率且快速回應(yīng)對效率及快速回應(yīng)不特別要求開發(fā)特性軟件開發(fā)生命周期動
30、態(tài)反復(fù)分析交易系統(tǒng)導(dǎo)向、適于大量交易決策分析導(dǎo)向、適于復(fù)雜查詢使用數(shù)據(jù)倉庫時需重點考慮的問題企業(yè)是否真正需要數(shù)據(jù)倉庫數(shù)據(jù)倉庫與數(shù)據(jù)挖掘工具時十分昂貴的,而且需要不斷地得到擴(kuò)展的和昂貴的支持。有些企業(yè)并不需要數(shù)據(jù)倉庫,若能從業(yè)務(wù)數(shù)據(jù)庫中輕而易舉地獲取決策所必需的信息,就沒必要采用數(shù)據(jù)倉庫。企業(yè)員工需要整個數(shù)據(jù)倉庫嗎如果不是這樣,就應(yīng)考慮建立數(shù)據(jù)集市。怎樣更新信息為創(chuàng)建數(shù)據(jù)庫,可以用“快照”(snapshot)方式從其他數(shù)據(jù)庫中提取信息,并導(dǎo)入數(shù)據(jù)倉庫,但如果關(guān)鍵的信息要做到即時更新,則往往是不可行的。案例:金融業(yè)數(shù)據(jù)倉庫解決方案數(shù)據(jù)倉庫是金融銀行機(jī)構(gòu)實現(xiàn)客戶關(guān)系管理的核心技術(shù),也是金融銀行業(yè)競爭
31、優(yōu)勢的來源,主要的應(yīng)用業(yè)務(wù)部門為信用卡部、信貸部、市場部和零售業(yè)務(wù)部等,應(yīng)用領(lǐng)域是以客戶為中心的,分銷渠道管理、客戶利潤分析、客戶關(guān)系優(yōu)化、風(fēng)險評估和管理。采用數(shù)據(jù)倉庫作為個性化服務(wù)的手段,在發(fā)達(dá)國家和地區(qū),金融銀行業(yè)的實踐已取得顯著的成效 。什么是個性化服務(wù)呢?客戶認(rèn)為:隱含知道我(Who)在什么數(shù)據(jù)(When)、需要什么產(chǎn)品或服務(wù)(What)、以我可以接受的價格(How much)、經(jīng)由我喜好的分銷渠道(Where),對我提供銷售。銀行認(rèn)為:以有競爭性的產(chǎn)品或服務(wù)(What)、在適當(dāng)?shù)臅r間(When)、通過適當(dāng)?shù)姆咒N渠道(Where)、對信用好風(fēng)險低的客戶(Who)、以合理的價格(How
32、Much)和利潤(Profitable)完成銷售。兩者都是在精打細(xì)算的前提下,以達(dá)成各自的需求和目標(biāo)。金融業(yè)數(shù)據(jù)倉庫解決方案(續(xù))以客戶為中心的數(shù)據(jù)倉庫決策支持系統(tǒng)可以快速的了解每一項交易、每一個賬號、每一個分銷渠道、每一位客戶的風(fēng)險和利潤,讓銀行作出正確的業(yè)務(wù)決策,及時響應(yīng)每一位客戶現(xiàn)在未來的需要,提高整體運(yùn)作和管理水平。主要體現(xiàn)在以下幾個方面:(1)分銷渠道的分析和管理(Behavior Explorer)建立分銷渠道的分析和管理階段完成后,銀行就能知道客戶、渠道、產(chǎn)品或服務(wù)三者之間的關(guān)系,了解客戶的購買行為,客戶或渠道對業(yè)務(wù)收入的貢獻(xiàn),哪些客戶比較喜好經(jīng)由什么渠道在何時和銀行打交道,目前
33、的分銷渠道的服務(wù)能力如何,需要增加哪些分銷渠道才能達(dá)到預(yù)期的服務(wù)水平。金融業(yè)數(shù)據(jù)倉庫解決方案(續(xù))(2)利潤評價模型(Profitable Measurement Foundation)建立所有客戶的每一個賬號的利潤評價模型,以便了解每一位客戶對銀行的總利潤貢獻(xiàn)度。銀行可以依照客戶的利潤貢獻(xiàn)度安排合適的分銷渠道提供服務(wù)和銷售,知道哪些有利潤的客戶需要留住,采用什么方法留住客戶,以交叉銷售改善客戶的利潤貢獻(xiàn)度,知道哪些客戶應(yīng)該爭取。另外,銀行可以模擬和預(yù)測,新產(chǎn)品對銀行利潤的貢獻(xiàn)度,或是新政策對銀行會產(chǎn)生什么樣的財務(wù)影響,或是客戶流失或留住對銀行的整體利潤的影響。金融業(yè)數(shù)據(jù)倉庫解決方案(續(xù))(3
34、)客戶關(guān)系優(yōu)化(Relationship Optimizer)客戶在每一筆交易中都能主動的告訴銀行需要什么產(chǎn)品或服務(wù),例如,定期存款是希望退休養(yǎng)老使用、申請信用卡是需要現(xiàn)金消費(fèi)、詢問放貸利息是需要住房貸款等,這些都是銀行提供產(chǎn)品或服務(wù)最好的時機(jī)。銀行需要將賬號每天發(fā)生的交易明細(xì),以實時或定時的方式加載到中央數(shù)據(jù)倉庫系統(tǒng),核對客戶行為的變化。當(dāng)有上述變化時,馬上生成事件,然后銀行業(yè)務(wù)部門利用客戶購買傾向模型、渠道喜好模型、利潤貢獻(xiàn)度模型、信用和風(fēng)險評分模型等,主動地和客戶溝通并進(jìn)行交叉銷售,達(dá)成留住客戶和增加利潤的目標(biāo)。金融業(yè)數(shù)據(jù)倉庫解決方案(續(xù))(4)風(fēng)險評估和管理風(fēng)險評估和管理是實施數(shù)據(jù)倉庫
35、最困難的工作,本階段因為牽涉很多管理制度,所以需要較長的時間。風(fēng)險評估和管理主要利用各種數(shù)學(xué)模型進(jìn)行分析,模擬風(fēng)險和利潤間的關(guān)系。當(dāng)本階段完成后,銀行就完全實現(xiàn)了以客戶為中心的個性化服務(wù)數(shù)據(jù)倉庫決策支持系統(tǒng),可以在滿足高利潤低風(fēng)險客戶需求的前提下,達(dá)成銀行收益的極大化。 學(xué)習(xí)內(nèi)容聯(lián)機(jī)分析處理的概念OLAP的基本分析操作聯(lián)機(jī)分析處理OLAP 5.2.3 聯(lián)機(jī)分析處理(OLAP) 的概念聯(lián)機(jī)分析處理 (On-Line Analytical Processing,OLAP)OLAP是在傳統(tǒng)的聯(lián)機(jī)事務(wù)處理(on-line transaction processing,OLTP)的基礎(chǔ)上發(fā)展起來的一種數(shù)
36、據(jù)分析技術(shù),又稱多維分析或共享多維信息的快速分析。它用于完成基于某種數(shù)據(jù)存儲的數(shù)據(jù)分析功能。隨著用戶對數(shù)據(jù)分析要求的增加,OLTP已不能完全滿足用戶的需求。關(guān)系數(shù)據(jù)庫雖然具有一定的數(shù)據(jù)視圖選取、比較和綜合的能力,但受到數(shù)據(jù)分析能力的制約,例如,SQL等數(shù)據(jù)庫查詢語言對大型數(shù)據(jù)庫的簡單查詢不能滿足決策者提出的信息需求,用戶的決策分析需要對關(guān)系數(shù)據(jù)庫進(jìn)行大量計算才能得出結(jié)果。1OLTP和OLAP 的比較OLTP是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果,可以以多維的形式從
37、多方面和多角度來觀察組織的狀態(tài)、了解組織的變化。 OLTP和OLAP 的比較(續(xù))OLTPOLAP用戶操作人員,低層管理人員決策人員,高級管理人員功能日常操作處理分析決策DB 設(shè)計面向應(yīng)用面向主題數(shù)據(jù)當(dāng)前的,最新的細(xì)節(jié)的,二維的分立的歷史的,聚集的,多維的集成的,統(tǒng)一的存取讀/寫數(shù)十條記錄讀上百萬條記錄工作單位簡單的事務(wù)復(fù)雜的查詢用戶數(shù)上千個上百個DB 大小100MB-GB100GB-TB OLAP的一些基本概念變量變量是數(shù)據(jù)的實際意義,即描述數(shù)據(jù)“是什么” 一般情況下,變量總是一個數(shù)值度量指標(biāo),例如人數(shù)、單價、銷售量等都是變量, 維維是人們觀察數(shù)據(jù)的特定角度。例如,企業(yè)常常關(guān)心產(chǎn)品銷售數(shù)據(jù)隨
38、著時間推移而產(chǎn)生的變化情況,這時是從時間角度來觀察產(chǎn)品的銷售,所以時間是一個維(時間維)。 2OLAP的一些基本概念(續(xù))維的層次人們觀察數(shù)據(jù)的某個特定角度(即某個維)還可以存在細(xì)節(jié)程度不同的多個描述方面,我們稱這個描述方面為維的層次。維成員維的一個取值稱為該維的一個維成員。如果一個維是多層次的,那么該維的維成員是由各個不同維層次的取值組合而成的。例如,時間維的一個維成員,即“某年某月某日”。一個維成員并不一定在每個維層次上都要取值,例如“某年某月”、“某月某日”、“某年”等都是時間維的維成員。對應(yīng)一個數(shù)據(jù)項來說,維成員是該數(shù)據(jù)項在某維中位置的描述。例如對一個銷售數(shù)據(jù)來說,時間維是維成員“某年
39、某月某日”就表示該銷售數(shù)據(jù)是“某年某月某日”的銷售數(shù)據(jù),“某年某月某日”是該銷售數(shù)據(jù)在時間維上位置的描述。OLAP的一些基本概念(續(xù))多維數(shù)組一個多維數(shù)組可以表示為:(維1,維2,維n,變量)。例如,若日用品銷售量數(shù)據(jù)是按時間、地區(qū)和銷售渠道組織起來的三維立方體,加上變量銷售額,就組成了一個多維數(shù)組(地區(qū)、時間、銷售渠道、銷售額)。數(shù)據(jù)單元(單元格)多維數(shù)組的取值成為一個數(shù)據(jù)單元。當(dāng)多維數(shù)組的各個維都選中一個維成員,這些維成員的組合就唯一確定了一個變量的值。那么數(shù)據(jù)單元就可以表示為(維1維成員,維2維成員,維n維成員,變量的值)。例如,我們在產(chǎn)品、地區(qū)、時間和銷售渠道上各取維成員“牙膏”、“上
40、?!?、“1998年12月”和“批發(fā)”,就唯一確定了變量“銷售額”的一個值(假設(shè)為100000),則該數(shù)據(jù)單元可表示為(牙膏、上海、1998年12月、批發(fā),100000)。 OLAP的基本分析操作切片(Slice)定義1:在多維數(shù)組的某一維上選定一維成員的動作成為切片,即在多維數(shù)組(維1,維2,維n,變量)中選一維,如維i,并取其一維成員(設(shè)為“維成員Vi”),所得的多維數(shù)組的子集(維1,維成員Vi,維n,變量)稱為在維i上的一個切片。定義2:選定多維數(shù)組的一個二維子集的動作叫做切片,即選定多維數(shù)組(維1,維2,維n,變量)中的兩個維,如維i和維j,在這兩個維上取某一區(qū)間或任意維成員,而將其余的
41、維都取定一個維成員,則得到的就是多維數(shù)組在維i和維j上的一個二維子集,稱這個二維子集為多維數(shù)組在維i和維j上的一個切片,表示為:(維i,維j,變量)。3切片示例上海時間維地區(qū)維產(chǎn)品維廣州電視機(jī) 電冰箱9899上海電視機(jī)切塊(Dice)定義1:在多維數(shù)組的某一維上選定某一區(qū)間的維成員的動作稱為切塊,即限制多維數(shù)組的某一維的取值區(qū)間。顯然,當(dāng)這一區(qū)間只取一個維成員時,即得到一個切片。定義2:選定多維數(shù)組的一個三維子集的動作稱為切塊。即選定多維數(shù)組(維1,維2,。,維n,變量)中的三個維:維i,維j和維r,在這三個維上取某一區(qū)間或任意的維成員,而將其余的維都取定一個維成員,則得到的就是多維數(shù)組在維i
42、、維j和維r上的一個三維子集,我們稱這個三維子集為多維數(shù)組在維i、維j和維r上的一個切塊,表示為:(維i,維j,維r,變量)。 OLAP的基本分析操作3旋轉(zhuǎn)(Rotate)旋轉(zhuǎn)即改變一個報告或頁面顯示的維方向。例如,旋轉(zhuǎn)可能包含交換行和列,或是把某一個行維移到列維中去,或是把頁面顯示中的一個維和頁面外的維進(jìn)行交換(令其成為新的行或列中的一個)。 OLAP的基本分析操作3旋轉(zhuǎn)示例(a)是把一個橫向為時間、縱向為產(chǎn)品的報表旋轉(zhuǎn)成為橫向為產(chǎn)品、縱向為時間的報表。(b)是把一個橫向為時間、縱向為產(chǎn)品的報表,變成一個橫向仍為時間,而縱向旋轉(zhuǎn)為地區(qū)的報表。 時間維產(chǎn)品維產(chǎn)品維時間維行列交換(a)時間維產(chǎn)品
43、維時間維地區(qū)維旋轉(zhuǎn)以改變頁面顯示(b)圖5-12 旋轉(zhuǎn)下鉆/上探(drill down/roll up)鉆探處理是使用戶在數(shù)據(jù)倉庫的多層數(shù)據(jù)中能通過導(dǎo)航信息而獲得更多的細(xì)節(jié)性數(shù)據(jù)。鉆探一般是指向下鉆探。 還包括上探:即讓用戶查看一個數(shù)據(jù)集的粗集視圖,例如上例中相反的操作為上探交叉鉆探:即可讓用戶在同一層次從一個數(shù)據(jù)集橫向地移到另一個數(shù)據(jù)集進(jìn)行查看和分析 OLAP的基本分析操作3下鉆示例地區(qū)銷售額(萬元)上海900長沙650廣州8001999年某產(chǎn)品銷售數(shù)據(jù) 1999年地區(qū)1季度2季度3季度4季度上海200200350150長沙250100150150廣州2001501802701999年各季度
44、某產(chǎn)品銷售數(shù)據(jù)人們在日常生活中經(jīng)常會遇到這樣的情況:超市的經(jīng)營者希望將經(jīng)常被同時購買的商品放在一起,以增加銷售;保險公司想知道購買保險的客戶一般具有哪些特征;醫(yī)學(xué)研 究人員希望從已有的成千上萬份病歷中找出患某種疾病的病人的共同特征,從而為治愈這種疾病提供一些幫助。對于以上問題,現(xiàn)有MIS中的數(shù)據(jù)分析工具無法給出答案。因為無論是查詢、統(tǒng)計還是報表,其處理方式都是對指定的數(shù)據(jù)進(jìn)行簡單的數(shù)字處理,而不能對這些數(shù)據(jù)所包含的內(nèi)在信息進(jìn)行提取。隨著MIS的廣泛應(yīng)用和數(shù)據(jù)量激增,人們希望能夠提供更高層次的數(shù)據(jù)分析功能,從而更好地對決策或科研工作提供支持。正是為了滿足這種要求,從大量數(shù)據(jù)中提取出隱藏在其中的有
45、用信息,將機(jī)器學(xué)習(xí)應(yīng)用于大型數(shù)據(jù)庫的數(shù)據(jù)挖掘(Data Mining)技術(shù)得到了長足的發(fā)展。 數(shù)據(jù)挖掘5.2.41數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(Data Mining)是從大量數(shù)據(jù)中抽取有意義的、隱含的、以前未知的并有潛在使用價值的知識的過程。 數(shù)據(jù)挖掘的基本理念:“顧客過去的消費(fèi)行為可以作為未來采購意愿的指標(biāo)。”,從不同的數(shù)據(jù)來源收集大量的顧客信息,以便分析并確認(rèn)特定的顧客需求,掌握特定目標(biāo)市場。例如:顧客在何時、何處采購,購買什么產(chǎn)品,什么價格,在哪一種商店,在何時到何處旅游等。2數(shù)據(jù)挖掘的過程采集選擇的目的是辨別出需要分析的數(shù)據(jù)集合,縮小處理范圍,然而實際相系統(tǒng)中收集到的原始數(shù)據(jù)通常是“臟”的
46、,即數(shù)據(jù)存在雜亂性、重復(fù)性及不完整性。數(shù)據(jù)預(yù)處理可以處理數(shù)據(jù)中的遺漏及清洗臟數(shù)據(jù),從而提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預(yù)處理包括數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)變換和數(shù)據(jù)簡化等幾方面的功能。采集選擇數(shù)據(jù)預(yù)處理采集開采原始數(shù)據(jù)源數(shù)據(jù)目標(biāo)數(shù)據(jù)模式知識解釋評價數(shù)據(jù)挖掘的過程數(shù)據(jù)挖掘的過程(續(xù))數(shù)據(jù)挖掘階段進(jìn)行實際的挖掘操作,它要先決定是進(jìn)行發(fā)現(xiàn)型的數(shù)據(jù)挖掘,還是驗證型的數(shù)據(jù)挖掘,然后選擇合適的工具,進(jìn)行發(fā)現(xiàn)知識的操作及證實發(fā)現(xiàn)的知識。解釋評價的任務(wù)不僅是把結(jié)果表達(dá)出來(例如采用信息可視化方法),還要對信息進(jìn)行過濾處理,如果不能令決策者滿意,需要重復(fù)以上數(shù)據(jù)挖掘的過程。3數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的關(guān)系首先,由于大多數(shù)數(shù)據(jù)挖
47、掘工具要在集成的、一致的、經(jīng)過清理的數(shù)據(jù)上進(jìn)行挖掘。而已經(jīng)完成數(shù)據(jù)清理、數(shù)據(jù)變換和數(shù)據(jù)集成的數(shù)據(jù)倉庫,完全能為數(shù)據(jù)挖掘提供它所需要的挖掘數(shù)據(jù),使數(shù)據(jù)挖掘免除了數(shù)據(jù)準(zhǔn)備的繁雜過程。3數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的關(guān)系其次,在數(shù)據(jù)挖掘過程中,常常需要進(jìn)行探測式的數(shù)據(jù)分析,從各種數(shù)據(jù)庫中選擇相關(guān)數(shù)據(jù),對各種數(shù)據(jù)選擇不同的粒度,以不同的形式提供知識或結(jié)果。而數(shù)據(jù)倉庫中的OLAP完全可以為數(shù)據(jù)挖掘提供有關(guān)的數(shù)據(jù)操作支持,例如,對數(shù)據(jù)立方體或數(shù)據(jù)挖掘中間結(jié)果進(jìn)行下鉆、上探、旋轉(zhuǎn)、切塊、切片等操作,且以O(shè)LAP的可視化功能為數(shù)據(jù)挖掘過程或挖掘結(jié)果提供良好的操作平臺,這些都將極大地增強(qiáng)數(shù)據(jù)挖掘的功能和靈活性。此外,在數(shù)
48、據(jù)挖掘過程中,如果將數(shù)據(jù)挖掘與數(shù)據(jù)倉庫進(jìn)行有效的連接,將增加數(shù)據(jù)挖掘的聯(lián)機(jī)挖掘功能。用戶在數(shù)據(jù)挖掘的過程中,可以利用數(shù)據(jù)倉庫中的OLAP與各種數(shù)據(jù)挖掘工具的連接,使用戶可以為數(shù)據(jù)挖掘選擇合適的數(shù)據(jù)挖掘工具,能夠在數(shù)據(jù)挖掘過程中靈活地組織挖掘工具以增強(qiáng)數(shù)據(jù)挖掘能力,同時還為用戶靈活地改變數(shù)據(jù)挖掘的模式與任務(wù)提供便利。數(shù)據(jù)挖掘工具是用戶對數(shù)據(jù)倉庫進(jìn)行信息查詢的軟件工具。數(shù)據(jù)挖掘工具支持OLAP的概念,即通過對數(shù)據(jù)的處理來支持決策任務(wù)。數(shù)據(jù)挖掘工具數(shù)據(jù)挖掘工具集查詢與報表工具查詢與報表工具與QBE工具、SQL和典型數(shù)據(jù)庫環(huán)境中的報表生成器類似。大多數(shù)數(shù)據(jù)倉庫環(huán)境都支持諸如QBE、SQL和報表生成器之
49、類的簡單易用的數(shù)據(jù)操作子系統(tǒng)工具。智能代理智能代理運(yùn)用各種人工智能工具(如:神經(jīng)網(wǎng)絡(luò)、模糊邏輯)形成OLAP中的“信息發(fā)現(xiàn)”基礎(chǔ),并創(chuàng)建商務(wù)智能。智能代理是一種軟件,它可以輔助人或充當(dāng)人的代表來執(zhí)行重復(fù)的與計算機(jī)相關(guān)的任務(wù)。數(shù)據(jù)挖掘代理在數(shù)據(jù)倉庫上運(yùn)行以發(fā)現(xiàn)信息(知識)。智能代理不僅僅應(yīng)用于數(shù)據(jù)倉庫環(huán)境的OLAP,而且還能應(yīng)用于Web上查詢信息。多維分析工具切片/切塊技術(shù)旋轉(zhuǎn)魔方統(tǒng)計工具統(tǒng)計工具幫助人們利用各種數(shù)學(xué)模型將信息存儲到數(shù)據(jù)倉庫中,進(jìn)而去挖掘出新的信息。時間序列分析-計劃未來趨勢回歸分析-確定一個變量對另一個變量的影響4數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域以產(chǎn)品營銷領(lǐng)域為例 顧客特性分析(customer profile analysis)目標(biāo)市場分析(targeted market analysis)市場購物籃分析(marketbasket analysis)5數(shù)據(jù)挖掘分類分類(Classification)其旨在生成一個分類函數(shù)或分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個。既可以用此模型分析已有的數(shù)據(jù),也可以用它來預(yù)測未來的數(shù)據(jù)。聚集(Clustering)聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區(qū)別是聚集不依賴于預(yù)先定義好的類,不需要訓(xùn)練集。數(shù)據(jù)可視化(Description and Visualization)數(shù)據(jù)可視化嚴(yán)格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑安全施工工程質(zhì)量評估考核試卷
- 紀(jì)律教育主題班會
- 專業(yè)工具與軟件使用指南考核試卷
- 皮膚病飲食護(hù)理
- 時尚市場中的品牌推廣與公關(guān)活動考核試卷
- 2024規(guī)范買賣合同范文
- 艾滋病病毒職業(yè)暴露定義
- 《成本管理會計》課件
- 企業(yè)安全生產(chǎn)管理課件考核試卷
- 人工智能在農(nóng)業(yè)領(lǐng)域的智能化農(nóng)業(yè)機(jī)器人技術(shù)考核試卷
- 倉庫貨物條碼管理培訓(xùn)
- 第六章-中國早期社會學(xué)中的社區(qū)學(xué)派-《中國社會學(xué)史》必備
- 太陽能發(fā)電技術(shù)在航天與航空領(lǐng)域的應(yīng)用
- 大學(xué)生預(yù)防猝死知識講座
- (2)反壟斷法(字向東)
- 行政事業(yè)單位合同管理內(nèi)部控制制度
- MSOP(測量標(biāo)準(zhǔn)作業(yè)規(guī)范)測量SOP
- 保險精算原理
- 充電樁采購安裝售后服務(wù)方案
- 老年肺炎病人護(hù)理課件
- 鄉(xiāng)鎮(zhèn)醫(yī)院網(wǎng)絡(luò)安全應(yīng)急預(yù)案
評論
0/150
提交評論