版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、商務(wù)智能發(fā)展背景伴隨著以電子商務(wù)為特征的新經(jīng)濟逐步走向成熟,企業(yè)需要處理的數(shù)據(jù)量越來越多,數(shù)據(jù)庫應(yīng)用的規(guī)模、范圍和深度不斷擴大,已經(jīng)從點(單臺機器),線(局域網(wǎng))發(fā)展到面(網(wǎng)絡(luò)),甚至到因特網(wǎng)全球信息系統(tǒng)。近年來商業(yè)條碼的推廣,企業(yè)和政府交易的管理,以及數(shù)據(jù)采集工具的發(fā)展,都提供了巨大規(guī)模的數(shù)據(jù),在商業(yè)管理,政府部門和工業(yè)數(shù)據(jù)處理等領(lǐng)域中應(yīng)用了數(shù)以百萬計的數(shù)據(jù)庫。對于企業(yè)來說,這些數(shù)據(jù)一方面來自與客戶間的交易記錄,另外,還可能來自企業(yè)內(nèi)部的管理或生產(chǎn)系統(tǒng),以及從其他途徑搜集到的市場信息、協(xié)作伙伴和競爭對手的信息等。企業(yè)急切地希望通過快速處理這些數(shù)據(jù)獲得有利于企業(yè)進一步發(fā)展的決策依據(jù),而是否能夠
2、最大限度地使用信息資源來管理和影響企業(yè)決策流程,將決定企業(yè)是否能擁有最大程度的競爭優(yōu)勢。我國加入世界貿(mào)易組織后,企業(yè)不僅要市場擴大到了全球,同時也要面對來自全球的更多更強的競爭對手,企業(yè)必須采用快速的智能分析手段來實現(xiàn)對市場的定位、細分,對客戶的更深層次的研究,以更強的姿態(tài)迎接挑戰(zhàn)?;窘虒W內(nèi)容本課程主要介紹商務(wù)智能的基本概念,基本理論及其應(yīng)用,同時重點介紹了相關(guān)技術(shù),以及在商務(wù)決策中的應(yīng)用。具體的內(nèi)容包括數(shù)據(jù)倉庫系統(tǒng)簡介、聯(lián)機分析處理(OLAP),數(shù)據(jù)預(yù)處理技術(shù)(包括數(shù)據(jù)清理、數(shù)據(jù)集成和轉(zhuǎn)換等),數(shù)據(jù)挖掘技術(shù)(包括分類、預(yù)測、關(guān)聯(lián)和聚類等)以及數(shù)據(jù)挖掘方法(包括決策樹方法、統(tǒng)計方法、關(guān)聯(lián)規(guī)則
3、挖掘、神經(jīng)網(wǎng)絡(luò)和基于案例推理等),并結(jié)合案例分析上述方法和技術(shù)在商務(wù)智能中的應(yīng)用。 基本要求目的主要是掌握商務(wù)智能的核心技術(shù)基礎(chǔ)數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘的基本概念、技術(shù)和方法,并在此基礎(chǔ)上應(yīng)用于相關(guān)領(lǐng)域。熟悉數(shù)據(jù)庫、數(shù)據(jù)倉庫構(gòu)建及多維數(shù)據(jù)的查看,掌握基本數(shù)據(jù)挖掘算法的應(yīng)用。教學綱要商務(wù)智能概述數(shù)據(jù)庫數(shù)據(jù)倉庫在線分析處理OLAP技術(shù)數(shù)據(jù)挖掘技術(shù)和方法商務(wù)智能應(yīng)用*教學方式課堂講解為主,輔以上機實驗和課堂討論。商務(wù)智能案例分析教材與參考書1趙衛(wèi)東.商務(wù)智能(第三版). 北京:清華大學出版社,20132趙衛(wèi)東. 流程智能.北京:清華大學出版社,20123趙衛(wèi)東. 客戶智能.北京:清華大學出版社,
4、2013數(shù)據(jù)DATA 數(shù)據(jù)是可以記錄、通信和能識別的符號,它通過有意義的組合來表達現(xiàn)實世界中的某種實體(具體對象、事件、狀態(tài)或活動)的特征。例如:38.2 21 8信息INFORMATION 信息是經(jīng)過某種加工處理后的數(shù)據(jù),是反映客觀事物規(guī)律的一些數(shù)據(jù)。信息是對數(shù)據(jù)的解釋,數(shù)據(jù)是信息的載體。 例如:價格:38.2元, 氣溫:21攝氏度, 長度:8厘米知識KNOWLEDGE知識是對信息內(nèi)容進行提煉、比較、挖掘、分析、概括、判斷和推論。事實性知識和經(jīng)驗知識(隱性和顯性)。例如:商品價格38.2元很貴 8月的天氣是21攝氏度很涼快 零件的長度是8厘米很短數(shù)據(jù)-信息-知識SenderReceiver處
5、理數(shù)據(jù)信息知識一個人的垃圾(數(shù)據(jù))是另一個人的財富(信息)案例 什么是數(shù)據(jù)信息和知識數(shù)據(jù):37.5通過這個你能看出什么嗎?估計很難?信息:姓名:陳浩 年齡:5歲時間:2014年6月8日13點20分腋下體溫:37.5度環(huán)境:孩子在樓下玩,回來后看到臉特別紅,測量體溫為37.5度 這個時候,這個37.5有意義了,一個小孩在夏天午后玩了后測試的體溫。在這樣的背景下,37.5成為了有意義的信息中的一個關(guān)鍵指標。知識如果體溫在36.937.5之間,則正常,稱為基礎(chǔ)體溫。如果體溫超過基礎(chǔ)體溫1以上時,則為發(fā)熱。如果體溫波動于38左右,則為低熱。如果體溫在39以上,則為高熱。如果連續(xù)發(fā)熱兩個星期以上,則為長
6、期發(fā)熱。判斷(知識應(yīng)用):是不是孩子在下面玩的比較熱,穿的比較多?是否可以先脫點衣服觀察一小時后再測量?決策:1個小時后,再測量。結(jié)果:體溫回落到36.8度,正常范圍,不用去醫(yī)院。數(shù)據(jù)信息知識總結(jié)數(shù)據(jù):單純的數(shù)據(jù)沒有意義,不能直接幫助決策。信息:信息是賦予了數(shù)據(jù)一環(huán)境。知識:從信息中得到,經(jīng)過實踐證明的、可以用來輔助決 策和行動。這個例子中只包含了顯性知識,如果小孩的發(fā)燒在經(jīng)過各種檢查后仍然找不到原因,則需要專家會診,要看既往的病史、家族的病史加上醫(yī)生的綜合判斷,就要使用醫(yī)生的隱性知識。 數(shù)據(jù)數(shù)據(jù)可以記錄歷史資料,可以記錄事件過程,可以表示事物特征。對于人類生存、發(fā)展、創(chuàng)新有著至關(guān)重要的作用。
7、體檢指標,商品價格,股票價格,財務(wù)數(shù)據(jù),GDP等等都屬于數(shù)據(jù)。對于企業(yè)而言數(shù)據(jù)就是生產(chǎn),經(jīng)營,戰(zhàn)略,幾乎所有的經(jīng)營活動都依賴數(shù)據(jù),不可或缺。對于政府而言,數(shù)據(jù)就是社會各類經(jīng)濟社會活動的表現(xiàn)。有了數(shù)據(jù)的記錄與使用,才有了社會的發(fā)展。信息時代數(shù)據(jù)的表現(xiàn)形式數(shù)據(jù)的潛在價值數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下如何使用數(shù)據(jù)數(shù)據(jù)再利用數(shù)據(jù)再利用是指企業(yè)對歷史數(shù)據(jù)進行重新的整理分析,為今后的業(yè)務(wù)提供決策支持。有些公司由于業(yè)務(wù)開展時間較長,會收集到大量的數(shù)據(jù),但是如果他們并不急需使用,或并不擅長再次利用這些數(shù)據(jù),就會使這些數(shù)據(jù)長期的擠壓起來,直到業(yè)務(wù)環(huán)境徹底
8、變化,而失去可利用的價值。保存舊信息的計算機就是“數(shù)據(jù)墳?zāi)埂薄?shù)據(jù)再利用適合于控制著大型數(shù)據(jù)集運作的傳統(tǒng)企業(yè)。比如移動電話運營商收集用戶的位置信息來傳輸電話信號。對于移動電話運營商來講,這些數(shù)據(jù)的任務(wù)已經(jīng)完成,但是對于一些廣告公司來說,這些數(shù)據(jù)非常有價值,可以用于發(fā)布位置廣告進行促銷活動。付費通數(shù)據(jù)再利用案例數(shù)據(jù)的重組數(shù)據(jù)重組是將兩組和多組不同內(nèi)容數(shù)據(jù)集結(jié)合起來進行分析。統(tǒng)計學中的關(guān)聯(lián)分析,回歸分析,就可以用于對不同數(shù)據(jù)集的結(jié)合分析。比如丹麥擁有1990-2007年間所有手機用戶的相關(guān)信息,共涉及358403人。同時記錄了該期間10729名中樞神經(jīng)系統(tǒng)疾病患者相關(guān)信息。研究人員試圖通過對這兩個
9、數(shù)據(jù)集的關(guān)聯(lián)分析來推斷:手機用戶是否比非手機用戶顯示出較高的中樞神經(jīng)系統(tǒng)疾病發(fā)病率?使用手機時間較長的用戶是否比時間較短的用戶更容易患???兩個數(shù)據(jù)集都采用了嚴格的質(zhì)量標準,幾乎包括了幾乎所有移動用戶和病患的相關(guān)信息,屬于全樣本分析,分析結(jié)果較抽樣分析更加準確。央行支付數(shù)據(jù)與區(qū)域經(jīng)濟關(guān)系分析案例可擴展的數(shù)據(jù)擴展數(shù)據(jù)是指一些具有基本用途的數(shù)據(jù),還可以進行擴展,二次使用。如果以某種方式收集的單一數(shù)據(jù)集有多種不同的用途,它就具有雙重功能。收集多個數(shù)據(jù)流或每個數(shù)據(jù)流中更多數(shù)據(jù)點的額外成本往往較低,因此,收集盡可能多的數(shù)據(jù)并在一開始的時候就考慮到各種潛在的二次用途并使其具有擴展性是非常有意義的。比如谷歌公
10、司的谷歌地圖不僅拍攝房屋和街道的照片,同時還采集了GPS數(shù)據(jù)。不僅充實了其地圖服務(wù),而且對交通導(dǎo)航也有很大的幫助。廢棄數(shù)據(jù)再利用廢棄數(shù)據(jù)是指在使用過程中產(chǎn)生,但是卻對最終結(jié)果沒有價值的數(shù)據(jù)。但是這些數(shù)據(jù)往往同最終結(jié)果具有一定的相關(guān)性,能夠反映出使用者的一些意圖。例如,人們經(jīng)常想搜索某個內(nèi)容,點擊進入后卻未能找到想要的信息,于是又返回到搜索頁面繼續(xù)搜索。但是這個訪問痕跡卻已經(jīng)被記錄下來。Google認為這些信息是非常有價值的。如果許多用戶都點擊這個鏈接,就表明這個嘗試和結(jié)果更加具有相關(guān)性,可以及時調(diào)整,提高搜索的效率。數(shù)據(jù)的分析目的讓數(shù)據(jù)說話;行動的向?qū)В欢沤^浪費;提供決策的依據(jù)。分類描述性數(shù)據(jù)
11、分析預(yù)測性數(shù)據(jù)分析什么是數(shù)據(jù)分析? 數(shù)據(jù)分析是指適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,將它們加以匯總、理解并消化。以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。 數(shù)據(jù)分析的目的 數(shù)據(jù)分析的目的是把隱藏在一大批看似雜亂無章的數(shù)據(jù)背后的信息集中和提煉出來,總結(jié)研究對象的內(nèi)在規(guī)律。簡單的數(shù)據(jù)分析數(shù)據(jù)分析步驟:明確分析目的和內(nèi)容數(shù)據(jù)采集數(shù)據(jù)處理根據(jù)研究目標和內(nèi)容進行分析分析出的結(jié)果通過圖表的方式展現(xiàn)出來撰寫數(shù)據(jù)分析報告數(shù)據(jù)分析中經(jīng)常用到的指標或術(shù)語,除掌握最基本的平均數(shù)、百分比等概念以外,還需要將容易混淆的指標進行明確區(qū)分,避免在以后闡述分析結(jié)果時出現(xiàn)錯誤。常用指標或術(shù)語 平均數(shù) 絕對數(shù)與相對數(shù)
12、 百分比與百分點 頻數(shù)與頻率 比例與比率 倍數(shù)與番數(shù) 同比與環(huán)比平均數(shù)絕對數(shù)與相對數(shù) 絕對數(shù):是反映客觀現(xiàn)象總體在一定時間、地點條件下的總規(guī)模、總水平的綜合指標。也是數(shù)據(jù)分析中常用的指標,如:GDP、總?cè)丝跀?shù)等。 相對數(shù):是指兩個有聯(lián)系的指標對比計算而得到的數(shù)值,用于反映客觀現(xiàn)象之間數(shù)量聯(lián)系程度的綜合指標。計算相對數(shù)的基本公式: 比較數(shù)值(比數(shù)) 相對數(shù)= 基礎(chǔ)數(shù)值(基數(shù))分母是用做對比標準的指標數(shù)值,簡稱基數(shù);分子是用做與基數(shù)對比的指標數(shù)值,簡稱比數(shù)。相對數(shù)一般以倍數(shù)、成數(shù)、百分數(shù)等表示,它反映了客觀現(xiàn)象之間數(shù)量聯(lián)系的程度。使用相對數(shù)時需要注意指標的可比性,同時要與總量指標(絕對數(shù))結(jié)合使用
13、。百分比與百分點 百分比是相對數(shù)中的一種,它表示一個數(shù)是另一個數(shù)的百分之幾,也稱百分率或百分數(shù)。 百分點是指不同時期以百分數(shù)的形式表示的相對指標的變動幅度,1個百分點=1%。例如,下圖某公司發(fā)言人就混淆了百分比與百分點的概念。 表示構(gòu)成的變動幅度不宜用百分數(shù),而應(yīng)該用百分點。因此,這位公司發(fā)言人正確的說法應(yīng)該是“公司今年的利潤是45%,比去年的28%提高了17個百分點”。頻數(shù)與頻率 頻率是每組類別次數(shù)與總次數(shù)的比值,它代表某類別在總體中出現(xiàn)的頻繁程度,一般采用百分數(shù)表示,所有組的頻率加總等于100%。某校A班30個男同學在50個同學中出現(xiàn)的頻率為60%,即(3050)X100%;而20個女同學
14、在50個同學中出現(xiàn)的頻率為40%,即(2050)X100%。 頻數(shù)也稱次數(shù)。在一組依大小順序排列的測量值中,當按一定的組距將其分組時,出現(xiàn)在各組內(nèi)的測量值的數(shù)目,即為該組的頻數(shù),頻數(shù)與總數(shù)的比為頻率。 頻數(shù)越大表明該組標志值對于總體水平所起的作用也越大,反之,表明該組標志值對于總體水平所起的作用越小。 在10次擲硬幣中,有4次正面朝上,我們說這10次試驗中正面朝上的頻數(shù)是4。 累積頻數(shù)就是將各類別的頻數(shù)逐級累加起來比例與比率 比例是指在總體中各部分的數(shù)值占全部數(shù)值的比重,通常反映總體的構(gòu)成和結(jié)構(gòu)。比如,A班共有學生50人,男生30人,女生20人,則男生的比例是30/50,女生的比例是20/50
15、。由此可以看出,比例的基數(shù)(也就是分母)都是全體學生人數(shù),即為同一個基數(shù)。 比率是指不同類別數(shù)值的對比,它反映的不是部分與整體之間的關(guān)系,而是一個整體中各部分之間的關(guān)系。比如剛才的例子,男生30人,女生20人,則男生與女生的比率是30/20。這一指標經(jīng)常會用在社會經(jīng)濟領(lǐng)域,比如我國的人口性別比就是用每100名女性數(shù)量相對的男性數(shù)量來表示的。倍數(shù)與番數(shù) 倍數(shù)與番數(shù)同樣屬于相對數(shù),但使用時容易混淆。倍數(shù)是一個數(shù)除以另一個數(shù)所得的商。比如ABC,就是說A是B的C倍。需要注意的是,倍數(shù)一般是表示數(shù)量的增長或上升幅度,而不適用于表示數(shù)量的減少或下降。番數(shù)是指原來數(shù)量的2的N次方倍。比如翻一番為原來數(shù)量的
16、2倍( 21 ),翻兩番為4倍( 22 )。正確的說法:公司產(chǎn)品銷量翻一番(6.4=3.2X 21 ),從去年的3.2萬件提高到今年的6.4萬件。此外,我們成本控制也很好,由20萬元下降了50%,今年成本為10萬元同比與環(huán)比 同比是指與歷史同時期進行比較得到的數(shù)值,該指標主要反映的是事物發(fā)展的相對情況。例如2010年12月與2009年12月相比,如左圖所示。 環(huán)比是指與前一個統(tǒng)計期進行比較得到的數(shù)值,該指標主要反映的是事物逐期發(fā)展的情況。例如2010年12月與2010年11月相比,如右圖所示。1、聰明的人有長的耳朵和短的舌頭。 弗萊格 2、重復(fù)是學習之母。 狄慈根 3、當你還不能對自己說今天學
17、到了什么東西時,你就不要去睡覺。 利希頓堡 4、人天天都學到一點東西,而往往所學到的是發(fā)現(xiàn)昨日學到的是錯的。 B.V 5、學到很多東西的訣竅,就是一下子不要學很多。 洛 克 6、學問是異常珍貴的東西,從任何源泉吸收都不可恥。 阿卜日法拉茲 7、學習是勞動,是充滿思想的勞動。 烏申斯基 8、聰明出于勤奮,天才在于積累 華羅庚 9、好學而不勤問非真好學者。 10、書山有路勤為徑,學海無涯苦作舟。 11、人的大腦和肢體一樣,多用則靈,不用則廢 茅以升 12、你想成為幸福的人嗎?但愿你首先學會吃得起苦 屠格涅夫 13、成功艱苦勞動正確方法少說空話 愛因斯坦 14、不經(jīng)歷風雨,怎能見彩虹 真心英雄 15、只有登上山頂,才能看到那邊的風光。 16只會幻想而不行動的人,永遠也體會不到收獲果實時的喜悅。 17、勤奮是你生命的密碼,能譯出你一部壯麗的史詩。 1 8成功,往往住在失敗的隔壁!1 9 生命不是要超越別人,而是要超越自己2 0命運是那些懦弱和認命的人發(fā)明的!1人生最大的喜悅是每個人都說你做不到,你卻完成它了!2世界上大部分的事情,都是覺得不太舒服的人做出來的3昨天是失效的支票,明天是未兌現(xiàn)的支票,今天才是現(xiàn)金4一直割舍不下一件事,永遠成不了!5掃地,要連心地一起掃!6不為模糊不清的未來擔憂,只為清清楚楚的現(xiàn)在努力7當你停止嘗試時,就是失敗的時候
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 食品加工企業(yè)供應(yīng)鏈管理合同
- 天然氣市場發(fā)展與供應(yīng)保障考核試卷
- 國際形勢與我國外交戰(zhàn)略考核試卷
- 彈簧在汽車尾氣凈化系統(tǒng)中的催化轉(zhuǎn)化考核試卷
- 新材料推廣應(yīng)用合同
- 城市軌道交通的節(jié)能與減排技術(shù)考核試卷
- 口腔科用牙科顯微鏡操作考核試卷
- 物聯(lián)網(wǎng)硬件設(shè)備采購合同
- 冷凍飲品行業(yè)企業(yè)社會責任履行與評價考核試卷
- 企業(yè)財務(wù)報表編制咨詢合同
- 2024年西藏中考物理模擬試題及參考答案
- 九型人格與領(lǐng)導(dǎo)力講義
- 藥品經(jīng)營和使用質(zhì)量監(jiān)督管理辦法培訓試題及答案2023年9月27日國家市場監(jiān)督管理總局令第84號公布
- 人教版五年級上冊數(shù)學脫式計算練習200題及答案
- 卵巢黃體囊腫破裂教學查房
- 醫(yī)院定崗定編
- 計算機網(wǎng)絡(luò)畢業(yè)論文3000字
- 2023年大學物理化學實驗報告化學電池溫度系數(shù)的測定
- 腦出血的護理課件腦出血護理查房PPT
- 煤礦機電運輸安全培訓課件
- 扣繳個人所得稅報告表-(Excel版)
評論
0/150
提交評論