



免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
淺析數(shù)據(jù)挖掘技術(shù)在信息化建設(shè)中的應(yīng)用 邱旭君 惠州市第三人民醫(yī)院廣東惠州516002 摘要在信息化高速發(fā)展的今天,信息化建設(shè)飛速發(fā)展,在改革與發(fā)展過(guò)程中扮演著至關(guān)重要的角色。面對(duì)過(guò)程中產(chǎn)生的大量數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)可以從中分析出有效的信息,為提升管理效率起到了重要作用,財(cái)務(wù)系統(tǒng)、ERP系統(tǒng)、辦公系統(tǒng)等,都大大提升了管理的效率,并且為企業(yè)管理者決策提供了支持。 本文從數(shù)據(jù)挖掘的重要性出發(fā),介紹了數(shù)據(jù)挖掘的主要方法及關(guān)鍵技術(shù),數(shù)據(jù)挖掘在信息化建設(shè)中的作用,以及信息化建設(shè)的目標(biāo)。 關(guān)鍵詞數(shù)據(jù)挖掘;信息化建設(shè);數(shù)據(jù)挖掘技術(shù) 一、數(shù)據(jù)挖掘的概念和主要方法 數(shù)據(jù)挖掘是指從大量不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含的、的且潛在有用的知識(shí)和模式的過(guò)程。它綜合運(yùn)用計(jì)算機(jī)科學(xué)、人工智能、統(tǒng)計(jì)學(xué)、信息管理、認(rèn)知科學(xué)等領(lǐng)域的先進(jìn)理論與技術(shù),研究如何從海量信息資源中快速準(zhǔn)確地獲取潛在的知識(shí),是一種信息資源深層開(kāi)發(fā)的新型信息處理技術(shù)。 數(shù)據(jù)挖掘的主要方法有以下七種: 分類:就是建立分類模式,對(duì)數(shù)據(jù)庫(kù)里面的數(shù)據(jù)進(jìn)行分類。 估計(jì):對(duì)連續(xù)值的輸出進(jìn)行處理并且估計(jì)的量是無(wú)法確定的;分類卻是對(duì)離散型變量輸出的描述且數(shù)目是確定的。 預(yù)測(cè):分類和估計(jì)所得出來(lái)的模型,可以通過(guò)預(yù)測(cè)來(lái)對(duì)其模型進(jìn)行預(yù)測(cè)。 預(yù)測(cè)是需要經(jīng)過(guò)長(zhǎng)時(shí)間來(lái)進(jìn)行驗(yàn)證的,所以在通過(guò)預(yù)測(cè)后,不要立即否決該模型,要過(guò)一段時(shí)間再來(lái)觀察預(yù)測(cè)的準(zhǔn)確性。 相關(guān)性分組或關(guān)聯(lián)規(guī)則:是決定哪些事情將會(huì)一起發(fā)生。 描述和可視性:是將數(shù)據(jù)挖掘結(jié)果用某些方式表達(dá)出來(lái)。 聚類:是將一些相似的數(shù)據(jù)記錄在同一個(gè)聚集里面。 復(fù)雜數(shù)據(jù)類型挖掘。 二、數(shù)據(jù)挖掘的流程 數(shù)據(jù)挖掘的一般流程如下(圖1): (1)確定對(duì)象。在數(shù)據(jù)挖掘中,我們首先要做的是將問(wèn)題弄清楚,認(rèn)清挖掘的目的是什么。數(shù)據(jù)挖掘所得的結(jié)果不是確定的,但我們研究的問(wèn)題是一定的,所以在這個(gè)過(guò)程中研究對(duì)象起到引導(dǎo)作用,分析人員可將對(duì)象作為檢驗(yàn)結(jié)果的重要依據(jù)。(2)數(shù)據(jù)準(zhǔn)備。就是通過(guò)程序?qū)?shù)據(jù)庫(kù)中所需的數(shù)據(jù)分撿出來(lái),然后合成數(shù)據(jù)挖掘的數(shù)據(jù)包的過(guò)程。首先要選擇與對(duì)象相關(guān)的所有的內(nèi)部與外部數(shù)據(jù)信息,并從中選擇適當(dāng)?shù)男畔⒆鳛橥诰蛐畔?;其次根?jù)對(duì)象選擇必要的數(shù)據(jù)挖掘類型,為下一步的數(shù)據(jù)轉(zhuǎn)換與驗(yàn)算作預(yù)處理準(zhǔn)備;最后進(jìn)行數(shù)據(jù)轉(zhuǎn)換,將數(shù)據(jù)轉(zhuǎn)換成特殊的針對(duì)數(shù)據(jù)挖掘算法模型的過(guò)程,這也是實(shí)現(xiàn)數(shù)據(jù)成功挖掘的必要步驟。(3)尋找規(guī)律。通過(guò)建立的已有模型或算法,對(duì)數(shù)據(jù)庫(kù)中具有一定規(guī)律特點(diǎn)的數(shù)據(jù)進(jìn)行挖掘,這也是整個(gè)挖掘過(guò)程的核心所在。(4)知識(shí)表示與運(yùn)用。知識(shí)表示就是將最科學(xué)、最直觀的方式呈現(xiàn)給用戶,便于他們的理解,找出規(guī)律進(jìn)行科學(xué)直觀的表達(dá)的過(guò)程。另外,我們的最終目的是將所挖掘的數(shù)據(jù)應(yīng)用,所以還要將挖掘結(jié)果分配到用戶系統(tǒng)中去。 三、數(shù)據(jù)挖掘在信息化建設(shè)中的作用 信息化社會(huì)產(chǎn)生大量數(shù)據(jù),可以將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。獲取的信息和知識(shí)可以廣泛用于各種應(yīng)用,包括商務(wù)管理,生產(chǎn)控制,市場(chǎng)分析,工程設(shè)計(jì)和科學(xué)探索等。 信息化建設(shè)中各應(yīng)用系統(tǒng)通過(guò)數(shù)據(jù)集合已經(jīng)形成了一個(gè)龐大的信息數(shù)據(jù)庫(kù),但這些數(shù)據(jù)沒(méi)有被有效的利用起來(lái),在現(xiàn)代信息化的條件下,應(yīng)對(duì)這些長(zhǎng)期積累的海量數(shù)據(jù)進(jìn)行分析和挖掘,可以輔助管理者決策,提高工作質(zhì)量,優(yōu)化綜合實(shí)力資源提供可靠的數(shù)據(jù)依據(jù),信息化建設(shè)能夠切實(shí)的幫助企業(yè)在各種關(guān)鍵決策中發(fā)揮作用。 數(shù)據(jù)挖掘最直接的作用就是提升企業(yè)核心競(jìng)爭(zhēng)力,對(duì)所搜集到的信息利用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,有助于企業(yè)在關(guān)鍵領(lǐng)域建立獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì)。應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠充分利用企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中的海量數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果找出企業(yè)管理過(guò)程中出現(xiàn)的各種問(wèn)題,從而提高企業(yè)管理過(guò)程中決策的能力。 四、信息化建設(shè)的目標(biāo) 1、構(gòu)建一個(gè)全面的信息溝通平臺(tái) 實(shí)現(xiàn)網(wǎng)絡(luò)的高速互聯(lián)和全面覆蓋,使企業(yè)的各個(gè)部門把所有的信息在平臺(tái)上進(jìn)行共享,既提高了工作效率,又提供了決策的依據(jù)。 2、提高企業(yè)信息化價(jià)值 企業(yè)信息化建設(shè)的深入應(yīng)圍繞著如何降低成本、提高利潤(rùn)這一主線開(kāi)展。在企業(yè)全員中推,讓大家都有一個(gè)明確的目標(biāo),通過(guò)企業(yè)信息化的應(yīng)用讓效果公開(kāi)化,通過(guò)績(jī)效管理的配合切實(shí)的在企業(yè)中貫徹起來(lái)。 3、完善企業(yè)信息化機(jī)制 不管是完善管理制度還是提高工作效率,企業(yè)都應(yīng)該納入規(guī)范管理的軌道,這才是企業(yè)全面管理的基礎(chǔ)。 4、利用企業(yè)信息化為領(lǐng)導(dǎo)層提供決策依據(jù) 企業(yè)需要發(fā)現(xiàn)問(wèn)題并解決問(wèn)題,但更需要預(yù)防問(wèn)題。通過(guò)企業(yè)信息化系統(tǒng)的建立,將企業(yè)存在的問(wèn)題以數(shù)據(jù)的形式反映出來(lái),為領(lǐng)導(dǎo)層的決策提供有力的依據(jù)。 5、知識(shí)管理 建立企業(yè)以及部門、崗位的專業(yè)知識(shí)體系,全力推動(dòng)知識(shí)資源的形成、儲(chǔ)存、共享、交流及應(yīng)用;知識(shí)管理可以使企業(yè)全員貢獻(xiàn)和分享自己所掌握的專業(yè)知識(shí)從而積少成多,聚沙成塔。創(chuàng)建企業(yè)知識(shí)地圖,將知識(shí)和人有效的聯(lián)系起來(lái),提高大家獲取知識(shí)的效率,使大家能清晰了解企業(yè)知識(shí)分布狀況。最終達(dá)到擁有企業(yè)創(chuàng)新能力的“學(xué)習(xí)型”組織。隨著數(shù)據(jù)信息的增多,人們?yōu)榱四軌蛟诤棋绾5臄?shù)據(jù)信息中以最少的時(shí)間找到自己想要的數(shù)據(jù),并提高數(shù)據(jù)信息的利用率,就要應(yīng)用數(shù)據(jù)挖掘。數(shù)據(jù)挖掘技術(shù)可以讓人們更加便利的進(jìn)行信息提取,為各個(gè)領(lǐng)域平臺(tái)提供有價(jià)值的數(shù)據(jù)信息,以促進(jìn)企業(yè)的發(fā)展。信息化建設(shè)的進(jìn)一步發(fā)展,積累在數(shù)據(jù)庫(kù)中的信息量快速增加,都要求數(shù)據(jù)挖掘在管理領(lǐng)域的應(yīng)用以及管理數(shù)據(jù)資源的挖掘逐步完善起來(lái)。 參考
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 國(guó)際貿(mào)易與實(shí)務(wù)協(xié)議
- 2025年公務(wù)員錄用考試申論試卷:湖北地區(qū)版
- 三年級(jí)的作文寫景14篇
- 一例登革熱合并凝血功能障礙患者的個(gè)案護(hù)理
- 2025年法語(yǔ)TCF考試試卷寫作實(shí)戰(zhàn)技巧與案例分析試題
- 2025年超高壓復(fù)合膠管項(xiàng)目規(guī)劃申請(qǐng)報(bào)告
- 2025年安全生產(chǎn)消防安全應(yīng)急處置人員培訓(xùn)試題集
- 那場(chǎng)難忘的演講激情四溢的演講稿8篇范文
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)數(shù)字簽名技術(shù)規(guī)范報(bào)告:2025年技術(shù)挑戰(zhàn)與解決方案
- 紡織服裝行業(yè)智能化生產(chǎn)設(shè)備市場(chǎng)分析報(bào)告001
- 糧食行業(yè)技能競(jìng)賽糧油保管員考試試題及答案
- 劍橋商務(wù)英語(yǔ)BEC(初級(jí))全套課件
- 浪琴環(huán)球馬術(shù)冠軍賽上海站官方贊助商合作方案課件
- 醫(yī)療器械臨床評(píng)價(jià)課件
- 滬科版九年級(jí)物理全一冊(cè)教案(完整版)教學(xué)設(shè)計(jì)含教學(xué)反思
- 現(xiàn)場(chǎng)工程量確認(rèn)單
- 2022年廣東省佛山市順德區(qū)承德小學(xué)小升初數(shù)學(xué)試卷
- 黃亮和李燕的創(chuàng)業(yè)故事(鳳山書屋)
- DB61∕T 5006-2021 人民防空工程標(biāo)識(shí)標(biāo)準(zhǔn)
- 潔凈室塵埃粒子檢測(cè)規(guī)范
- 系統(tǒng)開(kāi)發(fā)需求確認(rèn)單
評(píng)論
0/150
提交評(píng)論