粗糙集決策方法講義課件_第1頁
粗糙集決策方法講義課件_第2頁
粗糙集決策方法講義課件_第3頁
粗糙集決策方法講義課件_第4頁
粗糙集決策方法講義課件_第5頁
已閱讀5頁,還剩215頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

粗糙集決策方法鐘映竑zhongyh@粗糙集決策方法鐘映竑1管理研究方法論方法論,methodology,指處理問題的一般途徑和程序。方法,method,指具體的做法。管理研究方法論,闡述管理學科研究工作的基本原則、途徑和程序,在總結(jié)前人經(jīng)驗的基礎(chǔ)上,提出有效的研究工作規(guī)范,包括問題闡述、文獻綜述、假設(shè)提出、數(shù)據(jù)收集、統(tǒng)計分析、信度和效度判斷以及研究報告或論文的撰寫等各個環(huán)節(jié)的規(guī)范。管理研究方法論方法論,methodology,指處理問題的一2管理研究方法論的重要性研究方法論是一種規(guī)范、邏輯,可以把研究工作提高到專業(yè)水平。正規(guī)學術(shù)訓練VS野路子,新聞報道,工作報告管理研究方法論的重要性研究方法論是一種規(guī)范、邏輯,可以把研究3科學方法與科學研究通過系統(tǒng)觀測而獲取客觀知識的方法。客觀性實證性規(guī)范性科學研究:滿足以上特征的獲取新知識的精確方法。研究對象具有可直接側(cè)魯昂和重復(fù)出現(xiàn)等特點??茖W方法與科學研究通過系統(tǒng)觀測而獲取客觀知識的方法。4科學研究中應(yīng)使用中性名詞和語句舉例:貴重金屬,稀有金屬民族工業(yè),本土工業(yè)經(jīng)過艱苦不懈的努力研究,本文得到了重要結(jié)論,對我國低碳供應(yīng)鏈的發(fā)展具有重要意義??茖W研究中應(yīng)使用中性名詞和語句舉例:5思辨方法與思辨研究涉及人的價值觀和偏好的領(lǐng)域以及發(fā)現(xiàn)新知識的過程,不強調(diào)客觀性和實證性,所得結(jié)果不必建立在直接觀測和經(jīng)驗基礎(chǔ)上,不必服從規(guī)范性。哲學,宗教,文學,藝術(shù),音樂……思辨方法與思辨研究涉及人的價值觀和偏好的領(lǐng)域以及發(fā)現(xiàn)新知識的6目標函數(shù)是利潤最大化,如何實現(xiàn)最優(yōu)化?頓悟:賺錢的意義是什么?我為什么要賺那么多錢?VS科學研究問題思辨研究問題天上的星空心中的道德康德目標函數(shù)是利潤最大化,如何實現(xiàn)最優(yōu)化?頓悟:賺錢的意義是什么7管理研究的分類描述型研究(descriptionstudies):收集數(shù)據(jù)以檢驗有關(guān)亞久對象狀態(tài)假設(shè)的工作過程,它回答who,whatwhere,howmuch之類的問題,旨在將現(xiàn)象和事件描述和識別清楚。管理研究的分類描述型研究(descriptionstudi8管理研究的分類解釋型研究,explanationstudies,回答為什么(why)的問題。探索現(xiàn)象和事件之間的關(guān)聯(lián),弄清因果。描述型和解釋型研究類似于醫(yī)生看病的診斷過程。描述是基礎(chǔ),解釋是后續(xù)。管理研究的分類解釋型研究,explanationstudi9管理研究的分類規(guī)范型研究,prescriptionstudies,回答“應(yīng)該怎樣”的問題。理工科背景的研究生偏愛規(guī)范型研究。管理研究的分類規(guī)范型研究,prescriptionstud10管理研究設(shè)計兩個目的:辨識問題,提煉主題論證和驗證主題。管理研究設(shè)計兩個目的:11管理研究設(shè)計問題辨析:研究問題從哪里來?聚焦研究主題,提出假設(shè),建立假設(shè)樹。假設(shè)論證或假設(shè)檢驗:理論研究,實證研究,統(tǒng)計研究,實地研究,實驗研究等。管理研究設(shè)計問題辨析:研究問題從哪里來?12建立假設(shè)樹要注意的問題假設(shè)樹是一項研究工作創(chuàng)新點的結(jié)構(gòu)化表述,不是工作提綱。假設(shè)樹中任何一層假設(shè)的表述都應(yīng)當是假設(shè)的形式,也就是變量和變量之間關(guān)系的陳述語句。下層次假設(shè)一定要支持上層次的假設(shè)。建立假設(shè)樹要注意的問題假設(shè)樹是一項研究工作創(chuàng)新點的結(jié)構(gòu)化表述13推薦閱讀管理研究方法論,李懷祖,西安交通大學出版社,2006.11。組織與管理研究的實證方法,陳曉萍,徐淑英,樊景立,北京大學出版社,2008.6.推薦閱讀管理研究方法論,李懷祖,西安交通大學出版社,200614管理研究方法的來源管理學不是一門純粹的學問,它的學科基礎(chǔ)很復(fù)雜,包括數(shù)學、計算機科學、工程學、經(jīng)濟學、社會學,人類學、心理學、行為科學、政治學、生物學,等等。學科來源的復(fù)雜多樣化,導致管理研究方法的多樣性。管理研究方法的來源管理學不是一門純粹的學問,它的學科基礎(chǔ)很復(fù)15管理問題集經(jīng)濟學方法,數(shù)學方法,計算機科學方法,工程學方法,社會學方法,人類學方法,心理學方法,行為科學方法,政治學方法,生物學方法管理問題集經(jīng)濟學方法,數(shù)學方法,計算機科學方法,工程學方法,16燈下尋找鑰匙避免方法論或方法的帝國主義或孤立主義。應(yīng)當堅持:多元主義互補主義燈下尋找鑰匙避免方法論或方法的帝國主義或孤立主義。17管理問題管理研究方法論管理研究方法管理問題管理研究方法論管理研究方法18管理的學科基礎(chǔ)所提供的研究方法數(shù)學:運籌學,統(tǒng)計學。經(jīng)濟學:博弈論計算機科學:數(shù)據(jù)挖掘方法,仿真。社會學、人類學:案例研究方法,統(tǒng)計方法、結(jié)構(gòu)方程模型。工程學:系統(tǒng)工程方法,泰羅的科學管理。心理學、行為科學:實驗方法。生物學:演化方法。純粹管理學方法:?管理的學科基礎(chǔ)所提供的研究方法數(shù)學:運籌學,統(tǒng)計學。19處理大數(shù)據(jù)的方法粗糙集決策理論與應(yīng)用處理大數(shù)據(jù)的方法粗糙集決策理論與應(yīng)用20粗糙集概述在很多實際系統(tǒng)中均不同程度地存在著不確定性因素,采集到的數(shù)據(jù)常常包含著噪聲,不精確甚至不完整.粗糙集理論是繼概率論,模糊集,證據(jù)理論之后的又一個處理不確定性的數(shù)學工具。粗糙集概述在很多實際系統(tǒng)中均不同程度地存在著不確定性因素,21粗糙集在應(yīng)用中的優(yōu)點粗糙集分析數(shù)據(jù)不需要先驗知識.粗糙集理論是適合大數(shù)據(jù)集分析的強大工具.粗糙集提供了含糊概念的數(shù)學描述,并可計算。粗糙集在應(yīng)用中的優(yōu)點粗糙集分析數(shù)據(jù)不需要先驗知識.22粗糙集的發(fā)展歷程1982年提出到80年代末,研究主要集中在東歐.1991年,Pawlak出版了第一部關(guān)于粗糙集的專著《RoughSets:TheoreticalAspectsofReasoningaboutData》.1992年,R.Slowinski主編的關(guān)于粗糙集應(yīng)用及其與相關(guān)方法比較研究的論文集的出版,推動了國際上對粗糙集理論與應(yīng)用的深入研究.1992年在波蘭Kiekrz召開了第一屆國際粗糙集討論會.(以后每年一屆)粗糙集的發(fā)展歷程1982年提出到80年代末,研究主要集中231995年,ACMCommunication將它列為新浮現(xiàn)的計算機科學的研究課題;1998年,國際信息科學雜志《InternationalJournalofInformationScience》為粗糙集理論的研究出了一期???2004年,國際粗糙集協(xié)會主辦的第一本粗糙集國際期刊《AdvancesinRoughSets》出版發(fā)行;國外主要研究機構(gòu):波蘭華沙大學、工業(yè)大學、信息技術(shù)和管理大學和加拿大Regina大學和圣瑪麗大學、英國Edinburgh大學,Ulster大學和Cardiff大學,意大利Catania大學,印度統(tǒng)計研究院,美國SanJose州立大學.1995年,ACMCommunication將它列為新浮242001年5月,第一屆中國Rough集與軟計算學術(shù)研討會,邀請了創(chuàng)始人Z.Pawlak教授做大會報告(重慶,重慶郵電大學)2002年10月,第二屆中國Rough集與軟計算學術(shù)研討會(蘇州,蘇州大學)2003年5月,第三屆中國Rough集與軟計算學術(shù)研討會(重慶,重慶郵電大學)(注:同年,承辦了第九屆國際粗糙集,模糊集,數(shù)據(jù)挖掘與粒計算學術(shù)研討會;中國人工智能學會也于同年正式成立粗糙集與軟計算專業(yè)委員會.)2001年5月,第一屆中國Rough集與軟計算學術(shù)研討會,252004年10月,第四屆中國Rough集與軟計算學術(shù)研討會(舟山,浙江海洋學院)2005年8月,第五屆中國Rough集與軟計算學術(shù)研討會(鞍山,鞍山科技大學)2006年,第六屆中國Rough集與軟計算學術(shù)研討會(金華,浙江師范大學)2007年,第七屆Rough集與軟計算、第一屆Web智能、第一屆粒計算聯(lián)合學術(shù)會議(太原,山西大學)2004年10月,第四屆中國Rough集與軟計算學術(shù)研討會262008年,第八屆中國Rough集與軟計算學術(shù)會議、第二屆中國Web智能學術(shù)研討會、第二屆中國粒計算學術(shù)研討會聯(lián)合學術(shù)會議(CRSSC-CWI-CGrC2008)(新鄉(xiāng),河南師范大學)2009年8月,第九屆中國Rough集與軟計算學術(shù)會議在河北師范大學召開(石家莊).國內(nèi)主要研究機構(gòu):中科院計算所,中科院自動化所,重慶郵電大學,南昌大學,西安交通大學,山西大學,合肥工業(yè)大學,北京工業(yè)大學,上海大學,山東大學.2008年,第八屆中國Rough集與軟計算學術(shù)會議、第二屆27粗糙集基本概念基本粗糙集理論認為知識就是人類所固有的分類能力.分類是推理、學習與決策中的關(guān)鍵問題.粗糙集理論假定知識是一種對對象進行分類的能力.知識必須與具體或抽象世界的特定部分相關(guān)的各種分類模式聯(lián)系在一起,這種特定部分稱之為所討論的全域或論域(universe).對于全域及知識的特性并沒有任何特別假設(shè).事實上,知識構(gòu)成了某一感興趣領(lǐng)域中各種分類模式的一個族集(family),這個族集提供了關(guān)于現(xiàn)實的顯事實,以及能夠從這些顯事實中推導出隱事實的推理能力.粗糙集基本概念基本粗糙集理論認為知識就是人類所固有的分類能力28粗糙集的思想基礎(chǔ)粗糙集基于這種認識,在分類機制的基礎(chǔ)上建立.它將分類理解為在特定空間(論域U)上的等價關(guān)系(R),而等價關(guān)系構(gòu)成了對該空間的劃分.在特定空間上的等價關(guān)系反映了人們對該空間的認識,稱為知識(U/R).借用邊界域的概念,粗糙集理論巧妙地表達了人們在認識事物時表現(xiàn)出的不確定性.粗糙集的思想基礎(chǔ)粗糙集基于這種認識,在分類機制的基礎(chǔ)上建立29粗糙概念的來源之一—集合與模糊集合概念的提出(Cantor1883)集合是數(shù)學中的基本概念,也是大部分數(shù)學結(jié)構(gòu)的依賴.粗糙概念的來源之一—集合與模糊集合概念的提出(Cantor30如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?謂詞邏輯的創(chuàng)始人G.Frege(1904)提出了含糊(Vague)的概念,他把它歸結(jié)到邊界線上,也就是說在全域上存在一些個體既不能在其某個子集上分類,也不能在該子集的補集上分類.如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?謂詞邏輯的創(chuàng)始人G.Fr31如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?Zadeh提出了模糊集(1965),但模糊集理論采用隸屬度函數(shù)來處理模糊性,而基本的隸屬度是憑經(jīng)驗或者由領(lǐng)域?qū)<医o出,所以具有相當?shù)闹饔^性。含糊(vagueness)和不確定(uncertainty):含糊是集合的性質(zhì),可以通過近似概念來描述;而不確定性是集合中元素的性質(zhì),可以通過隸屬函數(shù)表達.(通常二者也不加區(qū)分,稱為模糊.注意!)如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?Zadeh提出了模糊集(32粗糙集的另一個來源—知識表達系統(tǒng)Z.Pawlak先提出了知識表達系統(tǒng)(1973),其中提出了按照屬性分類的思想,后來他又提出了近似空間的概念(1981),試圖用上下近似來描述集合.Z.Pawlak.InformationSystemsTheoreticalFoundations[J].InformationSystems,1981,6(3):205-218.

粗糙集的另一個來源—知識表達系統(tǒng)Z.Pawlak先提出了331982年,Pawlak提出了粗糙集(RoughSets),他把那些無法確認分類的個體都歸屬于邊界域,而這種邊界域被定義為上近似集和下近似集之差集.由于它有確定的數(shù)學公式描述,完全由數(shù)據(jù)決定,所以更有客觀性.Z.Pawlak.Roughsets.InternationalJournalofComputerandInformationSciences.1982,11(5):341-356.1982年,Pawlak提出了粗糙集(RoughSets)34基本概念定義稱一個二元組K=(U,R)為一個近似空間(approximatespace)(或知識庫).

其中U(為空集)是一個被稱為全域或論域(universe)的所有要討論的個體的集合,R是U上等價關(guān)系的一個族集.定義稱一個二元關(guān)系R是不可分辨關(guān)系或等價關(guān)系(indiscerniblerelation),如果R滿足:基本概念定義稱一個二元組K=(U,R)為一個近似空間35給定近似空間K=(U,R),子集XU稱為U上的一個概念(concept;空集也視為一個概念);非空子族集PR所產(chǎn)生的不分明關(guān)系IND(P)的所有等價類關(guān)系的集合即U/IND(P),稱為基本知識(basicknowledge),相應(yīng)的等價類稱為基本概念(basicconcept);特別地,若關(guān)系QR,則關(guān)系Q就稱為初等知識(elementaryknowledge),相應(yīng)的等價類就稱為初等概念(elementaryconcept).由定義可知,概念即對象的集合,概念的族集(分類)就是U上的知識,U上分類的族集可以認為是U上的一個知識庫,或說知識庫即是分類方法的集合。給定近似空間K=(U,R),子集XU稱為U上的一個概念36A={x1,x2,x3,x4,x5,x6,x7,x8},每個積木塊都有顏色屬性,按照顏色的不同,我們能夠把這堆積木分成R1={紅,黃,蘭}三個大類,那么所有紅顏色的積木構(gòu)成集合X1={x1,x2,x6},黃顏色的積木構(gòu)成集合X2={x3,x4},蘭顏色的積木構(gòu)成集合X3={x5,x7,x8}。按照顏色這個屬性我們就把積木集合A進行了一個劃分(所謂A的劃分就是指對于A中的任意一個元素必然屬于且僅屬于一個分類),那么我們就說顏色屬性就是一種知識。在這個例子中我們不難看到,一種對集合A的劃分就對應(yīng)著關(guān)于A中元素的一個知識

A={x1,x2,x3,x4,x5,x6,x7,x8},每個37假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},大小R3={大,中,小},這樣加上R1屬性對A構(gòu)成的劃分分別為:

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}(顏色分類)

A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}(形狀分類)

A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分類)

上面這些所有的分類合在一起就形成了一個基本的知識庫。假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},38除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}這樣的概念以外還可以表達例如

大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},

大三角{x1,x2,x5}∩{x1,x2}={x1,x2},

蘭色的小的圓形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},

蘭色的或者中的積木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而類似這樣的概念可以通過求交運算得到,比如X1與Y1的交就表示紅色的三角形。除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角39所有的這些能夠用交、并表示的概念以及加上上面的三個基本知識(A/R1,A/R2.A/R3)一起就構(gòu)成了一個知識系統(tǒng),記為R=R1∩R2∩R3,它所決定的所有知識是A/R={{x1,x2},{x3,x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。粗糙集理論建立在這樣一個前提上:即所考慮的論域中的每一個對象都包含某種信息(數(shù)據(jù)和知識)。所有的這些能夠用交、并表示的概念以及加上上面的三個基本知識(40基本集(基本粒度):定義:所有不可區(qū)分的對象形成的集合解釋:可區(qū)分(可分辨):如果Ui≠Uj就稱這兩個對象在其條件P下是可區(qū)分的(對于兩個不同的對象至少有一個屬性是不同的)否則即為不可區(qū)分。基本集(基本粒度):41舉例對于右表來說,U中有四個對象(概念),而現(xiàn)在條件集合中只有一個屬性,對于U1和U2來說,它們的p不同,所以可以通過p來區(qū)分,即u1,u2在p下可區(qū)分;而U2和U3雖然是不同的對象但是在P下卻是相同的,即在p下不可區(qū)分,就成為不可區(qū)分的對象。UP11203042舉例對于右表來說,U中有四個對象(概念),而現(xiàn)在條件集合中只42信息系統(tǒng)信息系統(tǒng)被定義為如下的四元組:S=(U,A,V,f)。其中S為知識表達系統(tǒng),U={x1,x2,…,xn}為對象的非空有限集合,也稱為論域;A={a1,a2,…,am}為屬性的非空有限集合;V為屬性值域,f:UAV為一信息函數(shù),當信息系統(tǒng)中屬性A等于C并D,其中C為條件屬性集,D為決策屬性集時,信息系統(tǒng)也稱為決策系統(tǒng)。信息系統(tǒng)信息系統(tǒng)被定義為如下的四元組:S=(U,A,V,f)43決策表決策表44等價關(guān)系舉例設(shè)信息系統(tǒng)如下表所示,對象為8輛汽車,條件屬性分別為顏色、排放量和價格,決策屬性為銷售量。等價關(guān)系舉例設(shè)信息系統(tǒng)如下表所示,對象為8輛汽車,條件屬性分45屬性對象條件屬性C決策屬性顏色a1排放量a2價格a3銷售量(d)x1紅色1.8中中x2黑色1.6低大x3銀灰1.6中大x4銀灰1.8高中x5黑色2.0中小x6紅色1.6低小x7銀灰1.6中大x8黑色2.0中小屬性條件屬性C決46U/a1={{x1,x6},{x2,x5,x8},{x3,x4,x7}}U/a2={{x1,x4},{x2,x3,x6,x7},{x5,x8}}U/a3={{x1,x3,x5,x7,x8},{x2,x6},{x4}}以上U/a1,U/a2,U/a3取交集,得U/C={{x1},{x2},{x3,x7},{x4},{x5,x8},{x6}}用決策屬性d來劃分,可得U/d={{x1,x4},{x2,x3,x7},{x5,x6,x8}}在每一等價類中,按現(xiàn)有的信息無法再區(qū)別開。例如,由所有的條件屬性獲得的信息無法區(qū)分x3與x7,也無法區(qū)分x5與x8.因而,這種知識是有粒度的U/a1={{x1,x6},{x2,x5,x8},{x3,x47下近似和上近似定義給定知識表達系統(tǒng)S=<U,A,V,f>,對于每個子集X

U和一個等價關(guān)系R,可以根據(jù)R的基本集合描述來劃分集合X:R_(X)={x|(xU)([x]RX)}R_(X)={x|(xU)([x]R∩X)}R_(X)和R_(X)分別稱為X的R下近似集和R上近似集;稱BNR(X)=R_(X)-R_(X)是X的邊界域.若BNR(X)則稱X是粗糙的.下近似和上近似定義給定知識表達系統(tǒng)S=<U,A,48下近似集是在那些所有的包含于X的知識庫中的集合中求并得到的,而上近似則是將那些包含X的知識庫中的集合求并得到的。

下近似集是在那些所有的包含于X的知識庫中的集合中求并得到的,49正域、負域和邊界域POS(X)=R_(X)稱為集合X的R-正域,NEG(X)=U–R_(X)稱為集合X的R-負域.集合的下近似是包含給定集合中所有基本集的集合,也就是所有一定能歸入X的元素的集合。集合的上近似是包含給定集合元素中所有基本集的最小集合,上近似表示在知識R下,U中可能歸入X的元素的集合.

邊界域表示在知識R下,U中既不能肯定歸入X也不能肯定歸入–X的元素的集合。正域、負域和邊界域POS(X)=R_(X)稱為集合X的R-50關(guān)于正域的理解把下近似求并,就是正域。關(guān)于正域的理解把下近似求并,就是正域。51舉例舉例52設(shè)屬性Headache(a1),Muscle_pain(a2),Temperature(a3),Flu(d).表中所有實例構(gòu)成論域U,U={e1,e2,e3,e4,e5,e6}.現(xiàn)設(shè)有一概念X={e1,e2,e3,e4,e5},對于關(guān)系R,若R僅考慮屬性a1,a2,則用R對U劃分可得到如下不可區(qū)分的實例集合:U/a1={{e1,e2,e3},{e4,e5,e6}}U/a2={{e1,e2,e3,e4,e6},{e5}}U/R={{e1,e2,e3},{e4,e6},{e5}}.這些集合稱為基本集.設(shè)屬性Headache(a1),Muscle_pain(a53U/R中,肯定屬于X的集合為下近似。R_(X)={e1,e2,e3}∪{e5}={e1,e2,e3,e5}U/R中,所有有可能屬于X的集合為上近似。R_(X)={e1,e2,e3}∪{e4,e6}∪{e5}=UBNR(X)={e4,e6}≠因此可以稱X是R-粗糙集.當上近似等于下近似時,稱集合X關(guān)于R是清晰的,當兩者不相等時,稱集合X關(guān)于R是粗糙的。U/R中,肯定屬于X的集合為下近似。R_(X)={e1,e254yesyes/nono{e1,e2,e3,e5}{e4,e6}上下近似實例(圖)下近似也就是正域,正域外面的是負域。yesyes/nono{e1,e2,e3,e5}{e4,e655粗糙集首先從新的視角對知識進行了定義。把知識看作是關(guān)于論域的劃分,從而認為知識是具有粒度〔granularity〕的。認為知識的不精確性是由知識粒度太大引起的。為處理數(shù)據(jù)〔特別是帶噪聲、不精確或不完全數(shù)據(jù)〕分類問題提供了一套嚴密的數(shù)學工具,使得對知識能夠進行嚴密的分析和操作。又由于數(shù)據(jù)挖掘的深入研究和一些成功的商業(yè)運作,使得粗糙集理論和數(shù)據(jù)挖掘有了天然的聯(lián)系,粗糙集在知識上的定義、屬性約簡、規(guī)則提取等理論,使得數(shù)據(jù)庫上的數(shù)據(jù)挖掘有了深刻理論基礎(chǔ),從而為數(shù)據(jù)挖掘提供了一種嶄新的工具。粗糙集不僅自己可以獨特的挖掘知識,而且可以和其他的數(shù)據(jù)挖掘算法結(jié)合起來,從而產(chǎn)生了學多混合數(shù)據(jù)挖掘算法,大大開拓了數(shù)據(jù)挖掘的算法和技術(shù),豐富了數(shù)據(jù)挖掘的工具。粗糙集首先從新的視角對知識進行了定義。把知識看作是關(guān)于論域的56粗糙隸屬函數(shù)定義:信息系統(tǒng)論域中元素x對集合X的粗糙隸屬函數(shù)定義為:粗糙隸屬函數(shù)表示在關(guān)系R下,元素x對集合X的隸屬程度,顯然在0到1之間。絕對值符號稱為集合的基數(shù)cardiny。粗糙隸屬函數(shù)定義:信息系統(tǒng)論域中元素x對集合X的粗糙隸屬函數(shù)57粗糙隸屬函數(shù)舉例U/C={{1,6},{2},{3},{4,7},{5},{6},{8}}U/d={{1,2,6,7},{3,4,5,8}}={X1,X2}求μx1(4)和μx1(7)?;

所以粗糙隸屬函數(shù)舉例U/C={{1,6},{2},{3},{4,58依賴度依賴度表示在條件屬性集C下,能確切地劃入決策分類U/D的對象占論域中的總對象數(shù)的比率。依賴度依賴度表示在條件屬性集C下,能確切地劃入決策分類U/D59屬性重要度設(shè)有決策系統(tǒng)S=(U,C∪D,C,f),其中,C,D分別為條件屬性和決策屬性集,屬性子集C’的屬性重要度定義為σC,D(C’)=γC(D)-γC-C’(D)當C’是屬性α,也可以有類似定義??衫斫鉃?,如果去掉屬性α,分類U/D的正域受到的影響。屬性重要度設(shè)有決策系統(tǒng)S=(U,C∪D,C,f),其中60屬性約簡屬性約簡是粗糙集理論中的核心內(nèi)容之一,決策表中的屬性并不是同等重要的,甚至有些屬性是冗余的,所謂屬性約簡,就是保持決策表條件屬性和決策屬性之間的依賴關(guān)系不變的前提下,刪除其中的不相關(guān)或不重要的屬性。屬性約簡屬性約簡是粗糙集理論中的核心內(nèi)容之一,決策表中的屬性61定義:設(shè)有決策系統(tǒng)S=(U,C∪D,V,f),若POSC(D)=POSC-α(D),則稱屬性α為C中D可省略的,否則屬性α為C中D不可省略的。去掉α之后,正域不變,說明α是可以省略的。定義:對于一個給定的決策系統(tǒng),條件屬性集C的D約簡是C的一個非空子集P.若滿足1)對于P中的任何一個α,α都是D不可省略的。2)POSP(D)=POSC(D),則稱P是C的一個約簡,C中所有約簡的集合記作REDD(C)。定義:設(shè)有決策系統(tǒng)S=(U,C∪D,V,f),若POS62核(core)C中所有不可省略屬性的集合成為C的核,記為CORED(C),則CORED(C)=∩REDD(C)決策表中的屬性約簡是指屬性的最小不可省略子集,而屬性的核是指最重要的屬性集。屬性的核可以是空集。核(core)C中所有不可省略屬性的集合成為C的核,記為CO63決策規(guī)則的準確度對于規(guī)則θ→φ,所有具有屬性θ和決策φ的規(guī)則的總數(shù)稱為規(guī)則的支持數(shù)(support)。在屬性θ的基礎(chǔ)上,能得到?jīng)Q策φ的準確性,稱為決策規(guī)則的準確度(accuracy)。Accuracy=support(θ·φ)/support(φ)由條件θ得到φ的數(shù)量除以所有能得到φ的數(shù)量。決策規(guī)則的準確度對于規(guī)則θ→φ,所有具有屬性θ和決策φ的規(guī)則64算例分析:求屬性約簡及決策規(guī)則uc1c2c3dx11110x21121x31131x40110x50020x60131x70021x80130算例分析:求屬性約簡及決策規(guī)則uc1c2c3dx11110x65U/c1={{x1,x2,x3},{x4,x5,x6,x7,x8}}U/c2={{x1,x2,x3,x4,x6,x8},{x5,x7}}U/c3={{x1,x4},{x2,x5,x7},{x3,x6,x8}}U/C={{x1},{x2},{x3},{x4},{x5,x7},{x6,x8}}U/d={{x1,x4,x5,x8},{x2,x3,x6,x7}}下近似R(d1)={x1,x4},下近似R(d2)={x2,x3}POSc(D)={x1,x2,x3,x4},依賴度=4/8=0.5U/c1={{x1,x2,x3},{x4,x5,x6,x7,66令C’=C-{c1}={c2,c3}U/C’={{x1,x4},{x2},{x3,x6,x8},{x5,x7}}d1={x1,x4,x5,x8},d2={x2,x3,x6,x7}R(d1)={{x1},{x4}},R(d2)={x2},POSC-{c1}(D)={x1,x2,x4},不等于POSc(D)U/C’的某子集/元素與d1的交集仍然等于U/C’的該子集/元素,則該子集/元素為下近似的一個子集或元素。令C’=C-{c1}={c2,c3}67令C’’=C-{c2}={c1,c3}U/C’’={{x1},{x2},{x3},{x4},{x5,x7},{x6,x8}}d1={x1,x4,x5,x8},d2={x2,x3,x6,x7}R(d1)={{x1},{x4}},R(d2)={{x2},{x3}},POSC-{c2}(D)={x1,x2,x3,x4},等于POSc(D)令C’’=C-{c2}={c1,c3}68令C’’’=C-{c3}={c1,c2}U/C’’’={{x1,x2,x3},{x4,x6,x8},{x5,x7}}d1={x1,x4,x5,x8},d2={x2,x3,x6,x7}R(d1)=?,R(d2)=?,POSC-{c3}(D)=?,不等于POSc(D)令C’’’=C-{c3}={c1,c2}69令C(4)=C-{c1,c2}={c3}U/c3={{x1,x4},{x2,x5,x7},{x3,x6,x8}}d1={x1,x4,x5,x8},d2={x2,x3,x6,x7}R(d1)={{x1},{x4}},R(d2)=?,POSC-{c1,c2}(D)={x1,x4},不等于POSc(D)令C(4)=C-{c1,c2}={c3}70令C(5)=C-{c2,c3}={c1}U/c1={{x1,x2,x3},{x4,x5,x6,x7,x8}}d1={x1,x4,x5,x8},d2={x2,x3,x6,x7}R(d1)=?,R(d2)=?,POSC-{c2,c3}(D)=?,不等于POSc(D)令C(5)=C-{c2,c3}={c1}71令C(6)=C-{c1,c3}={c2}U/c2={{x1,x2,x3,x4,x6,x8},{x5,x7}}d1={x1,x4,x5,x8},d2={x2,x3,x6,x7}R(d1)=?,R(d2)=?,POSC-{c1,c3}(D)=?,不等于POSc(D){c1,c3}是條件屬性集C的D約簡,并且屬性約簡唯一。令C(6)=C-{c1,c3}={c2}72決策規(guī)則共有4條確定性決策規(guī)則:r1:(c1,1)?(c3,1)→(d,0)r2:(c1,1)?(c3,2)→(d,1)r3:(c1,1)?(c3,3)→(d,1)r4:(c1,0)?(c3,1)→(d,0)決策規(guī)則共有4條確定性決策規(guī)則:73決策規(guī)則共有4條不確定性規(guī)則:r5:(c1,1)?(c3,2)→(d,0)r7:(c1,1)?(c3,2)→(d,1)r6:(c1,0)?(c3,3)→(d,1)r8:(c1,0)?(c3,3)→(d,0)確定性因子為0.5.準確度為0.5.決策規(guī)則共有4條不確定性規(guī)則:74準確度舉例項目abcD數(shù)量x1123150x212125x3223230x4233210x535134x635141準確度舉例項目abcD數(shù)量x1123150x212125x375支持數(shù)和準確度的結(jié)果得出的規(guī)則supportaccuracya1c3→d1501.0a1c1→d251.0a2c3→d2401.0a3c1→d340.8a3c1→d410.2支持數(shù)和準確度的結(jié)果得出的規(guī)則supportaccuracy76小結(jié)根據(jù)屬性約簡得到規(guī)則;規(guī)則的可信度由規(guī)則的支持數(shù)和準確度來衡量。小結(jié)根據(jù)屬性約簡得到規(guī)則;77練習在航空兵部隊中,飛機備件一般分為初始備件和后續(xù)備件。初始備件與后續(xù)備件的管理有所不同。因此,確定哪些備件為初始備件很重要。下表是決策信息表,其中對象為飛機器材,條件屬性C={a1,a2,a3,a4}分別為器材的關(guān)鍵性、故障修理間隔時間(MTBF)、故障發(fā)生間隔時間(MTTR)及費用;決策屬性d={是,否},分別表示該器材是否確定為初始備件。練習在航空兵部隊中,飛機備件一般分為初始備件和后續(xù)備件。初始78屬性對象條件屬性決策屬性編號關(guān)鍵性MTBFMTTR費用初始備件1I長短中是2I中中低是3II長中高否4II中中高否5III短長低否6I長短中是7II中中高是8II短中高否屬性條件屬性決策屬性編號關(guān)鍵性MTBFMTTR費用79U/a1={{1,2,6},{3,4,7,8},{5}}U/a2={{1,3,6},{2,4,7},{5,8}}U/a3={{1,6},{2,3,4,7,8},{5}}U/a4={{1,6},{2,5},{3,4,7,8}}U/C={{1,6},{2},{3},{4,7},{5},{8}}U/d={{1,2,6,7},{3,4,5,8}}R(d1)={1,2,6},Rˉ(d1)={1,2,4,6,7}BNR(d1)={4,7}U/a1={{1,2,6},{3,4,7,8},{5}}80U/C={{1,6},{2},{3},{4,7},{5},{8}}U/d={{1,2,6,7},{3,4,5,8}}R(d2)={3,5,8},Rˉ(d2)={3,4,5,7,8}BNR(d2)={4,7}POSR(d1)={1,2,6},POSR(d2)={3,5,8}POSC(d)={1,2,3,5,6,8}U/C={{1,6},{2},{3},{4,7},{5},{81練習考慮以下決策系統(tǒng),系統(tǒng)對象U={1,2,3,4,5},條件屬性C={a1,a2,a3},決策屬性D=fftdrb1,求其約簡與核。練習考慮以下決策系統(tǒng),系統(tǒng)對象U={1,2,3,4,5},條82屬性對象a1a2a3d1102122102321234122151203屬性a1a2a3d1102122102321283解U/a1={{1,4,5},{2,3}}U/a2={{1},{2,3},{4,5}}U/a3={{1,3,4},{2,5}}U/C={{1},{2},{3},{4},{5}}U/d={{1,4},{2},{3,5}}R(d1)={1,4},R(d2)={2},R(d3)={3,5}POSc(d)={1,2,3,4,5}解U/a1={{1,4,5},{2,3}}84U/{C-a2}={{1,4},{2},{3},{5}}其正域為{1,2,3,4,5},所以可以刪除a2.U/{C-a1}={{1},{2},{3},{4},{5}}其正域為{1,2,3,4,5},所以可以刪除a1.得到2個約簡,{a1,a3},{a2,a3},它們維持了原有條件屬性C相同的分類能力,2個約簡的交集是{a3},核是{a3}.U/{C-a2}={{1,4},{2},{3},{5}}85多值決策系統(tǒng)設(shè)有決策系統(tǒng)S={U,A,V,f},其中U={x1,x2,…,xn}為對象集,稱為論域。A是屬性集,A=C∪D,C為條件屬性集,D為決策屬性集;V為屬性值集,其中VC={Va,a∈C}是條件屬性值集,VD={Vd,d∈C}是決策屬性值集。f:U×A→V為一個信息函數(shù),表示對每一個a∈A,x∈U,f(x,a)∈Va。如果對于條件屬性值vij∈Va,Va是由幾個屬性值組成,并假定決策屬性值為單值,則S為多值決策系統(tǒng)。多值決策系統(tǒng)設(shè)有決策系統(tǒng)S={U,A,V,f},其中U={x86多值決策系統(tǒng)的相容粗糙集解讀:兩個對象,如果它們的所有屬性的取值的交集不為空,則它們是相容關(guān)系。多值決策系統(tǒng)的相容粗糙集解讀:兩個對象,如果它們的所有屬性的87不完備決策系統(tǒng)的粗糙決策定義:設(shè)有決策系統(tǒng)S=(U,A,V,f),其中U為論域,A為屬性集合,A=C∪D,C為條件屬性集,D為決策屬性集;V為屬性值集,其中VC={Va,a∈C}是條件屬性值集,VD={Vd,d∈C}是決策屬性值集。f:U×A→V為一個信息函數(shù),表示對每一個a∈A,x∈U,f(x,a)∈Va,如果至少有一個a∈C,Va中包含空值,則稱S為不完備決策系統(tǒng),*表示空值。不完備決策系統(tǒng)的粗糙決策定義:設(shè)有決策系統(tǒng)S=(U,A,V,88相容關(guān)系由相容關(guān)系SIM(P)對論域U進行的劃分可以表示為U/SIM(P),每一個劃分稱為一個相容類。相容類之間可能是子集,也可能重疊,但所有相容類的并集一定等于U。Sp(x)表示與x相容的所有對象的集合。相容關(guān)系由相容關(guān)系SIM(P)對論域U進行的劃分可以表示為U89對不完備決策系統(tǒng)相容關(guān)系的解讀對于兩個對象,如果它們的所有屬性的取值都相等,或者屬性值為空值,則它們是相容關(guān)系。對不完備決策系統(tǒng)相容關(guān)系的解讀對于兩個對象,如果它們的所有屬90相容關(guān)系的下近似與上近似相容關(guān)系的下近似與上近似91求多值決策系統(tǒng)的相容粗糙集a1a2a31{0,1}0322{1,2}13320410{2,3}5{1,2}3262{0,1}1721{1,2}80{0,3}0X={1,2,3,4,5,6,7,8},C={1,2,3}U/C={{1,4},{2,6,7},{3},{5},{8}}X的下近似:C(X)={1,4,8}X的上近似:求多值決策系統(tǒng)的相容粗糙集a1a2a31{0,1}0322{92多值決策系統(tǒng)和不完備決策系統(tǒng)的屬性約簡多值決策系統(tǒng)和不完備決策系統(tǒng)的屬性約簡可以用差別矩陣及差別函數(shù)來求得。多值決策系統(tǒng)和不完備決策系統(tǒng)的屬性約簡多值決策系統(tǒng)和不完備決93差別矩陣如果屬性集A=C∪D,其中C為條件屬性集,D為決策屬性集,則可以定義(C,D)差別矩陣如下:解讀:如果兩條記錄的條件屬性值和決策屬性值都不相等,則差別矩陣的元素為屬性值不同的條件屬性的組合;如果條件屬性值或決策屬性值相等,則取0.差別矩陣如果屬性集A=C∪D,其中C為條件屬性集,D為決策屬94約簡算法布爾函數(shù)的計算需用到布爾代數(shù)中的分配律和吸收律。約簡算法布爾函數(shù)的計算需用到布爾代數(shù)中的分配律和吸收律。95布爾代數(shù)的運算交換律:A*B=B*A,A+B=B+A結(jié)合律:A<B*C>=C*<A*B>,A+<B+C>=C+<A+B>分配律:A*<B+C>=<A*B>+<A*C>,A+<B*C>=<A+B>*<A+C>重言律:A*A=A,A+A=A,A+1=1,A*1=A,A*0=0,A+0=A吸收律:A*<A+B>=A,A+<A*B>=A布爾代數(shù)的運算交換律:96利用差別函數(shù)對信息系統(tǒng)進行約簡Uabcd1012021202310104210151102利用差別函數(shù)對信息系統(tǒng)進行約簡Uabcd101202120297差別矩陣項目1234512a,b,c,d3a,b,cb,c,d4a,c,da,b,da,b,c,d5a,c,dbb,c,da,d差別矩陣項目1234512a,b,c,d3a,b,cb,c,98差別函數(shù)這個知識表達系統(tǒng)有兩個約簡:{a,b}和{b,d},核是.差別函數(shù)這個知識表達系統(tǒng)有兩個約簡:{a,b}和{b,d},99舉例考查一個關(guān)于汽車性能綜合評判的不完備決策系統(tǒng),找出屬性約簡和決策規(guī)則。汽車價格,p里程,m尺寸,s最大速度,x加速,d1HighHighFullLowGood2Low*FullLowGood3**CompactHighPoor4High*FullHighGood5**FullHighExcel6lowHighfull*good舉例考查一個關(guān)于汽車性能綜合評判的不完備決策系統(tǒng),找出屬性約100解:U={1,2,3,4,5,6},C={p,m,s,x}在屬性集C下的相容類為U/C={{1},{2,6},{3},{4,5}}對決策屬性進行等價分類,得U/d={{1,2,4,6},{3},{5}}={Xgood,Xpoor,Xexcel}解:U={1,2,3,4,5,6},C={p,m,s,x}101差別矩陣123456123s,xs,x4s5xxs6s約簡為{s,x},即{尺寸,最大速度}差別矩陣123456123s,xs,x4s5xxs6s約簡為102決策規(guī)則(尺寸,full)?(最大速度,low)→(加速,good)(尺寸,compact)?(最大速度,high)→(加速,poor)(尺寸,full)?(最大速度,high)→(加速,good)(尺寸,full)?(最大速度,high)→(加速,excellent)(尺寸,full)?(最大速度,*)→(加速,good)決策規(guī)則(尺寸,full)?(最大速度,low)→(加速,g103大數(shù)據(jù)金融建模之信用等級傳統(tǒng)的風險建模思路采用的變量:?信用記錄時間?信用額度?借款逾期記錄?房屋按揭還款記錄?用款占信用額度的比例?壞賬記錄最最重要的變量:各種還款逾期、壞賬數(shù)據(jù)之前沒有與金融機構(gòu)發(fā)生借貸關(guān)系的用戶無法被金融機構(gòu)有效地評估信用。大數(shù)據(jù)金融建模之信用等級傳統(tǒng)的風險建模思路之前沒有與金融機構(gòu)104傳統(tǒng)的信用建模方法金融機構(gòu)的方法:使用金融數(shù)據(jù)進行金融建模,大概10-20個強變量Y(還款違約概率)=F(X1,X2,…,Xn)傳統(tǒng)的信用建模方法金融機構(gòu)的方法:使用金融數(shù)據(jù)進行金融建模,105基于大數(shù)據(jù)的金融信用建模思路使用非金融數(shù)據(jù)進行金融建模,大概500,000個弱變量。Y(還款違約概率)=F(X1,X2,…,Xn)Y(金融信用)變量X:消費,閱讀,娛樂,社交,旅游,…基于大數(shù)據(jù)的金融信用建模思路使用非金融數(shù)據(jù)進行金融建模,大概106數(shù)據(jù)來源身份類數(shù)據(jù)

?姓名、證件號?公安信息?戶籍信息?家庭成員信息行為類數(shù)據(jù)

?交易消費行為?網(wǎng)絡(luò)瀏覽行為?通訊類信息?LBS位置信息?航空酒店類差旅信用類數(shù)據(jù)

?人行信用報告?學歷學位信息?公共繳費信息?法院糾紛判決?金融機構(gòu)黑名單社交類數(shù)據(jù)

?社交APP數(shù)據(jù)?媒體閱覽數(shù)據(jù)?通訊運營商數(shù)據(jù)?網(wǎng)絡(luò)評論數(shù)據(jù)履約能力類數(shù)據(jù)

?銀行存款?可信收入?股票投資?不動產(chǎn)類共債類數(shù)據(jù)

?信用卡逾期?本機構(gòu)申請次數(shù)?申請過的機構(gòu)數(shù)?P2P申請次數(shù)?小貸申請次數(shù)數(shù)據(jù)來源身份類數(shù)據(jù)行為類數(shù)據(jù)信用類數(shù)據(jù)社交類數(shù)據(jù)履約107粗糙集理論的應(yīng)用銀行信用等級的評估對供應(yīng)商的評價人力資源管理中的員工績效考核市場營銷中對客戶的評價……尤其適用于大數(shù)據(jù)的規(guī)則提取,數(shù)據(jù)不完備或多值的決策問題。粗糙集理論的應(yīng)用銀行信用等級的評估108后面的話本次講座只是粗糙集理論的入門知識,還有:基于優(yōu)勢關(guān)系的粗糙決策,基于擴展優(yōu)勢關(guān)系的粗糙決策,粗糙集與神經(jīng)網(wǎng)絡(luò)的集成與應(yīng)用,粗糙集與模糊集的集成與應(yīng)用,三支決策粗糙集理論,……后面的話本次講座只是粗糙集理論的入門知識,還有:109Thanks!一剪寒梅知春早,莫辭來年耕作勞。Thanks!一剪寒梅知春早,110粗糙集決策方法鐘映竑zhongyh@粗糙集決策方法鐘映竑111管理研究方法論方法論,methodology,指處理問題的一般途徑和程序。方法,method,指具體的做法。管理研究方法論,闡述管理學科研究工作的基本原則、途徑和程序,在總結(jié)前人經(jīng)驗的基礎(chǔ)上,提出有效的研究工作規(guī)范,包括問題闡述、文獻綜述、假設(shè)提出、數(shù)據(jù)收集、統(tǒng)計分析、信度和效度判斷以及研究報告或論文的撰寫等各個環(huán)節(jié)的規(guī)范。管理研究方法論方法論,methodology,指處理問題的一112管理研究方法論的重要性研究方法論是一種規(guī)范、邏輯,可以把研究工作提高到專業(yè)水平。正規(guī)學術(shù)訓練VS野路子,新聞報道,工作報告管理研究方法論的重要性研究方法論是一種規(guī)范、邏輯,可以把研究113科學方法與科學研究通過系統(tǒng)觀測而獲取客觀知識的方法??陀^性實證性規(guī)范性科學研究:滿足以上特征的獲取新知識的精確方法。研究對象具有可直接側(cè)魯昂和重復(fù)出現(xiàn)等特點??茖W方法與科學研究通過系統(tǒng)觀測而獲取客觀知識的方法。114科學研究中應(yīng)使用中性名詞和語句舉例:貴重金屬,稀有金屬民族工業(yè),本土工業(yè)經(jīng)過艱苦不懈的努力研究,本文得到了重要結(jié)論,對我國低碳供應(yīng)鏈的發(fā)展具有重要意義??茖W研究中應(yīng)使用中性名詞和語句舉例:115思辨方法與思辨研究涉及人的價值觀和偏好的領(lǐng)域以及發(fā)現(xiàn)新知識的過程,不強調(diào)客觀性和實證性,所得結(jié)果不必建立在直接觀測和經(jīng)驗基礎(chǔ)上,不必服從規(guī)范性。哲學,宗教,文學,藝術(shù),音樂……思辨方法與思辨研究涉及人的價值觀和偏好的領(lǐng)域以及發(fā)現(xiàn)新知識的116目標函數(shù)是利潤最大化,如何實現(xiàn)最優(yōu)化?頓悟:賺錢的意義是什么?我為什么要賺那么多錢?VS科學研究問題思辨研究問題天上的星空心中的道德康德目標函數(shù)是利潤最大化,如何實現(xiàn)最優(yōu)化?頓悟:賺錢的意義是什么117管理研究的分類描述型研究(descriptionstudies):收集數(shù)據(jù)以檢驗有關(guān)亞久對象狀態(tài)假設(shè)的工作過程,它回答who,whatwhere,howmuch之類的問題,旨在將現(xiàn)象和事件描述和識別清楚。管理研究的分類描述型研究(descriptionstudi118管理研究的分類解釋型研究,explanationstudies,回答為什么(why)的問題。探索現(xiàn)象和事件之間的關(guān)聯(lián),弄清因果。描述型和解釋型研究類似于醫(yī)生看病的診斷過程。描述是基礎(chǔ),解釋是后續(xù)。管理研究的分類解釋型研究,explanationstudi119管理研究的分類規(guī)范型研究,prescriptionstudies,回答“應(yīng)該怎樣”的問題。理工科背景的研究生偏愛規(guī)范型研究。管理研究的分類規(guī)范型研究,prescriptionstud120管理研究設(shè)計兩個目的:辨識問題,提煉主題論證和驗證主題。管理研究設(shè)計兩個目的:121管理研究設(shè)計問題辨析:研究問題從哪里來?聚焦研究主題,提出假設(shè),建立假設(shè)樹。假設(shè)論證或假設(shè)檢驗:理論研究,實證研究,統(tǒng)計研究,實地研究,實驗研究等。管理研究設(shè)計問題辨析:研究問題從哪里來?122建立假設(shè)樹要注意的問題假設(shè)樹是一項研究工作創(chuàng)新點的結(jié)構(gòu)化表述,不是工作提綱。假設(shè)樹中任何一層假設(shè)的表述都應(yīng)當是假設(shè)的形式,也就是變量和變量之間關(guān)系的陳述語句。下層次假設(shè)一定要支持上層次的假設(shè)。建立假設(shè)樹要注意的問題假設(shè)樹是一項研究工作創(chuàng)新點的結(jié)構(gòu)化表述123推薦閱讀管理研究方法論,李懷祖,西安交通大學出版社,2006.11。組織與管理研究的實證方法,陳曉萍,徐淑英,樊景立,北京大學出版社,2008.6.推薦閱讀管理研究方法論,李懷祖,西安交通大學出版社,2006124管理研究方法的來源管理學不是一門純粹的學問,它的學科基礎(chǔ)很復(fù)雜,包括數(shù)學、計算機科學、工程學、經(jīng)濟學、社會學,人類學、心理學、行為科學、政治學、生物學,等等。學科來源的復(fù)雜多樣化,導致管理研究方法的多樣性。管理研究方法的來源管理學不是一門純粹的學問,它的學科基礎(chǔ)很復(fù)125管理問題集經(jīng)濟學方法,數(shù)學方法,計算機科學方法,工程學方法,社會學方法,人類學方法,心理學方法,行為科學方法,政治學方法,生物學方法管理問題集經(jīng)濟學方法,數(shù)學方法,計算機科學方法,工程學方法,126燈下尋找鑰匙避免方法論或方法的帝國主義或孤立主義。應(yīng)當堅持:多元主義互補主義燈下尋找鑰匙避免方法論或方法的帝國主義或孤立主義。127管理問題管理研究方法論管理研究方法管理問題管理研究方法論管理研究方法128管理的學科基礎(chǔ)所提供的研究方法數(shù)學:運籌學,統(tǒng)計學。經(jīng)濟學:博弈論計算機科學:數(shù)據(jù)挖掘方法,仿真。社會學、人類學:案例研究方法,統(tǒng)計方法、結(jié)構(gòu)方程模型。工程學:系統(tǒng)工程方法,泰羅的科學管理。心理學、行為科學:實驗方法。生物學:演化方法。純粹管理學方法:?管理的學科基礎(chǔ)所提供的研究方法數(shù)學:運籌學,統(tǒng)計學。129處理大數(shù)據(jù)的方法粗糙集決策理論與應(yīng)用處理大數(shù)據(jù)的方法粗糙集決策理論與應(yīng)用130粗糙集概述在很多實際系統(tǒng)中均不同程度地存在著不確定性因素,采集到的數(shù)據(jù)常常包含著噪聲,不精確甚至不完整.粗糙集理論是繼概率論,模糊集,證據(jù)理論之后的又一個處理不確定性的數(shù)學工具。粗糙集概述在很多實際系統(tǒng)中均不同程度地存在著不確定性因素,131粗糙集在應(yīng)用中的優(yōu)點粗糙集分析數(shù)據(jù)不需要先驗知識.粗糙集理論是適合大數(shù)據(jù)集分析的強大工具.粗糙集提供了含糊概念的數(shù)學描述,并可計算。粗糙集在應(yīng)用中的優(yōu)點粗糙集分析數(shù)據(jù)不需要先驗知識.132粗糙集的發(fā)展歷程1982年提出到80年代末,研究主要集中在東歐.1991年,Pawlak出版了第一部關(guān)于粗糙集的專著《RoughSets:TheoreticalAspectsofReasoningaboutData》.1992年,R.Slowinski主編的關(guān)于粗糙集應(yīng)用及其與相關(guān)方法比較研究的論文集的出版,推動了國際上對粗糙集理論與應(yīng)用的深入研究.1992年在波蘭Kiekrz召開了第一屆國際粗糙集討論會.(以后每年一屆)粗糙集的發(fā)展歷程1982年提出到80年代末,研究主要集中1331995年,ACMCommunication將它列為新浮現(xiàn)的計算機科學的研究課題;1998年,國際信息科學雜志《InternationalJournalofInformationScience》為粗糙集理論的研究出了一期專刊;2004年,國際粗糙集協(xié)會主辦的第一本粗糙集國際期刊《AdvancesinRoughSets》出版發(fā)行;國外主要研究機構(gòu):波蘭華沙大學、工業(yè)大學、信息技術(shù)和管理大學和加拿大Regina大學和圣瑪麗大學、英國Edinburgh大學,Ulster大學和Cardiff大學,意大利Catania大學,印度統(tǒng)計研究院,美國SanJose州立大學.1995年,ACMCommunication將它列為新浮1342001年5月,第一屆中國Rough集與軟計算學術(shù)研討會,邀請了創(chuàng)始人Z.Pawlak教授做大會報告(重慶,重慶郵電大學)2002年10月,第二屆中國Rough集與軟計算學術(shù)研討會(蘇州,蘇州大學)2003年5月,第三屆中國Rough集與軟計算學術(shù)研討會(重慶,重慶郵電大學)(注:同年,承辦了第九屆國際粗糙集,模糊集,數(shù)據(jù)挖掘與粒計算學術(shù)研討會;中國人工智能學會也于同年正式成立粗糙集與軟計算專業(yè)委員會.)2001年5月,第一屆中國Rough集與軟計算學術(shù)研討會,1352004年10月,第四屆中國Rough集與軟計算學術(shù)研討會(舟山,浙江海洋學院)2005年8月,第五屆中國Rough集與軟計算學術(shù)研討會(鞍山,鞍山科技大學)2006年,第六屆中國Rough集與軟計算學術(shù)研討會(金華,浙江師范大學)2007年,第七屆Rough集與軟計算、第一屆Web智能、第一屆粒計算聯(lián)合學術(shù)會議(太原,山西大學)2004年10月,第四屆中國Rough集與軟計算學術(shù)研討會1362008年,第八屆中國Rough集與軟計算學術(shù)會議、第二屆中國Web智能學術(shù)研討會、第二屆中國粒計算學術(shù)研討會聯(lián)合學術(shù)會議(CRSSC-CWI-CGrC2008)(新鄉(xiāng),河南師范大學)2009年8月,第九屆中國Rough集與軟計算學術(shù)會議在河北師范大學召開(石家莊).國內(nèi)主要研究機構(gòu):中科院計算所,中科院自動化所,重慶郵電大學,南昌大學,西安交通大學,山西大學,合肥工業(yè)大學,北京工業(yè)大學,上海大學,山東大學.2008年,第八屆中國Rough集與軟計算學術(shù)會議、第二屆137粗糙集基本概念基本粗糙集理論認為知識就是人類所固有的分類能力.分類是推理、學習與決策中的關(guān)鍵問題.粗糙集理論假定知識是一種對對象進行分類的能力.知識必須與具體或抽象世界的特定部分相關(guān)的各種分類模式聯(lián)系在一起,這種特定部分稱之為所討論的全域或論域(universe).對于全域及知識的特性并沒有任何特別假設(shè).事實上,知識構(gòu)成了某一感興趣領(lǐng)域中各種分類模式的一個族集(family),這個族集提供了關(guān)于現(xiàn)實的顯事實,以及能夠從這些顯事實中推導出隱事實的推理能力.粗糙集基本概念基本粗糙集理論認為知識就是人類所固有的分類能力138粗糙集的思想基礎(chǔ)粗糙集基于這種認識,在分類機制的基礎(chǔ)上建立.它將分類理解為在特定空間(論域U)上的等價關(guān)系(R),而等價關(guān)系構(gòu)成了對該空間的劃分.在特定空間上的等價關(guān)系反映了人們對該空間的認識,稱為知識(U/R).借用邊界域的概念,粗糙集理論巧妙地表達了人們在認識事物時表現(xiàn)出的不確定性.粗糙集的思想基礎(chǔ)粗糙集基于這種認識,在分類機制的基礎(chǔ)上建立139粗糙概念的來源之一—集合與模糊集合概念的提出(Cantor1883)集合是數(shù)學中的基本概念,也是大部分數(shù)學結(jié)構(gòu)的依賴.粗糙概念的來源之一—集合與模糊集合概念的提出(Cantor140如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?謂詞邏輯的創(chuàng)始人G.Frege(1904)提出了含糊(Vague)的概念,他把它歸結(jié)到邊界線上,也就是說在全域上存在一些個體既不能在其某個子集上分類,也不能在該子集的補集上分類.如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?謂詞邏輯的創(chuàng)始人G.Fr141如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?Zadeh提出了模糊集(1965),但模糊集理論采用隸屬度函數(shù)來處理模糊性,而基本的隸屬度是憑經(jīng)驗或者由領(lǐng)域?qū)<医o出,所以具有相當?shù)闹饔^性。含糊(vagueness)和不確定(uncertainty):含糊是集合的性質(zhì),可以通過近似概念來描述;而不確定性是集合中元素的性質(zhì),可以通過隸屬函數(shù)表達.(通常二者也不加區(qū)分,稱為模糊.注意!)如何表示和處理現(xiàn)實生活中的含糊現(xiàn)象?Zadeh提出了模糊集(142粗糙集的另一個來源—知識表達系統(tǒng)Z.Pawlak先提出了知識表達系統(tǒng)(1973),其中提出了按照屬性分類的思想,后來他又提出了近似空間的概念(1981),試圖用上下近似來描述集合.Z.Pawlak.InformationSystemsTheoreticalFoundations[J].InformationSystems,1981,6(3):205-218.

粗糙集的另一個來源—知識表達系統(tǒng)Z.Pawlak先提出了1431982年,Pawlak提出了粗糙集(RoughSets),他把那些無法確認分類的個體都歸屬于邊界域,而這種邊界域被定義為上近似集和下近似集之差集.由于它有確定的數(shù)學公式描述,完全由數(shù)據(jù)決定,所以更有客觀性.Z.Pawlak.Roughsets.InternationalJournalofComputerandInformationSciences.1982,11(5):341-356.1982年,Pawlak提出了粗糙集(RoughSets)144基本概念定義稱一個二元組K=(U,R)為一個近似空間(approximatespace)(或知識庫).

其中U(為空集)是一個被稱為全域或論域(universe)的所有要討論的個體的集合,R是U上等價關(guān)系的一個族集.定義稱一個二元關(guān)系R是不可分辨關(guān)系或等價關(guān)系(indiscerniblerelation),如果R滿足:基本概念定義稱一個二元組K=(U,R)為一個近似空間145給定近似空間K=(U,R),子集XU稱為U上的一個概念(concept;空集也視為一個概念);非空子族集PR所產(chǎn)生的不分明關(guān)系IND(P)的所有等價類關(guān)系的集合即U/IND(P),稱為基本知識(basicknowledge),相應(yīng)的等價類稱為基本概念(basicconcept);特別地,若關(guān)系QR,則關(guān)系Q就稱為初等知識(elementaryknowledge),相應(yīng)的等價類就稱為初等概念(elementaryconcept).由定義可知,概念即對象的集合,概念的族集(分類)就是U上的知識,U上分類的族集可以認為是U上的一個知識庫,或說知識庫即是分類方法的集合。給定近似空間K=(U,R),子集XU稱為U上的一個概念146A={x1,x2,x3,x4,x5,x6,x7,x8},每個積木塊都有顏色屬性,按照顏色的不同,我們能夠把這堆積木分成R1={紅,黃,蘭}三個大類,那么所有紅顏色的積木構(gòu)成集合X1={x1,x2,x6},黃顏色的積木構(gòu)成集合X2={x3,x4},蘭顏色的積木構(gòu)成集合X3={x5,x7,x8}。按照顏色這個屬性我們就把積木集合A進行了一個劃分(所謂A的劃分就是指對于A中的任意一個元素必然屬于且僅屬于一個分類),那么我們就說顏色屬性就是一種知識。在這個例子中我們不難看到,一種對集合A的劃分就對應(yīng)著關(guān)于A中元素的一個知識

A={x1,x2,x3,x4,x5,x6,x7,x8},每個147假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},大小R3={大,中,小},這樣加上R1屬性對A構(gòu)成的劃分分別為:

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}(顏色分類)

A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}(形狀分類)

A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分類)

上面這些所有的分類合在一起就形成了一個基本的知識庫。假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},148除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}這樣的概念以外還可以表達例如

大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},

大三角{x1,x2,x5}∩{x1,x2}={x1,x2},

蘭色的小的圓形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},

蘭色的或者中的積木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而類似這樣的概念可以通過求交運算得到,比如X1與Y1的交就表示紅色的三角形。除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角149所有的這些能夠用交、并表示的概念以及加上上面的三個基本知識(A/R1,A/R2.A/R3)一起就構(gòu)成了一個知識系統(tǒng),記為R=R1∩R2∩R3,它所決定的所有知識是A/R={{x1,x2},{x3,x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。粗糙集理論建立在這樣一個前提上:即所考慮的論域中的每一個對象都包含某種信息(數(shù)據(jù)和知識)。所有的這些能夠用交、并表示的概念以及加上上面的三個基本知識(150基本集(基本粒度):定義:所有不可區(qū)分的對象形成的集合解釋:可區(qū)分(可分辨):如果Ui≠Uj就稱這兩個對象在其條件P下是可區(qū)分的(對于兩個不同的對象至少有一個屬性是不同的)否則即為不可區(qū)分?;炯ɑ玖6龋?51舉例對于右表來說,U中有四個對象(概念),而現(xiàn)在條件集合中只有一個屬性,對于U1和U2來說,它們的p不同,所以可以通過p來區(qū)分,即u1,u2在p下可區(qū)分;而U2和U3雖然是不同的對象但是在P下卻是相同的,即在p下不可區(qū)分,就成為不可區(qū)分的對象。UP11203042舉例對于右表來說,U中有四個對象(概念),而現(xiàn)在條件集合中只152信息系統(tǒng)信息系統(tǒng)被定義為如下的四元組:S=(U,A,V,f)。其中S為知識表達系統(tǒng),U={x1,x2,…,xn}為對象的非空有限集合,也稱為論域;A={a1,a2,…,am}為屬性的非空有限集合;V為屬性值域,f:UAV為一信息函數(shù),當信息系統(tǒng)中屬性A等于C并D,其中C為條件屬性集,D為決策屬性集時,信息系統(tǒng)也稱為決策系統(tǒng)。信息系統(tǒng)信息系統(tǒng)被定義為如下的四元組:S=(U,A,V,f)153決策表決策表154等價關(guān)系舉例設(shè)信息系統(tǒng)如下表所示,對象為8輛汽車,條件屬性分別為顏色、排放量和價格,決策屬性為銷售量。等價關(guān)系舉例設(shè)信息系統(tǒng)如下表所示,對象為8輛汽車,條件屬性分155屬性對象條件屬性C決策屬性顏色a1排放量a2價格a3銷售量(d)x1紅色1.8中中x2黑色1.6低大x3銀灰1.6中大x4銀灰1.8高中x5黑色2.0中小x6紅色1.6低小x7銀灰1.6中大x8黑色2.0中小屬性條件屬性C決156U/a1={{x1,x6},{x2,x5,x8},{x3,x4,x7}}U/a2={{x1,x4},{x2,x3,x6,x7},{x5,x8}}U/a3={{x1,x3,x5,x7,x8},{x2,x6},{x4}}以上U/a1,U/a2,U/a3取交集,得U/C={{x1},{x2},{x3,x7},{x4},{x5,x8},{x6}}用決策屬性d來劃分,可得U/d={{x1,x4},{x2,x3,x7},{x5,x6,x8}}在每一等價類中,按現(xiàn)有的信息無法再區(qū)別開。例如,由所有的條件屬性獲得的信息無法區(qū)分x3與x7,也無法區(qū)分x5與x8.因而,這種知識是有粒度的U/a1={{x1,x6},{x2,x5,x8},{x3,x157下近似和上近似定義給定知識表達系統(tǒng)S=<U,A,V,f>,對于每個子集X

U和一個等價關(guān)系R,可以根據(jù)R的基本集合描述來劃分集合X:R_(X)={x|(xU)([x]RX)}R_(X)={x|(xU)([x]R∩X)}R_(X)和R_(X)分別稱為X的R下近似集和R上近似集;稱BNR(X)=R_(X)-R_(X)是X的邊界域.若BNR(X)則稱X是粗糙的.下近似和上近似定義給定知識表達系統(tǒng)S=<U,A,158下近似集是在那些所有的包含于X的知識庫中的集合中求并得到的,而上近似則是將那些包含X的知識庫中的集合求并得到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論