版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘中聚類算法的綜述3胡慶林葉念渝朱明富(華中科技大學(xué)控制科學(xué)與工程系武漢430074摘要聚類算法是數(shù)據(jù)挖掘領(lǐng)域中非常重要的技術(shù)。本綜述按照聚類算法的分類,對每一類中具有代表性的算法進(jìn)行了介紹,分析和評價。最后從發(fā)現(xiàn)聚類形狀、所適用的數(shù)據(jù)庫和輸入數(shù)據(jù)順序的敏感性等方面進(jìn)行了算法推薦,供大家在選擇聚類算法時參考。關(guān)鍵詞數(shù)據(jù)挖掘聚類分析聚類算法中圖分類號TP301.61引言數(shù)據(jù)挖掘(Data M ining:是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用信息和知識的過程。當(dāng)人們使用數(shù)據(jù)挖掘工具對數(shù)據(jù)中的模型和關(guān)系進(jìn)行辨識的時候,通常第一
2、個步驟就是聚類。因此根據(jù)實際科研情況,選擇一個好的聚類算法對后續(xù)的研究工作是非常關(guān)鍵的。聚類的定義:聚類是將數(shù)據(jù)劃分成群組的過程。通過確定數(shù)據(jù)之間在預(yù)先制定的屬性上的相似性來完成聚類任務(wù),這樣最相似的數(shù)據(jù)就聚集成簇。聚類與分類的不同點:聚類的類別取決于數(shù)據(jù)本身;而分類的類別是由數(shù)據(jù)分析人員預(yù)先定義好的。聚類算法的分類:一般可分為基于層次的,基于劃分的,基于密度的,基于網(wǎng)格的和基于模型的五種。2基于層次的聚類算法層次的聚類算法對給定數(shù)據(jù)對象進(jìn)行層次上的分解。根據(jù)層次分解的順序是自下向上的還是自上向下的,可分為凝聚算法(自下向上的和分裂算法(自上向下。2.1凝聚算法思想該算法的主要思想是發(fā)現(xiàn)最大連
3、通子圖,如果至少存在一條連接兩個簇的邊,并且兩點之間的最短距離小于或等于給定的閥值,則合并這兩個簇。該算法尋找的是一個團,而不是連通的分量,一個團是一個最大的圖,其中任意兩個頂點之間都存在一個條邊。如果兩個簇中的點之間的距離小于距離閥值,則合并這兩個簇。如果在兩個目標(biāo)簇中,一個簇中的所有成員與另一個簇中的所有成員之間的平均距離小于距離閥值,則合并這兩個簇。評論:以上三個算法的復(fù)雜度都是O(n2, (其中n是數(shù)據(jù)成員的個數(shù),因此他們的效率不高。而且在單連接算法中存在鏈?zhǔn)叫?yīng)(chain effect,影響了凝聚算法的實際應(yīng)用。鏈?zhǔn)叫?yīng)是指:當(dāng)兩個簇中只要存在兩個相近的點,這兩個簇就合并了,完全不
4、管這兩個簇中還可能存在其他相距很遠(yuǎn)的點。因此合并后的簇中可能存在一些根本就互不相關(guān)點。Clustering using H ierarchies算法B I RCH是一個綜合性的層次聚類方法。它用聚類特征和聚類特征樹(CF來描述聚類過程。CF樹是一個平衡樹,它有兩個參數(shù):分支因子和閾值,它存儲了層次聚類的聚類特征。分支因子定義為每個非葉節(jié)點孩子的最大數(shù)目,而閾值是指71第35卷(2007第2期計算機與數(shù)字工程3收到本文時間:2006年4月7日作者簡介:胡慶林,男,在讀碩士,主要研究方向:數(shù)據(jù)挖掘,電子商務(wù)。葉念瑜,女,教授,主要研究方向:計算機控制與管理一體化。朱明富,男,副教授。主要研究方向:
5、決策支持系統(tǒng),企業(yè)信息工程、控制管理一體化。存儲在樹的葉子節(jié)點中的子聚類的最大直徑。一個數(shù)據(jù)項總是被插入到最近的葉子條目(子聚類中。如果在插入后,使得該葉子節(jié)點中的子聚類的直徑大于閾值,則該葉子節(jié)點或其他節(jié)點很有可能被分裂。在新數(shù)據(jù)插入后,關(guān)于該數(shù)據(jù)的信息會向樹根傳遞。我們可以通過改變閾值來修改CF樹的大小,從而控制其占內(nèi)存容量;另外,CF樹可以動態(tài)地構(gòu)造,因此不要求所有的數(shù)據(jù)一次性地讀入內(nèi)存,故存儲在外存上的數(shù)據(jù)項可以逐個地被讀入。B I RCH算法通過一次掃描就可以進(jìn)行較好的聚類,該算法的計算復(fù)雜度是O(n,其中n是對象的數(shù)目。評論:優(yōu)點:B I RCH算法通過聚類特征可以方便地進(jìn)行中心、
6、半徑、直徑及類內(nèi)、類間距離的運算。算法具有對象數(shù)目的線性易伸縮性,及良好的聚類質(zhì)量。缺點:由于受CF樹節(jié)點大小的限制, CF樹節(jié)點并不總是與用戶所認(rèn)為的自然聚類相對應(yīng)。而且,如果簇不是球形,B I RCH算法則不能很好地工作。2.2分裂算法思想初始的時候,所有的數(shù)據(jù)成員都包含在一個簇中,是一個簇,然后將上層的簇重復(fù)地分裂為兩個下層簇,直到每一個成員都組成一個單獨的簇為止。代表算法:基于單連接算法MST。其分裂過程為:將最小生成樹的邊從最長到最短依次進(jìn)行剪切。該算法將產(chǎn)生與凝聚方法完全相同的簇集,只是產(chǎn)生過程的次序完全相反。層次的聚類算法評論:層次聚類方法的前提條件是假設(shè)數(shù)據(jù)是一次性提供的,因此
7、都不是增量算法。其缺陷在于,一旦一個步驟(合并或分裂完成,它就不能被撤消,因而不能更正錯誤的決定。改進(jìn)層次方法的聚類質(zhì)量的一個有希望的方向是將層次聚類和其他聚類技術(shù)進(jìn)行集成,例如上面的B I RCH算法。3劃分的聚類算法將一個有N個樣本的數(shù)據(jù)庫,分為K個劃分(KN,每個劃分表示一個簇,并同時滿足以下兩個條件的過程,稱為劃分算法。(1每個簇至少包含一個樣本;(2每個樣本必須屬于且僅屬于一個簇。其具體代表算法有:P AM算法,CLARA算法, CLARANS算法等等。3.1P AM(Partiti oning A r ound Medoids算法該算法也稱作K-中心點算法,是指用中心點來代表一個簇
8、。利用中心點這個概念能夠很好地處理異常點。初始時,將N個成員中的K個隨機成員設(shè)置為中心點集合,然后在每一步中,對輸入數(shù)據(jù)集中目前還不是中心點的成員進(jìn)行逐個檢驗,看是否可成為中心點。評論:該算法將判定是否存在一個成員,可以取代已存在的一個中心點。通過檢驗所有的中心點與非中心點組成的對,PAM算法將選擇最能提高聚類效果的對。該方法的聚類效果的度量是簇中的非中心點到簇的中心點的所有距離之和。由于在每次迭代過程中需要確定出K (N-K個交換對,在每個交換對中又要計算N -K個非中心點到簇的中心點距離之和的變化,故每次迭代的總的復(fù)雜度是O(K(N-K2。所以該算法的復(fù)雜性太高。但其算法邏輯較簡單,適合小
9、型的數(shù)據(jù)庫。3.2CLARA(Clustering LARge App licati ons算法通過數(shù)據(jù)庫抽樣,改進(jìn)了P AM的時間復(fù)雜性。其基本思想是首先對數(shù)據(jù)庫進(jìn)行抽樣,然后將利用P AM算法在抽樣后的數(shù)據(jù)上進(jìn)行聚類,得到的中心點就是整個數(shù)據(jù)庫的中心點,最后將數(shù)據(jù)庫中所有成員分配到離自身距離最近的中心點所代表的簇中。評論:為了提高CLARA的精度,可以分別進(jìn)行幾組抽樣,然后在每組抽樣上都應(yīng)用P AM算法,最后將最好的聚類結(jié)果作為最終的聚類結(jié)果。由于使用了抽樣技術(shù),對于大型數(shù)據(jù)庫而言,CLARA比P AM更有效率,但其效果則取決于樣本規(guī)模。有研究結(jié)果2表明,樣本規(guī)模為40+2K的數(shù)據(jù)庫,進(jìn)行
10、5次抽樣會得到較好的結(jié)果。3.3CLARANS(Clustering Large App licati ons basedupon Random ized Search算法CLARANS通過利用多次不同抽樣來改進(jìn)CLARA。除了需要與P AM一樣的輸入外,CLAR2 ANS還需要輸入兩個參數(shù):maxneighbor和num l o2 cal。maxneighbor表示一個節(jié)點可以與任意特定節(jié)點(鄰居進(jìn)行比較的數(shù)目。隨著maxneighbor的增長,CLARANS與P AM更加相近,這是由于所有節(jié)點都可能被檢驗。Num l ocal表示抽樣次數(shù)。評論:由于在每個樣本上都要進(jìn)行新的聚類,所以nu
11、m l ocal也表示需要進(jìn)行聚類的次數(shù)。研究結(jié)果3表明當(dāng)nu m l ocal=2和maxneighbor=max (0.01253K(N-K,250時,聚類效果較好。對于任意規(guī)模的數(shù)據(jù)集,CLARANS比CLARA和P AM效率要高。3.4CURE(Clustering U sing REp resentatives算法81胡慶林等:數(shù)據(jù)挖掘中聚類算法的綜述第35卷CURE算法中即有層次部分,也有劃分部分,所以CURE是一個綜合性的聚類算法。CURE算法過程,首先從每個簇中選擇c(常數(shù)個點,然后通過應(yīng)用收縮因子a,這些分散的點將向簇的質(zhì)心方向收縮。當(dāng)a為1的時候,所有點都收縮成一點,即質(zhì)心
12、。由這些點代表的簇,要比單個點更具有代表性。通過多個有代表性的點,簇的形狀可以更好地被表示出來。這一步完成后,再使用層次聚類算法中的凝聚算法。在凝聚算法中的每一步,距離最近的代表性點所對應(yīng)的簇將被合并。它們之間的距離被定義為兩個簇中代表性點之間距離的最小值。評價:該算法優(yōu)點:它回避用所有點或單個質(zhì)心來表示一個簇的傳統(tǒng)方法,將一個簇用多個具有代表性的點來表示,使C URE可以適應(yīng)非球形的幾何形狀。另外,收縮因子降底了噪音對聚類的影響,從而使CURE對孤立點的處理更加健壯,而且能識別非球形和大小變化比較大的簇。對于大型數(shù)據(jù)庫具有良好的伸縮性。缺點:參數(shù)設(shè)置對聚類結(jié)果有很大的影響,CURE算法不能處
13、理分類屬性。C URE的復(fù)雜度是O(n,其中n是對象的數(shù)目。劃分的聚類算法評論:劃分聚類方法對在中小規(guī)模的數(shù)據(jù)庫中發(fā)現(xiàn)球狀簇很適用。為了對大規(guī)模的數(shù)據(jù)集進(jìn)行聚類,以及處理復(fù)雜形狀的聚類,基于劃分的方法有待進(jìn)一步的擴展。4基于密度的算法提出基于密度的聚類方法是為了發(fā)現(xiàn)任意形狀的聚類結(jié)果。其主要思想是:只要臨近區(qū)域的密度超過某個閾值,就繼續(xù)聚類。這樣的方法可以用來過濾“噪聲”孤立點數(shù)據(jù),發(fā)現(xiàn)任意形狀的簇。代表算法:DBSCAN(Density-Based Spatial Cluste2 ring with Noise。4.1DBSCAN算法可以將足夠高密度的區(qū)域劃分為簇,并可以在帶有“噪聲”的空間
14、數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。該算法定義簇為密度相連的點的最大集合。DBSCAN通過檢查數(shù)據(jù)庫中每個點的鄰域來尋找聚類。如果一個點p的鄰域中包含數(shù)據(jù)項的個數(shù)多于最小閥值,則創(chuàng)建一個以p作為核心對象的新簇。然后反復(fù)地尋找從這些核心對象直接密度可達(dá)的對象,當(dāng)沒有新的點可以被添加到任何簇時,該過程結(jié)束。不被包含在任何簇中的對象被認(rèn)為是“噪聲”。如果采用空間索引,DBSCAN的計算復(fù)雜度是O(n l og n,這里n是數(shù)據(jù)庫中對象數(shù)目。否則,計算復(fù)雜度是O(n2。評價:DBSCAN算法具有很多優(yōu)點:能夠發(fā)現(xiàn)空間數(shù)據(jù)庫中任意形狀的密度連通集;在給定合適的參數(shù)條件下,能很好地處理噪聲點;對用戶領(lǐng)域知識要求較
15、少;對數(shù)據(jù)的輸入順序不太敏感;適用于大型數(shù)據(jù)庫。其缺點:DBSCAN算法要求事先指定領(lǐng)域和閾值;具體使用的參數(shù)依賴于應(yīng)用的目的。5基于網(wǎng)格的算法這種算法首先將數(shù)據(jù)空間劃分成為有限個單元的網(wǎng)格結(jié)構(gòu),所有的處理都是以單個的單元為對象的。處理速度通常與目標(biāo)數(shù)據(jù)庫中記錄的個數(shù)無關(guān),它只與單元的個數(shù)有關(guān),故這種算法的一個突出優(yōu)點就是處理速度很快。代表算法有:STI N G (Statistical I nf or mati on Grid based method算法。STI N G算法將空間區(qū)域劃分為矩形單元。針對不同級別的分辨率,通常存在多個級別的矩形單元,這些單元形成了一個層次結(jié)構(gòu):高層的每個單元
16、被劃分為多個低一層的單元。高層單元的統(tǒng)計參數(shù)可以很容易地從低層單元的計算得到。這些參數(shù)包括:屬性無關(guān)的參數(shù)count;屬性相關(guān)的參數(shù)m(平均值,s(標(biāo)準(zhǔn)偏差,m in(最小值,max(最大值,以及該單元中屬性值遵循的分布(distribu2 ti on類型。STI N G掃描數(shù)據(jù)庫一次來計算單元的統(tǒng)計信息,因此產(chǎn)生聚類的時間復(fù)雜度是O(n,其中n是對象的數(shù)目。在層次結(jié)構(gòu)建立后,查詢處理時間是O(g,g是最低層風(fēng)格單元的數(shù)目,通常遠(yuǎn)遠(yuǎn)小于n。評價:優(yōu)點是:效率高,且利于并行處理和增量更新。缺點:STI N G算法中,如果數(shù)據(jù)粒度比較細(xì),處理的代價會明顯增加;而且該算法沒有考慮子單元和其他相鄰單元
17、之間的關(guān)系。盡管該算法處理速度較快,但是可能會降低簇的質(zhì)量和精確性。6基于模型的算法基于模型的方法為每個簇都假定了一個模型,并尋找數(shù)據(jù)對給定模型的最佳擬合。該算法通過構(gòu)建反映數(shù)據(jù)點空間分布的密度函數(shù)來實現(xiàn)聚類。這種聚類方法試圖優(yōu)化給定的數(shù)據(jù)和某些數(shù)學(xué)模型之間的適應(yīng)性。其代表算法:COBW EB算法。COBW EB算法以一個分類樹的形式創(chuàng)建層次聚類,它的輸入對象用“分類屬性”-“值”對來描述。其工作流程是:在給定一個新的對象后,COB2 W E B沿一條適當(dāng)?shù)穆窂较蛳?修改計數(shù),以尋找可91第35卷(2007第2期計算機與數(shù)字工程以分類該對象的最好節(jié)點。該判定基于將對象臨時置于每個節(jié)點,并計算結(jié)
18、果劃分的分類效用。產(chǎn)生最高分類效用的位置應(yīng)當(dāng)是對象節(jié)點的一個好的選擇。給定一個新的對象,COBW EB沿一條適當(dāng)?shù)穆窂较蛳?修改計數(shù),尋找可以分類該對象的最好節(jié)點。在該過程中,將對象臨時置于每個節(jié)點上,并計算劃分的分類效用結(jié)果。產(chǎn)生最高分類效用的位置是對象節(jié)點的一個好的選擇。評價:優(yōu)點:COBW EB可以自動修正劃分中類的數(shù)目;不需要用戶提供輸入?yún)?shù)。缺點:COB2 W EB基于這樣一個假設(shè):在每個屬性上的概率分布是彼此獨立的。但這個假設(shè)并不總是成立。分類樹對于偏斜的輸入數(shù)據(jù)不是高度平衡的,它可能導(dǎo)致時間和空間復(fù)雜性的劇烈變化。COBW E B不適用于聚類大型數(shù)據(jù)庫的數(shù)據(jù)。7綜合結(jié)論通過以上的
19、分析得知,沒有一種算法是十全十美的,建議使用者根據(jù)實際情況(例如發(fā)現(xiàn)聚類的形狀、數(shù)據(jù)輸入順序是否敏感、適用數(shù)據(jù)庫的大小或者算法效率來選擇聚類算法。一般情況下有以下結(jié)論:目標(biāo)數(shù)據(jù)庫如果比較大,建議使用綜合性的聚類算法,如:B I RCH、CURE、DBSCAN和STI N G 等,以提高算法效率。如果聚類的形狀是球形或者凸形,B I RCH和CLARANS比較適合。一般而言,聚類算法對數(shù)據(jù)輸入的順序都比較敏感。如果希望不敏感,可以選用基于網(wǎng)格的STI N G算法。將不同類型的聚類算法相互結(jié)合(例如B I RCH算法和CURE算法,綜合各自的優(yōu)點,以滿足不同的聚類要求。是今后聚類算法的一個重要發(fā)展
20、方向。參考文獻(xiàn)1M argaret H.Dunha m著,郭崇慧等譯.數(shù)據(jù)挖掘教程M.清華大學(xué)出版社,20052L.Kauf man and P.J Rousseeu w.Finding Gr oup s in Data:An I ntr oducti on t o Cluster AnalysisM.Ne w York:John W iley&Sons,19903Ray mond T.Ng and J ia wei Han.Efficient and effectiveclustering methods f or s patial data m iningR.Pr oceed2 ings
21、of the internati onal Very Large Databases Conference, 1994:1441554湯效琴,戴汝源.數(shù)據(jù)挖掘中聚類分析的技術(shù)方法S.微計算機信息,20035范明,孟小峰譯.數(shù)據(jù)挖掘:概念與技術(shù)聚類分析M.北京:機械工業(yè)出版社,2001:2232586錢鋒等.知識發(fā)現(xiàn)中的聚類分析及其應(yīng)用J.杭州師范學(xué)院學(xué)報,2001(2:3437(上接第10頁文件和相連接的三角網(wǎng)文件,整個三角網(wǎng)不管是哪部分都將按需要以文件地址標(biāo)號形式存入RAM 中,這將大大減少占用存儲空間。6結(jié)束語本文提出了一種快速、有效的散亂點集Dealu2 any三角剖分算法,算法適用于大
22、數(shù)量點集的Delaunay三角剖分,已對數(shù)百萬個點進(jìn)行了三角網(wǎng)的構(gòu)建,實際應(yīng)用的效果很好。而且格子劃分靈活,大小隨點云情況而定,網(wǎng)格的寬度適應(yīng)點的疏密變化;點及三角網(wǎng)的文件管理較方便。本算法具有簡便實用,生成速度快,點集劃分和三角網(wǎng)格構(gòu)建時間復(fù)雜度與點數(shù)目成近優(yōu)線性關(guān)系,可靠性高等特點。該算法具有很大的實用價值和應(yīng)用前景。參考文獻(xiàn)1杜立彬,高曉輝,王昊等.逆向工程各關(guān)鍵技術(shù)的研究進(jìn)展J.機械制造,2004,(6:41452曲利巖,吳建華,陳永校.有限元網(wǎng)格的自動生成及快速實現(xiàn)J.電機與控制學(xué)報,2002,6(1:34383武曉波,王世新,肖春生.Delaunay三角網(wǎng)的生成算法研究J.測繪學(xué)報
23、,1999,28(1:28354Sap idis N,Perucchi o R.Delaunay triangulati on of arbitrarilyshaped p lanar domainsJ.CAG D,1991,(8:421437 5Bor ouchaki H,Lo S H.Fast Delaunay triangulati on in thethree di m ensi onsJ.Computer M ethods App l.M ech.En2 grg,1995,128(2:1531676周培德.計算幾何2算法分析與設(shè)計M.北京:清華大學(xué)出版社,20017T.M idtbi
24、.Spatial Modeling by Delaunay Net w orks of T woand Three D i m ensi onsM.Doct oral Thesis,University of Tr ondhei m,199302數(shù)據(jù)挖掘中聚類算法的綜述第35卷Key wordshe l m e t-m o un te d d isp l ays,SU SAN,cu rve fitti ng,sub-p i xe l(Page:14Survey of C luster Ana lysis i n Da t a M i n i n g byHu Q inglinAbstractC
25、 l u ste r a rithm e ti c is a ve ry i m po rtan t techno l o2 gy i n the a rea o f da ta m i n i ng.The rep re se n ted c l u s te r a2 rithm e ti c is i n tr o duced and ana l yzed i n th is a rti c l e.Fo r yo u r re fe re nce,som e sugge s ti o n s a re lis te d a t the e nd. Key wordsda ta m i
26、n i ng,c l u s te r ana l ysis,c l u ste r a rithm e2 ti c(Page:17O pti m i za ti on Stra tegy for Aud i o Processi n g Ar ith m eti c Used i n M PEG-1Layer3Ba sed on T M S320C6000Ch i pbyD ai D andanAbstractTh is p ap e r dea ls w ith the op ti m i za ti o n o f the key a l go rithm s i n the M PEG
27、-1l aye r3s tanda rdpo l y2 p ha se filte r bank,m o d i fi ed and d isc re te co s i ne Tran s2 fo r m,quan ti za ti o n,p hycho aco u sti c m o de l and b it o r no ise a ll o ca ti o n.O p ti m i za ti o n ba sed o n the T M S320C6000D SP p l a tfo r m w ith C6711c ited is a lso d is2 cu s sed.Th
28、e e xe cu ti o n o f l aye r3deco de r p r o g ram is g rea tl y acce l e ra te d th r o ugh the se m e tho d s.La s tl y,the p ap e r co nc l ude s and p u ts fo r w a rd ne ed no ti c i ng p r o b2 l em s.Key wordspo l yp ha se filte r bank,m o d i fi ed d isc re te co2 s i ne tran sfo r m,p e rce
29、p tua l co d i ng,p hycho aco u s ti c m o d2 e l,quan ti za ti o n(Page:21D esi gn and Ana lysis of Eff i c i ency for the Recursi on A lgo2 r ith m byYuan J insongAbstractThe recu rs i o n a l go rithm is a ki nd o f p r o g ram de s i gn m e tho d,w h i ch is p rac ti ca l and u se d fre quen tl
30、y.I ts effi c i e ncy que s ti o n is w o rth s tudyi ng.Th is a rti c l e p re se n ts the gene ra lity m e tho d to ana l yze re cu rs i o n a l go2 rithm:the re cu rsi ve e xp re s s i o n com p u ta ti o n m e tho d and the recu rs i o n tran sfe r tre e m e tho d,and p e rfo r m s them th r o u
31、gh e xam p l e s.Key wordsrecu rsi o n,com p li cacy o f ti m e,re cu rs i ve e xp re s s i o n(Page:25Research on Da t a I n tegra ti on Ba sed on X ML and W eb Serv i ce byCui W eiAbstractD ue to the ub i qu ity o f i nfo r m a ti o n is l and s and the he te r o ge neo u s system s am o ng en te
32、r p rise,da ta comm un i ca ti o n and da ta sha ri ng i n and be t w e en en te r2 p rise a re b l o cked.Fr om the vi ew po i n t o f s l o vi ng da ta i n2 te g ra ti o n fo r en te r p rise,th is a rti c l e s i m p l y sum s up and ana l yse s the p re se n t techno l o g i e s fo r da ta i n t
33、e g ra ti o n, and g i ve s a schem e w h i ch is ba se d o n X M L and W e b se rvi ce fo r bu il d i ng a h i gh effi c i e n t and un i fo r m e n te r p rise da ta i n te g ra ti o n.Key wordsX M L,W eb se rvi ce,da ta i n te g ra ti o n(Page:27 On tology Ba sed A ssoc i a ti on RulesM i n i n g
34、 byChen X iaAbstractTh is p ap e r p re sen ts an o n to l o gy-ba sed a s so2 c i a ti o n ru l e s m i n i ng m e tho d.It is to bu il d o n to l o gy o n som e dom a i n and the n ba se it to l e ad the m i n i ng p r o ce ss w h i ch w ill fa sten the p r o ce s s and i m p r o ve the effi c i e
35、ncy and qua lity.A lso it i nc l ude s the va l ue m e a su rem en ts o f a sso c i a ti o n ru l e s.Key wordso n to l o gy,a s so c i a ti o n ru l e s,da ta m i n i ng,se2 m an ti c W e b(Page:32Research on V isua li za ti on i n Lake D redg i n g Up Ba sed on O penGL byKang L ingAbstractThe re s
36、ea rch ba sed o n O p e nGL m ake s the p r o ce s s o f l ake d re dg i ng up vis i b l e.Th r o ugh B ezi e r su r2 face fitti ng,it rep re se n ts su rface o f unde r w a te r silt by sam p li ng po i n ts.Acco rd i ng to sam p li ng po i n ts,it co n2 s truc ts the cu rve abo u t th i ckne s s o f s ilt hvo l um e Q by l e a s t squa re m e tho d.I t adop ts o f O p enG L
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國威士忌市場銷售渠道與營銷趨勢預(yù)測報告
- 2024年獨家:影視作品版權(quán)許可使用協(xié)議
- 2024年特許經(jīng)營合同實務(wù)操作
- 2024年版企業(yè)間技術(shù)咨詢合同
- 茅臺學(xué)院《公共關(guān)系案例精講》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年智能監(jiān)控系統(tǒng)設(shè)備安裝協(xié)議版B版
- 2024年度內(nèi)河化學(xué)品運輸安全責(zé)任合同模板下載3篇
- 2024年生態(tài)農(nóng)業(yè)自建房產(chǎn)權(quán)轉(zhuǎn)移協(xié)議3篇
- 2025廢品回收合同
- 2024年標(biāo)準(zhǔn)電腦維修服務(wù)承諾合同范本版B版
- 2023年正規(guī)借條免費下載(5篇)
- 網(wǎng)絡(luò)創(chuàng)業(yè)智慧樹知到答案章節(jié)測試2023年海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院
- 高中英語新課標(biāo)新增詞匯匯總1
- GB/T 31586.2-2015防護涂料體系對鋼結(jié)構(gòu)的防腐蝕保護涂層附著力/內(nèi)聚力(破壞強度)的評定和驗收準(zhǔn)則第2部分:劃格試驗和劃叉試驗
- GB/T 20734-2006液化天然氣汽車專用裝置安裝要求
- GB/T 20197-2006降解塑料的定義、分類、標(biāo)志和降解性能要求
- GB/T 15561-2008靜態(tài)電子軌道衡
- 軍事理論論述題
- 寧德時代財務(wù)報表分析
- 門式起重機安裝施工方案
- 高中語文語法知識課件
評論
0/150
提交評論