版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
05二月2023DataMining:ConceptsandTechniques1第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques2什么是聚類分析聚類:將數(shù)據(jù)對象集合成簇簇內(nèi)相似最大化簇間相異最大化聚類分析將物理或抽象對象的集合分成相似的對象類的過程無監(jiān)督學(xué)習(xí):無欲先定義的類典型應(yīng)用作為獨立的工具來分析數(shù)據(jù)的分布情況作為其他程序的預(yù)處理過程05二月2023DataMining:ConceptsandTechniques3聚類在各學(xué)科間的應(yīng)用
模式識別空間數(shù)據(jù)分析CreatethematicmapsinGISbyclusteringfeaturespacesDetectspatialclustersorforotherspatialminingtasks圖像處理經(jīng)濟(jì)學(xué)(特別是市場分析)WWW文獻(xiàn)分類聚類網(wǎng)絡(luò)日志,ClusterWeblogdatatodiscovergroupsofsimilaraccesspatterns05二月2023DataMining:ConceptsandTechniques4聚類的應(yīng)用舉例市場學(xué):幫助營銷人員將其客戶數(shù)據(jù)分成不同的組,以更好的開拓目標(biāo)市場土地使用:對地球上相似地區(qū)土地的使用觀察數(shù)據(jù)保險行業(yè):將汽車保險分組從而使得投保人的平均花費最高城市規(guī)劃:根據(jù)的房子類型,價值,和地理位置確定住房團(tuán)體地震研究:
根據(jù)大陸斷層的聚類觀測震中05二月2023DataMining:ConceptsandTechniques5什么是好的聚類?一個好的聚類方法使聚類結(jié)果簇內(nèi)相似最大化簇間相似最小化
好的聚類方法不僅取決于它產(chǎn)生結(jié)果的相似程度,而且還與其執(zhí)行有關(guān)聚類方法的好壞也與他發(fā)現(xiàn)部分或全部潛在模式的能力有關(guān)05二月2023DataMining:ConceptsandTechniques6衡量聚類的質(zhì)量相異/相似尺度:我們用距離函數(shù)d(i,j)來表示相似度。有獨立的“質(zhì)量”函數(shù)來衡量聚類的好壞對區(qū)間標(biāo)度變量,布爾變量,分類變量,序數(shù)變量,向量的距離函數(shù)的定義方式是不同的.不同的應(yīng)用或數(shù)據(jù)含義,其衡量方法應(yīng)該不同很難定義“足夠相似”或“足夠好”
結(jié)果往往是高度主觀的05二月2023DataMining:ConceptsandTechniques7數(shù)據(jù)挖掘中聚類的要求
可伸縮性具有處理不同類型屬性的能力具有處理動態(tài)數(shù)據(jù)的能力發(fā)現(xiàn)任意形狀的聚類對于決定輸入的參數(shù)的領(lǐng)域知識需求最小可以處理噪聲和離群點不依賴于對象的輸入次序高維性基于約束的聚類可釋性和可用性05二月2023DataMining:ConceptsandTechniques8第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques9數(shù)據(jù)結(jié)果數(shù)據(jù)矩陣(二模)相異度矩陣(單模)05二月2023DataMining:ConceptsandTechniques10聚類分析中的數(shù)據(jù)類型區(qū)間標(biāo)度變量二元變量分類、序數(shù)、和比例表度變量混合類型的變量05二月2023DataMining:ConceptsandTechniques11區(qū)間標(biāo)度變量數(shù)據(jù)標(biāo)準(zhǔn)化計算均值絕對誤差其中計算標(biāo)準(zhǔn)度量值(z-score)使用均值絕對誤差比使用標(biāo)準(zhǔn)度量值穩(wěn)定05二月2023DataMining:ConceptsandTechniques12對象間的相似度和相異度通常用距離來描述對象間的相似度或相異度最常用的是閔可夫斯基距離其中i=(xi1,xi2,…,xip)和j=(xj1,xj2,…,xjp)是兩個p維數(shù)據(jù),q是一個正整數(shù)。當(dāng)q=1時,d是曼哈頓距離05二月2023DataMining:ConceptsandTechniques13對象間的相似度和相異度當(dāng)q=2時,d為歐氏距離:d應(yīng)滿足的要求d(i,j)
0d(i,i)
=0d(i,j)
=d(j,i)d(i,j)
d(i,k)
+d(k,j)當(dāng)然,我們也可以用加權(quán)距離或是其他的相異度衡量方法05二月2023DataMining:ConceptsandTechniques14二元變量二元變量的相依表使用對稱二元變量描述對象間的距離:使用非對稱二元變量描述對象間的距離:Jaccard系數(shù)(非對稱二元變量相似度):ObjectiObjectj05二月2023DataMining:ConceptsandTechniques15二元變量間的相異度例:性別是對稱屬性剩下的屬性為非對稱二元變量令,Y=P=1,N=005二月2023DataMining:ConceptsandTechniques16分類變量一般的變量都不是二元變量,是可以取多于兩個狀態(tài)值的。如:紅色,黃色,藍(lán)色,綠色。方法1:不匹配率m:匹配的數(shù)目,p:全部變量的數(shù)目方法2:使用多個二元變量為每個分類變量的狀態(tài)創(chuàng)建一個新的二元變量05二月2023DataMining:ConceptsandTechniques17序數(shù)變量序數(shù)變量可以是離散的或是連續(xù)的序數(shù)是很重要的,如:等級??梢援?dāng)做是區(qū)間標(biāo)度變量來對待將
xif
替換成他的秩
將每個變量的值映射到區(qū)間[0,1]內(nèi),這可以通過用代替第f個變量的第i個對象來實現(xiàn)利用求區(qū)間標(biāo)度變量相異度的方法來計算序數(shù)變量的相異度05二月2023DataMining:ConceptsandTechniques18比例標(biāo)度變量比例表度變量:在非線性的刻度(例如指數(shù)刻度)取正的度量值,近似的遵循下面的公式:
AeBt
或Ae-Bt
方法:采用處理區(qū)間標(biāo)度變量的方法——并不是一個好的方法(比例可能被扭曲了)對比例標(biāo)度進(jìn)行對數(shù)變化yif=log(xif)將其看做連續(xù)的序數(shù)數(shù)據(jù),將其秩看做區(qū)間標(biāo)度變量05二月2023DataMining:ConceptsandTechniques19混合類型的變量一個數(shù)據(jù)庫可能含有所以以上六種類型的變量對稱二元變量,非對稱二元變量,分類變量,序數(shù)變量,區(qū)間標(biāo)度變量和比例標(biāo)度變量用有效的公式將他們一起處理f
是二元變量或分類變量:dij(f)=0ifxif=xjf,ordij(f)=1否則f
是區(qū)間標(biāo)度變量:使用標(biāo)準(zhǔn)距離f
是序數(shù)或比例標(biāo)度變量計算秩rif
和zif
并將zif看做區(qū)間標(biāo)度變量05二月2023DataMining:ConceptsandTechniques20向量對象向量對象:文獻(xiàn)中的關(guān)鍵詞,微陣列中的基因特征等。廣泛應(yīng)用:信息檢索,生物學(xué)分類等.余弦度量Tanimoto系數(shù)05二月2023DataMining:ConceptsandTechniques21第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques22主要的聚類分析方法(I)劃分法:將給定的數(shù)據(jù),按照一定的標(biāo)準(zhǔn)構(gòu)建k劃分。典型的有:k均值法,k中心點算法,CLARA(聚類大型應(yīng)用)。層次方法:
按照一定的標(biāo)準(zhǔn),創(chuàng)建給定數(shù)據(jù)對象集的層次分解。典型的有:Diana,Agnes,BIRCH,ROCK,CAMELEON基于密度的方法:
基于密度或鏈接函數(shù)典型的有:DBSACN,OPTICS,DenClue05二月2023DataMining:ConceptsandTechniques23主要的聚類分析方法(II)基于網(wǎng)格的方法:
基于多層粒度結(jié)構(gòu)經(jīng)典的方法:STING,WaveCluster,CLIQUE基于模型的方法:為每個簇假定一個模型,并尋找數(shù)據(jù)對給定模型的最佳擬合。經(jīng)典的有:
EM,SOM,COBWEB基于頻繁模式的方法:基于對頻繁模式的分析。經(jīng)典的方法:pCluster基于約束的方法:結(jié)合用戶給定或面向應(yīng)用的特殊約束進(jìn)行聚類經(jīng)典的方法:COD(含障礙物),基于約束的聚類05二月2023DataMining:ConceptsandTechniques24常用的計算簇間距離的方法單鏈接:使用兩個簇的元素間的最小距離作為簇間距離即:dis(Ki,Kj)=min(tip,tjq)完全鏈接:使用兩個簇間的元素的最大距離作為簇間距離即:dis(Ki,Kj)=max(tip,tjq)平均值:使用兩個簇的元素間距離的平均值作為簇間距離即:dis(Ki,Kj)=avg(tip,tjq)質(zhì)心:使用兩個簇的質(zhì)心的距離作為簇間距離即:dis(Ki,Kj)=dis(Ci,Cj)中心點:使用兩個簇的中心點的距離作為簇間距離即:dis(Ki,Kj)=dis(Mi,Mj)05二月2023DataMining:ConceptsandTechniques25簇的質(zhì)心,半徑,直徑
(fornumericaldatasets)質(zhì)心:簇的“中央”半徑:簇中元素到其質(zhì)心的距離的平均值的平方根直徑:沒對元素的距離的平均值的平方根05二月2023DataMining:ConceptsandTechniques26第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques27劃分算法:基本概念劃分方法:
將給定n個對象的數(shù)據(jù)集D,劃分成k個簇,使得:平方距離和最小給定k,找到一個k劃分,找一個又劃分標(biāo)準(zhǔn)來判斷是最優(yōu)的k劃分全局最優(yōu):窮舉法啟發(fā)式的方法:k均值法和k中心點法K均值法
(MacQueen’67):每個簇由其中心來代替k-medoidsorPAM(Partitionaroundmedoids)(Kaufman&Rousseeuw’87):每個簇由其中的一個元素來代替05二月2023DataMining:ConceptsandTechniques28K均值聚類方法給定k,k均值算法的處理流程有以下四步組成:將數(shù)據(jù)集分成k個非空的子集計算當(dāng)前每個簇的質(zhì)心作為種子結(jié)點(質(zhì)心是簇的中心點,或是平均值點)將每個對象指派到離他最近的種子結(jié)點的簇回到第二步,知道指派結(jié)果不再變動05二月2023DataMining:ConceptsandTechniques29K均值聚類方法例:012345678910012345678910012345678910012345678910K=2任意選擇k個對象作為最初的簇的質(zhì)心將每個對象指派到最相似的簇更新簇的質(zhì)心更新簇的質(zhì)心重新指派reassign05二月2023DataMining:ConceptsandTechniques30K均值法的優(yōu)缺點優(yōu)點:
效率很高:算法時間復(fù)雜度為O(tkn),其中,n為給定對象的數(shù)目,k是給定要劃分的簇的個數(shù),t是指反復(fù)迭代次數(shù),通常k,t<<n.相比之下:PAM:O(k(n-k)2),CLARA:O(ks2+k(n-k))注:
常常會停留在局部最優(yōu)處,而達(dá)不到全局最優(yōu)。要找到全局最優(yōu)往往要使用確定的退火算法或是遺傳算法缺點:只適用于均值已被定義的情況,不能用于分類數(shù)據(jù)等。?需要預(yù)先指定要劃分的簇的個數(shù)不能處理噪聲或離群點不適于尋找圖形不規(guī)則的簇05二月2023DataMining:ConceptsandTechniques31改進(jìn)k均值算法改進(jìn)的k均值算法的幾個不同之處:挑選最初的k個均值計算相異度計算簇均值的算法可以處理分類數(shù)據(jù)的算法:k眾數(shù)(Huang’98)用眾數(shù)替代簇的均值使用新的相異度衡量方法來處理分類數(shù)據(jù)使用基于頻率的方法來更新簇的眾數(shù)處理數(shù)值數(shù)據(jù)和分類數(shù)據(jù)的混合類型:k-原型算法05二月2023DataMining:ConceptsandTechniques32K均值算法的問題Method?K均值算法對離群點非常敏感!因為一個對象如果具有很大的值,會對均值產(chǎn)生很大的影響,明顯的扭曲數(shù)據(jù)的分布狀態(tài).K中心點法:用中心點來代替簇的均值,中心點就是簇的最中央的那個對象。01234567891001234567891001234567891001234567891005二月2023DataMining:ConceptsandTechniques33K中心點聚類算法找到簇的中心點作為簇的代表對象PAM(圍繞中心點的劃分,1987)在隨機(jī)的選取k個代表對象做為中心點后,反復(fù)選擇簇的更好的代表對象。當(dāng)數(shù)據(jù)集很小時,PAM的效率是很高的,但是不適用于大的數(shù)據(jù)集CLARA
(聚類大型應(yīng)用)(Kaufmann&Rousseeuw,1990)CLARANS
(基于隨機(jī)搜索的聚類大型應(yīng)用)(Ng&Han,1994):RandomizedsamplingFocusing+spatialdatastructure(Esteretal.,1995)05二月2023DataMining:ConceptsandTechniques34經(jīng)典的k中心算法
(PAM)TotalCost=20012345678910012345678910K=2隨機(jī)的選擇k個對象作為代表對象將剩余的對象指派給離其最近的那個對象的簇隨機(jī)的選取一個不是代表對象的對象Oramdom計算總的交換開銷012345678910012345678910總開銷
=26如果情況變好了就交換O和Oramdom循環(huán),直至情況不再改變01234567891001234567891005二月2023DataMining:ConceptsandTechniques35PAM(圍繞中心點的劃分)(1987)PAM(KaufmanandRousseeuw,1987),builtinSplus使用實際的對象作為代表對象任選k個對象作為代表對象對任意一對沒被選中的對象h和被選中的對象i計算總的交換開銷TCih對任意一對
i
和
h,如果
TCih<0,h則用h來代替i然后將每個沒被選中的對象指派到最近的代表對象的簇重復(fù)第2-3步,直至結(jié)果不在改變05二月2023DataMining:ConceptsandTechniques36PAM聚類:總的交換開銷
TCih=jCjihjihttihjhitjtihj05二月2023DataMining:ConceptsandTechniques37PAM算法的問題在處理有離群點或噪聲的數(shù)據(jù)時PAM算法要比k均值算法穩(wěn)定,因為離群點或其他具有極端值的點對中心點的影響要小于對均值的影響PAM算法在處理小數(shù)據(jù)集的對象是效率很高的,但不適用于數(shù)據(jù)集很大的情況.每次迭代需要進(jìn)行O(k(n-k)2
步
其中,n是對象的個數(shù),k是劃分成的簇的個數(shù)基于取樣的方法,
CLARA(聚類大型應(yīng)用)05二月2023DataMining:ConceptsandTechniques38CLARA(聚類大型應(yīng)用)(1990)CLARA(KaufmannandRousseeuwin1990)用于統(tǒng)計學(xué)數(shù)據(jù)包分析,如S+對數(shù)據(jù)進(jìn)行多重抽樣,對每個抽樣的樣本用PAM算法聚類優(yōu)點:可以處理比PAM算法能處理的大的數(shù)據(jù)集缺陷:有效性取決于抽樣大小如果取樣偏執(zhí)了,那么對取樣的一個好的聚類并不能代表對整個數(shù)據(jù)的好的聚類05二月2023DataMining:ConceptsandTechniques39CLARANS(基于隨機(jī)搜索的CLARA)(1994)CLARANS(基于隨機(jī)搜索的聚類算法)(NgandHan’94)CLARANS動態(tài)的抽取緊鄰的隨機(jī)樣本聚類的過程可以看做搜素一個圖,圖中的每個結(jié)點是一個潛在解。當(dāng)達(dá)到局部最優(yōu)時,CLARANS會隨機(jī)的選擇一個新的結(jié)點開始,尋找新的局部最優(yōu)他比PAM和CLARA算法更有效。通過利用空間數(shù)據(jù)結(jié)構(gòu)的聚焦技術(shù),可以進(jìn)一步提高該算法的能力(Esteretal.’95)05二月2023DataMining:ConceptsandTechniques40第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques41層次方法使用距離矩陣作為聚類標(biāo)準(zhǔn)。此方法不需要輸入簇的個數(shù)k,但是需要終止條件Step0Step1Step2Step3Step4bdceaabdecdeabcdeStep4Step3Step2Step1Step0凝聚層次聚類法(AGNES)分裂層次聚類法(DIANA)05二月2023DataMining:ConceptsandTechniques42AGNES(凝聚層次聚類法)IntroducedinKaufmannandRousseeuw(1990)執(zhí)行統(tǒng)計數(shù)據(jù)分析,
如:Splus使用單連接方法,和相異度矩陣
合并相異度最小的結(jié)點采用非遞減模式進(jìn)行最終,所有的結(jié)點都凝聚成一個簇05二月2023DataMining:ConceptsandTechniques43樹狀圖:
簇是如何合并的Decomposedataobjectsintoaseverallevelsofnestedpartitioning(treeofclusters),calledadendrogram.Aclusteringofthedataobjectsisobtainedbycuttingthedendrogramatthedesiredlevel,theneachconnectedcomponentformsacluster.05二月2023DataMining:ConceptsandTechniques44DIANA(分裂層次聚類)IntroducedinKaufmannandRousseeuw(1990)執(zhí)行統(tǒng)計數(shù)據(jù)分析如:SplusAGNES的逆序過程最終每個結(jié)點構(gòu)成一個簇05二月2023DataMining:ConceptsandTechniques45最新的層次聚類分析法凝聚算法的主要缺陷不可伸縮型:時間復(fù)雜度至少是O(n2)不能取消以前的工作結(jié)合層次法和基于距離的方法的聚類BIRCH(1996):使用CF樹,對對象的增量和動態(tài)聚類也非常有效ROCK(1999):對分類屬性數(shù)據(jù)使用了鏈接,通過考慮成對點鄰域情況進(jìn)行聚類CHAMELEON(1999):使用動態(tài)建模的層次聚類算法05二月2023DataMining:ConceptsandTechniques46BIRCH(1996)Birch:利用層次方法的平衡迭代規(guī)約和聚類IncrementallyconstructaCF(ClusteringFeature)tree,ahierarchicaldatastructureformultiphaseclustering階段1:掃描DB在內(nèi)存中創(chuàng)建初始的CFtree階段2:使用任意聚類算法聚類CFtree的葉節(jié)點
線性增長:掃描一次就可以的到較好的聚類,如果增加掃描次數(shù)就可以提高聚類質(zhì)量缺陷:
只能處理數(shù)值數(shù)據(jù),而且對數(shù)據(jù)的輸入次序敏感05二月2023DataMining:ConceptsandTechniques47用BIRCH聚類特征向量聚類特征:
CF=(N,LS,SS)N:數(shù)據(jù)點個數(shù)LS:Ni=1=XiSS:Ni=1=Xi2CF=(5,(16,30),(54,190))(3,4)(2,6)(4,5)(4,7)(3,8)05二月2023DataMining:ConceptsandTechniques48BIRCH中的CF-Tree聚類特征:給定簇的統(tǒng)計匯總,他是簇的0階矩,一階矩,二階矩匯總對象簇的主要信息,避免存儲所有對象,有效地利用了存儲空間CFtree是一個高度平衡樹,他儲存了層次聚類的聚類特征
非葉節(jié)點有子女或后裔非葉節(jié)點存儲其子女的CF總和CFtree有兩個參數(shù)分支因子:定義了每個非葉結(jié)點的子女的最大數(shù)目.閾值:存儲在樹的葉節(jié)點中子簇的最大直徑05二月2023DataMining:ConceptsandTechniques49CFTree的結(jié)構(gòu)CF1child1CF3child3CF2child2CF6child6CF1child1CF3child3CF2child2CF5child5CF1CF2CF6prevnextCF1CF2CF4prevnextB=7L=6RootNon-leafnodeLeafnodeLeafnode05二月2023DataMining:ConceptsandTechniques50聚類分類數(shù)據(jù):ROCK算法ROCK:RObustClusteringusinglinKsS.Guha,R.Rastogi&K.Shim,ICDE’99主要思想使用鏈接來衡量相似度/相異度不急于距離計算復(fù)雜度:算法:基于取樣的聚類隨機(jī)取樣采用鏈接聚類在磁盤中標(biāo)號數(shù)據(jù)實驗議會選舉,迅速增長的數(shù)據(jù)05二月2023DataMining:ConceptsandTechniques51ROCK中的相似度衡量傳統(tǒng)的方法無法很好的衡量分類數(shù)據(jù)的相似度,如,Jaccard系數(shù)例如:兩個事務(wù)簇C1.<a,b,c,d,e>:{a,b,c},{a,b,d},{a,b,e},{a,c,d},{a,c,e},{a,d,e},{b,c,d},{b,c,e},{b,d,e},{c,d,e}C2.<a,b,f,g>:{a,b,f},{a,b,g},{a,f,g},{b,f,g}Jaccard系數(shù)會得到錯誤的聚類結(jié)果C1:0.2({a,b,c},{b,d,e}}to0.5({a,b,c},{a,b,d})C1&C2:couldbeashighas0.5({a,b,c},{a,b,f})基于Jaccard系數(shù)的相似度: 例.令
T1={a,b,c},T2={c,d,e}05二月2023DataMining:ConceptsandTechniques52ROCK中的鏈接方法鏈接:公共緊鄰C1<a,b,c,d,e>:{a,b,c},
{a,b,d},{a,b,e},
{a,c,d},{a,c,e},{a,d,e},{b,c,d},
{b,c,e},{b,d,e},{c,d,e}C2<a,b,f,g>:{a,b,f},
{a,b,g},{a,f,g},{b,f,g}LetT1={a,b,c},T2={c,d,e},T3={a,b,f}link(T1,T2)=4,因為他們有四個公共近鄰{a,c,d},{a,c,e},{b,c,d},{b,c,e}link(T1,T3)=3,他們有3個公共近鄰{a,b,d},{a,b,e},{a,b,g}所以鏈接法比Jaccard系數(shù)更為有效05二月2023DataMining:ConceptsandTechniques53CHAMELEON:利用動態(tài)建模的層次聚類法CHAMELEON:byG.Karypis,E.H.Han,andV.Kumar’99基于動態(tài)建模來衡量相似度如果兩個簇的互聯(lián)性都很高并且它們又靠的很近就將其合并
Cure
忽略了簇的互聯(lián)性,Rock
忽略了關(guān)于簇的鄰近度信息算法分為兩個階段使用圖劃分算法:將對象劃分為相對較小的字簇使用凝聚層次聚類算法:通過反復(fù)合并子簇來找到最終的簇05二月2023DataMining:ConceptsandTechniques54CHAMELEON的工作框架構(gòu)造稀疏圖劃分圖合并劃分最終的簇數(shù)據(jù)集05二月2023DataMining:ConceptsandTechniques55CHAMELEON(聚類復(fù)雜對象)05二月2023DataMining:ConceptsandTechniques56第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques57基于密度的聚類方法Clusteringbasedondensity(localclustercriterion),suchasdensity-connectedpoints主要特征:可以發(fā)現(xiàn)任意形狀的簇可以處理喊噪聲的數(shù)據(jù)一次掃描需要給出密度參數(shù)的終止條件典型算法DBSCAN:Ester,etal.(KDD’96)OPTICS:Ankerst,etal(SIGMOD’99).DENCLUE:Hinneburg&D.Keim(KDD’98)CLIQUE:Agrawal,etal.(SIGMOD’98)(moregrid-based)05二月2023DataMining:ConceptsandTechniques58基于密度聚類的基本概念兩個參數(shù):Eps:鄰域的最大半徑MinPts:對象鄰域內(nèi)最少點數(shù)NEps(p): {q屬于D|dist(p,q)<=Eps}直接密度可達(dá):對象p從對象q出發(fā)時直接密度可達(dá)的,如果
P屬于
NEps(q)核心對象條件:|NEps(q)|>=MinPts
pqMinPts=5Eps=1cm05二月2023DataMining:ConceptsandTechniques59密度可達(dá)和密度相連密度可達(dá):P是從q密度可達(dá)的,如果存在一連串的對象p1,…,pn,p1=q,pn=p
使得pi+1從
pi
出發(fā)直接密度可達(dá)密度相連P和q是密度互連的,如果存在o使得p和q都是從o出發(fā)密度可達(dá)的pqp1pqo05二月2023DataMining:ConceptsandTechniques60DBSCAN:基于高密度連同區(qū)域的基于密度的聚類方法依賴基于密度理論的分類:密度互連的對象組成的最大集合為一個簇在有噪聲的空間數(shù)據(jù)庫中可以發(fā)現(xiàn)任意形狀的簇CoreBorderOutlierEps=1cmMinPts=505二月2023DataMining:ConceptsandTechniques61DBSCAN:算法任選一個對象p找到所有從p出發(fā)密度可達(dá)的對象(給定Eps和MinPts)如果p是核心對象,則形成一個簇如果p是邊界對象,則沒有對象從p出發(fā)直接密度可達(dá),DBSCAN則會選擇數(shù)據(jù)庫中的另外一個對象重復(fù)上述步驟,直至所有的對象都被處理過05二月2023DataMining:ConceptsandTechniques62DBSCAN:對參數(shù)的敏感性05二月2023DataMining:ConceptsandTechniques63CHAMELEON(聚類復(fù)雜對象)05二月2023DataMining:ConceptsandTechniques64OPTICS:排序聚類方法(1999)OPTICS:通過點排序識別聚類結(jié)構(gòu)Ankerst,Breunig,Kriegel,andSander(SIGMOD’99)根據(jù)基于密度的分類結(jié)構(gòu)產(chǎn)生簇排序
該簇排序包含的信息等價于從一個廣泛的參數(shù)設(shè)置所獲得的基于密度的聚類有利于自動或交互式聚類分析,并能提供內(nèi)在的聚類結(jié)構(gòu)可以用圖表示,或者其他的可視化工具05二月2023DataMining:ConceptsandTechniques65OPTICS:對DBSCAN一些擴(kuò)展基于索引:
k=維數(shù)N=20p=75%M=N(1-p)=5Complexity:O(kN2)核心距離可達(dá)距離Dp2MinPts=5e=3cmMax(core-distance(o),d(o,p))r(p1,o)=2.8cm.r(p2,o)=4cmoop105二月2023DataMining:ConceptsandTechniques66可達(dá)距離Cluster-orderoftheobjects無定義‘05二月2023DataMining:ConceptsandTechniques67基于密度聚類:OPTICS及其應(yīng)用05二月2023DataMining:ConceptsandTechniques68DENCLUE:使用密度分布函數(shù)DENsity-basedCLUstEringbyHinneburg&Keim(KDD’98)使用密度分布函數(shù):主要特征固定的數(shù)學(xué)基礎(chǔ)可以處理含有大量噪聲的數(shù)據(jù)可以對高維數(shù)據(jù)集中任意形狀的簇做簡潔的數(shù)學(xué)描述比現(xiàn)有的其他算法要快得多(e.g.,DBSCAN)但是需要大量的參數(shù)05二月2023DataMining:ConceptsandTechniques69使用網(wǎng)格單元,但是只保存網(wǎng)格單元中實際包含的數(shù)據(jù)點的個數(shù)信息,并用樹結(jié)構(gòu)來管理這些網(wǎng)格影響函數(shù):描述數(shù)據(jù)點在其鄰域內(nèi)的影響數(shù)據(jù)空間的整體密度可以用所有數(shù)據(jù)點的影響函數(shù)計算出簇可以通過識別密度吸引點數(shù)學(xué)確定密度吸引點是全局密度函數(shù)的局部極大值Denclue:基本技術(shù)05二月2023DataMining:ConceptsandTechniques70密度吸引點05二月2023DataMining:ConceptsandTechniques71Center-DefinedandArbitrary05二月2023DataMining:ConceptsandTechniques72第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques73基于網(wǎng)格的聚類方法使用多分辨率的網(wǎng)格數(shù)據(jù)結(jié)構(gòu)相關(guān)的方法STING(aSTatisticalINformationGridapproach)byWang,YangandMuntz(1997)WaveClusterbySheikholeslami,Chatterjee,andZhang(VLDB’98)利用小波變換的多分辨率聚類方法CLIQUE:Agrawal,etal.(SIGMOD’98)處理高維數(shù)據(jù)05二月2023DataMining:ConceptsandTechniques74STING:統(tǒng)計信息網(wǎng)格法Wang,YangandMuntz(VLDB’97)將空間區(qū)域分成矩形單元存在多級矩形單元對應(yīng)不同級別的分辨率05二月2023DataMining:ConceptsandTechniques75STING聚類方法每個高層單元劃分成多個低一層的單元將每個單元的統(tǒng)計信息都計算并存儲起來,用于查詢處理高層單元的統(tǒng)計參數(shù)可以很容易的從低層單元的參數(shù)計算得到計數(shù),均值,標(biāo)準(zhǔn)差,最大值,最小值分布類型—正態(tài)的,均勻的等.使用從頂向下方法回答空間數(shù)據(jù)查詢從預(yù)先選定的一層開始,通常該層含有較少量的單元對當(dāng)前層的每個單元計算器相關(guān)的置信度區(qū)間
05二月2023DataMining:ConceptsandTechniques76STING刪除不相關(guān)的單元,不再進(jìn)一步考慮處理完當(dāng)前層后處理下一個較低層
重復(fù)此過程,直至達(dá)到最低層優(yōu)點:不依賴于查詢信息,有利于并行處理和增量更新時間復(fù)雜度為:O(K),其中k是最低層網(wǎng)格單元的數(shù)量缺點:所有簇的邊界不是水平的就是豎直的,沒有斜的分界線05二月2023DataMining:ConceptsandTechniques77WaveCluster:利用小波分析聚類(1998)Sheikholeslami,Chatterjee,andZhang(VLDB’98)對特征空間進(jìn)行小波變換的多分辨率聚類方法如何應(yīng)用小波變換來找到簇通過在數(shù)據(jù)空間強(qiáng)加一個多維網(wǎng)格結(jié)構(gòu)來匯總數(shù)據(jù)用一個n為特征空間來代替這些多維空間數(shù)據(jù)對特征空間進(jìn)行小波變換,在變換后的空間中發(fā)現(xiàn)密集區(qū)域多次應(yīng)用小波變換05二月2023DataMining:ConceptsandTechniques78小波變換小波變換:一種信號處理技術(shù),它將一個信號分解成不同頻率的子波段數(shù)據(jù)變換,以便在不同的分辨率水平保留對象間的相對距離使得數(shù)據(jù)的自然簇變得更加容易分辨05二月2023DataMining:ConceptsandTechniques79WaveCluster算法輸入?yún)?shù)#ofgridcellsforeachdimensionthewavelet,andthe#ofapplicationsofwavelettransform在聚類中為什么可以用小波變換?使用帽子形狀的過濾器來強(qiáng)調(diào)尖端簇區(qū)域,同時弱化其邊界的信息
有效地去除離群點,多分辨率,開銷低主要特征:復(fù)雜度O(N)可以發(fā)現(xiàn)任意形狀的簇對噪聲和數(shù)據(jù)的輸入順序不敏感僅適用于低維數(shù)據(jù)基于網(wǎng)格與基于密度相結(jié)合05二月2023DataMining:ConceptsandTechniques80分層與變換首先將數(shù)據(jù)分成m維網(wǎng)格結(jié)構(gòu),然后應(yīng)用小波變換a)scale1:高分辨率b)scale2:中等分辨率c)scale3:低分辨率05二月2023DataMining:ConceptsandTechniques81第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques82基于模型的聚類什么是基于模型的聚類?優(yōu)化給定數(shù)據(jù)與某個數(shù)學(xué)模型間的擬合
基于這個假設(shè),數(shù)據(jù)根據(jù)潛在的混合概率分布生成典型方法統(tǒng)計方法EM(Expectationmaximization),AutoClass機(jī)器學(xué)習(xí)法MachinelearningapproachCOBWEB,CLASSIT神經(jīng)網(wǎng)絡(luò)法NeuralnetworkapproachSOM(Self-OrganizingFeatureMap)05二月2023DataMining:ConceptsandTechniques83EM—期望最大化EM—一種流行的迭代求精算法可以看做是k均值法的擴(kuò)展根據(jù)一個代表隸屬度概率的權(quán)重將對象指派到簇(prob.distribution)新的均值基于加權(quán)的重量來計算主要思想對參數(shù)進(jìn)行初始猜測反復(fù)估計參數(shù)來產(chǎn)生的混合密度對每個對象重新打分重新打分后的對象又用來更新參數(shù)估計每個對象賦予一個概率,假定它是給定簇的成員,具有一定屬性值集合的可能性。算法收斂很快,但可能達(dá)不到全局最優(yōu)05二月2023DataMining:ConceptsandTechniques84EM算法隨機(jī)的選取k個對象代表簇的均值或中心按如下兩個步驟反復(fù)求精參數(shù)
期望步:用以下概率將每個對象XiXi
指派到簇Ck最大化步:估計模型參數(shù)05二月2023DataMining:ConceptsandTechniques85給定一些觀察數(shù)據(jù)x,假設(shè)x符合如下高斯分布:求混合高斯分布的三組參數(shù)05二月2023DataMining:ConceptsandTechniques86該混合高斯分布一共有K個分布,并且對于每個觀察
到的x,如果我們同時還知道它屬于K中的哪一個分布,則我們可以根據(jù)最大似然估計求出每個參數(shù)。結(jié)論:特別注意是個向量,而是個數(shù)值。表示屬于第k個高斯分布的觀察數(shù)據(jù)x。05二月2023DataMining:ConceptsandTechniques87實際問題觀察數(shù)據(jù)x屬于哪個高斯分布是未知的,所以要用
EM算法來解決這種實際問題。05二月2023DataMining:ConceptsandTechniques88EM算法過程:1、用隨機(jī)函數(shù)初始化K個高斯分布的參數(shù),同時保證Expectation2、依次取觀察數(shù)據(jù)x,比較x在K個高斯函數(shù)中概率的大小,把x歸類到這K個高斯中概率最大的一個。05二月2023DataMining:ConceptsandTechniques89Maximum3、用最大似然估計,使觀察數(shù)據(jù)是x的概率最大,因為已經(jīng)在第2步中分好類了,所以,即簡單問題的求法。4、返回第2步用第3步新得到的參數(shù)來對觀察數(shù)據(jù)x
重新分類。直到下式概率(最大似然函數(shù))達(dá)到最大。05二月2023DataMining:ConceptsandTechniques90問題求解過程:05二月2023DataMining:ConceptsandTechniques91概念分類概念分類一種機(jī)器學(xué)習(xí)聚類方法給定一組為標(biāo)記的對象,產(chǎn)生對象的模式分類找出每組對象的特征描述,其中每組對象代表一個概念或類COBWEB(Fisher’87)
一種流行的、簡單的、增量概念分類以分類樹的形式創(chuàng)建層次聚類每個結(jié)點代表一個概念,包含對該概念的概率描述05二月2023DataMining:ConceptsandTechniques92COBWEB聚類方法分類樹05二月2023DataMining:ConceptsandTechniques93概念分類COBWEB的缺陷它基于這樣一個假設(shè),各個屬性的概念分布是彼此統(tǒng)計獨立的。但屬性之間常常存在相關(guān)不適用于聚類大型的數(shù)據(jù)庫Notsuitableforclusteringlargedatabasedata–skewedtreeandexpensiveprobabilitydistributionsCLASSIT是對COBWEB的擴(kuò)展,用以處理連續(xù)性數(shù)據(jù)的增量聚類與COBWEB算法存在類似的問題
AutoClass(CheesemanandStutz,1996)使用貝葉斯統(tǒng)計分析法來估計簇的數(shù)目在工業(yè)中非常流行05二月2023DataMining:ConceptsandTechniques94神經(jīng)網(wǎng)絡(luò)方法神經(jīng)網(wǎng)絡(luò)方法將每個簇看成是一個標(biāo)本,作為簇的原型新的對象可以根據(jù)某種距離度量分布到其標(biāo)本最相似的簇經(jīng)典的方法SOM(自組織特征映射)競爭學(xué)習(xí)法Involvesahierarchicalarchitectureofseveralunits(neurons)神經(jīng)元按照Neuronscompeteina“winner-takes-all”fashionfortheobjectcurrentlybeingpresented05二月2023DataMining:ConceptsandTechniques95自組織特征映射(SOM)SOMs,也稱之為拓?fù)溆行蛴成浠騅ohonen自組織特征映射(KSOMs)目標(biāo)是用低維(通常是2維到3維)目標(biāo)空間的點來表示高維源空間中的所有點,盡可能的保持點見得距離和鄰近關(guān)系類似于k均值算法:簇的中心往往處于特征或?qū)傩钥臻g的一個低維流形中聚類通過若干單元競爭當(dāng)前對象來進(jìn)行權(quán)重向量最接近當(dāng)前對象的單元成為贏家或活躍點調(diào)整獲勝單元及其最近鄰的權(quán)重SOM被認(rèn)為類似于大腦的處理過程對用2維或3維的方式觀察高維數(shù)據(jù)時很有效的05二月2023DataMining:ConceptsandTechniques96使用SOM聚類的web文檔用SOM算法對12088篇web、文章聚類的結(jié)果右邊的圖片:對關(guān)鍵詞“mining”進(jìn)行下鉆的結(jié)果05二月2023DataMining:ConceptsandTechniques97第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques98聚類高維數(shù)據(jù)聚類高維數(shù)據(jù)應(yīng)用:文本文檔,DNA微序列數(shù)據(jù)主要挑戰(zhàn):很多不相關(guān)的維可能屏蔽真實的簇距離度量變得無意義了——數(shù)據(jù)特別稀疏時位于不同維的數(shù)據(jù)點可以認(rèn)為是等距的簇可能僅存在于某些子空間內(nèi)方法特征變換:僅適用于大部分維都是相關(guān)的情況下如:PCA(主成分分析)和SVD(支撐向量機(jī))僅適用于特征是高度相關(guān)的/冗余的特征選擇:wrapperorfilterapproachesusefultofindasubspacewherethedatahaveniceclusters子空間聚類:
在所有可能的子空間中尋找簇CLIQUE,ProClus,基于頻繁模式的聚類05二月2023DataMining:ConceptsandTechniques99維災(zāi)難
(graphsadaptedfromParsonsetal.KDDExplorations2004)一維的數(shù)據(jù)通常是在一個相關(guān)的區(qū)域內(nèi)的增加一個維,是數(shù)據(jù)點沿這個維延伸,則會使數(shù)據(jù)變得分離增加更多的維,會使得數(shù)據(jù)點之間更加分離,高維數(shù)據(jù)是極端稀疏的數(shù)據(jù)度量變得沒有意義了—當(dāng)數(shù)據(jù)特別稀疏時我們可以認(rèn)為位于不同維的數(shù)據(jù)點是距離相等的05二月2023DataMining:ConceptsandTechniques100為什么要對子空間聚類?
(adaptedfromParsonsetal.SIGKDDExplorations2004)簇可能僅僅是存在于某個子空間中子空間聚類:找出所有可能的子空間內(nèi)的簇05二月2023DataMining:ConceptsandTechniques101CLIQUE(維增長子空間聚類方法)
Agrawal,Gehrke,Gunopulos,Raghavan(SIGMOD’98)自動的將高維數(shù)據(jù)空間劃分成子空間以便更好的聚類
CLIQUE可以看做是基于密度的也可以看做是基于網(wǎng)格的他將每一維劃分成相同數(shù)目的等距的區(qū)域?qū)⒁粋€m維的數(shù)據(jù)空間劃分成互不重疊的矩形單元如果一個單元中包含的數(shù)據(jù)點的個數(shù)超過了輸入的參數(shù)則這個單元為稠密單元同一子空間中彼此相連的稠密單元構(gòu)成的最大集合為一個簇05二月2023DataMining:ConceptsandTechniques102CLIQUE:主要步驟將數(shù)據(jù)空間劃分,并找到每個劃分單元中的數(shù)據(jù)點的個數(shù).找出含有簇的子空間,使用Apriori規(guī)則剪枝確定簇找出所有相關(guān)子空間中的稠密單元找出相關(guān)子空間中的所有相連的稠密單元.生成簇的最小覆蓋(邏輯描述)為每個簇確定覆蓋所有相連的稠密單元的最大區(qū)域為每個簇確定一個最小覆蓋05二月2023DataMining:ConceptsandTechniques103Salary(10,000)2030405060age543126702030405060age54312670Vacation(week)ageVacationSalary3050
=305二月2023DataMining:ConceptsandTechniques104CLIQUE的優(yōu)缺點優(yōu)點自動的找出高維數(shù)據(jù)的簇存在的子空間對數(shù)據(jù)的輸入順序不敏感,不需要假定數(shù)據(jù)的規(guī)范分布
它隨著輸入規(guī)模線性的伸縮,當(dāng)數(shù)據(jù)維數(shù)增加時具有良好的伸縮性缺點作為算法簡潔的代價,聚類結(jié)果的精度可能會降低05二月2023DataMining:ConceptsandTechniques105基于頻繁模式的方法適合用于高維數(shù)據(jù)(如:聚類文本文檔,微陣列數(shù)據(jù))Projectedsubspace-clustering:whichdimensionstobeprojectedon?CLIQUE,ProClusFeatureextraction:開銷大,效率低?使用頻繁模式是因為其具有下列性質(zhì)頻繁度是固有的性質(zhì)挖掘頻繁模式的開銷不是很大經(jīng)典方法基于頻繁項的文件聚類通過微陣列數(shù)據(jù)分析中的模式相似性聚類(pClustering)05二月2023DataMining:ConceptsandTechniques106基于相似模式的聚類(p-Clustering)右圖:只包含3個對象的多維微陣列原始數(shù)據(jù)很難發(fā)現(xiàn)其中的模式下圖:選擇屬性的子集后的平移和縮放模式05二月2023DataMining:ConceptsandTechniques107p-Clustering產(chǎn)生的原因?微陣列數(shù)據(jù)分析需要聚類具有上千屬性的數(shù)據(jù)發(fā)現(xiàn)平移和縮放模式使用歐氏距離聚類?——不能發(fā)現(xiàn)平移模式
對數(shù)據(jù)變換后得到新的屬性如Aij=ai–aj再對其聚類?—將引入
N(N-1)個屬性Bi-cluster使用均方差得分矩陣變換matrix(I,J)其中子矩陣稱為稱為δ-雙簇,如果對于某個δ>0有H(I,J)≤δδ雙簇的問題δ雙簇的子矩陣不一定是δ雙簇由于取平均的影響,雙簇可能包含一些不符合要求的離群點,但仍滿足一個非常小的
δ閾值05二月2023DataMining:ConceptsandTechniques108p-Clustering:基于相似模式的聚類給定對象x,y屬于O,屬性a,b屬于T,pScore(X)是一個2*2階矩陣如果(O,T)中任意的2*2階矩陣X都有pScore(X)≤δ(δ>0)則(O,T)對形成pclusterδ-pCluster的性質(zhì)向下閉包性產(chǎn)生的簇比雙簇方法產(chǎn)生的更同源(thusthename:pair-wiseCluster)為了有效的挖掘引入模式增長算法
用比例模式,取對數(shù)可以得到pScore的形式為05二月2023DataMining:ConceptsandTechniques109第七章聚類分析什么是聚類分析?聚類分析中的數(shù)據(jù)類型聚類分析的主要方法分類劃分方法層次方法基于密度的方法基于網(wǎng)格的方法基于模型的方法聚類高維數(shù)據(jù)基于約束的聚類分析
離群點分析小結(jié)05二月2023DataMining:ConceptsandTechniques110為什么要有機(jī)遇約束的聚類分析?需要用戶反饋:用戶最了解他們的需求參數(shù)少,但是用戶定義的約束多,05二月2023DataMining:ConceptsandTechniques111基于約束聚類分析的分類聚類應(yīng)用:設(shè)計有用戶知道的聚類分析聚類分析中的不同約束:對個體對象的約束(應(yīng)首先選擇)聚類價值在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣告大棚銷售合同范例
- 綠化栽種勞務(wù)合同范例
- 海南光伏發(fā)電合同范例
- 宣傳標(biāo)識合同范例
- 正規(guī)外加工合同范例
- 機(jī)械車位出租合同范例
- 房貸購房合同范例
- 養(yǎng)狗家庭采購合同范例
- 夜場裝修工程合同范例
- 同濟(jì)大學(xué)《數(shù)字繪畫基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 膜厚測試報告
- 鈑金件質(zhì)量檢驗報告單
- 航空集裝器知識完整版
- 減速器箱體工藝工裝設(shè)計說明書(含圖紙)
- (完整版)臨床檢驗基礎(chǔ)名詞解釋
- 深度分析澳洲資源量最大的皮爾巴拉地區(qū)礦床匯總
- 技術(shù)交底給水銅管道及配件安裝.
- 實驗動物房改造項目設(shè)計淺談
- 市政道路與橋梁銜接處設(shè)計及施工
- 【機(jī)械畢業(yè)論文】便攜式電火花小孔機(jī)結(jié)構(gòu)設(shè)計
- 國際商法考點期末考試
評論
0/150
提交評論