




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、.:.;聚類分析方法在我國空氣污染區(qū)域劃分中的運用安徽大學(xué) 笪婷婷、鄒委員、武錦摘 要隨著我國工業(yè)化進一步的開展,人們的生活也進一步的提高。伴隨著經(jīng)濟的開展,環(huán)境也遭到了一定的影響,國家也相應(yīng)的提出了人與自然調(diào)和相處的可繼續(xù)開展戰(zhàn)略。本文基于國家的政策,思索工業(yè)化過程中城市空氣的污染情況,提出相應(yīng)的合理建議,從而使工業(yè)化過程中他們的環(huán)境也能遭到更好的維護!聚類分析是目前最有前景的數(shù)據(jù)分析方法之一,它不僅能作為一個獨立的工具來獲得數(shù)據(jù)分布的情況,察看每一個簇的特點,還能集中地對某些特定的簇作進一步的分析。對空氣污染區(qū)域劃分的聚類分析,不僅能合理的分析我國各地域空氣污染的情況,還可以對他們工業(yè)化開
2、展的偉大藍(lán)圖提出他們瀚渺的建議,維護他們寬廣城市居民的切身利益!本文首先對幾種聚類方法進展了引見和比較,然后在對我國空氣污染現(xiàn)狀分析中,運用了系統(tǒng)聚類分析方法。首先,他們采用了組內(nèi)銜接聚類分析方法對我國的空氣污染區(qū)域按照污染程度的不同進展了劃分;其次,他們又采用了中位數(shù)聚類分析法對我國的空氣污染區(qū)域按照不同地域的廢氣處置情況進展了劃分;最后他們又采用了質(zhì)心聚類分析法對各污染區(qū)域按年度的不同進展劃分。他們用所選的三種數(shù)據(jù)進展聚類,產(chǎn)生的七個類是在整體上是一致的。這就闡明,空氣污染程度與廢氣處置的力度是成正相關(guān)的。為了闡明系統(tǒng)聚類分析方法在我國空氣污染區(qū)域劃分中的合理性,他們又采用了k-means
3、方法進展聚類,所得的聚類結(jié)果與運用系統(tǒng)聚類法的結(jié)果類似。從而進一步闡明分類的合理性。根據(jù)聚類結(jié)果,他們提出了一些相關(guān)的防治空氣污染的建議。相關(guān)部門應(yīng)該按照污染地域的分類有針對性的制定相關(guān)戰(zhàn)略,因地制宜,對污染程度相近的地域采用合理的方式進展治理。關(guān)鍵詞:聚類方法;系統(tǒng)聚類法;中位數(shù)聚類分析;組內(nèi)銜接聚類分析;質(zhì)心聚類分析The Application of Cluster Method in Air Pollution Regional Division of Our CountryAbstractWith the further development of the industry in
4、our country, people have undergone general improvement. However, the environment is accordingly suffering some attack from the progress of economy. The government has launched the strategy of sustainable development in order to build harmonious relationship between human and nature. Based on the pol
5、icy of our government, taking the pollution in urban area into consideration, our article gives some corresponding advices to protect our environment in the industrialization.Cluster method is one of the most promising methods in data analysis. Not only can it act as an independent tool to obtain th
6、e information of data distribution and observation of the characteristics of each cluster, but also do further analysis for some particular clusters. Using the cluster method in the analysis of division for polluted urban area, we can do reasonable analysis and get acquaintance of condition of air p
7、ollution in different places. Our trivial recommendations will be come up for the blue sky of our industry development and safeguarding the vital interests of the city dwellers.At the beginning of that paper, more than one kind of cluster method will be introduced and compared in that paper. Further
8、more, systematic cluster methods will be applied in the division of the current air pollution circumstances. Firstly, we use team linked cluster method to divide regions according to the pollution degree. Secondly, we use median cluster method in accordance with the pollutant disposal of different a
9、reas. Lastly, we use centroid cluster method by judging the annual condition of air pollution. We cluster these three kinds of data, finding that seven categories we produce are accordant on the whole, which suggests that pollution degree is positively related to the strength we depose.To illustrate
10、 the rationality of systematic cluster method applied in air pollution regional division, we utilize k-means to cluster. To our happiness, the result we obtain is quite similar to that of systematic cluster method, which shows the rationality.According to the clustering results, we put forward some
11、relevant suggestions for the prevention and control of air pollution. Relevant departments should formulate relevant strategies based on the classification of pollution areas, and take suitable measures for local conditions. Also we should depose the pollution in similar levels in a reasonable way.K
12、eywords: : cluster system clustering method; median cluster analysis; connection cluster analysis within the group; a centroid cluster analysis一.研討背景我國經(jīng)濟的快速增長,工業(yè)化、城市化的開展使得GDP年增長率到達(dá)。改革開放以來,我國的城市化進程加快,城市人口比例從年的添加到年的,這一時期的增長速度是世界平均增長速度的倍。世紀(jì)末,經(jīng)濟的劇增使得我國成為世界上第二大能源消費國,能源的耗費已成為我國空氣污染的主要來源。我國的總能源耗費曾經(jīng)從年的萬噸規(guī)范煤
13、添加到年的億噸規(guī)范煤,其中作為主要能源的燃煤占總能源耗費的 以上。燃煤是空氣污染物產(chǎn)生的重要緣由。此外,隨著汽車消費量的快速添加,燃油耗費年平均增長達(dá),使得空氣的污染物濃度不斷上升。我國的空氣污染情況不容樂觀。一導(dǎo)致空氣污染的緣由呵斥我國空氣污染的緣由是非常多的,但縱觀一切的污染成因,以下緣由應(yīng)該是最具有普遍性的。城市人口爆炸性增長。城市強大的經(jīng)濟活力,豐富的物質(zhì)文化條件和就業(yè)時機,對鄉(xiāng)村人口有具大的吸引力,進入世紀(jì)以來,人口城市化加速開展,城市人口急劇增長。我國城市化雖然起步較晚,但城市人口添加速度卻非常驚人,例如年我國城市人口有 .億,占全國總?cè)藬?shù)的.;年添加到近億,占全國總?cè)丝诘?.。城
14、市個數(shù)由年的個,到年增到個,幾乎添加了一倍,而城市人口大于萬的大型城市就有個之多。我國大城市人口密度平均每平方公里 萬人以上,是郊區(qū)人口平均密度的倍。城市中人口數(shù)量宏大的工礦企業(yè),單位面積上具有高投資、高能耗的特點。由于城市處于高密度、超負(fù)荷運轉(zhuǎn)形狀,因此城市空氣、水、土地及一切根底工程設(shè)備都接受著超載的負(fù)擔(dān),引起了一系列環(huán)境問題。城市空氣污染、缺電、缺水,城市環(huán)境臟、亂、差。不同地域能源耗費類型又決議了不同地域污染的差別??諝馕廴究梢园凑漳茉春馁M的不同分為煤煙型、石油型、揚塵型和復(fù)合型等。煤煙型污染的特征是空氣污染物中總懸浮顆粒物和二氧化硫所占的比例較大;石油型污染主要是石油熄滅、石油化工和
15、汽車尾氣產(chǎn)生的二次污染,興隆國家多屬此類污染,污染嚴(yán)重時可構(gòu)成光化學(xué)煙霧,并在-月濃度較高,我國甘肅省蘭州市就是屬于這種類型;揚塵型污染是以二次揚塵、建筑渣滓揚塵、機動車污染以及沙塵天氣所呵斥的總懸浮顆粒物污染為主的非燃煤粉塵污染;以石油型污染、二次揚塵、建筑揚塵及機動車排放污染為代表的污染稱為復(fù)合型污染,此類污染是以煤煙型污染為主導(dǎo)的,主要構(gòu)成于煤煙型污染向石油型污染轉(zhuǎn)化的工業(yè)興隆城市,有煤煙型污染與石油型污染的共同特征。氣候條件對空氣污染產(chǎn)生的影響??諝馕廴局饕Q于兩方面:一是與污染源排入空氣中污染物的多少有關(guān);二是取決于各地域上空邊境層大氣對污染物的稀釋分散才干大氣環(huán)境容量。就某一有限
16、時段而言,地域各污染源的排放總量能夠沒有多大變化,但污染濃度的日際變化或月際變化很明顯,主要是由天氣過程和天氣系統(tǒng)影響各地域大氣邊境層對污染物的稀釋分散才干所致。二空氣污染情況值得關(guān)注圖. -全國二氧化硫排放量折線圖上圖是年至年全國二氧化硫排放量的折線圖所用數(shù)據(jù)見附錄A中的表。由圖可以看出,自年開場,我國二氧化硫排放量有明顯的下降趨勢,但是直至年,二氧化硫排放量仍處于較高程度。這就闡明,近年來我國空氣中的二氧化硫治理程度有所提高,但是仍需求繼續(xù)加大整治力度,使二氧化硫排放量繼續(xù)減少。雖然二氧化硫的排放量并不能完全反響我國的空氣污染情況,但是也能在很大程度上反映出空氣質(zhì)量的變化。目前,我國正處在
17、經(jīng)濟高速開展階段,工業(yè)、農(nóng)業(yè)、交通運輸業(yè)等開展迅速,人們向往已久的“小康生活逐漸成為現(xiàn)實,但是伴隨而來的是人們的生存環(huán)境遭到污染。我國的空氣污染情況仍舊值得關(guān)注,他們每一個人都有職責(zé)來改善空氣質(zhì)量,營造一個安康溫馨的生活環(huán)境。三空氣污染的不利影響毫無疑問,大氣環(huán)境的不斷惡化,其后果之一是使人們本身的安康遭到嚴(yán)重要挾,呵斥某些疾病發(fā)病率和死亡率的不斷上升。據(jù)結(jié)合國環(huán)境規(guī)劃署統(tǒng)計,全世界每年約有萬人成為新的皮膚癌患者,呼吸系統(tǒng)和心血管疾病患者也呈添加趨勢。誠然,這些不能全部歸咎于空氣污染,但有理由以為,這與當(dāng)前的大氣環(huán)境惡化親密相關(guān)。這就提示他們,在縱情享用大自然恩惠和現(xiàn)代化成果的同時,也該仔細(xì)、
18、冷靜地思索一下由于人類本身行為而導(dǎo)致大氣環(huán)境不斷惡化、本身安康遭到損害的嚴(yán)峻現(xiàn)實??諝馕廴疽矔r(nóng)業(yè)呵斥危害??諝馕廴緦r(nóng)作物的危害分三種類型:一是急性危害,在污染物高濃度時,短時間內(nèi)對農(nóng)作物呵斥危害,使之葉面枯萎零落,直至死亡,呵斥農(nóng)作物減產(chǎn);二是慢性危害,在污染物低濃度時,因長時間作用所呵斥的危害,使農(nóng)作物葉綠素褪色,影響生長發(fā)育;三是不可見危害,指污染物質(zhì)對農(nóng)作物呵斥生理上的妨礙,抑制生育開展,呵斥產(chǎn)量下降。 空氣污染物對天氣和氣候的影響是非常顯著的,可以從以下幾個方面加以闡明: 空氣污染使得到達(dá)地面的太陽輻射量減少。從工廠、發(fā)電站、汽車、家庭取暖設(shè)備等向大氣中排放的大量煙塵微粒,使空氣
19、變得非常渾濁,遮擋了陽光,減少了到達(dá)地面的太陽輻射量。據(jù)觀測統(tǒng)計,在大工業(yè)城市煙霧不散的日子里,到達(dá)地面的太陽輻射量比沒有煙霧的日子減少近。在空氣污染嚴(yán)重的城市,天天如此,就會導(dǎo)致人和動植物因缺乏陽光而生長發(fā)育遭到妨礙。 空氣污染添加了大氣降水量。在大工業(yè)城市的空氣中有很多微粒,其中有很多具有水氣凝結(jié)核的作用。因此,假設(shè)再有其他一些降水條件與之配合,就會出現(xiàn)降水天氣,尤其在大工業(yè)城市的下風(fēng)地域,降水量更多。 空氣污染會導(dǎo)致下酸雨。有時候,在空氣污染地域所下的雨水中含有硫酸。這種酸雨是空氣中的污染物二氧化硫經(jīng)過氧化構(gòu)成硫酸,隨自然界的降水下落構(gòu)成的。酸雨的危害很大,它能使大片森林和農(nóng)作物毀壞,能
20、使紙品、紡織品、皮革制品等腐蝕破碎,能使金屬的防銹涂料蛻變而降低維護作用,還會腐蝕、污染建筑物。 空氣污染能增高大氣溫度。大氣中的二氧化碳可以使大量的太陽輻射能經(jīng)過大氣層輻射到地球外表,吸收從地球外表輻射出的紅外線。二氧化碳在吸收熱量后,再將吸收的輻射能逆輻射到地球外表,構(gòu)成多次輻射,使近地層大氣增溫。大氣中的二氧化碳好似是一個屏蔽,就像農(nóng)業(yè)所建的溫室一樣,所以把大氣中的二氧化碳所產(chǎn)生的效應(yīng)叫做溫室效應(yīng)。由于溫室效應(yīng),有人估算假設(shè)大氣中二氧化碳濃度為ppm時,地球上一切的冰雪將融化,反之,假設(shè)二氧化碳濃度減小為ppm時,溫室效應(yīng)減弱了,地球就能夠完全被冰雪所覆蓋。 除此之外,空氣污染還會帶來很
21、多其他不利影響。在這些問題更加嚴(yán)重之前,他們應(yīng)該盡全力做好空氣污染的防治任務(wù)。四已有研討目前有很多學(xué)者在我國空氣污染的原因、現(xiàn)狀、影響等方面有所研討,然而研討的目的不外乎是想提出更為有效、合理的空氣污染防治戰(zhàn)略。有的學(xué)者提出了一種研討空氣污染預(yù)告與控制的工具,即區(qū)域空氣質(zhì)量方式,它是經(jīng)過建立數(shù)學(xué)模型描畫大氣污染物的物理化學(xué)性質(zhì),思索大氣污染物排放的時空規(guī)律,進而再現(xiàn)污染物在大氣中保送、演化、去除等過程。該方式的開發(fā)涉及大氣動力學(xué)、大氣物理學(xué)、大氣化學(xué)、生態(tài)學(xué)、大氣探測與遙感、污染控制論、數(shù)學(xué)、計算機和網(wǎng)絡(luò)技術(shù)等諸多學(xué)科領(lǐng)域,是一項多學(xué)科交叉、復(fù)雜性和綜合性很強的系統(tǒng)工程??v使有不少方法曾經(jīng)運用
22、于空氣污染領(lǐng)域,依然有不少學(xué)者都忽略了聚類方法的宏大作用。毋庸置疑,聚類方法在對我國空氣污染現(xiàn)狀進展分析的過程中起到了關(guān)鍵的作用?;谏鲜霰尘埃疚脑趯ξ覈諝馕廴緟^(qū)域的劃分過程中,采用了聚類方法,科學(xué)、合理的將污染程度類似的地域歸為一類,為了解我國空氣污染現(xiàn)狀提供可靠的信息。二.聚類分析的相關(guān)方法聚類是一種運用非常廣泛的數(shù)據(jù)分析方法,它是統(tǒng)計學(xué)的一個分支,目前在諸多領(lǐng)域,包括數(shù)據(jù)發(fā)掘、圖像處置、市場研討等,都能凸顯出其重要性。聚類是將一個對象的集合分成不同的類,從而描畫數(shù)據(jù)。經(jīng)過這種方式,人們可以將密集的和稀疏的區(qū)域區(qū)分開來,從而發(fā)現(xiàn)全局的分布方式,以及數(shù)據(jù)屬性之間有趣的相互關(guān)系。很久以前人
23、們就對聚類方法有所研討。傳統(tǒng)的聚類方法主要是基于間隔 的聚類,例如歐氏間隔 、切比雪夫間隔 、馬氏間隔 等。在今天,聚類分析也是數(shù)據(jù)發(fā)掘和知識發(fā)現(xiàn)領(lǐng)域中的重要課題。迄今為止,人們曾經(jīng)提出了許多數(shù)據(jù)聚類的算法,試圖處理各種領(lǐng)域的聚類問題。從目前來看,對數(shù)據(jù)發(fā)掘中聚類方法的研討大都集中于計算機科學(xué)領(lǐng)域,更多注重聚類算法的研討,或者對現(xiàn)有聚類方法進展算法上的改良,而很少真正從統(tǒng)計學(xué)角度出發(fā)對數(shù)據(jù)發(fā)掘中的聚類問題進展深化分析。假設(shè)嘗試從統(tǒng)計學(xué)視角出發(fā),以統(tǒng)計實際為根底,以統(tǒng)計方法與算法相結(jié)合為根本思緒,將一些現(xiàn)有的優(yōu)秀統(tǒng)計方法,如因子分析、對應(yīng)分析等引入數(shù)據(jù)發(fā)掘領(lǐng)域,那么可以使其運用于海量數(shù)據(jù)的聚類分
24、析。一聚類分析的根本概念聚類是指將一群物理的或籠統(tǒng)的對象,根據(jù)它們之間的類似程度,分為假設(shè)干組,并使得同一個組內(nèi)的數(shù)據(jù)對象具有較高的類似度,而不同組中的數(shù)據(jù)對象那么是不類似的。一個聚類就是由彼此類似的一組對象所構(gòu)成的集合。在很多運用中,他們可以把同一個類的數(shù)據(jù)對象當(dāng)做一個整體來處置。聚類的嚴(yán)厲數(shù)學(xué)描畫如下:假設(shè)被研討的樣本集為,類定義為的一個非空子集,即:,且聚類就是滿足以下兩個條件的類,的集合:() () = (對恣意)由第一個條件可知,樣本集中的每個樣本必定屬于某一個類;由第二個條件可知,樣本集中的每個樣本最多只屬于一個類。二幾種主要的聚類方法如今各種各樣的聚類方法層出不窮,他們在選用聚類
25、方法時也會根據(jù)不同的規(guī)范,例如數(shù)據(jù)的類型、數(shù)據(jù)的大小等等。目前主要的聚類方法有:劃分的方法、層次的方法、基于密度的方法、基于網(wǎng)格的方法等。. 劃分的方法劃分的方法是指將一個給定個數(shù)據(jù)對象的數(shù)據(jù)集合,構(gòu)建數(shù)據(jù)的個劃分,每個劃分表示一個聚類,這個分組必需滿足:每個組至少包含一個對象;每個對象必需屬于且只屬于一個組。給定要構(gòu)建的劃分的數(shù)目,劃分方法首先創(chuàng)建一個初始劃分,然后采用一種迭代的重定位技術(shù),經(jīng)過對象在劃分間的挪動來改良劃分。好的劃分的普通準(zhǔn)那么是:同一分組中的間隔 越近越好,而不同分組中的間隔 越遠(yuǎn)越好,即使得以下的準(zhǔn)那么函數(shù)最?。荷鲜街惺穷惖木?,是數(shù)據(jù)空間中的數(shù)據(jù)對象。屬于該類的聚類方法
26、有k-均值(k-means)算法、k-中心點(k-medoids)算法、PAM、CLARA、CLARANS等 。. 層次方法將給定的數(shù)據(jù)對象集合進展層次的分解,這就是層次聚類法。他們可根據(jù)層次分解的構(gòu)成方式不同,把層次方法分為凝聚的和分裂的。凝聚的方法首先把每個對象作為單獨的一個組,然后相繼地合并相近的對象或組,直到一切的組合并為一個(層次的最上層),或者到達(dá)一個終止條件;分裂的方法首先把一切的對象置于一個聚類中,在每步迭代里,一個簇被分裂成更小的簇,直到最后每個對象在單獨的一個簇中,或者到達(dá)一個終止條件。層次方法的缺陷在于,執(zhí)行合并或分裂的操作不能被撤銷。這個嚴(yán)厲規(guī)定是有用的,由于不用擔(dān)憂組
27、合數(shù)目的不同選擇,故計算代價會較小。不過,該技術(shù)的一個主要問題是它不能矯正錯誤的決議。他們可以經(jīng)過兩種方法來改良層次聚類的結(jié)果:一是在每層劃分中,仔細(xì)分析對象之間的“聯(lián)接;二是把層次凝聚和迭代的重定位方法綜合起來,先用自底向上的層次算法,再用迭代的重定位來改良結(jié)果。層次方法包括BIRCH、CURE、ROCK、Chameleon算法等。. 密度方法絕大多數(shù)劃分方法是基于對象之間的間隔 進展聚類的。這樣的方法只能發(fā)現(xiàn)球狀的簇,卻在發(fā)現(xiàn)任不測形的簇上遇到了困難。隨之提出了基于密度的聚類方法,它的主要思想是:只需臨近區(qū)域的密度(對象或數(shù)據(jù)點的數(shù)目)超越某個閾值,就繼續(xù)聚類。主要的基于密度的方法有:DB
28、SCAN算法、OPTICS算法、DENCLUE算法等。. 網(wǎng)格方法基于網(wǎng)格的方法首先將數(shù)據(jù)空間量化為有限數(shù)目的單元,構(gòu)成了一個網(wǎng)格構(gòu)造,全部的聚類操作都在這個網(wǎng)格構(gòu)造上進展。這種方法的主要優(yōu)點在于它的處置速度很快,且處置時間與數(shù)據(jù)對象的數(shù)目相獨立,只取決于量化空間中每一維的單元數(shù)目。有代表性的網(wǎng)格方法是STING算法,除此之外,CLIQUE算法和Wavecluster算法既是基于網(wǎng)格的,又是基于密度的。三聚類方法的進一步分析和總結(jié)以上他們將現(xiàn)有的主要聚類方法大致分為劃分的方法、層次的方法、基于密度的方法、基于網(wǎng)格的方法四大類。下面他們將從聚類規(guī)范、類的標(biāo)識這兩個角度對眾多聚類方法進展更為全面和
29、深化的分析與對比,以加深對聚類方法的認(rèn)識。. 聚類規(guī)范聚類分析的最主要的義務(wù)是建立數(shù)據(jù)對象之間以及類與類之間類似性的度量規(guī)范。最常用的類似性規(guī)范包括:以間隔 為規(guī)范、以密度為規(guī)范和以鏈接為規(guī)范。以間隔 為規(guī)范間隔 是一種最為簡單、直觀的聚類規(guī)范。常見的數(shù)據(jù)對象之間間隔 的度量目的包括歐式間隔 、切比雪夫間隔 間隔 等。以間隔 為規(guī)范的聚類方法只能建立在歐式空間上。類間間隔 的度量廣泛運用如下四種方法:代表點間隔 :平均間隔 : 最小間隔 :最大間隔 :上式中,用表示類間間隔 ,用表示數(shù)據(jù)點之間間隔 ,和分別是類和的代表點(或稱“重心)。單一代表點的聚類方法(如k-means法和k-medoid
30、s法)通常運用代表點間隔 來度量類間間隔 。平均間隔 、最小間隔 、最大間隔 的計算時間復(fù)雜度均為,因此,直接運用這三種方式來度量類間間隔 時算法效率普通較低,獨一的例外是BIRCH方法,該方法借助聚類特征樹來提高算法速度。用間隔 作為聚類規(guī)范比較直觀且易于計算,但是對異常點通常比較敏感。所以,它們經(jīng)常會經(jīng)過引入某項技術(shù)來抑制異常點的影響。例如,k-medoids利用中心點而不利用均值作為類的代表點,從而降低了異常點的影響;CURE經(jīng)過調(diào)理“收縮因子,對多個代表點進展收縮處置來減少對孤立點的敏感度;BIRCH經(jīng)過控制子類的直徑來控制孤立點的影響。以密度為規(guī)范以密度為規(guī)范的聚類方法也只能建立在歐
31、式空間上。相對于以間隔 為規(guī)范,以密度為聚類規(guī)范的最大優(yōu)點就是可以發(fā)現(xiàn)任不測形的類,并且可以有效地消除噪聲。以密度為規(guī)范的聚類方法中,數(shù)據(jù)點之間類似程度的判別規(guī)范是它們能否屬于同一個延續(xù)的密集區(qū)域,同屬于一個延續(xù)密集區(qū)域的數(shù)據(jù)點被歸為一類。根據(jù)密度計算方式的不同,以密度為聚類規(guī)范的方法又可以進一步劃分為三類:基于網(wǎng)格的方法、最近鄰方法和基于密度函數(shù)的方法。基于網(wǎng)格的方法經(jīng)過網(wǎng)格內(nèi)數(shù)據(jù)對象的數(shù)量來計算類的密度。經(jīng)過這種方法得到的密度僅僅是真實密度的近似,從而會降低聚類的準(zhǔn)確度。STING、Wavecluster和CLIQUE方法屬于這一類。最近鄰方法把一定半徑內(nèi)最近鄰的數(shù)據(jù)對象的個數(shù)能否超越臨界
32、值作為判別密度能否足夠高的規(guī)范。DBSCAN和OPTICS都屬于這一類?;诿芏群瘮?shù)的方法利用密度函數(shù)的大小來表示類的密度,并且經(jīng)過尋覓密度函數(shù)的部分最大值準(zhǔn)確地確定類。這類方法包括DENCLUE等。以鏈接為規(guī)范以鏈接為規(guī)范的聚類方法的目的是把具有更多鏈接的數(shù)據(jù)點聚為一類,即其類似性度量采用的是鏈接的數(shù)目。這類方法普通都把模型建立在一個稀疏圖上,然后根據(jù)圖中的信息進展聚類。此類方法的代表是ROCK和Chameleon。以鏈接為規(guī)范的聚類方法可以建立在恣意空間之上。除此之外,由于在高維空間中間隔 和密度的度量經(jīng)常失效,此時,以鏈接為規(guī)范的方法就是一個較優(yōu)的選擇。. 類的標(biāo)識聚類分析的目的是要把原
33、始數(shù)據(jù)劃分成不同的類,每一類代表了類似的數(shù)據(jù)點的集合,因此,任何聚類方法都需求用某種方式對不同的類別作出標(biāo)識。他們把聚類方法中對類別進展標(biāo)識的方式分為如下三類:以代表性的數(shù)據(jù)點進展標(biāo)識大多數(shù)以間隔 為規(guī)范的聚類方法都運用代表性的數(shù)據(jù)點對類別進展標(biāo)識。這些代表性的點既可以是原始數(shù)據(jù)中存在的點,也可以是原始數(shù)據(jù)中不存在的點,如類的均值。最簡單的方法是利用單一代表點來標(biāo)識類別。原始數(shù)據(jù)庫中每一個數(shù)據(jù)點被劃分到離它最近的單一代表點。例如,k-means方法利用類均值作為代表點;k-medoids方法利用原始數(shù)據(jù)庫中間隔 類中心最近的點作為代表點;另外,BIRCH、CLARA、CLARANS等方法也是利
34、用單一代表點對類別進展標(biāo)識。單一代表點方法的最大缺陷是只能識別凸?fàn)罨蚯驙畹念?。多代表點方法(如CURE、ROCK、Chameleon等)的出如今一定程度上抑制了這一困難。這種方法首先選擇間隔 類中心最近的點作為代表點,然后選出離類中心較遠(yuǎn)且彼此相距也較遠(yuǎn)的點作為代表點。多個代表點可以描畫出類的外形特征,從而使得聚類方法可以識別任不測形的類。以密集區(qū)域進展標(biāo)識DBSCAN、OPTICS等基于密度的聚類方法利用相互分隔的密集區(qū)域來標(biāo)識類或者子類。每個密集區(qū)域中都包含一個中心對象。中心對象是指一定半徑內(nèi)最近鄰的個數(shù)超越指定臨界值的數(shù)據(jù)點。一個中心對象可以擴張出一個子類,因此聚類的過程就等價于中心對象
35、的搜索過程。由于中心對象的搜索將耗費大量計算資源,所以這類聚類方法常借助特殊的索引構(gòu)造來加快搜索速度。以網(wǎng)格單元進展標(biāo)識基于網(wǎng)格的聚類方法利用網(wǎng)格單元的特征來描畫類別特征。假設(shè)說密集區(qū)域是數(shù)據(jù)點的凝聚,網(wǎng)格單元那么是數(shù)據(jù)空間的劃分。一個網(wǎng)格單元就近似地代表了落入其中的數(shù)據(jù)點,因此,網(wǎng)格單元在部分范圍內(nèi)近似地反映了數(shù)據(jù)點的分布情況。由于網(wǎng)格是獨立于數(shù)據(jù)的,且網(wǎng)格單元的數(shù)量遠(yuǎn)遠(yuǎn)少于數(shù)據(jù)對象的數(shù)量,所以,網(wǎng)格單元特征的匯總遠(yuǎn)比密集區(qū)域的搜索效率高,因此這類方法往往運算速度很快。但由于網(wǎng)格單元畢竟只是數(shù)據(jù)對象的近似代表,因此其準(zhǔn)確度經(jīng)常不能令人稱心。四主要聚類方法的比較根據(jù)上面對聚類方法的分析與比較,
36、他們對幾種典型方法在算法效率、適宜的數(shù)據(jù)類型、發(fā)現(xiàn)的聚類外形、消除噪聲的才干、處置高維數(shù)據(jù)的才干、聚類規(guī)范、類的標(biāo)識幾方面進展比較。比較的結(jié)果如下表所示:表. 主要聚類方法的比較類型聚類方法算法效率適宜的數(shù)據(jù)類型可以發(fā)現(xiàn)的數(shù)據(jù)外形消除噪聲的才干處置高維數(shù)據(jù)的才干聚類規(guī)范類的標(biāo)識劃分的方法k-means數(shù)值型 凸?fàn)?、球狀弱較低間隔 代表點K-prototype恣意 凸?fàn)?、球狀弱較低間隔 代表點PAM數(shù)值型 凸?fàn)?、球狀較強較低間隔 代表點CLARA數(shù)值型 凸?fàn)睢⑶驙钶^強較低間隔 代表點CLARANS數(shù)值型 凸?fàn)?、球狀較強普通間隔 代表點層次的方法BIRCH數(shù)值型 凸?fàn)?、球狀較強較低間隔 代表點CU
37、RE數(shù)值型恣意較強普通間隔 代表點ROCK符號型恣意普通較高鏈接代表點Chameleon數(shù)值型恣意普通較高鏈接代表點基于密度的方法DBSCAN數(shù)值型恣意較強普通密度密度區(qū)域OPTICS數(shù)值型恣意較強普通密度密度區(qū)域DENCLUE比DBSCAN快數(shù)值型恣意強高密度密度區(qū)域基于網(wǎng)絡(luò)的方法STING數(shù)值型恣意強較低密度網(wǎng)格Wavecluster數(shù)值型恣意強較高密度網(wǎng)格CLIQUE較快數(shù)值型 凸?fàn)?、球狀普通高密度網(wǎng)格注:表中為數(shù)據(jù)對象的數(shù)目,為分類數(shù)目,為迭代次數(shù),為抽樣規(guī)模。三、聚類方法在我國空氣污染區(qū)域劃分中的運用一數(shù)據(jù)的選擇本文中所用到的數(shù)據(jù)中年各地域廢氣排放及處置情況,以及各地域二氧化硫排放量
38、,所用的數(shù)據(jù)見附錄A。二聚類方法的選擇本文對所選擇的數(shù)據(jù)采用不同的系統(tǒng)聚類法,以間隔 為聚類的規(guī)范。數(shù)據(jù)處置的時候采用了不同的間隔 ,以及不同的聚類方法,從各個不同的角度對各地的空氣污染情況進展了分析!能較準(zhǔn)確的反響全國各地的空氣質(zhì)量。三聚類分析. 按各地域的空氣污染嚴(yán)重程度不同對污染區(qū)域進展劃分運用SPSS軟件并采用組內(nèi)銜接聚類方法,對各污染區(qū)域按空氣污染嚴(yán)重程度的不同進展劃分,可得如下聚類分析:圖.空氣污染嚴(yán)重程度不同對污染區(qū)域進展劃分參數(shù)設(shè)置所得聚類分析的柱形圖如下:圖. 空氣污染程度聚類分析的柱形圖所得聚類分析的樹狀圖如下:圖. 空氣污染程度組內(nèi)銜接聚類分析的樹狀圖由上面的樹狀圖,他們
39、按各地域空氣污染程度不同對各省份進展劃分,所得結(jié)果如下表所示:表. 運用組內(nèi)銜接聚類法按各地域空氣污染程度不同進展劃分的結(jié)果類別對應(yīng)編號對應(yīng)地域空氣質(zhì)量排名第一類、云南、甘肅、上海、重慶、四川第二類、北京、天津、青海、寧夏、海南第三類、吉林、黑龍江、新疆第四類、江蘇、廣東、浙江、安徽、江西、湖北、陜西第五類河南第六類、湖南、廣西第七類、河北、山西、內(nèi)蒙古、遼寧、山東.按各地域的廢氣處置情況進展區(qū)域劃分的中位數(shù)聚類分析運用SPSS軟件并采用中位數(shù)聚類分析法,對各污染區(qū)域按廢氣處置情況的不同進展劃分,可得如下聚類分析:聚類表階群集組合系數(shù)初次出現(xiàn)階群集下一階群集 群集 群集 群集 .-.-.-.-
40、.-.-.-.-.表. 中位數(shù)聚類分析法聚類表群集成員案例 群集 群集 群集 群集 群集 群集 群集:全 國:北 京:天 津:河 北:山 西:內(nèi)蒙古:遼 寧:吉 林:黑龍江:上 海:江 蘇:浙 江:安 徽:福 建:江 西:山 東:河 南:湖 北:湖 南:廣 東:廣 西:海 南:重 慶:四 川:貴 州:云 南:陜 西:甘 肅:青 海:寧 夏:新 疆表. 中位數(shù)聚類分析群集成員所得條形圖如下:圖. 運用中位數(shù)聚類分析法得到的各地域廢氣處置條形圖所得樹狀圖如下:圖. 運用中位數(shù)聚類分析法得到的各地域廢氣處置樹狀圖由上面的樹狀圖,他們按各地域廢氣處置情況不同對各省份進展劃分,所得結(jié)果如下表所示:表.
41、運用中位數(shù)聚類分析法按各地域廢氣處置情況不同進展劃分的結(jié)果類別對應(yīng)編號對應(yīng)地域空氣質(zhì)量排名第一類、北京、福建、全國、廣東、天津、上海、四川、新疆第二類、遼寧、青海、吉林第三類、河北、黑龍江、河南第四類、云南、陜西第五類、浙江、廣西、湖北、湖南、江西第六類、海南、重慶、甘肅第七類、山西、寧夏、江蘇、內(nèi)蒙古、山東、安徽、貴州.按年度對我國的空氣污染情況進展劃分運用SPSS軟件并采用質(zhì)心分類法,對各污染區(qū)域按年度的不同進展劃分,可得如下聚類分析:群集成員案例 群集 群集 群集 群集 群集 群集 群集:全 國:北 京:天 津:河 北:山 西:內(nèi)蒙古:遼 寧:吉 林:黑龍江:上 海:江 蘇:浙 江:安
42、徽:福 建:江 西:山 東:河 南:湖 北:湖 南:廣 東:廣 西:海 南:重 慶:四 川:貴 州:云 南:西 藏:陜 西:甘 肅:青 海:寧 夏:新 疆表. 質(zhì)心分類法群集成員所得柱形圖如下:圖 . 質(zhì)心分類法的柱形圖所得柱形圖如下:圖. 質(zhì)心分類法的柱形圖由上面的樹狀圖,他們對各污染區(qū)域按年度的不同對各省份進展劃分,所得結(jié)果如下表所示:表. 運用質(zhì)心分類法按年度的不同進展劃分的結(jié)果類別對應(yīng)編號對應(yīng)地域空氣質(zhì)量排名第一類、全國、西藏、廣東、江蘇、山東、四川、河北、重慶、湖南、海南、山西、上海、天津、貴州、云南、陜西、安徽、浙江、廣西、湖北、甘肅第二類、遼寧、吉林第三類、黑龍江、河南、寧夏第四
43、類、福建、江西、內(nèi)蒙古第五類新疆第六類北京第七類青海四 聚類結(jié)果分析由以上聚類結(jié)果可知,用所選的三種數(shù)據(jù)進展聚類,產(chǎn)生的七個類是在整體上是一致的。這就闡明,空氣污染程度與廢氣處置的力度是成正相關(guān)的,這也就闡明,空氣污染程度越嚴(yán)重的地域,廢氣處置的力度就大,這是非常合理的。另外,二氧化硫是廢氣中的主要氣體之一,二氧化硫排放量與廢氣的排放量有著親密的關(guān)聯(lián),可以說二氧化硫的排放量一定程度上能反映出空氣質(zhì)量的好壞。由所分的七類可以看出,空氣質(zhì)量較好的的地域有北京、天津、海南、西藏、青海。北京是我國首都,對空氣質(zhì)量的要求很高,相關(guān)部門也加大了治理力度,經(jīng)過對空氣質(zhì)量的高度關(guān)注和嚴(yán)厲把關(guān),北京市的空氣質(zhì)量
44、相對較高。天津、海南、青海、西藏在空氣質(zhì)量上也嚴(yán)厲把關(guān)。另外,西藏等地由于地理位置等要素的影響,工業(yè)化程度低,這也是其空氣質(zhì)量較好的一個重要緣由。對于這類地域,他們應(yīng)繼將任務(wù)重心放在“防上,使空氣質(zhì)量一直堅持良好。當(dāng)然,“治也不能忽視,只需防治結(jié)合,才干有更好的呼吸環(huán)境??諝赓|(zhì)量最差的地域是山東。山東的土質(zhì)土壤和特殊的地理位置使得該地域容易呵斥揚塵。另外,汽車尾氣也是影響山東空氣質(zhì)量的重要緣由。山東的空氣質(zhì)量有待改善。對于這類地域,相關(guān)任務(wù)人員應(yīng)該注重空氣污染的防治任務(wù),加大力度對廢氣進展處置,改善空氣質(zhì)量,同時加強宣傳,號召群眾共同參與到空氣污染的防治任務(wù)中。五經(jīng)過運用不同聚類方法對聚類結(jié)果
45、進展對比為了更好的證明以上運用系統(tǒng)聚類法得到的聚類結(jié)果的合理性,他們又采用了一種劃分的聚類方法k-means方法,對所選的數(shù)據(jù)進展聚類,并與以上所得的聚類結(jié)果進展對比。在這里,他們僅思索按各地域空氣污染程度不同進展聚類,按廢氣處置情況聚類以及按年度聚類可類似思索。他們運用SPSS軟件對各污染區(qū)域按空氣污染程度不同進展k-means法聚類,聚類界面圖如下所示:圖. 運用 k-means法按各地域空氣污染程度不同進展聚類利用k-means法按各地域空氣污染程度不同進展聚類,所得結(jié)果如下表所示:表. 運用k-means法按各地域空氣污染程度不同進展聚類的結(jié)果由上表中的聚類結(jié)果,他們按各地域空氣污染程
46、度不同將各省份分類如下:表. 運用k-means法按各地域空氣污染程度不同進展劃分的結(jié)果類別對應(yīng)編號對應(yīng)地域空氣質(zhì)量排名第一類、北京、天津、上海、海南、西藏、寧夏第二類、遼寧、江蘇、廣東、四川、陜西第三類貴州第四類、河北、山西第五類、內(nèi)蒙古、山東、河南第六類、湖南、廣西第七類、吉林、黑龍江、浙江、安徽、福建、湖北、重慶、云南、甘肅、新疆經(jīng)過對比表.和表.,他們可以發(fā)現(xiàn)用系統(tǒng)聚類法中的內(nèi)銜接聚類方法和劃分聚類法中的k-means方法對附錄A中表的數(shù)據(jù)的聚類結(jié)果是相近的,這可以闡明他們運用內(nèi)銜接聚類方法對我國的空氣污染區(qū)域按污染程度的不同進展劃分的結(jié)果是合理的。同樣,他們用SPSS軟件對附錄A中表
47、、表的數(shù)據(jù)用k-means方法進展聚類,所得的結(jié)果仍與運用系統(tǒng)聚類法的結(jié)果類似。在這里他們不列出這兩種數(shù)據(jù)用k-means方法聚類的結(jié)果。由以上可以看出,用系統(tǒng)聚類法對我國的空氣污染區(qū)域進展按污染程度不同聚類、按廢氣處置情況聚類、按年度聚類的結(jié)果都是合理的。六防治空氣污染的可行性建議根據(jù)以上的分類結(jié)果,相關(guān)部門應(yīng)該按照污染地域的分類有針對性的制定相關(guān)戰(zhàn)略,因地制宜,對污染程度相近的地域采用合理的方式進展治理。根本的防治空氣污染的戰(zhàn)略應(yīng)該是監(jiān)測干涉評價。第一步,經(jīng)過對空氣污染和人群安康的監(jiān)測,掌握情況;第二步,針對問題制定對策,進展干涉治理;第三步對干涉的效果進展評價,再針對發(fā)現(xiàn)的問題采取相應(yīng)的
48、措施。如此循環(huán)往復(fù),將空氣質(zhì)量治理得越來越好,人群安康情況也越來越好。 加大力度治理二氧化硫及酸雨污染。相關(guān)部門應(yīng)做到限制高硫煤的開采和運用;重點治理火電廠污染,削減二氧化硫的排放總量;防治化工,冶金,建材等行業(yè)消費過程中產(chǎn)生的二氧化硫污染;大力研討開發(fā)二氧化硫污染防治技術(shù)和設(shè)備;做好二氧化硫排污收費任務(wù),運用經(jīng)濟手段促進治理。 治理汽車尾氣污染。在開展汽車工業(yè)的同時,應(yīng)該改良汽車工藝,研討開發(fā)環(huán)保型的汽車,以及汽油的代用品。針對機動車的排氣污染,加強機動車出廠管理,提高機動車性能;加強機動車落戶管理;加強機動車運轉(zhuǎn)及維護管理;改善道路設(shè)備;改動燃料構(gòu)造,大力推行無鉛汽油;向興隆國家學(xué)習(xí),大力
49、研討、開發(fā)機動車尾氣凈化技術(shù),安裝先進高效的尾氣凈化安裝。在交通管理方面,他們應(yīng)進一步加強研討,開展公共交通事業(yè),疏通道路,減少汽車怠速,慢速行駛的時間。建立完善的法律管理機制,督促企業(yè)改革,加強環(huán)境法制建立,依法治理空氣污染。由于當(dāng)前法律本身的缺陷,相關(guān)部門在落實空氣污染防治任務(wù)時會有很多不便。很多企業(yè)、工廠不注重維護大氣環(huán)境,法律、品德認(rèn)識淡薄,為人類的生存環(huán)境帶來艱苦危害。這就需求完善的法律管理機制,加大對空氣污染行為的處分力度,讓各企業(yè)、工廠在法律的制約下減少本身的廢氣排放量,探尋更為環(huán)保的消費運營方式。改善能源構(gòu)造,促進空氣污染的防治任務(wù)。我國空氣污染的一個重要特征是煤煙型污染,燃煤
50、排放出大量的煙塵、二氧化硫和氮氧化物,這些都是重要的空氣污染源。所以,改善城市能源構(gòu)造,減少燃煤,多用天然氣、液化石油氣,多用電等清潔能源,成為控制空氣污染的重要措施。四、本文的創(chuàng)新之處首先,本文在聚類方法的運用過程中,對所選擇的數(shù)據(jù)并不是直接運用現(xiàn)成的軟件進展聚類,而是先經(jīng)過用Matlab軟件編程,制造聚類界面,然后再對所選數(shù)據(jù)進展層次聚類。在編程制造界面的過程中,不僅需求掌握編程的一些方法,還要對聚類的原理有深化的了解,除此之外還要對界面的規(guī)劃有合理的安排。為了證明系統(tǒng)聚類結(jié)果的合理性,他們又運用SPSS軟件,采用k-means方法對所選數(shù)據(jù)進展聚類,并將兩種聚類方法的聚類結(jié)果加以比較。其次,本篇論文是將聚類方法運用于我國空氣污染區(qū)域的劃分之中,這無疑給他們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 隔音板施工方案
- 專利引進合同范例格式
- 公司承包印刷合同范例
- 制度牌制作合同范例
- 論黨的青年工作總結(jié)
- 出租車行合同范例
- 農(nóng)業(yè)機械合同范例
- 債權(quán)轉(zhuǎn)讓結(jié)算合同范例
- 農(nóng)田合租合同范例
- 供貨磚合同范例
- 2024年中國作家協(xié)會所屬單位招聘筆試真題
- 2025年貴州通服安順分公司招聘筆試參考題庫含答案解析
- 2025年廣州市黃埔區(qū)東區(qū)街招考社區(qū)居委會專職工作人員高頻重點提升(共500題)附帶答案詳解
- 法治信訪培訓(xùn)課件
- 鉛鋅選礦廠安全教育培訓(xùn)
- 某寺廟施工組織設(shè)計方案
- 伊斯蘭法 外國法制史 教學(xué)課課件
- 汽車維修保養(yǎng)服務(wù)項目投標(biāo)文件
- 《國家文化安全》課件
- 特種設(shè)備日管控、周排查、月調(diào)度模板
- 保密知識培訓(xùn)課件
評論
0/150
提交評論