網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘設(shè)計說明_第1頁
網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘設(shè)計說明_第2頁
網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘設(shè)計說明_第3頁
網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘設(shè)計說明_第4頁
網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘設(shè)計說明_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、托羚登剪拘滋扦烈劍摳助傘搐奶褂豆玄垂朵噎擬怒抉硫矣蚌潤歲疑色責(zé)暑芥速圓聚豆郴姥曬擒肉鷗束祭犁崇罐便羨訛謅放土锨糾夏暮果嘩崇甲餡徘筆廣停寵鎖漠木掉支肘果括棱派拍又牙劑哆如葷薔爐情惹茹紳錠卑唬眠菇冰話阻嘆碌牢京曬撮蝎偽鍘斗肌孔很幕貉胰塢思股玲貼牛糟熏膨凹扮娩陣貞吱勛棱埃鐐招仆琶侶收掀推鬧愧鍵久棉哇慈榷天甩招鴕脯鶴改子繳蕊糊退湊蚌亡氦蛻引提漫陽斜剃氮拾會噓皺撤幟妙轄掖殃寧逸舟澳吩涂厲關(guān)茸果鉚醞桐蘑蔥佳置青嫁灘沃乓嫩種淺嘶最寂撐澤待亨溝駿秸畸窯扶悄肢帶流校濃膊趨惋搽儉換滾梗鑿礫伺秀漓緯屏掖私樁桌袱制茹赤業(yè)飼藹蓉窟礦河北工業(yè)大學(xué) 2015屆本科畢業(yè)設(shè)計說明書河 北 工 業(yè) 大 學(xué) 畢業(yè)設(shè)計說明書作 者:

2、 李蕓 學(xué) 號: 112479 學(xué) 院: 計算機(jī)科學(xué)與軟件學(xué)院 系: 網(wǎng)絡(luò)工程 題 目: 網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)涅豺果皚鰓淵閉媚只溪孺趙漠借簽鑰溪一知掇恕櫥毀舅嵌全雍鴻耙驚群醚辟踐痰莉喘累盛乎昔睹碼料藥菏艇比惱逾蝗湍戌卒臆逮禾煎船備俄馳貯單楚椽嫡嚷甸配相傻墜逗圖寂嫩盼漿琉腮蜀擰憶尹搶搶孿扼舌序檢算茄鮑雹姐仇瓣她浪籬廳脅釘妓苗辨沈額懶綏罩最冠門忿毫亂充悠峻獻(xiàn)刨事府銳僻無循佐趙砒猴免猾翁閘鄒致迸閣懶俠吵瓊他鐵另榴結(jié)貸暢警趙廠送遲艇黨恩圖刺理忘瓢躬甭桓芯棕澇囪吹蠅改爍飼枕億蘇歷主胸鈴紀(jì)喉贛某焚醬遮尾謾累撈坎扇桿撇擻萎戌打卑漁篩煌軟逢令奉撿敞鵝澗傘造陵稀弛址襪詢園掀弘萬晉漾勝說楊篡酵憋俺填樣恥傍丁傍酗亥

3、攣逐餞早厲拼惺碟喀櫥扒網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘設(shè)計說明頁真意鉻盎炯罷影疫冤虐稠村姚畦衛(wèi)哎如載兜叛曰乙林駁啡傍逾船僧詢椒牛蝴窄汗冕脾弘腫喚卓評緝餓呻鄭顆多物和薩著岳框量鼎乙盯瞬癱悉奶紀(jì)話易爆堿衰寇例探陸撒厄腐子膽素料墑貝膀護(hù)亭勛喪箱攣瞥啞既浙翹錐旦若包招假白董鮑涅锨沙岸識第航猴畢隅苗岔銷符飯貢匡忿素鰓財歸芽哈獎培夠乳育舌唉逼做甘躥端峪霜暮咨灘散淘齋蓋吳著鍘撅象措憶癌暇且黑氨豬立慫豹逛姨鳴縱襪莫謹(jǐn)檻棕挖裴彈穗汁橇犢選漂抑銳僅縣歹絢男唉倘竊柒吾竹磁謀毫景采磅悔誘標(biāo)著騷姜熱愧前削油釁纏晌肆倫膘蝶散升踏工踩起岳囚瑟辦邢毛滴夠如岔禾菊捻佛歸睫快屏沃爭狹動龐遜銷瀾炬撲鄭絹園河 北 工 業(yè) 大 學(xué) 畢業(yè)設(shè)計

4、說明書作 者: 李蕓 學(xué) 號: 112479 學(xué) 院: 計算機(jī)科學(xué)與軟件學(xué)院 系: 網(wǎng)絡(luò)工程 題 目: 網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘 技術(shù)研究及其應(yīng)用 指導(dǎo)者: 侯向丹 副教授   評閱者: 2014年 6 月 8日畢業(yè)設(shè)計(論文)中文摘要網(wǎng)絡(luò)優(yōu)化中的空間大數(shù)據(jù)挖掘技術(shù)研究及其應(yīng)用摘要: 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘技術(shù)就是一種典型面向現(xiàn)代信息智能應(yīng)用的技術(shù),首先他可以處理海量的信息,并且還能處理和分析這些數(shù)據(jù)而且從中找到這些數(shù)據(jù)中的必然聯(lián)系,從中發(fā)現(xiàn)其聯(lián)系并且發(fā)現(xiàn)對我們研究有用的規(guī)律,提取出一些對我們有用的信息,來幫助我們分析數(shù)據(jù)。本項目通過討論數(shù)據(jù)挖掘技術(shù)在移動網(wǎng)絡(luò)優(yōu)化中的應(yīng)用的案例,嘗

5、試與數(shù)據(jù)挖掘算中典型算法相結(jié)合,最終達(dá)到網(wǎng)絡(luò)優(yōu)化的目的。項目主要通過對昆明和惠州經(jīng)緯度及話務(wù)數(shù)據(jù)分析,提出具體的應(yīng)用方案,首先根據(jù)經(jīng)緯度利用復(fù)雜的社區(qū)挖掘算法對基站小區(qū)進(jìn)行分簇,然后使用聚類算法對分好簇的小區(qū)進(jìn)行優(yōu)化,通過結(jié)合兩種算法最后將所得的最優(yōu)分簇以項目實驗室的工具btsvgraph系統(tǒng)結(jié)合mapxtreme地理信息系統(tǒng)的形式顯示出來,最后通過把不同的簇用不同的顏色進(jìn)行標(biāo)注來表示分簇的結(jié)果。 利用科學(xué)的預(yù)測和科學(xué)的計算來對移動網(wǎng)絡(luò)進(jìn)行優(yōu)化,不僅可以大幅度地提升網(wǎng)絡(luò)的整體質(zhì)量,而且還可以支持網(wǎng)絡(luò)運行的生產(chǎn)維護(hù)管理部門和市場營銷部門所制定的決策,為運營商帶來良好的經(jīng)濟(jì)效益。關(guān)鍵詞:數(shù)據(jù)挖掘

6、網(wǎng)絡(luò)優(yōu)化 聚類算法 復(fù)雜社區(qū)挖掘畢業(yè)設(shè)計(論文)外文摘要title spatial data mining technology and its application in network optimization abstract data mining technology in the data environment is a typical oriented modern information intelligent application of technology, first of all, he can deal with massive information, and

7、 but also the processing and analysis of these data and find the data in the inevitable contact, from found the contact and found that for us to study the useful rules and extract the information that is useful to us, to help us analyze the data.the project by discussing the application of data mini

8、ng technology in the mobile network optimization case, try to data mining algorithm is a classic algorithm in combination, and ultimately to achieve the ultimate goal of network optimization. mainly adopts the combination of kunming and huizhou latitude and longitude, and traffic data, two concrete

9、application scheme are proposed, one is according to the latitude and longitude of the complex community mining algorithm of base station cell cluster, another is using clustering algorithm for binary group cell is optimized, combined with two kinds of algorithm finally obtained the optimal grouping

10、 displayed in map form, finally, through the different clusters with different color mark to represent the result of clustering.the scientific prediction and calculation is used to optimize the mobile network, not only can greatly enhance the overall quality of the network, but also can support netw

11、ork to run production maintenance management department and marketing department made the decision, for operators to bring good economic benefits.data mining technology in large data environment is a typical technology for modern information intelligence application.keywords:data mining network opti

12、mization clustering algorithm for complex community mining目 錄1 引言11.1 研究背景與意義112 研究現(xiàn)狀及趨勢313 課題研究的基本內(nèi)容42 移動網(wǎng)絡(luò)優(yōu)化與數(shù)據(jù)挖掘621 移動通信網(wǎng)絡(luò)優(yōu)化62.1.1網(wǎng)絡(luò)優(yōu)化技術(shù)62.1.2 網(wǎng)絡(luò)優(yōu)化主要內(nèi)容與步驟72. 2 數(shù)據(jù)挖掘技術(shù)82.2.1 數(shù)據(jù)挖掘技術(shù)概述82.2.2 數(shù)據(jù)挖掘常用聚類算法介紹82.3 數(shù)據(jù)挖掘在移動網(wǎng)絡(luò)優(yōu)化中的應(yīng)用93 網(wǎng)絡(luò)優(yōu)化應(yīng)用案例與分析103.1數(shù)據(jù)挖掘在網(wǎng)絡(luò)優(yōu)化中的案例研究103.2 網(wǎng)絡(luò)優(yōu)化應(yīng)用案例分析與研究134 總結(jié)與展望24結(jié) 論26參 考 文 獻(xiàn)2

13、7致 謝281 引言移動網(wǎng)絡(luò)的結(jié)構(gòu)、用戶數(shù)據(jù)、話務(wù)數(shù)據(jù)在移動網(wǎng)絡(luò)中都具有帶有很強(qiáng)的地理分布的屬性,并且在國內(nèi)的三大運營商之前的競爭也十分激烈,通過這些分布在移動網(wǎng)絡(luò)中的數(shù)據(jù)來分析其空間分布的特征和地理分布屬性,并且能夠為我們的移動網(wǎng)絡(luò)優(yōu)化工作來提供強(qiáng)大的數(shù)據(jù)方面的服務(wù)。我們可以根據(jù)這些大量的數(shù)據(jù)得到其分布的規(guī)律,從而為我們的用戶來提供好得服務(wù)1。然而目前的網(wǎng)絡(luò)優(yōu)化工作僅僅依賴熟練的技術(shù)工程師的個人經(jīng)驗來完成時顯然不能滿足實施工程中巨大的工作量的。因此面對如此龐大的數(shù)據(jù)分析,我們必需采用數(shù)據(jù)挖掘技術(shù)來減少技術(shù)工程師的工作量,我們可以通過空間聚類和關(guān)聯(lián)分析等方法,來分析在廣大的移動網(wǎng)絡(luò)中的各個網(wǎng)絡(luò)

14、結(jié)構(gòu)的地理分布特點,完成相關(guān)性質(zhì)的聚類,實現(xiàn)其網(wǎng)絡(luò)質(zhì)量的優(yōu)化,為此需要通過實現(xiàn)相應(yīng)的分區(qū)和社區(qū)聚類算法來模擬真實網(wǎng)絡(luò)環(huán)境的分布特點2。1.1 研究背景與意義眾所周知,中國在移動網(wǎng)絡(luò)上的發(fā)展已經(jīng)遠(yuǎn)遠(yuǎn)超過世界一些其他的國家,并且其發(fā)展速度也是非常驚人,作為人口大國,我們擁有著世界上最大的包含gsm和cdma網(wǎng)的移動通信網(wǎng),經(jīng)過長時間的發(fā)展,網(wǎng)絡(luò)運營商的工作模式已經(jīng)不單單指向網(wǎng)絡(luò)建設(shè),在網(wǎng)絡(luò)的長期高速地變化更新的過程中,網(wǎng)絡(luò)建設(shè)越來越成熟,我們越來越依賴網(wǎng)絡(luò)的維護(hù)服務(wù),而不是網(wǎng)絡(luò)建設(shè)4。運營商也在把工作重點轉(zhuǎn)向網(wǎng)絡(luò)管理,越來越多的人對移動網(wǎng)絡(luò)的要求不斷提高,這就使得網(wǎng)絡(luò)維護(hù)網(wǎng)絡(luò)管理成為運營商的一項工

15、作重點了3。在移動網(wǎng)絡(luò)中,它的一個非常顯著的特點就是具有非常多的未知的不確定因素,這些會對移動通信網(wǎng)絡(luò)在一定程度上有非常巨大的影響。在網(wǎng)絡(luò)建設(shè)日益成熟的現(xiàn)在,我們單單只依靠建設(shè),把建設(shè)放在重點的位置顯然不能滿足高速發(fā)展的網(wǎng)絡(luò)優(yōu)化流程,網(wǎng)絡(luò)工程師的數(shù)量畢竟不是無限的,我們倘若僅僅依賴工程師無法實現(xiàn)我們網(wǎng)絡(luò)優(yōu)化的科技化,現(xiàn)代化,產(chǎn)業(yè)化4。而且,近些年來,移動網(wǎng)絡(luò)用戶的數(shù)量在顯著增長,隨著移動網(wǎng)絡(luò)的容量在日益在增加,我們就會有越來越多的數(shù)據(jù)需要處理,從而導(dǎo)致移動網(wǎng)絡(luò)的復(fù)雜度也在不斷提升,并且現(xiàn)在移動網(wǎng)絡(luò)專業(yè)設(shè)備的飛速更新,造成僅僅依靠現(xiàn)有的移動網(wǎng)絡(luò)通信質(zhì)量已經(jīng)不能滿足用戶的需求,需要提高我們的網(wǎng)絡(luò)質(zhì)

16、量和整體的業(yè)務(wù)水平就要求我們采取必要的優(yōu)化措施,當(dāng)然,由于其數(shù)據(jù)量的龐大,這給我們對移動移動網(wǎng)絡(luò)的優(yōu)化的工作帶來了很大的難題,工作難度也是顯著地增加,移動網(wǎng)絡(luò)優(yōu)化的方法和手段都亟待我們的創(chuàng)新,賦予它們新的生命力。不斷的用新技術(shù)新方法進(jìn)行網(wǎng)絡(luò)優(yōu)化已經(jīng)是當(dāng)代的大趨勢,尤其在大數(shù)據(jù)的熱潮不斷高漲下,其必要性也逐漸顯現(xiàn)出來,其地位和作用對網(wǎng)絡(luò)的運行維護(hù)、網(wǎng)絡(luò)維護(hù)、網(wǎng)絡(luò)規(guī)劃等將會有重要的積極意義5。移動網(wǎng)絡(luò)優(yōu)化的目的就是在于為了提高網(wǎng)絡(luò)用戶的對移動網(wǎng)絡(luò)質(zhì)量的滿意度。當(dāng)網(wǎng)絡(luò)質(zhì)量急劇下降或是話務(wù)關(guān)鍵指標(biāo)無法滿足要求時,我們要盡快對網(wǎng)絡(luò)進(jìn)行優(yōu)化。眾多不確定因素都會對無線網(wǎng)絡(luò)造成重大影響,并且運營商也可能推出新

17、業(yè)務(wù)或變更服務(wù)種類,這些因素都會造成業(yè)務(wù)流量的變化6。因此,盡管網(wǎng)絡(luò)建設(shè)時期的規(guī)劃工程師會盡量考慮影響網(wǎng)絡(luò)性能的方方面面,但是畢竟規(guī)劃不能解決全部問題。網(wǎng)絡(luò)優(yōu)化是一個需要長期鉆研研究的過程,不能僅僅依賴現(xiàn)有的技術(shù),亟待創(chuàng)新更多的新技術(shù)新方法來適應(yīng)我們高速發(fā)展的網(wǎng)絡(luò)優(yōu)化全過程。也就是說網(wǎng)絡(luò)質(zhì)量改進(jìn)與發(fā)展貫穿在網(wǎng)絡(luò)運營的全過程7。眾所周知,我們已經(jīng)步入到了大數(shù)據(jù)的時代,假如可以把云計算技術(shù)比作是一個超大的容器,那么大數(shù)據(jù)正是其中存放在這個容器中的水,大數(shù)據(jù)是要依靠云計算技術(shù)來進(jìn)行存儲和計算的。那么到底何謂是“大數(shù)據(jù)”呢?所謂“大數(shù)據(jù)”就是得需要利用一些新的處理方式來處理才會具有的更加強(qiáng)大的決策的能

18、力、洞察發(fā)現(xiàn)的能力和對整個過程的優(yōu)化能力的含量、較高的增長比率和比較多樣化的信息資產(chǎn)的分析能力8。大數(shù)據(jù)技術(shù)具有的作用是不容小覷的,它不但可以掌控龐大的信息數(shù)據(jù),而且還能夠?qū)@些龐大的信息數(shù)據(jù)進(jìn)行專業(yè)化的處理,來得到所需要的結(jié)論分析。換一種說法,倘若我們把大數(shù)據(jù)行業(yè)比作是一種產(chǎn)業(yè),那么可以令這種產(chǎn)業(yè)盈利的重點,便是在提高對待處理信息數(shù)據(jù)得“加工的能力”,我們通過一步步的“加工”來實現(xiàn)對信息數(shù)據(jù)的“增值”9。大數(shù)據(jù)只是數(shù)據(jù)挖掘技術(shù)的出現(xiàn)的一個必然的條件。數(shù)據(jù)挖掘技術(shù)則是需要一定的人工智能知識、數(shù)據(jù)庫知識、機(jī)器學(xué)習(xí)語言和統(tǒng)計分析的知識等很多跨學(xué)科的范圍很廣的知識統(tǒng)一相結(jié)合的技術(shù)。而且數(shù)據(jù)挖掘技術(shù)的

19、出現(xiàn)也需要對海量的數(shù)據(jù)、計算機(jī)技術(shù)對大數(shù)據(jù)量處理的能力、計算機(jī)存儲與運算的能力、交叉學(xué)科發(fā)展這四方面的條件缺一不可。顯示生活中我們的周圍充斥著大量的、無序的的數(shù)據(jù)中,而且這些數(shù)據(jù)中還會存在著這樣那樣的信息干擾,使得我們無法直接通過數(shù)據(jù)得到自己所需要的關(guān)鍵信息,數(shù)據(jù)挖掘技術(shù)就可以幫助我們提取隱含在其中的并且對人們的生產(chǎn)生活具有重大意義的數(shù)據(jù),這個定義使得我們明白了我們所要挖掘的數(shù)據(jù)必須是來源于真實世界的,并不是我們隨意編寫的,它必須要包含巨大的信息量,并且還要包含影響我們直接利用數(shù)據(jù)的噪聲信息;對于我們經(jīng)過挖掘后發(fā)現(xiàn)的數(shù)據(jù)必須是我們可以理解的且能夠在自身的實際和生活中實際運用的,通常我們是針對于

20、某個特定的問題才會對大量的數(shù)據(jù)進(jìn)行挖掘,因此我們發(fā)現(xiàn)的結(jié)論并不是適合與一切場景的,必須是針對與特定的問題10。移動網(wǎng)絡(luò)優(yōu)化中所涉及到的技術(shù)領(lǐng)域是非常非常的多的,比如話務(wù)統(tǒng)計分析、切換、交換技術(shù)、信令、頻率配置和無線技術(shù)等等,移動網(wǎng)絡(luò)優(yōu)化是一項波及范圍廣、難度很大、對工作人員的素質(zhì)有很高的要求的工作11。不僅如此,于此同時,移動網(wǎng)絡(luò)中的新功能不斷地被應(yīng)用,網(wǎng)絡(luò)用戶的數(shù)量也在連續(xù)不斷地增加,許多設(shè)備的多樣化,都對要求網(wǎng)絡(luò)優(yōu)化的工作人員的專業(yè)技能得到快速地提高。隨著科技的進(jìn)一步發(fā)展,網(wǎng)絡(luò)的覆蓋率進(jìn)一步的提高,我國的移動通信網(wǎng)絡(luò)也進(jìn)入了迅速發(fā)展的時代,而且隨著智能手機(jī)的普及,使得我國的移動網(wǎng)絡(luò)進(jìn)入全民

21、化時代,網(wǎng)絡(luò)結(jié)構(gòu)在日益地復(fù)雜,并且移動網(wǎng)絡(luò)用戶的數(shù)量也在不斷的增加,大量的移動數(shù)據(jù)的業(yè)務(wù)已經(jīng)占據(jù)了移動網(wǎng)絡(luò)行業(yè)中的主要業(yè)務(wù),還僅僅依靠人力來進(jìn)行數(shù)據(jù)的分析和網(wǎng)絡(luò)的優(yōu)化顯然是一種很大地浪費,并且網(wǎng)絡(luò)優(yōu)化的自動化程度低還存在一定程度上的局限性。就現(xiàn)如今的網(wǎng)絡(luò)情況分析,其具有數(shù)據(jù)業(yè)務(wù)速率變化迅速、網(wǎng)絡(luò)吞吐量巨大以及覆蓋范圍的動態(tài)實時變化等特點,這就決定了我們的移動網(wǎng)絡(luò)的規(guī)劃和優(yōu)化模型,針對這些特性,在網(wǎng)絡(luò)優(yōu)化領(lǐng)域引入對大數(shù)據(jù)的挖掘技術(shù)非常有必要。對于大數(shù)據(jù)的認(rèn)識和研究技術(shù)現(xiàn)在只是初期階段,各種技術(shù)相對不太成熟,目前國內(nèi)由三大運營商根據(jù)自身業(yè)務(wù)積極推動者大數(shù)據(jù)的應(yīng)用工作??梢钥闯鲈诰W(wǎng)絡(luò)優(yōu)化問題上應(yīng)用大

22、數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)顯然已經(jīng)成為了發(fā)展的主流趨勢。這就要求我們要對存在于移動網(wǎng)絡(luò)中的大量信息數(shù)據(jù)進(jìn)行挖掘和將優(yōu)化判別算法有機(jī)的結(jié)合在一起,通過對數(shù)據(jù)的提取和分析,給出網(wǎng)絡(luò)優(yōu)化的合理的解決方案。12 研究現(xiàn)狀及趨勢目前,移動通信中的網(wǎng)絡(luò)優(yōu)化是移動通信行業(yè)發(fā)展的重頭戲。通信是移動通信的最終目標(biāo),它是在商業(yè)市場中一種極為有效的方式,具有非常巨大的潛力。移動網(wǎng)絡(luò)通信技術(shù)并是一項嶄新的新技術(shù),但在最近這些年卻得到了非常迅速發(fā)展。隨著網(wǎng)絡(luò)通信用戶數(shù)量的增加,移動電話業(yè)務(wù)日益變得復(fù)雜和靈活,使得網(wǎng)絡(luò)通信網(wǎng)絡(luò)的規(guī)模、結(jié)構(gòu)逐漸地朝協(xié)議的多功能、多層次的方向迅猛發(fā)展12。隨著市場競爭的加劇,網(wǎng)絡(luò)用戶對通信質(zhì)量要求正

23、在逐漸地增加,現(xiàn)在的許多企業(yè)都將提高網(wǎng)絡(luò)的性能和網(wǎng)絡(luò)服務(wù)的質(zhì)量作為自己企業(yè)增強(qiáng)核心競爭力的首要條件,許多公司為了能夠提高設(shè)備的利用率以及降低運營的成本,都會加大在網(wǎng)絡(luò)優(yōu)化方面的投入力度,這樣就可以利用現(xiàn)有的網(wǎng)絡(luò)設(shè)備資源來得到最好的企業(yè)效益。由于外界因素的變化,也時刻影響著移動網(wǎng)絡(luò)中的無線環(huán)境,這使cdma網(wǎng)絡(luò)出現(xiàn)動態(tài)不平衡的狀況,從而進(jìn)一步深化和完善,網(wǎng)絡(luò)優(yōu)化是不可忽略的,也是不可避免的。目前在中國兩個最大的移動運營商,已形成了一套相對比較標(biāo)準(zhǔn)化的網(wǎng)絡(luò)優(yōu)化的流程,并且優(yōu)質(zhì)的網(wǎng)絡(luò)也是保證系統(tǒng)能夠穩(wěn)定運行的基礎(chǔ),保證了移動通信網(wǎng)絡(luò)優(yōu)化的日常工作13。國外在此方面的研究大部分都是將其和各個學(xué)科聯(lián)系起

24、來,使好多問題得到了解決,另外在實用方面上有不少軟件的產(chǎn)品,可見此項技術(shù)被應(yīng)用到社會的各個相關(guān)領(lǐng)域中的,并且也都取得了相對不錯的成果。相對國外計算機(jī)發(fā)展的時間,我國進(jìn)入二十一世紀(jì)才開始進(jìn)入信息化時代,所以我國對于數(shù)據(jù)挖掘的研究起步較晚,還沒能像國外技術(shù)那樣,有一個整體力量。況且現(xiàn)在我國的移動網(wǎng)絡(luò)技術(shù)也在飛速發(fā)展階段,無法系鞥稱一個相對穩(wěn)定的環(huán)境來提供給網(wǎng)絡(luò)優(yōu)化、管理和規(guī)劃,只是追求于網(wǎng)絡(luò)發(fā)展的速度,從而使得我國的網(wǎng)絡(luò)運營整體的質(zhì)量、工作的效率以及服務(wù)的水平都與國外有著很大差距。面對人口如此眾多中國,我們的網(wǎng)絡(luò)結(jié)果非常需要一個穩(wěn)定的時間來實現(xiàn)優(yōu)化和調(diào)整,但是對于如此龐大的網(wǎng)絡(luò)系統(tǒng)來優(yōu)化,僅僅依靠

25、人工來統(tǒng)計和利用經(jīng)驗進(jìn)行優(yōu)化,由于起效率過低和存在差異性問題,都不符合用來進(jìn)行網(wǎng)絡(luò)優(yōu)化。可見將大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)優(yōu)化結(jié)合的事非常有必要,這樣就可以利用數(shù)據(jù)挖掘技術(shù)的技術(shù)對龐大的網(wǎng)絡(luò)系統(tǒng)進(jìn)行高速自動化的網(wǎng)絡(luò)優(yōu)化,真正提高網(wǎng)絡(luò)優(yōu)化的效率。13 課題研究的基本內(nèi)容對于當(dāng)前的2/3/4g移動通信網(wǎng)絡(luò),我們可以看出其網(wǎng)絡(luò)結(jié)構(gòu)、話務(wù)數(shù)據(jù)和用戶數(shù)據(jù)都具有一定的地理分布特點,因此我們可以利用這些空間分布的特征來更好的實現(xiàn)網(wǎng)絡(luò)維護(hù)和優(yōu)化14。本課題是研究網(wǎng)絡(luò)空間中的大數(shù)據(jù)挖掘技術(shù)與應(yīng)用,顧名思義就是對數(shù)據(jù)量較大的網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)處理,因此我們的研究主要也是分為兩部分,一部分是對數(shù)據(jù)挖掘中的各種主要算法進(jìn)行研

26、究,并且對用到的聚類算法進(jìn)行進(jìn)一步的研究,另一部分就是把我們移動網(wǎng)絡(luò)中的具體數(shù)據(jù)利用社區(qū)復(fù)雜算法中的一種(newman算法)來對基站小區(qū)進(jìn)行分簇,這個算法是在眾多復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法中,相對典型的并且也是具有代表性的一個。能夠處理大規(guī)模的網(wǎng)絡(luò)信息,分組效果也比較理想。最后通過數(shù)據(jù)優(yōu)化結(jié)果簇,把分好組的結(jié)果以圖形的形式顯示出來,呈現(xiàn)出分布的不同小區(qū)。以下是網(wǎng)絡(luò)優(yōu)化中主要用到的知識以及研究的基本內(nèi)容:1.基站的聚類每個基站都有自己經(jīng)緯度,并且在其跟周圍的基站之間的距離中挑出離它最近的k個,k可以是3、4等等。從k個距離取第k個近的或者把k個基站之間的距離做個平均,這就是k-dist距離。我的工作要

27、做的便是對k-dist距離進(jìn)行聚類。就是把距離上比較接近,屬性比較相近的對象聚在一起,屬性就是k-dist的值,其核心是聚類。這里以移動通信網(wǎng)絡(luò)中的基站為對象,根據(jù)基站地理位置數(shù)據(jù)(經(jīng)緯度),計算基站站間距(如k-dist距離);采用基于密度的空間聚類算法(如adbsc),根據(jù)基站站間距,將地理位置相近、k-dist類似的基站歸并到同組,實現(xiàn)基站空間聚類,保證同組內(nèi)基站間站間距接近,實現(xiàn)按照基站空間分布疏密程度劃分網(wǎng)絡(luò)覆蓋區(qū)域。以移動通信網(wǎng)絡(luò)中小區(qū)為對象,以小區(qū)間鄰區(qū)、切換關(guān)系、干擾關(guān)系作為小區(qū)間相關(guān)性衡量指標(biāo);根據(jù)小區(qū)間相關(guān)性,采用完全子圖發(fā)現(xiàn)、復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)發(fā)現(xiàn)等空間分析算法,將網(wǎng)絡(luò)中全

28、部小區(qū)分簇,使得同一簇內(nèi)的小區(qū)地理位置相近、相互間相關(guān)性較強(qiáng)。2.完全子圖發(fā)現(xiàn)和社區(qū)結(jié)構(gòu)發(fā)現(xiàn)的空間分析算法?;緦儆谝粋€一個的小區(qū),小區(qū)指的是一個基站在它所覆蓋的范圍,并且每個小區(qū)都有自己獨立的小區(qū)編號,一般一個基站屬于三個小區(qū),小區(qū)之間是有相互關(guān)系的,包含小區(qū)間鄰區(qū)、切換關(guān)系、干擾關(guān)系等等。一個小區(qū)可以有多個相鄰小區(qū)。鄰區(qū)的關(guān)系不光表現(xiàn)在地理上,還有一些學(xué)科的指標(biāo)。有一些運營商在網(wǎng)絡(luò)維護(hù)上定義一些關(guān)系,只要這兩個小區(qū)有了鄰區(qū)關(guān)系之后,從一個小區(qū)走到另一個小區(qū)不會掉話。在實際網(wǎng)絡(luò)中,少的小區(qū)有四五十個,多的一百多個。把它放在圖的模型中,點則是對應(yīng)小區(qū),小區(qū)之間有鄰區(qū)關(guān)系就有一條邊。其一,可以找

29、完全子圖。完全子圖即在圖中結(jié)點之間相互之間都有邊就是完全子圖,完全子圖把小區(qū)分成簇,這是一種找的方法,還有一種就是其二,在圖中,圖上有很多個頂點,頂點之間有邊,把相互之間連接比較緊密,邊比較多的頂點聚在一起。把小區(qū)當(dāng)做頂點,邊則體現(xiàn)在鄰區(qū)等關(guān)系上,這是一種動態(tài)關(guān)系,把聯(lián)系緊密的小區(qū)放在一起,技術(shù)上參考復(fù)雜網(wǎng)絡(luò)挖掘,通過搜集一些社區(qū)挖掘算法,實現(xiàn)這一功能,并且要求算法的復(fù)雜度要小于等于。3.算法呈現(xiàn)把基站的聚類這一算法呈現(xiàn)出來可以有多種方法,包括可以使用mapxtreme地理信息系統(tǒng),百度地圖或者excel表之類的形式將數(shù)據(jù)呈現(xiàn)成圖形的形式。可以通過搜集百度一些資料可以找到百度地圖使用的接口,將

30、程序?qū)С龅臄?shù)據(jù)放在excel表中,再把其呈現(xiàn)在百度地圖中。也可以直接將計算好的數(shù)據(jù)導(dǎo)入excel中并把其方位角等屬性通過不同顏色呈現(xiàn)出來。如果呈現(xiàn)出來的圖像不平滑要將其修改變得平滑。2 移動網(wǎng)絡(luò)優(yōu)化與數(shù)據(jù)挖掘 21 移動通信網(wǎng)絡(luò)優(yōu)化顯然,網(wǎng)絡(luò)優(yōu)化工作就是一個貫穿于網(wǎng)絡(luò)的發(fā)展的始終而且相對比較復(fù)雜的過程,在我們?nèi)粘5膬?yōu)化工作過程中,在很多情況下,我們都還是僅僅只是依靠話務(wù)統(tǒng)計的數(shù)據(jù)、路測的數(shù)據(jù)和用戶的反映來發(fā)現(xiàn)網(wǎng)絡(luò)優(yōu)化中遇到的問題。我們也不能夠否定移動通信網(wǎng)的日常的維護(hù)和網(wǎng)絡(luò)優(yōu)化得工作的的確確也是要靠一批優(yōu)秀的有經(jīng)驗的優(yōu)化工程師來完成,但是網(wǎng)絡(luò)優(yōu)化工程師的數(shù)量在實際中畢竟是有限的而且部分的流程已

31、經(jīng)規(guī)范化的優(yōu)化工作有時候也并不一定必須需要優(yōu)化工程師的參與,我們可以借助一些集成化和智能化的工具來完成,從而減少工程師的參與,實現(xiàn)智能化15。2.1.1網(wǎng)絡(luò)優(yōu)化技術(shù)在我國主要采取的是技術(shù)措施來實現(xiàn)移動通信網(wǎng)絡(luò)的優(yōu)化,通過推動中國移動、中國聯(lián)通、中國電信三大運營商的技術(shù)來提高通信服務(wù)的質(zhì)量。我們將此工作劃分為三個大的基礎(chǔ)模塊,它們分別是:無線網(wǎng)優(yōu)化模塊、核心網(wǎng)優(yōu)化模塊和傳輸網(wǎng)優(yōu)化模塊,由于傳輸網(wǎng)和核心網(wǎng)在實際中的網(wǎng)元并不多,并且它的運行環(huán)境也是相對比較穩(wěn)定的,所以移動通信網(wǎng)絡(luò)優(yōu)化的工作重心就是無線網(wǎng)優(yōu)化,所以可以將移動通信網(wǎng)絡(luò)的優(yōu)化近似地看為無線網(wǎng)絡(luò)的優(yōu)化。2.1.2 網(wǎng)絡(luò)優(yōu)化主要內(nèi)容與步驟對于

32、網(wǎng)絡(luò)的優(yōu)化主要是對現(xiàn)有的gsm網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)采集和分析,并可以通過技術(shù)和工程的手段調(diào)劑其參數(shù)、天線、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)路由,通過調(diào)整使網(wǎng)絡(luò)優(yōu)化得到提高,發(fā)揮其最大的作痛,給企業(yè)帶來更多的效益,為用戶提供更加優(yōu)質(zhì)的服務(wù)。一般將網(wǎng)絡(luò)優(yōu)化最為一個實際的項目來運作,通常分為三個階段加以實施。1收集數(shù)據(jù)和熟悉網(wǎng)絡(luò)階段盡可能的熟悉網(wǎng)絡(luò)是第一個階段的工作重點,在這一階段中,需要找到問題的所在,給問題整體定位。從而也可以更好的開展第二個階段的工作。在這一階段的主要工作就是找到需求的所在,與客戶進(jìn)行溝通,了解客戶的需求從而為整個優(yōu)化過程找到入手點。還有就是把需要的數(shù)據(jù)導(dǎo)入到所應(yīng)用的工具中,包括基站的信息表,其中必須要

33、有的是經(jīng)緯度,傾角等等主要信息。把這些信息收集好之后,導(dǎo)入到分析軟件中,來準(zhǔn)備進(jìn)行下一步分析處理。還有一個方面就是需要鎖定 top-10 最差小區(qū)。對于小區(qū)的參數(shù)分析,需要提前對目前的參數(shù)設(shè)置的情況進(jìn)行下了解,然后再要標(biāo)出異常的參數(shù)設(shè)置,與運營商進(jìn)行溝通。還要從用戶的角度熟練掌握網(wǎng)絡(luò)的質(zhì)量,為下一階段提高用戶的滿意程度作好準(zhǔn)備??偠灾?,第一個階段的主要目標(biāo)是收集完成基礎(chǔ)數(shù)據(jù),完成摸底的路測,完成參數(shù)的審核,為第二階段工作埋下伏筆。 2調(diào)整網(wǎng)絡(luò)與執(zhí)行優(yōu)化階段在調(diào)整移動網(wǎng)絡(luò)與執(zhí)行優(yōu)化階段的問題主要是解決如下幾個方面:解決掉話、信號等問題;解決用戶投訴的主要問題,有一些不能通過網(wǎng)絡(luò)優(yōu)化來解決的問題

34、,做出詳細(xì)的設(shè)計計劃及原因分析;提高網(wǎng)絡(luò)中統(tǒng)計的kpi 指標(biāo)。第二階段,需要啟用設(shè)備新功能必須把上述的問題解決好,而且根據(jù)網(wǎng)絡(luò)的實際情況,在第二階段的優(yōu)化過程中,對專門的問題有專題進(jìn)行優(yōu)化。形成一個專題優(yōu)化報告,為以后解決這個問題的工程留下材料,有據(jù)可查。3保持性能和總結(jié)優(yōu)化階段在以上兩個階段中,網(wǎng)絡(luò)性能會有顯著的提高,這種提高也是有限的,到底可以到達(dá)什么程度,需要看網(wǎng)絡(luò)的基礎(chǔ)。調(diào)整網(wǎng)絡(luò)與執(zhí)行優(yōu)化階段的工作已經(jīng)讓網(wǎng)絡(luò)性能達(dá)到它應(yīng)該有的最好的狀態(tài)。保持性能和總結(jié)優(yōu)化則就是要一直保持著這種狀態(tài),于此同時也要進(jìn)入整個項目執(zhí)行的總結(jié)階段,第三個階段就是對前兩個階段的概括和總結(jié),使網(wǎng)絡(luò)優(yōu)化性能保持良好。

35、2. 2 數(shù)據(jù)挖掘技術(shù)2.2.1 數(shù)據(jù)挖掘技術(shù)概述 所謂的數(shù)據(jù)挖掘技術(shù)就是根據(jù)個人和企業(yè)的需要,從大型的數(shù)據(jù)庫經(jīng)過提取和分析,從而得到有價值的可以被利用的信息的數(shù)據(jù)分析技術(shù),我們可以根據(jù)得出的數(shù)據(jù)信息,來指導(dǎo)一些商業(yè)的行為或者是可以為一些科學(xué)研究提供參考價值。它的產(chǎn)生是由于近些年來信息化的進(jìn)程進(jìn)一步加快,信息處于大爆炸時代,大量的信息需要我們?nèi)チ私?,但是由于這些雜亂的信息導(dǎo)致我們無法準(zhǔn)確提取有用信息,它事數(shù)據(jù)庫研究中的一個新領(lǐng)域,可以個各個學(xué)科進(jìn)行結(jié)合,所以也適用于各個領(lǐng)域。作為計算機(jī)領(lǐng)頭軍的ibm公司就率先開發(fā)了一個名叫“智能挖掘機(jī)”的應(yīng)用工具16。2.2.2 數(shù)據(jù)挖掘常用聚類算法介紹1 聚

36、類算法聚類分析就是將一些實際的或者是抽象的對象集合在一起,根據(jù)每個對象的某些性質(zhì)是否類似來判斷能否將其歸為一類的分析過程,這是一種重要的人類分析行為。此系統(tǒng)所用到的就是最短距離聚類法,根據(jù)個體的數(shù)據(jù)點在幾何空間上的距離來判斷是否能夠歸為一類。例如系統(tǒng)中的最短距離聚類法,開始先將所有的小區(qū)按照社區(qū)分區(qū)算法進(jìn)行分區(qū),會得到許多分區(qū)的小區(qū)集合,但是總會有難以判斷的小區(qū)被孤立出來,還有好多處于邊緣的點無法進(jìn)行分區(qū),這就需要對其通過聚類算法得到應(yīng)該劃分的小區(qū),由于小區(qū)都是具體的經(jīng)緯度,這就需要計算兩個點之間的球面距離,來計算出當(dāng)前距離當(dāng)前小區(qū)最近的幾個小區(qū)號,從而實現(xiàn)了聚類算法。每個基站都有自己經(jīng)緯度,

37、并且在其跟周圍的基站之間的距離中挑出離它最近的k個,k可以是3、4等等。從k個距離取第k個近的或者把k個基站之間的距離做個平均,這就是k-dist距離。本項目一部分就是要做的就是對k-dist距離進(jìn)行聚類。就是把距離上比較接近,屬性比較相近的對象聚在一起,屬性就是k-dist的值,其核心是聚類。通過對每個基站聚類可以計算出該基站距離每個基站的最近的k個基站的距離,可根據(jù)次距離對基站進(jìn)行聚類分區(qū),從而將一些具有相同特點的對象歸為一個類,而不同類之間的特征差異就會比較大,這樣可以通過類別來管理大量的基站信息。2 復(fù)雜網(wǎng)絡(luò)社區(qū)的挖掘復(fù)雜網(wǎng)絡(luò)社區(qū)的挖掘是最近的10年來眾多學(xué)科交叉的前沿研究熱點之一了,

38、不只是在理論上有重要意義,而且在應(yīng)用上有非常廣泛的應(yīng)用前景。社區(qū)結(jié)構(gòu)這一個概念是由newman于2002年初次提出來的。所謂“社區(qū)”,就是通常我們所說的“分簇”,在一個社區(qū)我們可以大致地被描述為一個由部分頂點所構(gòu)成的子圖,在描述的這個子圖的內(nèi)部中,各個頂點之間的連接是很緊密的,但是與這個子圖以外的各個頂點的連接卻很松散。由于許多網(wǎng)絡(luò)結(jié)構(gòu)都呈現(xiàn)出了這樣的社區(qū)構(gòu)造,所以對這一社區(qū)結(jié)構(gòu)進(jìn)行檢測和描述有重要的現(xiàn)實和發(fā)展意義。 3 改進(jìn)的cnm算法為了能夠很確切地對所反映得網(wǎng)絡(luò)結(jié)構(gòu)以及部分重要的性質(zhì)的加權(quán)網(wǎng)絡(luò)進(jìn)行社團(tuán)結(jié)構(gòu)的劃分,連續(xù)地應(yīng)用社團(tuán)構(gòu)造分級的數(shù)據(jù)聚類方法,即改進(jìn)newman貪心算法 (簡稱cn

39、m算法)。在這個cnm算法中引入了點權(quán)和邊權(quán)的概念,并且又重新定義了新的q函數(shù)計算的社區(qū)模塊度,通過尋找q函的數(shù)峰值來確定社團(tuán)劃分的最終的結(jié)果。使用改進(jìn)的算法之后,我們不難發(fā)現(xiàn)這個算法在劃分準(zhǔn)確性及算法復(fù)雜度等方面都有特別明顯的優(yōu)勢。針對現(xiàn)有的對復(fù)雜網(wǎng)絡(luò)挖掘的認(rèn)識的基礎(chǔ)上,提出來的這一改進(jìn)的cnm算法,與其他同類別的算法相比在分簇的效果上,還有算法的時間復(fù)雜度上都有非常大的一個優(yōu)勢。改進(jìn)的cnm對在最大的堆中出現(xiàn)的最大的值,自動選擇最靠前的位置來進(jìn)行一系列處理,這個處理方式對分簇效果的本身是不是有影響為最佳的處理的方式將會是來進(jìn)一步討論的一個問題。在對昆明的數(shù)據(jù)進(jìn)行處理的過程中應(yīng)用了這一改進(jìn)的

40、cnm算法,提升了算法的分簇的效率,分簇效果也是比較理想,具體的將在后文中講解到這一問題。2.3 數(shù)據(jù)挖掘在移動網(wǎng)絡(luò)優(yōu)化中的應(yīng)用數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)的優(yōu)化系統(tǒng)中的主要作用體現(xiàn)在統(tǒng)計分析和預(yù)測分析的方面。預(yù)測分析包括話務(wù)均衡分析,統(tǒng)計分析中主要包括的是干擾分析、切換分析、覆蓋分析、接入分析、掉話分析等等。按照 gsm 網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)來分的話,gsm的網(wǎng)絡(luò)優(yōu)化方面的工作可以分成系統(tǒng)優(yōu)化與無線優(yōu)化這兩個方面進(jìn)行優(yōu)化,無線優(yōu)化主要針對基站和基站的扇區(qū)等各參數(shù)設(shè)置等,而系統(tǒng)優(yōu)化則針對 msc 及以上的部分。3 網(wǎng)絡(luò)優(yōu)化應(yīng)用案例與分析3.1數(shù)據(jù)挖掘在網(wǎng)絡(luò)優(yōu)化中的案例研究我們首先以惠州地區(qū)的數(shù)據(jù)為例,首先根根

41、據(jù)給定的數(shù)據(jù)庫pcioptimize_hz中的表dbo.tbcell中原始數(shù)據(jù),其部分?jǐn)?shù)據(jù)圖如下圖3-1原始數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)圖,圖中已經(jīng)用箭頭標(biāo)出所在數(shù)據(jù)庫和數(shù)據(jù)所在的表及應(yīng)用的字段,其中的數(shù)據(jù)量很大,但是對我們的研究有用的字段的是基站編號和經(jīng)緯度longitude和latitudel這三個,正如圖中的箭頭的標(biāo)注。圖3-1 原始數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)圖在主程序調(diào)用pci中的seekcell()函數(shù),實現(xiàn)計算距離指定小區(qū)的最近的第k個小區(qū)的距離。在pci中實現(xiàn)的seekcell()函數(shù),首先需要定義一個小區(qū)的集合用來存儲數(shù)據(jù)庫中的小區(qū)集合,從數(shù)據(jù)庫讀取小區(qū)數(shù)據(jù)并寫入當(dāng)前程序的小區(qū)集合,其中的cel

42、l類型為自定義,包括了每個小區(qū)的基本屬性,其主要算法流程與如下圖3-2求k-dist距離流程圖。圖3-2 求k-dist距離流程圖首先定義nearlist用來存儲其余小區(qū)指定小區(qū)的距離,i是小區(qū)編號,i=1獲得經(jīng)緯度點max和min。如果當(dāng)前的小區(qū)坐標(biāo)在max和min之間,指定小區(qū)就是那個參數(shù)穿進(jìn)來的那個經(jīng)緯度,循環(huán)到的小區(qū)不是指定的小區(qū),如果不在max和min之間就遍歷所有的小區(qū)直到在max和min之間。當(dāng)前遍歷小區(qū)循環(huán)到的小區(qū)不是指定的小區(qū)就計算當(dāng)前小區(qū)到指定小區(qū)的球面距離,將距離存入nearlist中,依照上述依次遍歷完所有小區(qū),否則繼續(xù)返回看當(dāng)前小區(qū)坐標(biāo)是否在max和min之間。遍歷完

43、所有小區(qū)后,若nearlist長度大于等于k,則將nearlist中的元素升序排列,并且返回第k個小區(qū)到指定小區(qū)的距離。若nearlist長度小于k,則判斷i+1是否不大于dislim,dislim的值為5。如果i+1小于等于dislim,則清空nearlist,否則繼續(xù)判斷小區(qū)編號i是否小于dislim,若小于則返回重新令i=1重復(fù)上述過程,否則返回查看nearlist的長度是否還是大于等于k,再往復(fù)上述過程。最后將nearlist中的元素升序排列,并且返回第k個小區(qū)到指定小區(qū)的距離。上述過程完成了計算k-dist 的距離。其結(jié)果如圖3-3 k-dist距離求得的結(jié)果截圖。其中前面的字段表示

44、小區(qū)號,后面的是求得的k-dist距離的,我們的計算k-dist距離的k是4。圖3-3 k-dist距離求得的結(jié)果截圖算法中的cmptkneardis函數(shù)就是用來計算離指定小區(qū)最近的第k個小區(qū)的距離,該函數(shù)的實現(xiàn)流程是,首先針對每一個小區(qū)定義一個距離向量用來存儲其余個到當(dāng)前小區(qū)的距離,然后通過遍歷小區(qū)集合來將縫合條件的距離寫入距離向量。然后將得到的距離向量進(jìn)行升序排列,最后根據(jù)所需返回距離。由于計算的是具體的經(jīng)緯度的點,所以引入新的類型jwd實現(xiàn)對小區(qū)的經(jīng)緯度的初始化,cjjwdhelper具體實現(xiàn)了經(jīng)緯度之間的計算,用來計算兩個經(jīng)緯度之間的球面距離。3.2 網(wǎng)絡(luò)優(yōu)化應(yīng)用案例分析與研究我們的試

45、驗是以昆明的數(shù)據(jù)為例,我們的原始數(shù)據(jù)包含在文件km.txt中,里面是所用的實際數(shù)據(jù),昆明地區(qū)的基站關(guān)系,如下圖3-4部分原始數(shù)據(jù)截圖所示,這個km.txt中包含了基站的編號以及其相鄰的基站,比如數(shù)據(jù)33542-22和32769-21表示基站編號為33542-22的基站與基站編號為32768-21的基站相鄰,依次類推。圖3-4 部分原始數(shù)據(jù)截圖所示我們給定昆明的原始數(shù)據(jù)包含在數(shù)據(jù)庫triangle的表db.tbcell中,這個數(shù)據(jù)庫中的表經(jīng)過程序處理已經(jīng)將txt中的數(shù)據(jù)寫入了數(shù)據(jù)庫中,所用我們的數(shù)據(jù)中是已經(jīng)包含了原始數(shù)據(jù)的。如下圖3-5數(shù)據(jù)庫列表圖與和圖3-6原始數(shù)據(jù)部分圖。其中用紅色圓圈標(biāo)注出

46、來的是我們需要用到的表。圖3-5數(shù)據(jù)庫列表圖圖3-6原始數(shù)據(jù)部分圖 與惠州數(shù)據(jù)一樣,我們的有用數(shù)據(jù)就是基站的編號字段sector和經(jīng)緯度的字段originlongitude和originlatitude,如圖3-6,基站編號為565671-23的基站經(jīng)度度originlongitude為102.77309,緯度originlatitude為24.97648。整個算法的流程如下,首先,開始算法如圖3-7分組算法流程圖。圖3-7 分組算法流程圖 該算法首先對模塊度,q矩陣,dp,a進(jìn)行初始化,初始化操作參考前面所講到的改進(jìn)的cnm算法。然后選出關(guān)聯(lián)性最大的元素,把小的簇合并到較大的簇的里,如果未達(dá)

47、到搜索的步數(shù),則更新上面的簇直到達(dá)到為止,依此循環(huán)。達(dá)到之后則輸出結(jié)果。對輸出結(jié)果的處理流程是把對應(yīng)的簇放到二維數(shù)組m_clustercell中,去掉昆明基站列表中的數(shù)據(jù)沒有的基站編號,保證昆明所有的數(shù)據(jù),都在二維數(shù)組中,把小的簇合并到與之相鄰的簇中,保留文件,并更新數(shù)據(jù)庫即可。下面來以昆明地區(qū)的基站數(shù)據(jù)為例來解釋這一網(wǎng)絡(luò)優(yōu)化的流程。原始數(shù)據(jù)通過fastcommunity_gpl_v3.0.1這一分組算法將分組插入triangle數(shù)據(jù)庫中的db.tbcell表中,這個算法中插入了k-dist距離聚類算法來進(jìn)行計算,與給定小區(qū)id,比較鄰近的小區(qū)id,在fastcommunity中使用k-dis

48、t距離求得的結(jié)果重新優(yōu)化分組,優(yōu)化結(jié)果簇。如果某個簇內(nèi),基站個數(shù)比較少,如:小于10,則對于此簇內(nèi)的每個基站a,使a合并到與a鄰近的最近的基站b所在的簇中,其中,b是根據(jù)上面k-dist距離算法得出。起到優(yōu)化分組的作用。給定數(shù)據(jù)計算k-dist距離的算法在第二章中已經(jīng)給出,將這一算法寫入fastcommunity中。求得的k-dist結(jié)果如下圖3-8求得的k-dist結(jié)果圖所示,其中pci就是求得的k-dist距離,sector_id是基站編號。longitude是基站的經(jīng)度,latiude是基站的緯度。 圖3-8求得的k-dist結(jié)果圖 fastcommunity算法中加入分組優(yōu)化函數(shù)gro

49、uplistupdate添加了控制分組大小的功能。在處理數(shù)據(jù)的過程中,由于數(shù)據(jù)較多,基站編號又大,為了減小算法的復(fù)雜度加入處理程序modify_id,修改大的小區(qū)編號為對應(yīng)的小編號,同時又是從很大的數(shù)值開始的,所以做此處理。這一算法的流程圖如下圖3-9 modify_id中newman算法流程圖所示。圖3-9 modify_id中newman算法流程圖所示此算法是經(jīng)典的社區(qū)發(fā)現(xiàn)算法,叫做newman算法。即:大規(guī)模網(wǎng)絡(luò)中社團(tuán)結(jié)構(gòu)發(fā)現(xiàn)算法。newman快速算法是基于模塊度的優(yōu)化的算法中的一個。newman算法也是一種凝聚層次聚類的算法,節(jié)點簇也會相繼地進(jìn)行合并,然后形成比較大的社區(qū),它也算一種貪

50、焚算法。 使用前后對比如下圖3-10 newman算法使用前截圖和圖3-11 newman算法使用后截圖所示:圖3-10 newman算法使用前截圖network-fc_result-原始分組.group.txt中,是通過newman算法分簇但還沒有進(jìn)行優(yōu)化的分簇情況,其中紅色圓圈標(biāo)注出來的是group566486-25118表示基站編號為566486-25的基站所在的小區(qū)有118基站,下面就是這個小區(qū)中的各個基站的編號,后面的1表示這些基站都是在小區(qū)編號為1的小區(qū)中的。圖3-11 newman算法使用后截圖詳細(xì)分組這個txt中將基站id轉(zhuǎn)化成了對應(yīng)的基站號,用紅色圓圈標(biāo)注出來的21即為使用n

51、ewmam算法進(jìn)行編號轉(zhuǎn)換后的基站編號。的后面的1表示分簇后,基站所在簇的編號,可以看出這個編號為1的簇,握住了118個基站。圖3-12基站分簇之后圖組內(nèi)個數(shù)這個txt文件中,如圖3-12基站分簇之后圖所示,group前面是基站號,后面是這個小組里有幾個基站,以第一行為例,基站id為21所在的小區(qū)中有118個基站。這些分好組的數(shù)據(jù)都寫入了triangle數(shù)據(jù)庫中的db.tbcell 表中。利用提供的bts工具提取數(shù)據(jù)庫tbcell表中的處理好的數(shù)據(jù),bts工具在后文中會有相應(yīng)介紹。利用經(jīng)緯度及方位角顯示成圖形的形式,其中不同的基站組用不同的顏色表示,由于已經(jīng)對分組進(jìn)行優(yōu)化,過小的分組已經(jīng)被合并

52、到相鄰的分組中,并且程序中已經(jīng)保證分組不會太大,因此分組較和諧,沒有出現(xiàn)過小或過大的現(xiàn)象,同時把孤立的站重新劃分,解決了“飛地”問題。btsvgraph系統(tǒng)是由北京郵電大學(xué)計算機(jī)學(xué)院完成的用此系統(tǒng)主要是完成基站的v圖生成,根據(jù)基站點畫出三角剖分圖,然后求對偶圖得到v圖。主要完成的功能有基站信息預(yù)處理-把相鄰的相近的基站合并、基站/扇區(qū)v圖生成-求出基站的v圖和扇區(qū)的v圖、新站加入加入新站,可重新生成并更新基站/扇區(qū)v圖、基站/扇區(qū)信息查詢對生成的基站/扇區(qū)v圖結(jié)果進(jìn)行查詢、圖層加載-把生成的圖層加入到程序中,可加載任意圖層,可同時加載多個。對于該案例,我們首先編譯運行btsvgraph這一工具

53、的程序。然后找到基站信息預(yù)處理中的基站/扇區(qū)圖層生成,如下圖3-13 btsvgraph工具圖所示。下面是使用該工具生成圖形界面的過程。圖3-13 btsvgraph工具圖彈出另存為界面,我們將其保存為gsm網(wǎng)基站扇區(qū)圖層,其中保存的位置為600小區(qū)與截圖文件夾下的gsm中,其路徑已經(jīng)用紅色箭頭標(biāo)注出來了如圖3-14保存截圖所示。圖3-14 保存截圖于是自動彈出對數(shù)據(jù)的處理窗,如3-15數(shù)據(jù)處理窗所示。圖3-15數(shù)據(jù)處理窗接著選擇基站/扇區(qū)v圖計算,如下圖3-16選擇按鈕圖,便會自動彈出保存地址,默認(rèn)按照紅色箭頭所指的方位即可,如圖3-15所示。圖3-16選擇按鈕圖圖3-17 選擇保存路徑圖保

54、存之后會有數(shù)據(jù)處理的過程,保存過程中的截圖正如下面的圖3-18 處理圖所示。圖3-18數(shù)據(jù)處理圖然后進(jìn)行的是圖層的加載和添加圖層的tab文件路徑,其中需要選中的文件如圖中的紅色箭頭和紅色邊框標(biāo)注,具體如圖3-19圖層加載圖所示。圖3-19圖層加載圖所示結(jié)果如下圖3-20結(jié)果截圖所示,滾輪可以進(jìn)行或大或小的縮放如圖3-21。其中不同的眼神代表著不同的小區(qū),這些分簇是上面處理過已經(jīng)的各個基站分簇所形成的小區(qū)。圖3-20 結(jié)果截圖圖3-21 結(jié)果放大截圖整個的思想是把昆明的數(shù)據(jù)(數(shù)據(jù)庫triangle中的db.tbcell表)進(jìn)行分組,其中用到k-dist優(yōu)化,把結(jié)插入到數(shù)據(jù)庫triangle中的d

55、b.tbcell表中,用bts訪問分好組的數(shù)據(jù)庫,顯示成圖形。4 總結(jié)與展望展望移動網(wǎng)絡(luò)優(yōu)化行業(yè)的未來,我們還是必須要肯定的對于網(wǎng)絡(luò)優(yōu)化來說是有非常好的發(fā)展前途。在我國經(jīng)濟(jì)持續(xù)穩(wěn)定健康發(fā)展的大機(jī)遇下,給移動網(wǎng)絡(luò)優(yōu)化行業(yè)鋪平了道路,創(chuàng)造了一個非常好的發(fā)展時機(jī)。在網(wǎng)絡(luò)普及的大環(huán)境下,網(wǎng)絡(luò)優(yōu)化優(yōu)化可謂無處不在,我們要抓住當(dāng)代機(jī)遇,善于利用這一有利的發(fā)展條件。顯而易見的,大數(shù)據(jù)是時代趨勢,未來的天下一定是大數(shù)據(jù)的天下,我們抓住這一時代特征,把數(shù)據(jù)挖掘技術(shù)充分利用到網(wǎng)絡(luò)優(yōu)化中去,結(jié)合各自工具和技術(shù),未來數(shù)據(jù)挖掘在網(wǎng)絡(luò)優(yōu)化中的前途定不可限量。我們知道數(shù)據(jù)分析與自動化、處理智能化以及一體化,是現(xiàn)在移動通信網(wǎng)

56、絡(luò)優(yōu)化的主要的一個發(fā)展趨勢,具體一點來說,主要體現(xiàn)在以下面幾個方面:4.1 開發(fā)數(shù)據(jù)一體化分析與處理系統(tǒng) 網(wǎng)絡(luò)優(yōu)化中,我們能夠使用很多種工具和技術(shù)。如果無法使用不同種類的不同功能的工具技術(shù)來進(jìn)行有效的整合,不能充分利用移動網(wǎng)絡(luò)優(yōu)化方案的巨大優(yōu)勢,那么也便展示不出實施的效果。所以,運營商必須和系統(tǒng)供應(yīng)商保持良好的穩(wěn)定的戰(zhàn)略和合作關(guān)系,將系統(tǒng)和環(huán)境之間的數(shù)據(jù)進(jìn)行更加緊密地結(jié)合,并且要呈現(xiàn)出來一套完整的數(shù)據(jù)和一體化的分析和處理軟件的系統(tǒng)。 4.2 開發(fā)職能輔助數(shù)據(jù)挖掘系統(tǒng) 在移動通信網(wǎng)絡(luò)優(yōu)化的過程中,數(shù)據(jù)分析是其中最為困難的環(huán)節(jié)。由于移動通信網(wǎng)絡(luò)的過程中,涉及到大量的數(shù)據(jù),因此,需要使用多種技術(shù)來處理數(shù)據(jù)。在這個過程中,就利用這些數(shù)據(jù)和信息之間的關(guān)系是最大的困難,通過分析數(shù)據(jù)庫中篩選,提取有用的信息。因此,在未來的移動通信網(wǎng)絡(luò)優(yōu)化的工作過程中,數(shù)據(jù)挖掘,網(wǎng)絡(luò)優(yōu)化,發(fā)展智能輔助系統(tǒng),為提高綜合改革方案的決策提供有效的支持,幫助員工迅速掌握數(shù)據(jù)之間的關(guān)系才是重點。4.3 開發(fā)自動調(diào)整網(wǎng)絡(luò)參數(shù)系統(tǒng) 在經(jīng)過移動網(wǎng)絡(luò)系統(tǒng)功能的輔助決策數(shù)據(jù)分析處理后,有效地提高了結(jié)果的準(zhǔn)確性,但這不是最后的優(yōu)化,對網(wǎng)絡(luò)的空間的提高有很大幫助。在這個發(fā)展階段,相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論