版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、SNMP下的網(wǎng)絡(luò)性能測量摘要本文引入了網(wǎng)絡(luò)性能測量的方法,對這兩類測量方式的原理及各自的優(yōu)缺點分別闡述并進行比較,特別強調(diào)了采用每種測量方式所需注意的安全問題,同時剖析了國內(nèi)外相關(guān)領(lǐng)域的研究現(xiàn)狀,介紹SNMP簡單網(wǎng)絡(luò)管理協(xié)議詳細介紹了網(wǎng)絡(luò)性能相關(guān)的指標參數(shù),并針對不同的指標重點闡述如何利用SNMP獲得測量數(shù)據(jù)。本文從多角度、多層面展現(xiàn)了基于SNMP獲取網(wǎng)絡(luò)性能測量數(shù)據(jù)的優(yōu)勢:使用簡單靈活,應(yīng)用廣泛可靠。并且總結(jié)了現(xiàn)階段存在的問題。關(guān)鍵詞:網(wǎng)絡(luò)測試,網(wǎng)絡(luò)性能,SNMPAbstractThis paper introduces network performance measurement met
2、hod. We elaborated and compare these two types of measurement principle and their respective advantages and disadvantages. The security aspects are accentuated. The development of the relative research field is introduced. Introduction SNMP network performance and indicators parameter details. And e
3、xplains how to use the SNMP measurement data for different indicators focus. Show the advantage of access to network performance measurement data based on SNMP From multi-angle and multi-level, that is Simple to use, flexible, reliable and widely used. At last summarizes the existing problemsKey wor
4、ds: network measurement, network performance, SNMP摘要iAbstracti引言11.網(wǎng)絡(luò)測量21.1.網(wǎng)絡(luò)測量的基本概念21.2.網(wǎng)絡(luò)測量的種類和常用指標21.3.國內(nèi)外關(guān)于網(wǎng)絡(luò)測量的研究進展42.性能測試62.1.SNMP協(xié)議簡介62.2.可用性62.3.響應(yīng)時間82.4.理論模型92.5.精確度92.6.利用率102.7.CPU利用率112.8.內(nèi)存利用率113.總結(jié)討論123.1.研究結(jié)論123.2.存在問題12參考文獻1313引言隨著計算機和通信技術(shù)的發(fā)展,計算機網(wǎng)絡(luò)作為信息社會的基礎(chǔ)設(shè)施滲透到了社會的各個方面現(xiàn)代計算機網(wǎng)絡(luò)已經(jīng)演化成多
5、種體系結(jié)構(gòu)網(wǎng)絡(luò)互聯(lián)的異質(zhì)性網(wǎng)絡(luò)?,F(xiàn)代網(wǎng)絡(luò)具有以下顯著特征: 1) 地理分散性:現(xiàn)代網(wǎng)絡(luò)已經(jīng)成為全球性的網(wǎng)絡(luò)網(wǎng)絡(luò)接點遍布世界各地。 2) 網(wǎng)絡(luò)體系結(jié)構(gòu)的復(fù)雜性:隨著網(wǎng)絡(luò)互聯(lián)技術(shù)的發(fā)展利用TCP/IP等網(wǎng)絡(luò)互聯(lián)協(xié)議可以將不同廠商生產(chǎn)的網(wǎng)絡(luò)設(shè)備互聯(lián)起來允許同一網(wǎng)絡(luò)中幾種體系結(jié)構(gòu)的共存。 3) 網(wǎng)絡(luò)通信量大幅增加:隨著光纖通信技術(shù)的發(fā)展線路的通信容量大幅提高。同時網(wǎng)絡(luò)規(guī)模的擴大、網(wǎng)絡(luò)服務(wù)類型向語音、圖象傳輸?shù)霓D(zhuǎn)變也導(dǎo)致了網(wǎng)絡(luò)通信量的大幅增長。 4) 網(wǎng)絡(luò)設(shè)備的自治性增強:隨著IC技術(shù)的發(fā)展調(diào)制解調(diào)器等網(wǎng)絡(luò)設(shè)備的處理能力得到大大增強使其能夠獨立實現(xiàn)較復(fù)雜的功能。 5) 網(wǎng)絡(luò)的變動性增加:網(wǎng)絡(luò)規(guī)模的擴大和
6、網(wǎng)絡(luò)體系結(jié)構(gòu)的復(fù)雜化導(dǎo)致網(wǎng)絡(luò)結(jié)點的增加從而造成整個網(wǎng)絡(luò)狀態(tài)的多變性。 6) 網(wǎng)絡(luò)設(shè)備的管理需求增加:網(wǎng)絡(luò)設(shè)備的種類眾多不同的設(shè)備對設(shè)備管理有不同的需求導(dǎo)致對整個網(wǎng)絡(luò)的管理變得十分復(fù)雜。上述情況需要我們對網(wǎng)絡(luò)性能有一個全面的了解,即利用網(wǎng)絡(luò)測量相關(guān)技術(shù)對網(wǎng)絡(luò)性能進行跟蹤。1. 網(wǎng)絡(luò)測量1.1. 網(wǎng)絡(luò)測量的基本概念網(wǎng)絡(luò)測量是指遵照一定的方法和技術(shù),利用軟件和硬件工具來測試或驗證表征網(wǎng)絡(luò)性能的指標的一系列活動的總和,可以借鑒物理學(xué)中測量物理量的方法。網(wǎng)絡(luò)測量包含以下幾個要素1。測量對象:被測量的節(jié)點或鏈路,測量節(jié)點、鏈路或網(wǎng)絡(luò)的什么特征,如鏈路的時延、帶寬、丟包率,路由器的路由效率、時延、丟包率;
7、服務(wù)器的應(yīng)答延遲、吞吐率、系統(tǒng)容量、最大穩(wěn)定鏈接數(shù)等;測量環(huán)境:包括測量點的選取、測量時間的確定、測量設(shè)備、通信鏈路的類型等;測量方法:針對某一具體的網(wǎng)絡(luò)行為指標,選取合適的測量方法,測量方法應(yīng)滿足穩(wěn)健性被測網(wǎng)絡(luò)的輕微變化不會使測量方法失效;可重復(fù)性同樣的網(wǎng)絡(luò)條件,多次測量結(jié)果應(yīng)一致;準確性測量結(jié)果應(yīng)能反映網(wǎng)絡(luò)的真實情況)1.2. 網(wǎng)絡(luò)測量的種類和常用指標網(wǎng)絡(luò)測量的方法有兩種:主動測量、被動測量。主動測量是將探測分組注入網(wǎng)絡(luò)進行測量,如通過在一端發(fā)送UDP分組,而在另一端接收該分組,可以測量端到端的延時、丟包率。如后面將要講述的IEPM,NIMI,MLANR AMP,Surveyor,Skit
8、ter 等采用了主動測量。被動測量是在網(wǎng)絡(luò)的某處布置數(shù)據(jù)采集器,收集流過該處的網(wǎng)絡(luò)業(yè)務(wù)流,進行分析、提取業(yè)務(wù)特征,獲得性能數(shù)據(jù)。如NLANR PMA,CoralReef。主動測量2是由AMP(Active Measurement Project)組織提出的數(shù)據(jù)分析方法。這種測量方式實際上就是映射Internet 系統(tǒng),在主動測量方式中,通過向網(wǎng)絡(luò)中發(fā)送數(shù)據(jù)、觀察結(jié)果和發(fā)送數(shù)據(jù)所需時間來研究網(wǎng)絡(luò)的行為。主動測量本身產(chǎn)生新的業(yè)務(wù)測量流量,利用這些業(yè)務(wù)量測量反映網(wǎng)絡(luò)提供給其他用戶的服務(wù)的參數(shù),包括round-trip time(RTT)和丟包率等。這些測量流量可能會引起網(wǎng)絡(luò)的特殊響應(yīng)( 如trace
9、route),或網(wǎng)絡(luò)為流量提供某種性能(如treno)。在主動測量過程中,測量流量可通過詳細定義,在一定的控制條件下產(chǎn)生。主動測量是基于RTT 測量,而不是對單程延遲的測量。因為RTT 測量更易于實現(xiàn),而且不會依賴外部設(shè)備去同步兩臺監(jiān)視器的時間。另外,有的測量方法是使用全球定位系統(tǒng)(GPS)接收器來同步主機的時間。但是這些系統(tǒng)過于昂貴而且難于安裝,并且獲得的額外信息也很有限,因此并不普及。具體來說,RTT 測量是通過類似Ping 的程序,每隔一定時間段進行一次。該程序?qū)γ颗_被測主機發(fā)送ICMP 響應(yīng)包,然后等待ICMP 的回應(yīng)包,記錄每個站點的測量延遲。發(fā)現(xiàn)或者診斷一個站點故障的最好方法之一就
10、是查看RTT 圖標的起伏狀況,這些起伏表明了路由或者配置上的變化所引起兩個站點間RTT 的改變情況。另外一點,就是要查看丟包率。如果一個站點的丟包率過高,那么它可能出現(xiàn)硬件損壞,這種分析是非?;镜摹H绻獙σ粋€站點的性能有進一步理解,就要通過比較它同其他站點的連通性來獲得。比如,被測站點日常鏈路出現(xiàn)的擁塞是否也同樣出現(xiàn)在其他站點上?連接回程時間是多少?主動測量的優(yōu)缺點主動測量的優(yōu)點如下:使用方便,適合端到端的網(wǎng)絡(luò)性能測量,對于需要關(guān)心的內(nèi)容只要在本地發(fā)送測試包觀察網(wǎng)絡(luò)的響應(yīng)即可;由于該方法不涉及用戶的網(wǎng)絡(luò)信息,所以對用戶而言是很安全的。但它也存在一定的缺點,主要包括:它增加了網(wǎng)絡(luò)潛在的負載,
11、尤其是如果該測量未經(jīng)仔細設(shè)計,使產(chǎn)生的流量達不到最小,可能會對網(wǎng)絡(luò)造成較大的影響;主動測量會引起Heisenberg 效應(yīng),即額外的流量可能會干擾網(wǎng)絡(luò),并使結(jié)果分析產(chǎn)生偏差。另外,需要注意的是,在同樣都是主動測量的情況下,一些測量工具可能會比其它測量工具“更加”主動一些,如Ping 程序在執(zhí)行過程中只對網(wǎng)絡(luò)帶來較輕微的負載,所以Ping 測量因Heisenberg 效應(yīng)帶來的偏差比上述瓶頸帶寬的測量要小得多。主動測量中的安全問題對于主動測量技術(shù),需要將測試流量注入網(wǎng)絡(luò),這種測試流量有可能會影響網(wǎng)絡(luò)的擁塞情況,因此要謹慎地控制所用的測試流量,避免因測試而引起網(wǎng)絡(luò)擁塞3。另外,要避免主動測量技術(shù)被
12、濫用,如利用此技術(shù)進行偽造測試流量的拒絕服務(wù)DoS攻擊。與主動測量相對應(yīng)的是被動測量2,在被動測量方式中,記錄網(wǎng)絡(luò)活動的探針被接入到網(wǎng)絡(luò)中的某個點上,在大多數(shù)情況下探接到網(wǎng)絡(luò)節(jié)點之間的連接上,然后使用包過濾器捕獲通過該點的數(shù)據(jù)包,匯總和記錄那條連接上業(yè)務(wù)流量的信息。因為包過濾能夠捕獲網(wǎng)絡(luò)流量而不會對網(wǎng)絡(luò)造成什么影響,所以使用被動測量可以消除額外的流量負載和Heisenberg 效應(yīng)。被動測量使用設(shè)備監(jiān)視經(jīng)過它的流量,這些設(shè)備可以是專用的(如Sniffer),也可以是嵌入在其它設(shè)備(如路由器、防火墻、交換機和主機)之中的(如RMON,SNMP 和netflow使能設(shè)備等)。測量軟件或系統(tǒng)周期性地
13、輪詢被動監(jiān)測設(shè)備并采集信息(在SNMP 方式時,從MIB 中采集),以判斷網(wǎng)絡(luò)性能和狀態(tài)。被動測量的優(yōu)點如下:在測量時并不增加網(wǎng)絡(luò)上的流量,測量的是網(wǎng)絡(luò)上的真正流量;能夠達到對觀察點網(wǎng)絡(luò)行為的詳盡理解.但它也有其本身所固有的缺點:關(guān)于隱私和安全的問題:被動測量方式可能要查看網(wǎng)絡(luò)上的所有數(shù)據(jù)包,容易捕獲網(wǎng)絡(luò)中的敏感信息,給用戶信息的保密和安全帶來一定威脅;只能獲得網(wǎng)絡(luò)局部數(shù)據(jù),無法了解網(wǎng)絡(luò)整體狀況或?qū)W(wǎng)絡(luò)的端到端行為的理解;被動測量只能固定在網(wǎng)絡(luò)的某一點收集數(shù)據(jù),而不能根據(jù)網(wǎng)絡(luò)的整體情況來調(diào)整收集策略;被動測量在網(wǎng)絡(luò)排錯時特別有價值,但在仿真網(wǎng)絡(luò)故障或隔離確切的故障位置時會受到限制;被動測量的前
14、提是協(xié)作,否則無法在測量點安裝必要的軟、硬件設(shè)備,測量范圍由此而受限。1.3. 國內(nèi)外關(guān)于網(wǎng)絡(luò)測量的研究進展到目前為止,人們所做網(wǎng)絡(luò)測量項目中的大多數(shù)都涉及到主動測量。到了2000 年6 月,運行主動測量監(jiān)視器的源站點有116 個(美國114 個,新西蘭、挪威各1 個),被測量的目的站點約有13340 個。到了2003 年11 月,運行主動測量監(jiān)視器的源站點已增加到140 多個。其目的是為了增強參與站點和用戶對高性能網(wǎng)絡(luò)運行情況的理解,幫助網(wǎng)絡(luò)用戶和網(wǎng)絡(luò)服務(wù)提供者分析問題。美國的NIMI (National Internet Measurement Infrastructure)項目2,利用p
15、ing,tracerute,mtrace 等工具進行主動測量,它是一個可進行大規(guī)模網(wǎng)絡(luò)測量的測量基礎(chǔ)設(shè)施,創(chuàng)建了一個通用的架構(gòu),具有良好的可擴展性。NIMI 的主要特點在于它不是為某種特殊的分析目標執(zhí)行特定的測試集,而是可以靈活地在底層架構(gòu)之上添加自己所需的測量工具。NLANR( The National Laboratory for Applied Network Research),NAI (Network Analysis Infrastructure)是美國的一個研究支持HPC(High Performance Connection)的組織建設(shè)的基礎(chǔ)設(shè)施。與其它項目相比,NIANR 主
16、要有以下兩個特色:1) 數(shù)據(jù)收集方式全面,包括主動、被動和控制監(jiān)視;2) 數(shù)據(jù)可視化采用了三維形象顯示的方式。Surveyor是一個建立在全球參與站點上的測量平臺,部分由NSF(National Science Foundation)支持。它測量Internet 的路徑性能,包括單向延時、損耗、路由測量等,并研究相應(yīng)的分析方法與工具。Surveyor 的特色主要表現(xiàn)在1) 采用標準的測試方法,使得結(jié)果具有可比性;2) 利用GPS 卡進行時鐘同步,對于單向的測量準確率較高。依托于UCSD/ SDSC(University of California,San Diego,Supercomputer
17、 Center)的研究部門CAIDA( Cooperative Association for Internet Date Analysis),開展網(wǎng)絡(luò)測量、分析、可視化工具的研發(fā),維護全球因特網(wǎng)平臺的健壯性和可擴放性,受到NSF、DARPA(Defense Advanced Research Projects Agency)、ISP 和硬件供應(yīng)商的資助,研究對象包括Internet 拓撲結(jié)構(gòu)、網(wǎng)絡(luò)負載、網(wǎng)絡(luò)性能、網(wǎng)絡(luò)路由、監(jiān)測正、異?;顒?,關(guān)注帶寬估計、負載刻畫、長期趨勢識別,以進行流量工程設(shè)計、能力計劃、安全跡象檢測等等。Skitter是一個采用主動測量方式來測量一系列主機的轉(zhuǎn)發(fā)路徑和RT
18、T 的工具。Skitter 選用了較多的被測節(jié)點,與其它項目相比,該項目測量范圍大,對Internet 的覆蓋面要廣得多。加拿大國家研究機構(gòu)使用perl script 跟蹤對TRIUMF 感興趣的節(jié)點,每10 分鐘檢測一次丟包率,每天收集4 次tracert 數(shù)據(jù)并生成網(wǎng)絡(luò)可視化圖;歐洲的PPNCG(Particle Physics Network Coordinating Group)項目,監(jiān)視全歐洲某些粒子物理研究所的網(wǎng)絡(luò)端到端性能,并加以優(yōu)化。國內(nèi)的國防科學(xué)技術(shù)大學(xué)、西南交通大學(xué)等單位在基于ICMP協(xié)議的IP 拓撲探測方面的技術(shù)比較成熟;哈爾濱工業(yè)大學(xué)計算機科學(xué)與工程系實現(xiàn)了一個大規(guī)模網(wǎng)
19、絡(luò)拓撲測量的原型系統(tǒng),能夠針對大規(guī)模網(wǎng)絡(luò)進行路由IP 拓撲結(jié)構(gòu)的自動發(fā)現(xiàn),并進行可視化顯示;中國科學(xué)院計算技術(shù)研究所信息網(wǎng)絡(luò)室開發(fā)出大規(guī)模INTERNET 網(wǎng)絡(luò)測量與分析系統(tǒng)NIPMAS,該系統(tǒng)能對跨地域的大型網(wǎng)絡(luò)進行在線監(jiān)測,并能根據(jù)用戶需求靈活添加業(yè)務(wù)測量工具,實現(xiàn)對網(wǎng)絡(luò)主要性能狀態(tài)的監(jiān)測,分別針對網(wǎng)絡(luò)業(yè)務(wù)運行正常、亞健康狀況( 即網(wǎng)絡(luò)設(shè)備正常但業(yè)務(wù)運行不正常)和用戶業(yè)務(wù)完全不能進行(即網(wǎng)絡(luò)設(shè)備或鏈路不正常)狀態(tài)進行了具體性能監(jiān)測或故障定位,另外,NIPMAS 還實現(xiàn)了GIS 顯示、動態(tài)播放和Web 發(fā)布等功能;在NIPMAS 的基礎(chǔ)上,中科院計算所還開發(fā)出支持IPv6 的大型網(wǎng)絡(luò)測量系統(tǒng)
20、FOX,在國內(nèi)外處于領(lǐng)先地位。Simple Network Management Protocol作為一種網(wǎng)絡(luò)管理協(xié)議是被廣泛接受并投入使用的工業(yè)標準它的目標是保證網(wǎng)絡(luò)管理信息在任意管理實體和被管設(shè)備間傳送便于網(wǎng)絡(luò)管理系統(tǒng)在網(wǎng)絡(luò)上的任何節(jié)點檢索信息獲得網(wǎng)絡(luò)指標參數(shù)。SNMP是TCP/IP協(xié)議族中的一個應(yīng)用層協(xié)議。2. 性能測試2.1. SNMP協(xié)議簡介Simple Network Management Protocol4作為一種網(wǎng)絡(luò)管理協(xié)議是被廣泛接受并投入使用的工業(yè)標準它的目標是保證網(wǎng)絡(luò)管理信息在任意管理實體和被管設(shè)備間傳送便于網(wǎng)絡(luò)管理系統(tǒng)在網(wǎng)絡(luò)上的任何節(jié)點檢索信息獲得網(wǎng)絡(luò)指標參數(shù)。SNMP
21、是TCP/IP協(xié)議族中的一個應(yīng)用層協(xié)議。SNMPUDPIP鏈路層協(xié)議物理層協(xié)議2.2. 可用性可用性是網(wǎng)絡(luò)性能最重要的度量指標之一是計算機網(wǎng)絡(luò)系統(tǒng)設(shè)備、鏈路等和應(yīng)用服務(wù)可供用戶使用的時間可以用每年、每月、每周、每天、每小時的網(wǎng)絡(luò)運行時間與所對應(yīng)時間段的全部時間之比表達5。例如:一個可提供每天24小時、每周7天服務(wù)的網(wǎng)絡(luò),如果在一周168小時之內(nèi)運行了165個小時其可用性是98.21%??捎眯酝ǔEc冗余聯(lián)系在一起但冗余并不是網(wǎng)絡(luò)建設(shè)的目標而是可用性目標的一種解決方法。冗余是指為避免網(wǎng)絡(luò)服務(wù)中斷分擔網(wǎng)絡(luò)負載而在網(wǎng)絡(luò)中增加多重鏈路或備用設(shè)備。 可用性還與可靠性有關(guān)但比可靠性更明確前者可以用運行時間百
22、分比來精確度量??煽啃允侵竼栴}的多樣性包括精確度、錯誤率、穩(wěn)定性、無故障時間等。 可用性與彈性也有聯(lián)系。彈性Resiliency指的是網(wǎng)絡(luò)能夠承受多大壓力以及網(wǎng)絡(luò)從問題中恢復(fù)回來的速度。理論模型可用性基于網(wǎng)絡(luò)中單個系統(tǒng)的可靠性。可靠性指一個系統(tǒng)在特定條件特定時間內(nèi)執(zhí)行其特定功能的概率。一般地用Mean Time Between Failures平均無故障時間來表示。系統(tǒng)的可用性A可表示為A = MTBF/(MTBF + MTTR)其中MTTR是發(fā)生故障后的平均修復(fù)時間Mean Time To Repair。由于網(wǎng)絡(luò)配置復(fù)雜,且路由總在不斷地動態(tài)變化,除了可以測量單個系統(tǒng)的可用性,對網(wǎng)絡(luò)可用性的
23、測量則簡化為對網(wǎng)絡(luò)路徑上每條物理鏈路可用性的測量。測量網(wǎng)絡(luò)設(shè)備和鏈路的可用性可以有兩種方式:主動探測和被動接收通知。常用的主動探測方法有Icmp Ping、Snmp Poll。Icmp Ping是管理站向被測設(shè)備發(fā)送ICMP協(xié)議報文。如果被測設(shè)備不可用,將返回超時信息。在實際測量中,我們每隔5分鐘向目標設(shè)備同時發(fā)送10個100字節(jié)大小的ICMP報文。這樣既可以不占用較多的網(wǎng)絡(luò)帶寬,又能保證測量的準確性。如果10個報文全部超時,我們認為目標不可用;如果有4個或4個以下報文超時;認為目標不可達,如路由錯誤、網(wǎng)絡(luò)擁塞否則目標設(shè)備可用。每次的測量數(shù)據(jù)都被記錄在數(shù)據(jù)庫中。當統(tǒng)計設(shè)備可用性時,使用如下公式
24、來計算:可用性=總測量次數(shù)-測量結(jié)果為不可用的次數(shù)總測量次數(shù)(3.1.1)為了盡可能避免目標不可達的情況出現(xiàn),可以采取就近原則,以確保管理站與被測設(shè)備間鏈路通暢。分布式架構(gòu)就是在大型廣域網(wǎng)絡(luò)的每個以區(qū)域劃分的網(wǎng)段內(nèi)放置一臺管理站,負責本區(qū)域內(nèi)網(wǎng)絡(luò)設(shè)備的性能監(jiān)測。管理站之間保證時間同步,數(shù)據(jù)同步,即時鐘保證一致。同時測量結(jié)果數(shù)據(jù)存入統(tǒng)一的中心數(shù)據(jù)庫。由于管理站與被測設(shè)備地理位置較近,測量結(jié)果也就更加準確。Snmp Poll是另外一種主動探測方法。管理站與被管設(shè)備之間通過Snmp協(xié)議通信。管理站M命令被測設(shè)備A檢索某一管理對象。A在管理信息庫(MIB)中查找該對象的值并將結(jié)果返回給M。 通過Snm
25、p測量可用性主要用于獲得設(shè)備接口的可用性。 首先我們要確定能反映接口狀態(tài)的管理變量,這是所有基于Snmp進行性能測量的第一步,也是最重要的步驟。它決定了要通過Snmp采集什么數(shù)據(jù)、所采集的數(shù)據(jù)是否真正符合要求。使用Snmp Poll5的方法可以準確地獲得接口狀態(tài)。但要測量其可用性,則需進行大量的采樣。像Icmp Ping一樣,我們每隔5分鐘向目標設(shè)備發(fā)送命令報文,并將測量結(jié)果記錄在數(shù)據(jù)庫中。 當統(tǒng)計設(shè)備接口可用性時,使用如下公式來計算:可用性=測量結(jié)果為可用的次數(shù)總測量次數(shù) (3.1.2)主動探測適于某一時刻設(shè)備是否可用的測量。但對于可用性統(tǒng)計來說,由于其使用了采樣的方法難免會有遺漏。例如:一
26、臺設(shè)備在采樣點t時刻是可用的,在采樣點(t + 5)也是可用的,我們的測量程序就認為該設(shè)備在t到(t + 5)時間段內(nèi)是可用的。實際上t到(t + 5)時間段內(nèi)該設(shè)備可能因重啟而不可用.但主動探測并不能發(fā)現(xiàn)。改進的辦法就是縮短采樣間隔但這不能徹底的解決問題。相對來說,被動方式的測量在這方面具有絕對的優(yōu)勢。被動方式主要采用Snmp Trapd的方式。使用這種方法可以獲得所有的關(guān)于設(shè)備及其端口是否可用的信息,再加上分布式采集結(jié)構(gòu)來減少因UDP丟包造成的數(shù)據(jù)不完整,相對來說這是測量可用性的最完備的解決方案。與此類似的另外一種被動測量方法是Syslog。它也使用UDP協(xié)議傳輸報文。大多數(shù)網(wǎng)絡(luò)設(shè)備都支持
27、Syslog方式將系統(tǒng)日志等發(fā)送到遠程的管理站的Syslog Daemon。但Syslog Daemon是Unix上的一種特有服務(wù),并不是在所有平臺上都可獲得的。一般地Sun工作站上Syslog作為缺省服務(wù)偵聽514/udp。 通過可用性的四種測量方法的對比實現(xiàn),我認為可以采用Snmp Trapd作為基本的測量手段,以Snmp Poll、Icmp Ping為輔助測量設(shè)備的可用性,確保數(shù)據(jù)完整性、一致性、可靠性。2.3. 響應(yīng)時間提到響應(yīng)時間,一般有兩種解釋:網(wǎng)絡(luò)響應(yīng)時間和應(yīng)用響應(yīng)時間。我們先討論前者。網(wǎng)絡(luò)響應(yīng)時間是數(shù)據(jù)流在網(wǎng)絡(luò)的兩個節(jié)點之間的傳輸時間,是網(wǎng)絡(luò)層的概念。當響應(yīng)時間不正常甚或超過了
28、某個閾值(網(wǎng)路用戶可忍受的最大響應(yīng)時間)時就表明可能出現(xiàn)了網(wǎng)絡(luò)擁塞或故障。響應(yīng)時間能最快、最直接地反映了網(wǎng)路性能幫助我們及時、準確的掌握網(wǎng)絡(luò)的運營效率。在分布式的網(wǎng)絡(luò)里,響應(yīng)時間受很多因素所影響,包括:網(wǎng)絡(luò)擁塞路由失效中間設(shè)備超負荷或處理能力不夠包差錯(噪音、CRC校驗錯誤等)在一個實現(xiàn)了Qos5排隊機制的網(wǎng)絡(luò)里,測量響應(yīng)時間對判定某種類型的流量是否按所期望質(zhì)量進行緩沖轉(zhuǎn)發(fā)通過網(wǎng)絡(luò)是非常有意義的。例如:在承載語音業(yè)務(wù)的IP網(wǎng)絡(luò)里,語音分組必須以固定的速率實時的傳送以確保高質(zhì)量的話音。我們可以產(chǎn)生一些仿真的語音分組測量其在網(wǎng)絡(luò)中指定端點間的傳輸延遲測量或測試該網(wǎng)絡(luò)的Qos。測量響應(yīng)時間還能夠幫助
29、確定當應(yīng)用服務(wù)變得反應(yīng)較慢甚至不可訪問時問題的根源。網(wǎng)絡(luò)管理員可以測量網(wǎng)絡(luò)響應(yīng)時間來證明是否網(wǎng)絡(luò)性能問題抑或應(yīng)用服務(wù)自身的問題。一般地,測量響應(yīng)時間應(yīng)盡可能的仿真最終用戶行為。舉個例子:一個用戶打開瀏覽器輸入要訪問的Web服務(wù)器地址敲擊回車鍵,從這時開始到所請求的頁面出現(xiàn)在瀏覽器里所經(jīng)過的時間是這個Web應(yīng)用對這個用戶在這個特定時刻的響應(yīng)時間,它包括用戶主機到Web服務(wù)器的網(wǎng)絡(luò)響應(yīng)時間還有Web服務(wù)器對頁面請求的處理時間,加在一起就是所謂的應(yīng)用響應(yīng)時間。 不幸的是,應(yīng)用響應(yīng)時間的測量幾乎是不能做到的,因為用戶太多且分散,而且缺少合適的工具。另外,應(yīng)用響應(yīng)時間的測量對解決網(wǎng)絡(luò)性能問題或?qū)淼木W(wǎng)絡(luò)
30、擴容規(guī)劃來說也并不是必要的。盡管從測量應(yīng)用性能的角度來說它是必不可少的。2.4. 理論模型我們可以使用專用的設(shè)備來測量響應(yīng)時間,也可以使用ICMP(如Ping、Traceroute)來測量,雖然無法獲得應(yīng)用級的響應(yīng)時間,但至少可以了解網(wǎng)絡(luò)是怎樣一跳一跳地、多快地傳輸IP分組的。比如說:可以用Ping命令獲得從管理站到網(wǎng)絡(luò)中某個關(guān)鍵節(jié)點的時延一個核心路由器的某個接口、一個SP(服務(wù)提供商)接入點的設(shè)備、一個重要用戶的工作站等。這個方法的缺點是不能反映用戶設(shè)備到用戶目的設(shè)備的響應(yīng)時間,僅僅簡單地收集并報告了從管理站到用戶目的設(shè)備的響應(yīng)時間。 替代管理站-集中式探測的另外一種測量方法是分布式探測。即
31、以用戶接入點到用戶目的設(shè)備響應(yīng)時間作為用戶設(shè)備到用戶目的設(shè)備的響應(yīng)時間,這要求我們能夠測量用戶接入點到用戶目的設(shè)備的響應(yīng)時間。如果用戶接入點的設(shè)備是實現(xiàn)了Service Assurance Agent (SAA)功能的Cisco設(shè)備,就可以做到。利用SAA可以測量其所駐留的路由器到任意目標IP設(shè)備的響應(yīng)時間,不但可以模擬ICMP協(xié)議包來探測到指定IP設(shè)備的響應(yīng)時間,還可以模擬發(fā)送UDP、TCP、DNS、DHCP、SMTP、FTP、HTTP、VOICE等多種協(xié)議報文,仿真用戶行為,測量相應(yīng)的應(yīng)用響應(yīng)時間。雖然這種方法所得到的測量數(shù)據(jù)也只是接近而不能完全真實、絲毫不差的反映用戶到應(yīng)用的相應(yīng)時間。但
32、卻是僅有的行之有效的方法。 在實現(xiàn)了Qos排隊機制的網(wǎng)絡(luò)里,依然可以利用SAA產(chǎn)生仿真的數(shù)據(jù)流相對有效的測量出網(wǎng)絡(luò)任意端到端的相應(yīng)時間。2.5. 精確度精確度是衡量網(wǎng)絡(luò)設(shè)備接口是否準確無誤地轉(zhuǎn)發(fā)報文的概念,可以用一段時間內(nèi)無差錯轉(zhuǎn)發(fā)報文數(shù)與報文總數(shù)的百分比來表示。例如:一個接口平均每轉(zhuǎn)發(fā)100個報文就有2個報文出錯,那么錯誤率為2%,精確度為98%。 對于早期的網(wǎng)絡(luò),特別是廣域網(wǎng)絡(luò),一定級別的錯誤率是可接受的。但隨著高速網(wǎng)絡(luò)和越來越多的關(guān)鍵網(wǎng)絡(luò)業(yè)務(wù)的出現(xiàn),要求網(wǎng)絡(luò)傳輸必須是穩(wěn)定可靠的。很多技術(shù)文獻提到以下的錯誤率參考值5:模擬鏈路的典型閾值為10-5 數(shù)字鏈路中光纜鏈路的錯誤率約為10-11銅
33、線鏈路的錯誤率約為10-6 共享以太網(wǎng)中,錯誤通常是由碰撞引起的。受合法碰撞影響的幀不應(yīng)該超過0.1%。 任何超過以上錯誤率的差錯都可能導(dǎo)致網(wǎng)絡(luò)性能下降、網(wǎng)絡(luò)服務(wù)停工、用戶的不滿和申告等一大堆問題。 一些常見的接口出錯原因有不符合規(guī)范的布線 電子干擾; 軟件或硬件缺陷; 因此監(jiān)視測量必須修正的錯誤率是很有必要的,它能指出必須修正的間歇故障線路、噪聲或干擾源的出現(xiàn)跡象防患于未然。2.6. 利用率利用率是指給定的時間段內(nèi)資源的利用情況。通常用所能使用和全部可用容量的百分比來表示。 利用率的最大用途是查找發(fā)現(xiàn)潛在的瓶頸或阻塞區(qū)域。這一點是很重要的,因為響應(yīng)時間隨資源的利用率呈冪指數(shù)的增長(這是著名的
34、隊列理論的結(jié)果)如果不及時發(fā)現(xiàn)并處理阻塞的話,阻塞就會失去控制,致使網(wǎng)絡(luò)性能極度下降。另外,測量利用率還能發(fā)現(xiàn)那些沒有利用率較低、沒有被充分使用的資源。 一般地,利用率主要是作為確定網(wǎng)絡(luò)鏈路使用狀態(tài)的最基本測量手段。但要完全掌握網(wǎng)絡(luò)資源的利用情況,還需測量CPU、Interface、Queuing等關(guān)鍵系統(tǒng)容量指標。 事實上,高利用率不一定是壞事,而低利用率則可能暗示網(wǎng)絡(luò)交通量并沒按所期望的路由流動。但利用率過高、持續(xù)升高則或出現(xiàn)大的起伏變化則說明網(wǎng)絡(luò)正面臨著問題。接口利用率當一個接口出現(xiàn)阻塞,接口處報文越來越多超過其處理能力或報文進入接口的速度超過接口的轉(zhuǎn)發(fā)速度時,就會把報文排入接口隊列;如
35、果隊列已滿則丟棄。例如:當從一個快速的接口向一個慢速的接口轉(zhuǎn)發(fā)數(shù)據(jù)流時,就會出現(xiàn)丟包。當一個報文被丟棄時,上層協(xié)議可能要求重傳,如果丟棄了許多報文,網(wǎng)絡(luò)就產(chǎn)生大量的重傳報文流量,這樣發(fā)展下去,網(wǎng)絡(luò)鏈路就會Down掉。通過利用率測量能及時發(fā)現(xiàn)問題,進行必要的負載均衡或路由調(diào)整,避免網(wǎng)絡(luò)癱瘓。 因此,對網(wǎng)絡(luò)接口利用率的測量可以說是利用率測量的重中之重。下面是兩個計算公式,依據(jù)所要測試的連接是半雙工還是全雙工使用其一。共享式局域網(wǎng)連接傾向于半雙工,因為設(shè)備在發(fā)送報文之前需要載波偵聽進行連接沖突檢測(CSMA/CD)。廣域網(wǎng)連接則是典型的全雙工,因為連接是點到點的,兩端的設(shè)備可以同時發(fā)送和接收報文。半
36、雙工連接的接口利用率計算公式:Utilization=ifInOctets+ifOutOctets*8*100間隔秒數(shù)*ifSpeed(3.5.1)對于全雙工來說利用率的測量是不同的:Utilizationin=ifInOctets*8*100間隔秒數(shù)*ifSpeed(3.5.2)Utilizationout=ifOutOctets*8*100間隔秒數(shù)*ifSpeed(3.5.3)上述公式看起來有些簡單,并沒有考慮特定的協(xié)議(Qos),但實際中使用證明,這種測量計算無論對局域網(wǎng)還是廣域網(wǎng)接口都是比較準確和的可靠的。 另外對大多數(shù)物理鏈路,接口利用率即是該鏈路的利用率,所以用Snmp Poll來
37、采集接口使用情況也是測量鏈路利用率的有效手段。2.7. CPU利用率我們知道一些關(guān)鍵的路由器功能如協(xié)議解析、包交換處理都在內(nèi)存里共享CPU的方式完成的。CPU利用率過高,就會造成路由表無法更新、包丟失等現(xiàn)象,嚴重影響網(wǎng)絡(luò)性能。 如何了解系統(tǒng)CPU利用率呢? 這里以Cisco設(shè)備為例,說明使用Snmp如何來獲得CPU利用率。首先確定CPU利用率所對應(yīng)的管理變量,在Cisco管理信息庫中,有兩個表包含著方面的信息一個表是(OLD-CISCO-CPU MIB)或(OLD-CISCO-SYS MIB);另外一個表則是(CISCO-PROCESS MIB)5。 對于單CPU系統(tǒng)來說,可以從上述兩個表中的響應(yīng)變量獲得CPU利用率。而多CPU系統(tǒng)則只能通過第二個表。2.8. 內(nèi)存利用率 監(jiān)測內(nèi)存使用狀況有助于發(fā)現(xiàn)內(nèi)存泄漏和不正常的網(wǎng)絡(luò)事件。當一個進程申請內(nèi)存塊獲得使用后卻不釋放時,就稱內(nèi)存泄漏了。持續(xù)的發(fā)生這種現(xiàn)象,就會用盡所有內(nèi)存,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《習(xí)題及答案》課件
- 藥物治療頸外動脈閉塞長期效果-洞察分析
- 線下體驗式營銷升級-洞察分析
- 水污染生物降解機制-洞察分析
- 虛擬農(nóng)場規(guī)劃與管理-洞察分析
- 心臟擴大康復(fù)訓(xùn)練策略-洞察分析
- 先進制造技術(shù)在航空應(yīng)用-洞察分析
- 脫硫自動化控制-洞察分析
- 《v消費者市場分析》課件
- 糖果巧克力市場趨勢分析-洞察分析
- 《銀屑病生物制劑達標治療共識》解讀課件
- 福州大學(xué)C#程序設(shè)計
- 胃鏡室護士長述職報告課件
- 收納家具調(diào)研報告
- 供應(yīng)商信息維護與變更規(guī)定
- 優(yōu)化家裝商店的客戶體驗與服務(wù)質(zhì)量
- 農(nóng)田春耕安全生產(chǎn)培訓(xùn)
- 吸氧護理課件
- 小型農(nóng)田水利初步設(shè)計
- 計算機導(dǎo)論試題及答案
- 2022-2023學(xué)年廣東省東莞市高二(上)期末英語試卷(含答案解析)
評論
0/150
提交評論