博科300光纖交換機(jī)故障診斷及處理方法_第1頁(yè)
博科300光纖交換機(jī)故障診斷及處理方法_第2頁(yè)
博科300光纖交換機(jī)故障診斷及處理方法_第3頁(yè)
博科300光纖交換機(jī)故障診斷及處理方法_第4頁(yè)
博科300光纖交換機(jī)故障診斷及處理方法_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一、博科300,5100,6500系列光纖交換機(jī)基本故障處理1、License某些功能需要License才能正常工作。多個(gè)交換機(jī)不能使用同一個(gè)License,請(qǐng)使用licenseshow命令查看,確保License已正確安裝。交換機(jī)功能運(yùn)行不正??赡茉蚝徒ㄗh措施可能未安裝License,請(qǐng)確定已安裝的License。1)連接到交換機(jī),并以擁有管理員權(quán)限的用戶名登錄。2)輸入licenseshow命令,查看當(dāng)前交換機(jī)上所安裝License的列表。2、時(shí)間不同步故障建立NTP有助于同步交換機(jī)的消息日志和Fabric內(nèi)其他交換機(jī)的端口日志,這將使查找定位問(wèn)題更為方便??赡茉蚝徒ㄗh措施:在Fabr

2、ic中,交換機(jī)上未建立NTP(Network Time Protocol)。建議在所有SAN和metaSAN的Fabric中的交換機(jī)都建立NTP。3、交換機(jī)消息日志交換機(jī)消息日志(RAS日志)包含了交換機(jī)或Fabric中所發(fā)事件的消息,這是一個(gè)了解交換機(jī)或Fabric運(yùn)行狀態(tài)的有效工具,每周檢查RAS日志非常必要,可以在早期發(fā)現(xiàn)問(wèn)題,避免小問(wèn)題成為大問(wèn)題。以下是交換機(jī)消息日志中一些常見(jiàn)的問(wèn)題:系統(tǒng)消息日志不準(zhǔn)確可能原因和建議措施:在極少數(shù)情況下,用TC(Track Change)功能追蹤到的事件會(huì)上報(bào)錯(cuò)誤的系統(tǒng)消息日志。例如,用戶輸入正確的用戶名和密碼,但無(wú)法登錄,這是因?yàn)橛脩魯?shù)量已滿。然而,

3、查看系統(tǒng)消息日志,發(fā)現(xiàn)報(bào)告登錄成功。如果交換機(jī)用戶達(dá)到了最大用戶數(shù),即使輸入正確的用戶名和密碼,登錄還是會(huì)失敗。但在這個(gè)例子中,TC向系統(tǒng)消息日志錯(cuò)誤地上報(bào)了此事件,導(dǎo)致顯示登錄成功。這種現(xiàn)象僅發(fā)生在已達(dá)到最大用戶數(shù)的情況下,其他情況下系統(tǒng)消息日志反映的都是真實(shí)情況。在交換機(jī)日志中出現(xiàn)MQ錯(cuò)誤可能原因和建議措施:MQ錯(cuò)誤是一個(gè)消息隊(duì)列錯(cuò)誤,通過(guò)尋找M和Q兩個(gè)字母后是否伴隨數(shù)字來(lái)辨別是否有MQ錯(cuò)誤。MQ錯(cuò)誤會(huì)導(dǎo)致設(shè)備從交換機(jī)的NS(Name Server)上斷開(kāi),或者致使交換機(jī)無(wú)法接入Fabric中。如下所示,在MQ錯(cuò)誤消息中,MQ后面跟著一個(gè)數(shù)字:2004/08/24-10:04:42, MQ

4、-1004, 218, ERROR, ras007, mqRead, queue = raslog-test- string0123456-raslog, queue ID = 1, type = 2MQ錯(cuò)誤非常罕見(jiàn),并且很難解決,需要與博科技術(shù)支持工程師合作來(lái)解決這個(gè)問(wèn)題。當(dāng)遇到一個(gè)MQ錯(cuò)誤,通過(guò)輸入supportsave命令來(lái)獲取交換機(jī)的調(diào)試信息,然后提交supportsave命令輸出的數(shù)據(jù)給博科技術(shù)支持工程師做進(jìn)一步分析。在交換機(jī)日志中出現(xiàn)I2C總線錯(cuò)誤可能原因:I2C總線錯(cuò)誤通常表明存在有出現(xiàn)故障的硬件、設(shè)備安裝不當(dāng)或插片安裝不當(dāng),具體的項(xiàng)目會(huì)列在錯(cuò)誤信息中。一些CPT(Chip-Po

5、rt)和EM(Environmental Monitor)消息中包含有I2C相關(guān)的消息。如果I2C消息并未表示出特定的硬件失效,依然需要調(diào)試硬件,因?yàn)檫@是最可能的原因。4、交換機(jī)開(kāi)機(jī)以及滾動(dòng)重啟檢測(cè)企業(yè)級(jí)平臺(tái)模式在初始化啟動(dòng)后又重新啟動(dòng)可能原因和建議措施:該問(wèn)題發(fā)生在企業(yè)級(jí)平臺(tái)上的主備CP刀片啟動(dòng)過(guò)程中。如果備CP在獲得HA同步并且其功能并未齊全之前,主CP上出現(xiàn)故障,那么備CP將無(wú)法采取積極措施成功執(zhí)行主備自動(dòng)切換功能。滾動(dòng)重啟檢測(cè)當(dāng) 交換機(jī)或企業(yè)級(jí)平臺(tái)連續(xù)出現(xiàn)意外重啟時(shí),就會(huì)發(fā)生滾動(dòng)重啟。系統(tǒng)未檢測(cè)到滾動(dòng)重啟之前,將持續(xù)重啟。滾動(dòng)重啟檢測(cè)(Rolling Reboot Detection,

6、RRD)發(fā)生時(shí),交換機(jī)處于穩(wěn)定狀態(tài)。這樣就可以收集最小的supportSave輸出并發(fā)送給服務(wù)支持供應(yīng)商進(jìn)行數(shù)據(jù)分析。在 RRD模式中,同樣支持USB設(shè)備。運(yùn)行usbstorage -e命令,開(kāi)啟USB設(shè)備。運(yùn)行supportsave -U -d MySupportSave命令,收集結(jié)果。不是每次重啟都會(huì)激活RRD特性。重啟分類在交換機(jī)和企業(yè)級(jí)平臺(tái)上會(huì)產(chǎn)生兩種類型的重啟:預(yù)期型和突發(fā)型。命令初始化而導(dǎo)致的重啟就是預(yù)期型重啟,這類重啟往往會(huì)被RRD特性忽略。這類命令包括:reboothaFailoverfastBootfirmwareDownload在某一時(shí)間段內(nèi),如果重啟歷史記錄中一直顯示突發(fā)

7、性重啟原因,那么RRD特性將會(huì)被激活,并阻斷重啟。RRD特性激活的時(shí)間取決于交換機(jī)。以下就是突發(fā)型重啟:復(fù)位交換機(jī)或CP的動(dòng)力循環(huán)Linux重啟命令硬件看門(mén)狗超時(shí)與心跳丟失有關(guān)的重啟軟件故障:內(nèi)核崩潰一旦系統(tǒng)檢測(cè)到內(nèi)部致命性且其無(wú)法進(jìn)行安全恢復(fù)的錯(cuò)誤,一般而言,系統(tǒng)會(huì)輸出一條錯(cuò)誤信息給控制臺(tái),轉(zhuǎn)儲(chǔ)堆棧跟蹤進(jìn)行調(diào)試,然后再執(zhí)行自動(dòng)重啟。在發(fā)生內(nèi)核崩潰以后,系統(tǒng)沒(méi)有足夠的時(shí)間寫(xiě)入重啟原因,從而導(dǎo)致重啟原因?yàn)榭?。這被視為復(fù)位案例。軟件故障軟件看門(mén)狗ASSERT軟件恢復(fù)失敗此類問(wèn)題與HA重啟有關(guān)。當(dāng)交換機(jī)無(wú)法恢復(fù)至穩(wěn)定狀態(tài)時(shí),此問(wèn)題就會(huì)出現(xiàn)。HASM日志包含此類故障的更加詳細(xì)和具體的信息,例如:故障恢

8、復(fù)失敗:出現(xiàn)在自動(dòng)切換故障并且CP必須重啟時(shí)。備CP對(duì)切換未準(zhǔn)備就緒時(shí)進(jìn)行的故障切換:出現(xiàn)在主CP需要故障切換,但備CP對(duì)接管主控權(quán)未準(zhǔn)備就緒時(shí)。未完成LS轉(zhuǎn)移時(shí)進(jìn)行的故障切換:出現(xiàn)在邏輯交換機(jī)事務(wù)還未處理完成時(shí)。軟件重啟失敗此類問(wèn)題與HA重啟相關(guān)。當(dāng)交換機(jī)無(wú)法加載固件至可用狀態(tài)時(shí),此問(wèn)題就會(huì)出現(xiàn)。HASM日志包含此類故障的更加詳細(xì)和具體的信息,例如:系統(tǒng)應(yīng)用超時(shí):CP未能在分配的時(shí)間內(nèi)完成切換。LS配置超時(shí)和失?。哼壿嫿粨Q機(jī)配置失敗和超時(shí)。在激活RRD后,以擁有管理員權(quán)限的用戶登錄。運(yùn)行supportShow或supportSave命令,收集一定量的數(shù)據(jù)解決問(wèn)題。二、博科300光纖交換機(jī)基本

9、故障處理1、鏈路問(wèn)題可以通過(guò)觀察交換機(jī)的端口指示燈狀態(tài)對(duì)鏈路問(wèn)題進(jìn)行排查。端口指示燈閃爍可能原因和建議措施:指示燈的顏色和閃爍頻率代表著不同的狀態(tài)。要確定端口指示燈或電源狀態(tài)指示燈上所指示的故障及建議的解決方案,請(qǐng)參見(jiàn)表1。表1 交換機(jī)指示燈狀態(tài)說(shuō)明LED指示燈名稱LED指示燈狀態(tài)硬件狀態(tài)建議操作電源LED指示燈(僅博科300)熄滅主電源線沒(méi)有連接、沒(méi)有上電或電源故障。請(qǐng)確保供電正常,并且電源線與正在供電的電源正確連接。綠色、常亮電源正常。無(wú)需處理。電源狀態(tài)LED指示燈熄滅系統(tǒng)關(guān)閉或內(nèi)部電源故障。1.   請(qǐng)查看系統(tǒng)是否上電。2.   

10、;請(qǐng)聯(lián)系博科技術(shù)支持工程師。綠色、常亮電源正常。無(wú)需處理。系統(tǒng)狀態(tài)LED指示燈熄滅系統(tǒng)關(guān)閉或無(wú)電源輸入。1.   請(qǐng)查看電源輸入是否正常。2.   請(qǐng)查看系統(tǒng)是否上電完成。3.   請(qǐng)聯(lián)系博科技術(shù)支持工程師。綠色、常亮系統(tǒng)正常運(yùn)行。無(wú)需處理。黃色、常亮(超過(guò)5秒)系統(tǒng)出錯(cuò)。1.   請(qǐng)使用串口重新啟動(dòng)系統(tǒng)。2.   請(qǐng)檢查系統(tǒng)控制臺(tái)上的故障。3.   請(qǐng)聯(lián)系博科技術(shù)支持工程師。黃色/綠色、閃爍單電源故障、風(fēng)扇故障或環(huán)

11、境不滿足交換機(jī)要求等因素可能會(huì)引發(fā)此狀態(tài)。請(qǐng)查看管理網(wǎng)口和錯(cuò)誤日志,并進(jìn)行相應(yīng)處理。以太網(wǎng)速率LED指示燈熄滅端口速率為10Mbit/s。無(wú)需處理。綠色、常亮端口速率為100Mbit/s。無(wú)需處理。以太網(wǎng)鏈路指示燈熄滅無(wú)鏈路或鏈路斷開(kāi)。· 如果此端口未使用,則無(wú)需處理。· 如果此端口正在使用,請(qǐng)修復(fù)鏈路。黃色/綠色、常亮鏈路已建立。無(wú)需處理。黃色/綠色、閃爍鏈路中有數(shù)據(jù)傳輸。無(wú)需處理。端口狀態(tài)LED指示燈熄滅無(wú)信號(hào)或光載波。請(qǐng)確認(rèn)收發(fā)器已正確安裝且線纜已正確連接。綠色、緩慢閃爍(2秒閃一次)端口在線,但由于回環(huán)線纜或不相容的交換機(jī)連接而產(chǎn)生分段。無(wú)需處理。綠色、快速閃爍(0

12、.5秒閃一次)端口在線且正在進(jìn)行內(nèi)部回環(huán)診斷測(cè)試。無(wú)需處理。綠色、無(wú)規(guī)則閃爍端口在線,存在幀正在通過(guò)端口。無(wú)需處理。綠色、常亮端口在線且與設(shè)備相連,但無(wú)流量。無(wú)需處理。黃色、緩慢閃爍(2秒閃一次)由于診斷或使用了portdisable關(guān)閉端口,端口關(guān)閉。驗(yàn)證沒(méi)有進(jìn)行診斷測(cè)試,診斷測(cè)試完畢后,執(zhí)行portenable命令重新開(kāi)啟端口。黃色、快速閃爍(0.5秒閃一次)端口故障。請(qǐng)檢查管理網(wǎng)口和錯(cuò)誤日志,并進(jìn)行相應(yīng)處理。黃色、常亮(超過(guò)5秒)端口正以4Gbit/s的速率接收光或信號(hào)載波,但處于離線狀態(tài)。無(wú)需處理。電源和風(fēng)扇模塊LED指示燈(僅博科5100,6500系列)熄滅電源和風(fēng)扇模塊未上電完成或

13、無(wú)電源供電。請(qǐng)確保供電正常,并且電源線與正在供電的電源正確連接。綠色、常亮電源和風(fēng)扇模塊正常運(yùn)行。無(wú)需處理。綠色、閃爍電源和風(fēng)扇模塊故障。說(shuō)明:當(dāng)交換機(jī)第一次上電時(shí),電源和風(fēng)扇模塊LED指示燈會(huì)出現(xiàn)此狀態(tài)。1.   請(qǐng)確保電源線正確連接。2.   請(qǐng)更換電源和風(fēng)扇模塊。端口指示燈長(zhǎng)亮可能原因和建議措施:該端口指示燈長(zhǎng)亮?xí)r不同的顏色代表著不同的狀態(tài)。要確定端口指示燈或電源狀態(tài)指示燈上所指示的故障及建議的解決方案,請(qǐng)參見(jiàn)表1。端口指示燈不亮可能原因和建議措施:如果端口指示燈不亮,說(shuō)明沒(méi)有檢測(cè)到信號(hào)。請(qǐng)檢查電纜和SFP接口來(lái)確定物理故障。2

14、、鏈路故障當(dāng)服務(wù)器、存儲(chǔ)設(shè)備或交換設(shè)備連接到交換機(jī)上,但兩臺(tái)設(shè)備間的鏈路不通時(shí),會(huì)發(fā)生鏈路故障,阻礙設(shè)備與交換機(jī)之間的通信。如果通過(guò)輸入switchshow命令或者觀察指示燈發(fā)現(xiàn)鏈路連接錯(cuò)誤,可進(jìn)行以下操作步驟。實(shí)現(xiàn)可用速率匹配說(shuō)明:如果端口的速率通過(guò)使用portcfgspeed命令設(shè)置為靜態(tài)速率,請(qǐng)忽略以下操作。實(shí)現(xiàn)可用速率的操作步驟如下。1)使用portcfgshow命令,可查看所有端口的端口速率。2)輸入switchshow命令,以確定端口上是否有光模塊。3) 根據(jù)兩個(gè)設(shè)備能夠共用的端口速率,使用portcfgspeed命令將速率修改為1Gbit/s(僅SNS2124支持)、2Gbit/

15、s、4Gbit /s、8Gbit/s、10Gbit/s(僅SNS2248支持)或16Gbit/s(僅SNS2224和SNS2248支持),通過(guò)設(shè)置速率能夠使匹配 成功。4)輸入portlogshow或者portLogdump命令。5)查看該命令的輸出:time                task     event        port  &

16、#160;     cmd       args-14:38:51.976       SPEE        sn        <Port#>     NC        00000001,00000000,0000000114:39

17、:39.227       SPEE        sn        <Port#>     NC        00000002,00000000,00000001在“event”列,“sn”表示速率匹配。在“cmd”列,“NC”表示完成匹配。如果這些字段沒(méi)有出現(xiàn),請(qǐng)繼續(xù)第6步的操作。6)請(qǐng)通過(guò)輸入portcfg

18、speed (序列號(hào)/端口號(hào))和speed_level命令來(lái)完成速率匹配。switch:admin> portcfgspeedUsage: portCfgSpeed PortNumber    Speed_LevelSpeed_Level: 0    - Auto Negotiate             1    - 1Gbps    &

19、#160;        2    - 2Gbps             4    - 4Gbps             8    - 8Gbps    &

20、#160;        ax - Auto Negotiate + enhanced retries環(huán)路初始化失敗檢查1)證端口是L_Port。輸入switchshow命令。檢查輸出的最后字段,驗(yàn)證交換機(jī)端口是否為L(zhǎng)_Port。如果一個(gè)環(huán)路設(shè)備連接到交換機(jī),交換機(jī)端口必須初始化為L(zhǎng)_Port。檢查端口是否處于上線狀態(tài),如果不是上線狀態(tài),請(qǐng)檢查是否出現(xiàn)了鏈路故障問(wèn)題。上線狀態(tài)下L_Port舉例:Area   Port  Media   Speed   St

21、ate            Proto        =        (output truncated)        66     66    -      N8

22、      No_Module        67     67    id      AN      No_Sync        68     68    id

23、60;     N2      Online        L_Port 13 public2)如果環(huán)路設(shè)備所在端口不是L_Port,檢查環(huán)路是否初始化。輸入portlogshow或portlogdump命令,顯示交換機(jī)上所有端口的端口日志。如果正在尋找一個(gè)特定端口,輸入portlogdumpport命令。檢查L(zhǎng)ISA(Loop Initialization Soft Assigned)框架0x11050100的第四項(xiàng)參數(shù):switch

24、:admin> portlogdumpport 4    time              task       event   port    cmd       args    -    11:40:02.078 &#

25、160;     PORT     Rx3      23          20        22000000,00000000,ffffffff,11050100    Received LISA frame輸出中顯示的“LISA frame”表明環(huán)路初始化已完成。3)輸入portcfglport命令,跳過(guò)點(diǎn)對(duì)點(diǎn)的初始化。在環(huán)路初始化的LISA階段之后,交換機(jī)轉(zhuǎn)為點(diǎn)對(duì)點(diǎn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論