




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、故障處理業(yè)務技術(shù)規(guī)范RG-erCache 產(chǎn)品2012-05-31福建星網(wǎng)銳捷網(wǎng)絡文件類型: 故障處理類版本號:V1.0文檔作者:TAC文檔密級: 受控內(nèi)審人:使用對象:ASE、PMC、RSC福建星網(wǎng)銳捷網(wǎng)絡2000-2011銳捷網(wǎng)絡,并保留對本手冊及本的一切權(quán)利。未得到銳捷網(wǎng)絡的,任何人不得以任何方式或形式對本手冊內(nèi)的任何部分進行商業(yè)用途。、摘錄、備份、修改、翻譯成其他語言、將其全部或部分用于、都是星網(wǎng)銳捷網(wǎng)絡的商標,不得仿冒。技術(shù)支持銳捷網(wǎng)絡: 天*24 小時技術(shù)服務:4008-111-000銳捷網(wǎng)絡技術(shù): HYPERLINK http:/ http:/銳捷網(wǎng)絡技術(shù)支持與反饋信箱:.cn銳
2、捷網(wǎng)絡: HYPERLINK http:/ http:/您可以在每周一至周五早8:30至晚6點,通過“”獲得信息咨詢、調(diào)試排障、軟件等技術(shù)支持。無需客戶端,可以即時截圖、發(fā)附件,方便快捷。銳捷網(wǎng)絡技術(shù)支持中心: 安裝手冊本手冊介紹了產(chǎn)品在功能和物理上的一些特性,提供了設備安裝步驟、硬件故障排除、模塊技術(shù)規(guī)格,以及電纜和連接器的規(guī)格和使用準則等。產(chǎn)品 配置手冊詳細的產(chǎn)品各功能配置手冊產(chǎn)品 命令手冊本手冊對產(chǎn)品支持的配置命令做了詳細的描述。包括命令模式、參數(shù)說明和使用指南等,并配有具體的實例。1前言讀者對象本文檔是作為故障排查業(yè)務的配套技術(shù)規(guī)范,講述了 RG-erCache 產(chǎn)品在故障處理業(yè)務中需
3、要掌握的的重點技術(shù)規(guī)范,在故障分析,信息收集,故障定位,解決方案實施等各個環(huán)節(jié)的操作建議,并給出了相關(guān)告警與日志分析以及典型案例的解決方操作標準,幫助提高故障處理業(yè)務的效率。范工本文檔主要適用于以下工:l工l調(diào)測工l網(wǎng)絡工修訂日期修訂說明執(zhí)行人2012-5-31第一次發(fā)布此文檔僅限公司,嚴禁外傳。如果您在閱讀中產(chǎn)生疑問,請與文檔人聯(lián)系。2目錄1234前言4目錄5常用故障信息收集8硬件類故障9硬盤類故障處理9故障現(xiàn)象9故障處理流程9故障處理步驟10RAID 類故障處理10故障現(xiàn)象10故障處理流程11故障處理步驟11CPU 類故障處理12故障現(xiàn)象12故障處理流程12故障處理步驟12內(nèi)存類故障處理1
4、3故障現(xiàn)象13故障處理流程13故障處理步驟14系統(tǒng)類故障15Web 界面無法打開故障處理16故障現(xiàn)象16故障處理流程16故障處理步驟16更改控制臺端口后,重新初始化 web 界面 443 端口不能連接故障處理17故障現(xiàn)象17故障處理流程17故障處理步驟17忘記信任 IP 地址故障處理18故障現(xiàn)象18故障處理流程18故障處理步驟1855.4 忘記 web 界面 administrator故障處理19故障現(xiàn)象19故障處理流程19故障處理步驟195.5 忘記root. 205.5.1 故障現(xiàn)象20故障處理流程20故障處理步驟205.6 主機不能登陸21故障現(xiàn)象21故障處理流程21故障處理步驟215.
5、7 搜狗瀏覽器不能正常重定向緩存文件故障處理22故障現(xiàn)象22故障處理流程22故障處理步驟235.8 增加網(wǎng)卡配置需求23故障現(xiàn)象23故障處理流程23故障處理步驟24服務器異常死機故障處理24故障現(xiàn)象24故障處理流程24故障處理步驟24清除和替換Cache 故障硬盤故障處理25故障現(xiàn)象25故障處理流程25故障處理步驟25修改Cache IP 地址故障處理29故障現(xiàn)象29故障處理流程29故障處理步驟29清除 cache 緩存文件故障處理30故障現(xiàn)象30故障處理流程30故障處理步驟30更改 BT 硬盤為HTTP 硬盤故障處理32故障現(xiàn)象32故障處理流程32故障處理步驟32系統(tǒng)根目錄使用率 100%故
6、障處理33故障現(xiàn)象33故障處理流程33故障處理步驟34opt 目錄使用率 100%故障處理35故障現(xiàn)象35故障處理流程36故障處理步驟36從服務器加入主服務器集群中,無法選擇從服務器查看統(tǒng)計報表信息故障處理37故障現(xiàn)象37故障處理流程375.16.3 故障處理步驟38Cache 提供了錯誤的緩存文件故障處理38故障現(xiàn)象38故障處理流程38故障處理步驟39刪除集群中的從服務器故障處理39故障現(xiàn)象39故障處理流程39故障處理步驟40網(wǎng)絡類故障4166.1 正確部署緩存后,無HTTP 和流服務流量41故障現(xiàn)象41故障處理流程42故障處理步驟426.2 緩存系統(tǒng)不能用戶請求數(shù)據(jù)包43故障現(xiàn)象43故障處
7、理流程43故障處理步驟436.3 開啟緩存服務后,系統(tǒng)不能. 44故障現(xiàn)象44故障處理流程44故障處理步驟446.4 無法通過SNMP 協(xié)議erCache 系統(tǒng)44故障現(xiàn)象44故障處理流程45故障處理步驟45erCache 通信網(wǎng)卡丟包故障處理46故障現(xiàn)象46故障處理流程46故障處理步驟466.57兼容類故障47故障處理流程47故障處理步驟473常用故障信息收集故障處理的初期階段做好與故障相關(guān)的各種基本信息的收集工作,可以幫助范圍,提高故障定位的準確性。對于Cache故障來說,常用的故障基本信息搜集縮小定位故障的令如下:信息項使用命令使用說明CPU 信息查看 CPU 利用率及各種應用進程 CP
8、U 的情況CPU 利用率是分析er Cache 響應慢的重要內(nèi)存利用率查看er Cache 內(nèi)存占用情況,是分析設備是否存在內(nèi)存溢出的必須端口狀態(tài)顯示網(wǎng)卡的狀態(tài)(包括雙工、速率、模式等)可以顯示網(wǎng)卡的詳細統(tǒng)計信息(包括報文速率、CRC 等異常丟包統(tǒng)計信息,用來評估網(wǎng)絡環(huán)境的重要信息網(wǎng)絡通信顯示網(wǎng)卡及路由的詳細信息(包括 IP 地址、子網(wǎng)掩碼、網(wǎng)關(guān)、DNS、主機路由表等)日志查看日志信息,包括故障關(guān)聯(lián)周邊設備的Log 信息都是非常關(guān)鍵的。系統(tǒng)日志是排查 er Cache 問題的重要線索。通過日志可以查詢 er Cache 各服務是否工作正常。異常信息查看顯示 er Cache 的異常錯誤信息。該
9、信息是分析硬件故障引起的 er Cache 異常錯誤的重要線索。dmesgcat /var/log/messagescat admin.log cat sniffer.logcat downloader.logtail -f acs.logifconfig routecat /etc/resolv.confethtool eth0free -mtop建議erCache 類的故障,以下信息作為常用故障基本信息作為每次故障信息的必備收集內(nèi)容。4硬件類故障關(guān)于本章4.1.1 故障現(xiàn)象硬盤作為服務器,與普通單機電腦硬盤一樣,隨時可能因使用年限過長、硬盤自身質(zhì)量問題以及不良操作等原因造成各種服務器硬盤故
10、障(如硬盤壞道、磁頭不穩(wěn)定、盤片劃傷等),譬如當服務器出現(xiàn)頻繁死機、無征兆重啟等現(xiàn)象時則有可能是服務器硬盤出現(xiàn)了物理壞道,需服務器數(shù)據(jù)安全管理提高警惕。4.1.2 故障處理流程硬盤類故障通常是由于硬盤安裝故障處理流程如下:或接口松動、硬盤自身質(zhì)量問題、硬盤槽位硬件故障引起的。4.1 硬盤類故障處理章節(jié)內(nèi)容介紹4.1 硬盤類故障介紹了硬盤類故障的處理思路。4.2 RAID卡類故障介紹RAID卡類故障處理思路。4.3 CPU類故障介紹CPU類故障處理思路。4.4 內(nèi)存類故障介紹內(nèi)存類故障處理思路。確定硬件是否插緊,檢查接插件是否有損壞確定基本連接正常嘗試更換硬件槽位、硬件替換排除硬件故障排除硬件故
11、障撥打支持并傳回收集信息尋求故障解決幫助4.1.3 故障處理步驟步驟 1檢查并確定硬件是否插緊,檢查接插件是否有損壞,可嘗試重新插拔硬件,以便確定硬件是否連接正常。對于插拔時,受到阻力或感覺不順暢的時候,請不要強行大力或撥出,需要立即停止操作。并緩慢移出硬件,確認硬件和背板相連的接插件是否松動或明顯變形現(xiàn)象,確認硬件是否存在明顯變形的情況,確認背板槽上的接插件是否被折彎或明顯變型現(xiàn)象。如條件具備,強烈建議對接插件進行詳細拍照并。步驟 2嘗試更換硬件槽位、硬件替換排除硬件故障。步驟 3撥打 400,尋求故障解決幫助。4.2.1 故障現(xiàn)象服務器具有海量的功能,這主要源于其采用 RAID 卡模式。常
12、見的服務器陣列包括 RAID0、,甚至數(shù)據(jù)丟失,嚴重影響服務器數(shù)據(jù)RAID1、RAID5 等,一旦出現(xiàn)故障,將直接導致服務器數(shù)據(jù)不可4.2 RAID 類故障處理安全管理。經(jīng)常表現(xiàn)為 RAID 信息丟失,硬盤經(jīng)常掉線,不能做 REBUILD,開機自檢時檢測不到硬盤或需要較長時間4.2.2 故障處理流程RAID 卡類故障通常是由于 RAID 卡安裝故障引起的。故障處理流程如下:或接口松動、RAID 卡自身質(zhì)量問題、RAID 卡槽位硬件確定硬件是否插緊,檢查接插件是否有損壞確定基本連接正常嘗試更換硬件槽位、硬件替換排除硬件故障排除硬件故障撥打支持并傳回收集信息尋求故障解決幫助4.2.3 故障處理步驟
13、步驟 1檢查并確定硬件是否插緊,檢查接插件是否有損壞,可嘗試重新插拔硬件,以便確定硬件是否連接正常。對于插拔時,受到阻力或感覺不順暢的時候,請不要強行大力或撥出,需要立即停止操作。并緩慢移出硬件,確認硬件和背板相連的接插件是否松動或明顯變形現(xiàn)象,確認硬件是否存在明顯變形的情況,確認背板槽上的接插件是否被折彎或明顯變型現(xiàn)象。如條件具備,強烈建議對接插件進行詳細拍照并。步驟 2嘗試更換硬件槽位、硬件替換排除硬件故障。步驟 3撥打 400,尋求故障解決幫助。4.3.1 故障現(xiàn)象服務器處理器 CPU 出現(xiàn)故障時,通常表現(xiàn)為服務器無法啟動(一般會有現(xiàn)象。聲)、服務器莫名死機等4.3.2 故障處理流程CP
14、U 類故障通常是由于 CPU 安裝故障處理流程如下:或接口松動、CPU 自身質(zhì)量問題、CPU 槽位硬件故障引起的。確定硬件是否插緊,檢查接插件是否有損壞確定基本連接正常嘗試更換硬件槽位、硬件替換排除硬件故障排除硬件故障撥打支持并傳回收集信息尋求故障解決幫助4.3.3 故障處理步驟步驟 1檢查并確定硬件是否插緊,檢查接插件是否有損壞,可嘗試重新插拔硬件,以便確定硬件是否連接正常。對于插拔時,受到阻力或感覺不順暢的時候,請不要強行大力或撥出,需要立即停止操作。并緩慢移出硬件,確認硬件和背板相連的接插件是否松動或明顯變形現(xiàn)象,確認硬件4.3 CPU 類故障處理是否存在明顯變形的情況,確認背板槽上的接
15、插件是否被折彎或明顯變型現(xiàn)象。如條件具備,強烈建議對接插件進行詳細拍照并。步驟 2嘗試更換硬件槽位、硬件替換排除硬件故障。步驟 3撥打 400,尋求故障解決幫助。4.4.1 故障現(xiàn)象內(nèi)存和 CPU 一樣是服務器成員,內(nèi)存可能因自身承載的服務過多,而導致服務器處理數(shù)據(jù)時速度越來越慢,甚至出現(xiàn)內(nèi)存系統(tǒng)頻繁重啟(可從 BIOS 錯誤等現(xiàn)象。中查出)、服務器無法啟動(一般伴有聲)4.4.2 故障處理流程內(nèi)存類故障通常是由于內(nèi)存安裝故障處理流程如下:或接口松動、內(nèi)存自身質(zhì)量問題、內(nèi)存槽位硬件故障引起的。確定硬件是否插緊,檢查接插件是否有損壞確定基本連接正常嘗試更換硬件槽位、硬件替換排除硬件故障排除硬件故
16、障撥打支持并傳回收集信息尋求故障解決幫助4.4 內(nèi)存類故障處理4.4.3 故障處理步驟步驟 1檢查并確定硬件是否插緊,檢查接插件是否有損壞,可嘗試重新插拔硬件,以便確定硬件是否連接正常。對于插拔時,受到阻力或感覺不順暢的時候,請不要強行大力或撥出,需要立即停止操作。并緩慢移出硬件,確認硬件和背板相連的接插件是否松動或明顯變形現(xiàn)象,確認硬件是否存在明顯變形的情況,確認背板槽上的接插件是否被折彎或明顯變型現(xiàn)象。如條件具備,強烈建議對接插件進行詳細拍照并。步驟 2嘗試更換硬件槽位、硬件替換排除硬件故障。步驟 3撥打 400,尋求故障解決幫助。5系統(tǒng)類故障關(guān)于本章章節(jié)內(nèi)容介紹5.1 web界面無法打開
17、故障處理介紹了web界面無法打開故障處理思路。5.2 更改控制臺端口后,重新初始化 web界面443端口不能連接故障處理介紹更改控制臺端口后,重新初始化web界面443端口不能連接故障處理思路。5.3 忘記信任IP故障處理介紹忘記系統(tǒng)信任IP故障處理思路。5.4 忘記web頁面administrator密碼故障處理介紹忘記web頁面administrator故障處理思路。5.5 忘記roo故障處理介紹忘記roo故障處理思路5.6主機不能登錄故障處理介紹主機不能登錄故障處理思路5.7搜狗瀏覽器不能正常重定向緩存文件故障處理介紹搜狗瀏覽器不能正常重定向緩存文件故障處理思路5.8增加網(wǎng)卡配置故障處理
18、介紹增加網(wǎng)卡配置故障處理思路5.9服務器異常死機故障處理介紹服務器異常死機故障處理思路5.10清除和替換cache故障硬盤故障處理介紹清除和替換 cache 故障硬盤故障處理思路5.11 修改cache ip地址故障處理介紹修改 cache ip 地址故障處理思路5.12清除cache緩存文件故障處理介紹清除 cache 緩存文件故障處理思路5.13 更改BT硬盤為HTTP硬盤故障處理介紹更改 BT 硬盤為HTTP 硬盤故障處理思路5.14 系統(tǒng)根目錄使用100%故障處理介紹系統(tǒng)根目錄使用 100%故障處理思路5.15 opt目錄使用率100%故障處理介紹 opt 目錄使用率 100%故障處理
19、思路5.16 從服務器加入主服務器集群,不能查看從服務器統(tǒng)計報表故障處理介紹從服務器加入主服務器集群,不能查看從服務器統(tǒng)計報表故障處理思路5.17 刪除集群中從服務器故障處理介紹刪除集群中從服務器故障處理思路5.1.1 故障現(xiàn)象能正常登錄系統(tǒng)初始化 web 界面,但初始化后只能夠 SSH 登錄系統(tǒng),不能通過 web 界面登錄系統(tǒng)5.1.2 故障處理流程此故障是由于工誤操作導致系統(tǒng)初始化沒有正常完成(初始化時er Cache 意外掉電關(guān)機)導致的。故障處理流程如下:443 端檢查系統(tǒng)口是否開放重新初始化緩存系統(tǒng)撥打支持并傳回收集信息5.1.3 故障處理步驟步驟1ssh 登陸er Cache步驟2
20、rootRG-erCache xcache#iptables-save 通過此命令查看是否開啟 443 端口請檢查列表中是否有-A RH-Firewall-1-INPUT -p tcp -m se -se NEW -m tcp -dport 443-j ACCEPT 條目,如沒有此條,需要將其加入/etc/sysconfig/iptables 文件中,然后通過/etc/init.d/iptables restart 命令重啟服務。在測試是否能正常登陸系統(tǒng)web 界面。如5.1 Web 界面無法打開故障處理果不能請繼續(xù)下一步步驟3rootRG-erCache xcache# cd /opt/xc
21、ache/步驟4rootRG-erCache xcache# /etc/init.d/xcached re步驟5撥打 400,尋求故障解決幫助。5.2.1 故障現(xiàn)象在 web 界面恢復出廠設置,重新初始化后,web 界面不能連接5.2.2 故障處理流程此故障一般是由于更改控制臺端口后,也同步更改了端,重新初始化,系統(tǒng)不會將防火端口修改為默認 443 端。導致 web 界面不能登陸。故障處理流程如下:檢查系統(tǒng)口是否開放443 端撥打支持并傳回收集信息5.2.3 故障處理步驟步驟1ssh 登陸er Cache步驟2rootRG-erCache xcache# iptables-save 通過此命令
22、查看是否開啟 443 端口5.2 更改控制臺端口后,重新初始化 web 界面 443 端口不能連接故障處理請檢查列表中是否有-A RH-Firewall-1-INPUT -p tcp -m se -se NEW -m tcp -dport 443-j ACCEPT 條目,如沒有此條,需要將其加入/etc/sysconfig/iptables 文件中,然后通過/etc/init.d/iptables restart 命令重啟服務。在測試是否能正常登陸系統(tǒng) web 界面。步驟3撥打 400,尋求故障解決幫助。5.3.1 故障現(xiàn)象用戶正確輸入用戶名后,系統(tǒng)提示為“非信任 IP”錯誤5.3.2 故障處
23、理流程故障處理流程如下:檢查/opt/xcache/conf/user.conf 文件trustedip 選項設置撥打支持并傳回收集信息5.3.3 故障處理步驟步驟 1步驟 2ssh 登陸er CacherootRG-erCache # vi /opt/xcache/conf/user.conf請檢查列表中trustedIp 選項配置,此選項配置了信任 IP,可查看系統(tǒng)信任 IP 或修改系統(tǒng)信任 IP null 代表信任所有 IP 修改完后,通過/etc/init.d/xcached restart 命令重啟緩存服務生效。5.3 忘記信任 IP 地址故障處理步驟 3撥打 400,尋求故障解決幫
24、助。5.4.1 故障現(xiàn)象忘記系統(tǒng) web 界面,導致不能正常登陸系統(tǒng)5.4.2 故障處理流程故障處理流程如下:檢查/opt/xcache/conf/user.conf 文件password 選項設置撥打支持并傳回收集信息5.4.3 故障處理步驟步驟 1步驟 2ssh 登陸er CacherootRG-erCache # vi /opt/xcache/conf/user.conf請檢查列表中password 選項配置,將此選項值修改為 0DPiKuNIrrVmD8IUCuw1hQxNqZc=改為 admin 修改完后,通過/etc/init.d/xcached restart 命令重啟緩存服務生
25、效。步驟 3撥打 400,尋求故障解決幫助。5.4 忘記web 界面 administrator故障處理5.5.1 故障現(xiàn)象由于 root 用戶忘記 導致不能正常登陸系統(tǒng)5.5.2 故障處理流程故障處理流程如下開機修改 root撥打支持并傳回收集信息5.5.3 故障處理步驟步驟 1開機啟動的時候按下e鍵.出現(xiàn)菜單RuiJie,再按e鍵進入二級菜單,出現(xiàn) 3 個選項:root (hd0,0)RuiJieOS (2.6.18-128.el5PAE)kernel /vmlinuz-2.6.18-128.el5PAE ro root=LABEL=/ rhgb quietinitrd /initrd-2
26、.6.18-128.el5PAE.img步驟 2用光標鍵選中第二行,再按e鍵,在 rhgb 后面增加 single(注意 rhgb 后面有一空格),然后回車,再按b,即可啟動到單用戶模式,出現(xiàn) rootmaster log# 提示符. rootmasterlog# .5.5 忘記root步驟 3修改.在提示符后面輸入: passwd root回車,提示輸入新登陸了。,輸入 2 次,系統(tǒng)確認。然后再輸入 reboot, 重新啟動系統(tǒng)即可用新步驟 4撥打 400,尋求故障解決幫助。5.6.1 故障現(xiàn)象通過 SSH 方式無法連接系統(tǒng)5.6.2 故障處理流程故障處理流程如下測試網(wǎng)絡的連通性檢查22 端
27、口是否開啟重啟 ssh 服務撥打支持并傳回收集信息5.6.3 故障處理步驟步驟 1通過命令檢查系統(tǒng)的連通性5.6 主機不能登陸步驟 2檢查22 端口是否開啟步驟 3通過/etc/init.d/sshd restart 命令重啟 ssh 服務步驟 4撥打 400,尋求故障解決幫助。5.7.1 故障現(xiàn)象IE 瀏覽器能夠正常重定向緩存文件,搜狗瀏覽器不能正常重定向緩存文件5.7.2 故障處理流程此 故 障 是 由 于 由 于 系 統(tǒng) 配 置 誤 操 作 , 導 致 /opt/xcache/conf/perties“application.host= ”選項 IP 地址部分多了一個空格。導致數(shù)據(jù)庫 U
28、RL IP 地址部分多了一個空格標識(%20),IE 瀏覽器能自動清除空格標識,搜狗瀏覽器不能自動清除空格標識。 故障處理流程如下驗證 IE 瀏覽器是否能正常重定向緩存文件驗證搜狗瀏覽器是否能夠正常重定向件緩存文撥打支持并傳回收集信息5.7 搜狗瀏覽器不能正常重定向緩存文件故障處理5.7.3 故障處理步驟步驟 1通過 IE 瀏覽器測試是否能正常重定向緩存文件,如果能,請進行下一步排查,如果不能請檢查網(wǎng)絡問題。步驟 2測試搜狗瀏覽器是否能正常重定向緩存文件,若不能請執(zhí)行如下操作步驟重新更新數(shù)據(jù)庫 host 字段可以解決此問題。ssh 登陸er Cacheapplication -e update
29、 http_filessethost=;/etc/init.d/xcached restart步驟 3撥打 400,尋求故障解決幫助。5.8.1 故障現(xiàn)象新增網(wǎng)卡后,cache 無法新增網(wǎng)卡數(shù)據(jù)5.8.2 故障處理流程故障處理流程如下:檢查/opt/xcache/conf/perties文件是否配置新增網(wǎng)卡撥打支持并傳回收集信息5.8 增加網(wǎng)卡配置需求5.8.3 故障處理步驟步驟1檢查/opt/xcache/conf/perties 文件sniffer.device=選項是否配置了新增監(jiān)聽網(wǎng)卡,如果沒有配置,請執(zhí)行如下操作ssh 18 登陸er Cachevi /opt/xcache/conf
30、/perties聽網(wǎng)卡選項,不同網(wǎng)卡見用“;”號隔開/etc/init.d/xcached restart“sniffer.device=eth2;eth3”選項為監(jiān)步驟 2撥打 400,尋求故障解決幫助。5.9.1 故障現(xiàn)象不能通連接主機,顯示器無輸出信息,鍵盤不能操作5.9.2 故障處理流程故障處理流程如下:檢查 message 日志是否異常撥打支持并傳回收集信息5.9.3 故障處理步驟步驟 1檢查 message 日志是否有異常錯誤,如硬盤錯誤、CPU 錯誤、內(nèi)存錯誤等步驟 2撥打 400,尋求故障解決幫助。5.9 服務器異常死機故障處理5.10.1 故障現(xiàn)象系統(tǒng)無法識別硬盤、硬盤無法讀
31、寫,重啟故障依然存在。此故障會導致用戶文件,因此,當硬盤出現(xiàn)故障時,請及時清除。故障硬盤文件時無法5.10.2 故障處理流程故障處理流程如下:系統(tǒng)是否能正別故障硬盤清除故障硬盤替換故障硬盤5.10.3 故障處理步驟步驟 1檢查系統(tǒng)是否能正別故障硬盤,可通過 fdisk l 命令查看??赏ㄟ^拔插硬盤、更換槽位來測試硬盤是否正常,如系統(tǒng)不能識別硬盤,請執(zhí)行步驟 3 操作。如系統(tǒng)能識別硬盤,請執(zhí)行步驟 2 操作。步驟 2硬盤是否能夠正常進行讀寫操作??赏ㄟ^如下命令進試進入硬盤所在的分區(qū),通過 ls touch 命令測試硬盤是否可讀寫。如系統(tǒng)不能正常讀寫,請執(zhí)撥打支持并傳回收集信息硬盤讀寫是否正常5.
32、10 清除和替換 Cache 故障硬盤故障處理下一步操作。步驟 3清除故障硬盤,具體操作步驟如下以緩存服務器 IP 地址:18 硬盤目錄:/data1 為例一、停止緩存服務:cd /opt/xcache/etc/init.d/xcached stop/etc/init.d/nginx stop二、緩存文件數(shù)據(jù)庫:./bin/config.sh cache cleanfiles 18 /data1./bin/config.sh cache cleanfiles host disk注解:(刪除硬盤數(shù)據(jù)庫參數(shù)說明)三、刪除緩存文件:cd /rm -rf /data1/*四、取消分區(qū)掛載umount
33、/data1五、刪除分區(qū)目錄rm -rf /data1六、修改配置文件/etc/fstab 文件vi /etc/fstab刪除一行配置文本:LABEL=/data1/data1ext3defaults 0 0緩存服務配置文件:vi /opt/xcache/conf/perties刪除/data1 緩存目錄七、重啟緩存服務/etc/init.d/xcache restart步驟 4替換 cache 故障硬盤,具體操作步驟如下一、首先使用命令查看硬盤設備列表:fdisk -l二、給其中一塊硬盤創(chuàng)建分區(qū):fdisk /dev/sdb根據(jù)情況,輸入n(回車)p(回車)1(回車)(回車)(回車)w(回車
34、)注釋:硬盤與分區(qū)對應關(guān)系(sdb 對應/data1、sdc 對應/data2、sdd 對應/data3、sde 對應/data4、sdf 對應/data5、sdg 對應/data7、sdh 對應/data8、sdi 對應/data9、sdj 對應/dataA、sdk對應/dataB、sdl 對應/d)三、格式化分區(qū):mkfs.ext3 -L /data1 /dev/sdb1四、掛載分區(qū):mkdir -p /data1echo LABEL=/data1/data1ext3defaults 0 0 /etc/fstabmount -a五、緩存服務配置文件:vi /opt/xcache/conf/
35、perties增加/data1 緩存目錄六、重啟緩存服務/etc/init.d/xcache restart5.11.1 故障現(xiàn)象修改 cache 網(wǎng)卡 IP 地址后,所有 cache 已緩存的資源都不可用5.11.2 故障處理流程故障處理流程如下:更新 cache 軟件配置及數(shù)據(jù)庫撥打支持并傳回收集信息5.11.3 故障處理步驟步驟 1更新 cache 軟件配置及數(shù)據(jù)庫,具體操作步驟如下:請首先將服務器的 IP 地址網(wǎng)絡設置修改啟用新的 IP 地址。下面的例子將修改址從 2 到 2IP 服務器地一、更新 cache 配置 IP:cd /opt/xcache./bin/config.sh cl
36、uster changehost 2 2二、更新 cache iptables(此操作會設置的內(nèi)部網(wǎng)段):./bin/config.sh cache iptables5.11 修改 Cache IP 地址故障處理三、更新 cache 文件數(shù)據(jù)庫:./bin/config.sh cache movefiles 22四、重啟集群服務./bin/cluster.sh restart步驟 2撥打 400,尋求故障解決幫助。5.12.1 故障現(xiàn)象Cache 更換測試用戶,需要把原來用戶處緩存的數(shù)據(jù)清空5.12.2 故障處理流程故障處理流程如下:清除 cache 緩存文件撥打支持并傳回收集信息5.12.3
37、 故障處理步驟步驟 1清除 cache 緩存文件方法如下:X5 清除緩存文件處理方法/etc/init.d/xcached stopwget/updates/xcache/ruijie-xcache/delete-disk-x5.sh5.12 清除 cache 緩存文件故障處理od a+x delete-disk-x5.sh(給賦予可執(zhí)行權(quán)限)./delete-disk-x5.sh(清除 cache 中的緩存文件)/etc/init.d/xcached restart登錄 web 界面重新初始化X10 清除緩存文件處理方法/etc/init.d/xcached stopwget/updates
38、/xcache/ruijie-xcache/delete-disk-x10.shod a+x delete-disk-x10.sh(給賦予可執(zhí)行權(quán)限)./delete-disk-x10.sh(清除 cache 中的緩存文件)/etc/init.d/xcached restart登錄 web 界面重新初始化W5 清除緩存文件處理方法/etc/init.d/wcached stopwget/updates/xcache/ruijie-xcache/delete-disk-w5.shod a+x delete-disk-w5.sh(給賦予可執(zhí)行權(quán)限)./delete-disk-w5.sh(清除 ca
39、che 中的緩存文件)/etc/init.d/wcached restart登錄 web 界面重新初始化步驟 2撥打 400,尋求故障解決幫助。5.13.1 故障現(xiàn)象一般是由于學校封了 BT,導致沒有 BT 流量,需要將 BT 硬盤更改為 HTTP 硬盤5.13.2 故障處理流程故障處理流程如下:將 BT 硬盤更改為 HTTP 硬盤撥打支持并傳回收集信息5.13.3 故障處理步驟步驟 1將BT 硬盤更改為 HTTP 硬盤,具體操作步驟如下:以將/data6 /data7 /data8 BT 硬盤更改為 HTTP 硬盤為例1.停止緩存服務rootRG-erCache xcache# /etc/i
40、nit.d/xcached stop2.刪除 BT 分區(qū)的所有文件rootRG- rootRG-rootRG-erCache erCacheerCachedata6# data7#data8#rm rmrm-rf-rf-rf/data6/*&/data7/*&/data8/*&3.清除 BT 硬盤的數(shù)據(jù)庫rootRG- rootRG-rootRG-erCache erCacheerCachexcache# xcache#xcache#./bin/config.sh./bin/config.sh./bin/config.shcache cachecachecleanfiles cleanfile
41、scleanfiles717171/data6/data7/data84.更改 BT 分區(qū)為 HTTP/流分區(qū)rootRG-erCache xcache# vi /opt/xcache/conf/perties# downloader settingdownloader.http.enabled=true5.13 更改 BT 硬盤為 HTTP 硬盤故障處理downloader.http.path=/data1;/data2;/data3;/data4;/data5;/data6;/data7;/data8 downloader.bt.enabled=truedownloader.bt.down
42、load=false #downloader.bt.path=/data6;/data7;/data85.重啟緩存服務rootRG-erCache conf# /etc/init.d/xcachedrestart步驟 2撥打 400,尋求故障解決幫助。5.14.1 故障現(xiàn)象web 查看統(tǒng)計報表出錯,root 用戶寫入錯誤5.14.2 故障處理流程故障處理流程如下檢查根分區(qū)使用情況檢查硬盤掛載情況及處理檢查 message 日志大小及處理撥打支持并傳回收集信息5.14 系統(tǒng)根目錄使用率 100%故障處理密級:故障處理業(yè)務技術(shù)規(guī)范5.14.3 故障處理步驟步驟 1通過df h命令 檢查根分區(qū)使用率
43、是否為 100%步驟 2通過df h命令查看各緩存硬盤掛載是否正常,如緩存硬盤工作正常,請繼續(xù)步驟 3 操作。主要檢查硬盤大小是否與掛載目錄大小一致,如果不一致,需要將其從 cache 配置文件中刪除,并刪除對應緩存目錄下的所有緩存文件。(注:如出現(xiàn)硬盤故障,導致系統(tǒng)無法識別,系統(tǒng)默認會將緩存文件到對應該硬盤的根目錄文件夾中,會導致根分區(qū)使用率 100%),具體操作步驟如下:以緩存服務器 IP 地址:18 硬盤目錄:/data1 為例一、停止緩存服務:cd /opt/xcache/etc/init.d/xcached stop/etc/init.d/nginx stop二、緩存文件數(shù)據(jù)庫:./
44、bin/config.sh cache cleanfiles 18 /data1./bin/config.sh cache cleanfiles host disk 注解:(刪除硬盤數(shù)據(jù)庫參數(shù)說明)三、刪除緩存文件:cd /rm -rf /data1/*四、取消分區(qū)掛載umount /data1五、刪除分區(qū)目錄rm -rf /data1六、修改配置文件保存期限:2 年銳捷網(wǎng)絡,不得擴散第 34 頁, 共 47 頁密級:故障處理業(yè)務技術(shù)規(guī)范/etc/fstab 文件vi /etc/fstab刪除一行配置文本:LABEL=/data1/data1ext3defaults0 0緩存服務配置文件:vi
45、 /opt/xcache/conf/perties刪除/data1 緩存目錄七、重啟緩存服務/etc/init.d/xcache restart步驟 3檢查 message 日志大小及內(nèi)容是否正常。具體操作步驟如下:通過 ls -la /var/log/messages 命令查看 message 日志是否過大,當message 日志大小超過2G 后,會導致系統(tǒng)根分區(qū)使用率 100%。通過 cat /var/log/message 查看 message 日志內(nèi)容,并將錯誤日志,以供研發(fā)工排查錯誤。如 message 日志過大,請執(zhí)行如下操作:rm -rf /var/log/messages*/e
46、tc/init.d/rsyslog restart軟件后續(xù)改善:1.擴大根分區(qū)容量,避免系統(tǒng)日志過大導致根分區(qū)滿的問題出現(xiàn)步驟 4撥打 400,尋求故障解決幫助。5.15.1 故障現(xiàn)象web 查看統(tǒng)計報表出錯保存期限:2 年銳捷網(wǎng)絡,不得擴散第 35 頁, 共 47 頁5.15 opt 目錄使用率 100%故障處理密級:故障處理業(yè)務技術(shù)規(guī)范5.15.2 故障處理流程檢查/opt/xcache/logs 目錄日志大小是否正常及處理檢查/opt/xcache/nginx/logs/目錄日志大小是否正常及處理檢查/opt/xcache/data/logs/目錄日志大小是否正常及處理撥打支持并傳回收集
47、信息5.15.3 故障處理步驟步驟 1檢查/opt/xcache/logs 目錄日志大小是否正常及處理可通過 ls la /opt/xcache/logs 目錄日志大小,當日志過大,需要手動將其刪除,具體操作步驟如下:/etc/init.d/xcached stop/etc/init.d/nginx stop rm -rf /opt/xcache/logs/*/etc/init.d/xcached restart步驟 2檢查/opt/xcache/nginx/logs 目錄日志大小是否正常及處理可通過 ls la /opt/xcache/nginx/logs 目錄日志大小,當日志過大,需要手動
48、將其刪除,具體操作步驟如下:/etc/init.d/xcached stop/etc/init.d/nginx stop保存期限:2 年銳捷網(wǎng)絡,不得擴散第 36 頁, 共 47 頁密級:故障處理業(yè)務技術(shù)規(guī)范rm -rf /opt/xcache/nginx/logs/*/etc/init.d/xcached restart檢查/opt/xcache/data/logs 目錄日志大小是否正常及處理步驟 3可通過 ls la /opt/xcache/data/logs 目錄日志大小,當日志過大,需要手動將其刪除,具體操作步驟如下:/etc/init.d/xcached stop/etc/init.
49、d/nginx stoprm -rf /opt/xcache/data/logs/*/etc/init.d/xcached restart步驟 4撥打 400,尋求故障解決幫助。5.16.1 故障現(xiàn)象在集群主服務器web 統(tǒng)計報表中,無法單獨選擇從服務器查看統(tǒng)計報表信息5.16.2 故障處理流程故障處理流程如下:修改集群設置撥打支持并傳回收集信息保存期限:2 年銳捷網(wǎng)絡,不得擴散第 37 頁, 共 47 頁5.16 從服務器加入主服務器集群中,無法選擇從服務器查看統(tǒng)計報表信息故障處理密級:故障處理業(yè)務技術(shù)規(guī)范5.16.3 故障處理步驟步驟 1修改集群設置,具體操作步驟如下:以主服務器 IP:4
50、 從服務器 IP:6 為例 1.登錄從服務器做如下操作vi /opt/xcache/conf/perties將# application setting 選項修改為 application.type=downloaderapplication.host=6vi /opt/xcache/conf/clustroperties 將內(nèi)容修改為application.admin.host=4 application.downloader.hosts=4;6 application.sniffer.hosts=42.登錄主服務器做如下操作vi /opt/xcache/conf/clustropertie
51、s 將內(nèi)容修改為application.admin.host=4 application.downloader.hosts=4;6 application.sniffer.hosts=43.在主服務器上重啟集群服務生效 cd /opt/xcache/./bin/cluster.sh restart步驟 2撥打 400,尋求故障解決幫助。5.17.1 故障現(xiàn)象文件名相同,URL 不同時,有可能出現(xiàn)極少數(shù)的文件誤緩存問題,即用戶從緩存系統(tǒng)里到的文件與用戶實際請求的原始文件不一致。具體原因詳見RG-erCache X 系列 4.0 版本 FAQ2.7.1 章節(jié)5.17.2 故障處理流程故障處理流程如
52、下:保存期限:2 年銳捷網(wǎng)絡,不得擴散第 38 頁, 共 47 頁5.17 Cache 提供了錯誤的緩存文件故障處理密級:故障處理業(yè)務技術(shù)規(guī)范將重定向錯誤加入,不對其做緩存撥打支持并傳回收集信息5.17.3 故障處理步驟步驟 1對重定向錯誤加入,不對其做緩存。具體操作步驟如下:將該IP 地址加入緩存刪除緩存系統(tǒng)中該的緩存內(nèi)容步驟 2撥打 400,尋求故障解決幫助。5.18.1 故障現(xiàn)象從服務器下線時,需要將其從服務器集群中刪除。否則會導致集群主服務器還會發(fā)送從服務器的內(nèi)容重定向給客戶,導致客戶不能正常資源。5.18.2 故障處理流程故障處理流程如下:保存期限:2 年銳捷網(wǎng)絡,不得擴散第 39
53、頁, 共 47 頁5.18 刪除集群中的從服務器故障處理密級:故障處理業(yè)務技術(shù)規(guī)范刪除集群中的從服務器撥打支持并傳回收集信息5.18.3 故障處理步驟步驟 1刪除集群中的從服務器,具體操作步驟如下:以從服務器 IP 地址為 2 為例登錄主服務器執(zhí)行以下操作一、集群配置刪除服務器: cd /opt/xcache./bin/config.sh cluster removehost 2二、更新所有集群服務器 iptables(此操作會./bin/config.sh cache iptables緩存設置的緩存網(wǎng)段):三、刪除服務器緩存文件數(shù)據(jù)庫./bin/config.sh cache cleanfi
54、les四、重啟集群服務./bin/cluster.sh restart:2步驟 2撥打 400,尋求故障解決幫助。保存期限:2 年銳捷網(wǎng)絡,不得擴散第 40 頁, 共 47 頁密級:故障處理業(yè)務技術(shù)規(guī)范6網(wǎng)絡類故障關(guān)于本章6.1.1 故障現(xiàn)象正確部署緩存后,無HTTP 和流服務流量保存期限:2 年銳捷網(wǎng)絡,不得擴散第 41 頁, 共 47 頁6.1 正確部署緩存后,無 HTTP 和流服務流量章節(jié)內(nèi)容介紹6.1 正確部署緩存系統(tǒng)后,無HTTP和流服務流量故障處理介紹正確部署緩存系統(tǒng)后,無 HTTP 和流服務流量故障處理思路6.2 緩存系統(tǒng)不能用戶請求故障處理介紹緩存系統(tǒng)不能用戶請求故障處理思路6
55、.3 開啟緩存系統(tǒng)后,系統(tǒng)不能故障處理介紹開啟緩存系統(tǒng)后,系統(tǒng)不能故障處理思路6.4 無法通過SNMP協(xié)議 erCache系統(tǒng)故障處理介紹無法通過SNMP 協(xié)議erCache 系統(tǒng)故障處理思路6.5erCache通信網(wǎng)卡丟包故障處理介紹erCache 通信網(wǎng)卡丟包故障處理思路密級:故障處理業(yè)務技術(shù)規(guī)范6.1.2 故障處理流程此故障一般是因為客戶端不能正常接收 Cache 發(fā)出的重定向數(shù)據(jù)包,導致客戶端無法從 Cache 上文件。此原因一般是由于 Cache 和客戶端間通信存在故障處理流程如下:或安全策略,將 Cache 發(fā)出的重定向。緩存系統(tǒng)是否能正常撲捉鏡像數(shù)據(jù)包緩存系統(tǒng)通信網(wǎng)卡是否有重定向
56、數(shù)據(jù)包發(fā)出用戶端是否能正常收到緩存系統(tǒng)重定向數(shù)據(jù)包用戶和緩存系統(tǒng)間是否存在進行6.1.3 故障處理步驟步驟 1檢查緩存系統(tǒng)是否能正常從資源,可通過 wget 命令測試資源,如不能請檢查網(wǎng)絡信息,如能,請繼續(xù)步驟 2 操作。步驟 2檢查緩存系統(tǒng)是否能正常撲捉鏡像數(shù)據(jù)包,可通過 tcpdump -n -i ethx命令查看鏡像數(shù)據(jù)包是否正常。ethx 為鏡像網(wǎng)卡,如沒有鏡像數(shù)據(jù),請檢查端口鏡像配置是否正常,續(xù)步驟 3 操作。檢查緩存系統(tǒng)通信網(wǎng)卡是否有重定向數(shù)據(jù)包發(fā)出,可通過 tcpdump 命令抓取數(shù)據(jù)包,然后通過鏡像數(shù)據(jù),請繼步驟 3Wireshark 工具進行分析,如果沒有重定向數(shù)據(jù)包發(fā)出,請聯(lián)系研發(fā)工包發(fā)出,請繼續(xù)步驟 4 操作。如果有重定向數(shù)據(jù)檢查用戶端是否能正常收到緩存系統(tǒng)發(fā)出的重定向數(shù)據(jù)包??赏ㄟ^ Wireshark 工具抓取數(shù)據(jù)包進步驟 4保存期限:2 年銳捷網(wǎng)絡,不得擴散第 42 頁, 共 47 頁緩存系統(tǒng)是否能正常從資源密級:故障處理業(yè)務技術(shù)規(guī)范行分析。如果客戶端能收到緩存系統(tǒng)發(fā)出的重定向數(shù)據(jù)包,但不能從緩存系統(tǒng)文件,請確認端口鏡像是否為 cisco或板卡鏡像,處理方法詳見er
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 路基灰土施工方案
- 2025年護理要解剖學試題及答案
- 基于涉入理論的高爾夫球手地方依戀研究
- 5年級上冊第5單元
- 4年級下冊人教版要寫的字第七課
- 4大發(fā)明英語簡短50字左右
- 礦用管路安裝施工方案
- 站臺墻施工方案
- 【HR必看】房地產(chǎn)公司三級管控體系優(yōu)化案例
- 2025年湖北省荊門市單招職業(yè)傾向性測試題庫及參考答案1套
- (綜合治理)修復工程指南(試行) - 貴州省重金屬污染防治與土壤修復網(wǎng)
- 員工就餐簽到表
- A-level項目介紹(課堂PPT)
- 證明銀行賬戶公戶轉(zhuǎn)個人戶
- 航海計算軟件---ETA計算器
- 光伏電站運維手冊
- 南京連續(xù)運行衛(wèi)星定位綜合服務系統(tǒng)
- 半導體及集成電路領(lǐng)域的撰寫及常見問題
- 2000年考研英語真題及答案
- 設計成果接收單確認單及付款申請表
- 水保及環(huán)保管理體系與措施
評論
0/150
提交評論