服務器日常維護及常見故障排除方法免費_第1頁
服務器日常維護及常見故障排除方法免費_第2頁
服務器日常維護及常見故障排除方法免費_第3頁
服務器日常維護及常見故障排除方法免費_第4頁
服務器日常維護及常見故障排除方法免費_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、2022-3-24Inspur groupInspur group服務器日常維護及常見故障排除方法22022-3-24Inspur group主要內(nèi)容主要內(nèi)容故障維修注意事項常見故障處理及調(diào)試32022-3-24Inspur group故障維修注意事項故障維修注意事項服務器故障排錯的基本原則服務器硬件維護注意事項關于最小化和還原出廠配置42022-3-24Inspur group服務器故障排錯的基本原則服務器故障排錯的基本原則1. 盡量恢復系統(tǒng)缺省配置a:硬件配置:去除第三方廠商備件和非標配備件;b:資源配置:清除CMOS,恢復資源初始配置;c: BIOS,F(xiàn)/W,驅動程序:升級最新的BIOS

2、,F(xiàn)/W和相關驅動程序;d: TPL:擴展的第三方的I/O卡屬于該機型的硬件兼容列表(TPL)嗎?2. 從基本到復雜a:系統(tǒng)上從個體到網(wǎng)絡:首先將存在故障的服務器獨立運行,待測試正常后再接入網(wǎng)絡運行,觀察故障現(xiàn)象變化并處理。b:硬件上從最小系統(tǒng)到現(xiàn)實系統(tǒng):指從可以運行的硬件開始逐步到現(xiàn)實系統(tǒng)為止。c: 軟件上從基本系統(tǒng)到現(xiàn)實系統(tǒng):指從基本操作系統(tǒng)開始逐步到現(xiàn)實系統(tǒng)為止。3. 交換對比a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b: 交換NOS載體,既交換軟件環(huán)境;c:交換硬件,既交換硬件環(huán)境;d:交換整機,既交換整體環(huán)境52022-3-24Inspur group服務器硬件維護注意

3、事項服務器硬件維護注意事項只有合格的技術人員才可以對主板進行設置系統(tǒng)電源開關:系統(tǒng)前面板上的直流電源開關并不能關閉系統(tǒng)電源的交流輸入,系統(tǒng)中尚有8mA的伺服電流,在設置之前,必須拔下系統(tǒng)交流電源電纜系統(tǒng)外界設備:必須拔下系統(tǒng)外接網(wǎng)線和Modem等外接設備,否則可能會對人員或設備造成意外傷害靜電釋放和靜電釋放保護措施:靜電釋放會對主板、硬盤、板卡和系統(tǒng)的其它部件造成損害,在您要對系統(tǒng)硬件進行設置時,最好在防靜電環(huán)境下進行(一端接地)靜電釋放和板卡持拿:因為板卡上的芯片對靜電特別敏感,持拿板卡必須小心,只能接觸主板的邊沿。當板卡暫時不用時,必須把它放回專用的防靜電袋中,芯片朝上放在接地平臺上機箱蓋

4、:為了系統(tǒng)正常散熱和空氣流通,在系統(tǒng)上電前一定要安裝機箱蓋,否則會對系統(tǒng)部件造成損害,機架式服務器要特別注意62022-3-24Inspur group硬件維修注意事項硬件維修注意事項確保在機箱和主板之間不存在短路把和主板相連接的線纜斷掉,包括鍵盤和鼠標移走所有的外插板卡安裝一顆 CPU (確保安裝牢固)連接機箱揚聲器連線和電源指示燈LED連線到主板檢查主板等部件的跳線設置是否正確72022-3-24Inspur group關于最小化和還原出廠配置關于最小化和還原出廠配置遇到復雜問題時,需要進行機器的最小化操作來進行問題定位,籠統(tǒng)的講,最小化指單cpu、單內(nèi)存或雙內(nèi)存(根據(jù)主板要求決定)、主板

5、、電源接顯示器開機測試,其他的板卡、跳線等都去掉。但由于機型的差異,通過一些案例分析,我們真正做到最小化了么?還原到出廠配置要求保證原廠的部件,去掉用戶自己擴配的部件,甚至要求bios版本的還原。82022-3-24Inspur group排除非浪潮部件干擾非常重要排除非浪潮部件干擾非常重要硬件故障并不單單指硬件有問題,它也指硬件之間不兼容。因為服務器的正常運作需要各部件之間的大力協(xié)調(diào)。建議大家在采購各元件時,都采用同一品牌原裝的,并且要采用能發(fā)揮服務器性能的元件(上例中的舊式網(wǎng)卡即使正常也會嚴重影響服務器性能),這樣才不會發(fā)生莫明其妙的故障92022-3-24Inspur group外設故障

6、不可小看外設故障不可小看這些外設部件往往是最容易被忽略的,但這些故障會被引起以下故障:藍屏切換器導致開機報錯鍵盤導致開機報警鼠標線纜被老鼠咬了!鍵盤故障顯示器安裝as4.6死機,安裝其他系統(tǒng)沒問題。必要時要替換測試102022-3-24Inspur group主要內(nèi)容主要內(nèi)容故障維修注意事項常見故障處理及調(diào)試112022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障硬盤相關故障開機無顯機器不加電意外重啟風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障122022-3-24Inspur group硬盤相關故障硬盤相關故障硬盤無法識別1.檢測不到

7、硬盤2.可檢測到硬盤數(shù)量不正確開機自檢硬盤報錯檢測到硬盤時報錯:smart error 或disk I/O error硬盤亮紅燈陣列中硬盤頻繁掉線132022-3-24Inspur group硬盤相關故障:硬盤檢測問題硬盤相關故障:硬盤檢測問題硬盤無法識別問題可從以下幾個方面考慮1.重新拔插硬盤電源及數(shù)據(jù)線纜 ,注意是否有接觸不良的問題。2.更換硬盤至原先可正常檢測到的槽位,如果仍然檢測不到則可能存在硬盤損壞故障。3.可檢測到硬盤數(shù)量不正確實的情況要注意先確定bios中是否設置了正確的參數(shù),然后再排除上述1.2問題。4.硬盤背板故障。5.磁盤控制器可能存在故障。142022-3-24Inspu

8、r group硬盤相關故障:硬盤檢測問題硬盤相關故障:硬盤檢測問題Sata硬盤的識別問題更多表現(xiàn)在bios設置上,例如NF190/NF280G2/NF190E bios中相關sata參數(shù)設置 152022-3-24Inspur group硬盤相關故障:硬盤檢測問題硬盤相關故障:硬盤檢測問題例如NF190D/NF280D bios中相關sata參數(shù)設置 162022-3-24Inspur groupNF190D/NF280D ESB2 SATA3種模式:Compatible、AHCI、HostRaid172022-3-24Inspur group NF190D/NF280D SATA RAID關

9、于SATA HostRAID有如下限制:RAID-0Min 2 drives, max 4 drives.RAID-1Min 2 drives, max 2 drives.RAID-10Min 4 drives, max 4 drives.the same limitation with SCSI HostRAID182022-3-24Inspur group NF190D/NF280D SATA Compatible Mode: IDE0Mas, IDE0Sla, SATA0,SATA2 or SATA1,SATA3,支持Windows, Linux, no driver requiredE

10、nhance IDE Mode: IDE0Mas, IDE0Sla, SATA0,SATA1,SATA2,SATA3,支持Windows, no driver requiredEnhance Mode (AHCI or RAID enabled): IDE0Mas, IDE0Sla, SATA0, SATA1, SATA2, SATA3, SATA4, SATA5, driver is required.192022-3-24Inspur group硬盤相關故障:開機自檢硬盤報錯硬盤相關故障:開機自檢硬盤報錯檢測到硬盤時報錯:smart error 、disk I/O error 或預期錯誤1

11、.使用現(xiàn)有的硬盤控制器校驗硬盤。2.出現(xiàn)此類報錯時背板或主板也是故障原因但幾率較小。202022-3-24Inspur group磁盤相關故障硬盤亮紅燈磁盤相關故障硬盤亮紅燈很多機器背板有硬盤故障檢測功能,如硬盤亮紅燈一般意味著硬盤掉線、背板檢測到硬盤存在故障隱患,此時可以從raid卡配置界面中查看硬盤的狀態(tài),如果處于非掉線狀態(tài),需要安裝對應的管理軟件, 從管理軟件中查看是否有磁盤media error,有一點需要強調(diào),硬盤亮紅燈并不一定意味著硬盤掉線。212022-3-24Inspur group硬盤相關故障硬盤掉線硬盤相關故障硬盤掉線對于硬盤頻繁掉線的故障,首先校驗硬盤是否有壞道,如確定有

12、壞道建議立即更換而不是通過其他修正的方法經(jīng)過校驗確認硬盤沒有壞道,但此硬盤頻繁掉線,同樣需要更換硬盤,然后依次考慮背板、主板或raid卡、數(shù)據(jù)線、終結器故障。222022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障開機無顯開機無顯機器不加電意外重啟風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障232022-3-24Inspur group開機無顯的維護思路開機無顯的維護思路Clear CMOS檢查供電環(huán)境,零-火;零-地電壓?檢查電源指示燈,如果亮,正常嗎?按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?是否更換過顯示器,更換另一臺顯示

13、器。去掉增加內(nèi)存去掉增加的CPU去掉增加的第三方I/O卡檢查內(nèi)存和CPU 插的是否牢靠主板是否有顯示屏蔽的跳線更換主要備件,如主板,內(nèi)存和CPU242022-3-24Inspur group開機無顯開機無顯-清清cmosNF190/NF280G2清cmos方法:用跳線帽將跳線2的bc短接,保持5秒鐘;重啟機器使設置生效;關掉機器,將跳線帽接回原先位置即可。 252022-3-24Inspur group開機無顯清開機無顯清cmosNF190D/NF280D清cmos方法:用金屬物體(如小螺絲刀)將JBT1的兩個腳點短接即可。 262022-3-24Inspur group開機無顯內(nèi)存最小化開機

14、無顯內(nèi)存最小化單條內(nèi)存插法:1.NF280G2/NF190單內(nèi)存插在靠近主板邊緣的A1或B1槽位2.NF190D/NF280D單內(nèi)存插在靠近主板內(nèi)部的DIMM 1A槽位上主板power開關跳線位置:NF280D/NF190D: 272022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障開機無顯機器不加電機器不加電意外重啟風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障282022-3-24Inspur group主機不加電主機不加電確定外插電源線是否正常,更換電源線測試清cmos、最小化拔插相關部件在確定外部電源沒有問題的情況下,將電源單獨取

15、出,插上電源線后短接電源24針插座的綠、黑接口,看電源風扇是否轉動來確認電源故障。(臺達的一些電源有空載保護機制,不能通過此方法進行測試,還有一些電源有節(jié)電功能,必須在電源內(nèi)部溫度達到一定閥值才啟動風扇,如NP110D共享工程機器,所以也不能用此方法測試)更換主板測試,(依照現(xiàn)場更換情況定位最終故障)292022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障開機無顯機器不加電意外重啟意外重啟風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障302022-3-24Inspur group意外重啟意外重啟查看bios相關日志及系統(tǒng)日志考慮相關因素如

16、果是藍屏重啟,可查看dump日志進行分析與系統(tǒng)有關,重裝系統(tǒng)內(nèi)存和主板是導致硬件藍屏的主要原因,可對內(nèi)存進行校驗,或對內(nèi)存進行最小化測試312022-3-24Inspur group關于系統(tǒng)藍屏故障的分析關于系統(tǒng)藍屏故障的分析關于 windbgDump文件的生成,及設置Windbg 設置如何分析dump文件具體案例分析322022-3-24Inspur group關于關于windbg什么是windbg微軟在DDK和SDK中提供的一個調(diào)試工具,既能調(diào)試驅動程序也能調(diào)試應用程序。同時可以對系統(tǒng)進行調(diào)試,對于藍屏后產(chǎn)生的dump文件也有很強大的分析能力,幫助我們找到在藍屏發(fā)生的最后一刻,系統(tǒng)在執(zhí)行什

17、么操作。 Windbg下載http:/ 分析性能如何 1,如果是軟件原因造成的,尤其是殺毒軟件防 火墻原因造成,確定的成功率可以達到90%以上。 2,如果是硬件原因造成的藍屏,不能唯一確定到哪個硬件,但是可以大體上判定問題出現(xiàn)在哪一路上332022-3-24Inspur groupDump文件生成文件生成當一個核心態(tài)錯誤發(fā)生的時候,windows缺省的方式是產(chǎn)生一個帶有報錯代碼的藍屏。有三種類型的dump文件: 完全內(nèi)存轉儲 核心內(nèi)存轉儲 最小內(nèi)存轉儲342022-3-24Inspur groupWindbg 設置設置Symbol file path1,下載并安裝2,直接連接到微軟網(wǎng)站SRV*

18、d:/temp/*http:/ group案例分析講解案例分析講解殺毒軟件原因 瑞星,天網(wǎng)等殺毒軟件或防火墻軟件。驅動問題硬件故障實例:河北省滄州市計生委 207990484 NF380D 接網(wǎng)線藍屏stop:0 x000000FC(f78ae884, 2fbf0963, f78ae7f0, 00000000) 100s重啟,不接網(wǎng)線運行正常。使用winDbg分析結果:Probably caused by : BlackDrv.sys ( BlackDrv+11c6 ) 安裝了BlackICE(黑冰)防火墻,卸載后正常362022-3-24Inspur group常見故障處理及調(diào)試常見故障處理

19、及調(diào)試硬盤相關故障開機無顯機器不加電意外重啟風扇故障風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障372022-3-24Inspur group風扇相關故障風扇相關故障風扇轉速問題:1. 一些機型有針對不同操作系統(tǒng)的降速調(diào)節(jié)軟件如NF190/NF280G22. 可通過修正bios中相關參數(shù)實現(xiàn)自動調(diào)節(jié)降速如NF280D/NF190D3.也可通過bios修改來實現(xiàn)對風扇轉速的控制如NP370D/NF280風扇故障會造成內(nèi)部溫度過高,出現(xiàn)cpu過熱而使系統(tǒng)自動斷電的情況,可從bios監(jiān)控頁面查看風扇轉速或查看bios事件日志是否有相關信息。高端機型機箱風扇本身有狀態(tài)指示燈,當風扇

20、本身異常時燈狀態(tài)會有變化,如NF520D,正常狀態(tài)下風扇指示燈為綠色,故障時會變?yōu)槌燃t色,預示風扇可能存在異常。有時風扇故障可能由槽位或其他因素引起,所以對于多個冗余風扇的情況下,盡可能現(xiàn)場交換風扇測試確定可能性原因。382022-3-24Inspur group風扇故障風扇故障NF190D/NF280D硬件監(jiān)控及風扇參數(shù)調(diào)整: BIOS風扇限速(6000轉風扇-4500轉)(1)Disable: FAN at full speed(2)1U (3-pin): fan voltage controlled to 9V, 10V, 12V.(3)2U (3-pin): fan voltage c

21、ontrolled to 8V, 9V, 10V.清cmos或恢復bios默認值后要修改回正確的參數(shù)392022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障開機無顯機器不加電意外重啟風扇故障前面板狀態(tài)燈相關說明前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障402022-3-24Inspur group關于故障指示燈關于故障指示燈首先要明確狀態(tài)燈的不同含義,比如服務器的網(wǎng)卡,有兩個狀態(tài)燈,一個為綠色,加電后常亮,代表網(wǎng)卡通電,另外一個是網(wǎng)絡連接狀態(tài)燈,不亮代表處于10m連同狀態(tài),綠色代表100m連接狀態(tài),紅色代表千兆連接狀態(tài),閃爍代表正在進行數(shù)據(jù)交

22、換。高端服務器一般都有系統(tǒng)狀態(tài)指示燈,不同機器指示燈含義是不同的,如NF180正常情況下是綠色,系統(tǒng)異常時表現(xiàn)為紅色,而NF500正常情況下是綠色常亮,非緊急故障狀態(tài)為綠色閃爍,緊急故障情況下是橙色常亮。根據(jù)不同狀態(tài)的變化,系統(tǒng)在報警的同時也進行日志記錄,此時可參考系統(tǒng)日志、bmc日志燈進行問題的診斷和分析。412022-3-24Inspur group前面板狀態(tài)燈說明前面板狀態(tài)燈說明NF190/NF280G2前面板狀態(tài)燈前面板狀態(tài)燈NF190D/NF280D前面板狀態(tài)燈前面板狀態(tài)燈 422022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障開機無顯機器不加

23、電意外重啟風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障432022-3-24Inspur group系統(tǒng)相關故障系統(tǒng)相關故障系統(tǒng)不能正常啟動1.可能是系統(tǒng)本身故障,重裝系統(tǒng)測試2.查看系統(tǒng)相關日志和啟動信息,測試相關部件分區(qū)不能掛載1.掛載設備是否正確連接?是否工作正常?2.系統(tǒng)相關參數(shù)是否設置正確?3.硬盤為只讀時需要進行單獨格式化后重新掛載。系統(tǒng)安裝問題1.驅動制作不正?;蝌寗渝e誤導致安裝系統(tǒng)時藍屏或找不到硬盤2.由于一些機型對傳統(tǒng)ide通道的顛覆,在linux系統(tǒng)安裝時需要添加引導參數(shù),并且在安裝后修改相應文件,如NP120D2/NF190D2/NF290

24、D23.對系統(tǒng)安裝版本的要求,有些芯片組要求安裝windows 2003必須是集成sp1的,windows 2000必須是集成sp4的,否則安裝時藍屏,而象NF500必須在windows 2003系統(tǒng)安裝時保證沒有外插hba卡,否則安裝過程中提示找不到光盤。4.oem 2003光盤在系統(tǒng)安裝時需要添加的驅動和普通2003系統(tǒng)光盤需要的驅動是不一樣的,要將驅動軟盤文件目錄中加新目錄:$OEM$/TEXTMODE將驅動拷貝進入此目錄 442022-3-24Inspur group常見故障處理及調(diào)試常見故障處理及調(diào)試硬盤相關故障開機無顯機器不加電意外重啟風扇故障前面板狀態(tài)燈相關說明系統(tǒng)相關故障數(shù)據(jù)讀寫緩慢數(shù)據(jù)讀寫緩慢網(wǎng)絡相關故障452022-3-24Inspur group導致數(shù)據(jù)讀寫緩慢的原因導致數(shù)據(jù)讀寫緩慢的原因1.硬盤掉線,后臺正在rebuild,或raid陣列正在進行一致性校驗。2.病毒導致,從任務管理器看出,cpu占用率達100,一般與蠕蟲類病毒嚴重占用系統(tǒng)資源有關。3.磁盤控制器驅動問題,使磁盤性能不能得到穩(wěn)定發(fā)揮或存在bug,導致讀寫緩慢。4.數(shù)據(jù)庫相關,數(shù)據(jù)庫優(yōu)化或程測試序有問題,導致程序執(zhí)行時不能正常獲取相關信息,表現(xiàn)為硬盤讀寫慢。5.硬件故障,包括硬盤、背

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論