![服務(wù)器故障排除方法_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/7/761ba4d7-45d2-4f82-a09b-1d7978797505/761ba4d7-45d2-4f82-a09b-1d79787975051.gif)
![服務(wù)器故障排除方法_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/7/761ba4d7-45d2-4f82-a09b-1d7978797505/761ba4d7-45d2-4f82-a09b-1d79787975052.gif)
![服務(wù)器故障排除方法_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/7/761ba4d7-45d2-4f82-a09b-1d7978797505/761ba4d7-45d2-4f82-a09b-1d79787975053.gif)
![服務(wù)器故障排除方法_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/7/761ba4d7-45d2-4f82-a09b-1d7978797505/761ba4d7-45d2-4f82-a09b-1d79787975054.gif)
![服務(wù)器故障排除方法_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/7/761ba4d7-45d2-4f82-a09b-1d7978797505/761ba4d7-45d2-4f82-a09b-1d79787975055.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、服務(wù)器故障排除方法本文主要是針對(duì)一些服務(wù)器出現(xiàn)的簡單的故障進(jìn)行排查處理,主要分三部分,第一部分講的是服務(wù)器故障排除的基本原則性問題,第二部分講述了一些服務(wù)器硬件故障排除的實(shí)例,第三部分講述了一些服務(wù)器軟件故障排除的實(shí)例 第一部分 服務(wù)器故障排除的基本原則性問題 1、 服務(wù)器開機(jī)無顯示應(yīng)怎么辦 1. 檢查供電環(huán)境,零-火;零-地電壓?2. 檢查電源指示燈,如果亮,正常嗎?3. 按下電源開關(guān)時(shí),鍵盤上指示燈亮嗎?風(fēng)扇全部轉(zhuǎn)動(dòng)嗎?4. 是否更換過顯示器,更換另一臺(tái)顯示器。5. 去掉增加內(nèi)存。6. 去掉增加的CPU7. 去掉增加的第三方I/O卡8. 檢查內(nèi)存和CPU 插的是否牢靠9. Clear CM
2、OS10. 更換主要備件,如系統(tǒng)板,內(nèi)存和CPU 2、 服務(wù)器故障排錯(cuò)的基本原則是什么 1. 盡量恢復(fù)系統(tǒng)缺省配置 推薦精選a:硬件配置:去除第三方廠商備件和非標(biāo)配備件;b:資源配置:清除CMOS,恢復(fù)資源初始配置;c: BIOS,F(xiàn)/W,驅(qū)動(dòng)程序:升級(jí)最新的BIOS,F(xiàn)/W和相關(guān)驅(qū)動(dòng)程序;d: TPL:擴(kuò)展的第三方的I/O卡屬于該機(jī)型的硬件兼容列表(TPL)嗎? 2. 從基本到復(fù)雜 a:系統(tǒng)上從個(gè)體到網(wǎng)絡(luò):首先將存在故障的服務(wù)器獨(dú)立運(yùn)行,待測(cè)試正常后再接入網(wǎng)絡(luò)運(yùn)行,觀察故障現(xiàn)象變化并處理。b:硬件上從最小系統(tǒng)到現(xiàn)實(shí)系統(tǒng):指從可以運(yùn)行的硬件開始逐步到現(xiàn)實(shí)系統(tǒng)為止。c: 軟件上從基本系統(tǒng)到現(xiàn)實(shí)系
3、統(tǒng):指從基本操作系統(tǒng)開始逐步到現(xiàn)實(shí)系統(tǒng)為止。 3. 交換對(duì)比 a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b: 交換NOS載體,既交換軟件環(huán)境;c:交換硬件,既交換硬件環(huán)境;d:交換整機(jī),既交換整體環(huán)境; 3、 服務(wù)器故障排除需要收集哪些信息?服務(wù)器信息:1. 機(jī)器型號(hào)2. 機(jī)器序列號(hào)(S/N: 如:NC00075534)推薦精選3. Bios 版本4. 是否增加其它設(shè)備,如網(wǎng)卡,SCSI 卡,內(nèi)存,CPU5. 硬盤如何配置,是否做陣列, 陣列級(jí)別6. 安裝什么操作系統(tǒng)及版本(Winnt 4, Netware, Sco, others) 故障信息1. 在POST時(shí),屏幕顯示的異常信
4、息2. 服務(wù)器本身指示燈的狀態(tài)?3. 報(bào)警聲和BEEP CODES4. NOS的事件記錄文件?5. Events Log 文件確定故障類型和故障現(xiàn)象:1. 開機(jī)無顯示;2. 上電自檢階段故障;3. 安裝階段故障和現(xiàn)象;4. 操作系統(tǒng)加載失??;5. 系統(tǒng)運(yùn)行階段故障; 第二部分服務(wù)器硬件故障處理幾例 硬件故障是指服務(wù)器硬件出現(xiàn)異常而導(dǎo)致的各類錯(cuò)誤。由于服務(wù)器構(gòu)成比較復(fù)雜,因此在檢查的時(shí)候必須認(rèn)真、仔細(xì)。下面以一臺(tái)萬全4500為例說明。(例子,在實(shí)際問題中如果遇到相似現(xiàn)象,也需要具體問題具體分析,不要盲目套用);推薦精選有一臺(tái)萬全4500,配有256M內(nèi)存,使用一個(gè)PIII XEON 500帶2M
5、高速緩存的處理器。開機(jī)后沒有任何顯示,但系統(tǒng)日志上提示了一條CPU電壓為0伏的信息,系統(tǒng)指示燈三燈不停在閃爍(指示燈三燈閃爍是服務(wù)器的另一種報(bào)警方式,我會(huì)在文后說明)。這種錯(cuò)誤一般是處理器電壓調(diào)節(jié)模塊(VRM)出錯(cuò)或CPU出錯(cuò)或CPU與CPU板塊接觸不良,但也可能是CPU板塊出錯(cuò),這時(shí)情況就比較復(fù)雜了,必須經(jīng)過認(rèn)真慎重的思考。因?yàn)镃PU板塊在整個(gè)服務(wù)器中,占有舉足輕重的地位,如果它出錯(cuò)服務(wù)器是會(huì)報(bào)致命錯(cuò)誤的,并且在系統(tǒng)日志中會(huì)提示致命錯(cuò)誤,但報(bào)CPU電壓錯(cuò)的情況也有5%左右。我們立刻把CPU調(diào)換在另一CPU插槽中,開機(jī)后依然是剛才的那種故障。所以在初步判斷中,可以排除是CPU板塊壞。這時(shí),取出
6、CPU仔細(xì)擦拭金手指,以及CPU板塊中與CPU接觸的地方后,開機(jī)依然無顯示。相對(duì)處理器壞的情況來說處理器電壓模塊(VRM)出現(xiàn)故障的情況比較大。于是立即在另一臺(tái)萬全4500中取下一個(gè)處理器電壓模塊,安裝在此服務(wù)器中。開機(jī)后,服務(wù)器依然沒有任何顯示,系統(tǒng)日志上依然提示CPU電壓為0伏的信息,系統(tǒng)指示燈三燈依然不停在閃爍。這時(shí)的情況就比較明顯了。于是立即從另一臺(tái)萬全4500中取下一個(gè)CPU安裝后,開機(jī)正常??偨Y(jié):在服務(wù)器的維修中,線索都會(huì)顯得撲朔迷離,一般來說不可能一次就可以準(zhǔn)確地判斷出問題的所在。這樣就要求相關(guān)人員要有信心及耐心。出現(xiàn)錯(cuò)誤一般的流程是通過系統(tǒng)日志上的信息來解決,如果沒有解決問題再
7、找出其它因素,然后再看日志信息。總之,服務(wù)器出錯(cuò)后,必須一步一步解決,沒有捷徑可言。 又如:有一臺(tái)萬全4200開機(jī)不顯示,發(fā)現(xiàn)開機(jī)時(shí)系統(tǒng)日志沒有任何信息,且系統(tǒng)指示燈不亮。初步判斷是電源方面出現(xiàn)了錯(cuò)誤。經(jīng)過仔細(xì)檢查,發(fā)現(xiàn)服務(wù)器的電源是正常的,因此最大的可能就是服務(wù)器的電源管理板出現(xiàn)故障。更換電源管理板后,開機(jī)顯示正常。但這時(shí),新的問題來了:自檢時(shí),用CTRL+M不能檢測(cè)到硬盤。推薦精選硬盤在別的服務(wù)器上是正常的,因此立即清除此服務(wù)器的CMOS,但依然不正常。立刻上網(wǎng)找到此服務(wù)器的最新BIOS,升級(jí)BIOS后也不能解決問題。又檢查硬盤籠子和服務(wù)器里的數(shù)據(jù)線及電源線后依然出錯(cuò)。這時(shí),一般情況會(huì)懷疑
8、是服務(wù)器的I/O板(輸入輸出板塊)有問題。但就在這個(gè)時(shí)候,我發(fā)現(xiàn)在I/O板上有一個(gè)非聯(lián)想的舊式網(wǎng)卡,立即去除此網(wǎng)卡后服務(wù)器就一切正常。硬件故障并不單單指硬件有問題,它也指硬件之間不兼容。因?yàn)榉?wù)器的正常運(yùn)作需要各部件之間的大力協(xié)調(diào)。建議大家在采購各元件時(shí),都采用同一品牌原裝的,并且要采用能發(fā)揮服務(wù)器性能的元件(上例中的舊式網(wǎng)卡即使正常也會(huì)嚴(yán)重影響服務(wù)器性能),這樣才不會(huì)發(fā)生莫明其妙的故障。還有一種情況:用戶需要把他的萬全3200升級(jí)到雙網(wǎng)卡,我建議他購買原裝網(wǎng)卡,但當(dāng)他看到萬全4500的網(wǎng)卡是采用的INTEL 82559芯片后,斷然決定不使用原裝網(wǎng)卡而采用另一品牌也采用INTEL 82559的
9、網(wǎng)卡。過了幾天,他打電話給我說,他的新網(wǎng)卡不能使用網(wǎng)絡(luò)冗余及數(shù)據(jù)校驗(yàn),并懷疑服務(wù)器有問題。維修工程師帶了一個(gè)INTEL 82559網(wǎng)卡到用戶那里,仔細(xì)檢查了服務(wù)器的環(huán)境完全正常后,把INTEL 82559網(wǎng)卡安裝到機(jī)器上后一切正常。這個(gè)例子更加說明了,要發(fā)揮服務(wù)器的最大性能及功能,必須使用原品牌原裝的配件。非原品牌非原裝的配件,不能支持服務(wù)器的某些功能,嚴(yán)重的會(huì)影響到服務(wù)器的正常使用。要避免硬件故障發(fā)生頻率,服務(wù)器管理人員必須注意服務(wù)器的使用環(huán)境完全正常。比較重要的服務(wù)器必須在恒溫、恒濕的環(huán)境;電壓也要符合,不僅要采用UPS,還必須接地線,必須是左零線、右火線,零地電壓在13伏。在開、關(guān)服務(wù)器
10、上必須符合正常的流程。工作人員必須嚴(yán)格執(zhí)行操作流程。一般情況來說,服務(wù)器維修人員對(duì)于硬件故障只要有豐富的經(jīng)驗(yàn)都能很快找出故障所在,如果不能解決就必須迅速與服務(wù)器的售后服務(wù)中心8008108888聯(lián)系。第三部分服務(wù)器常見軟故障解決思路與實(shí)例推薦精選服務(wù)器軟件故障是在服務(wù)器故障中占有比例最高的部份,約占70%,解決的過程必須更加深思熟慮。導(dǎo)致服務(wù)器出現(xiàn)軟件故障的原因有很多,最常見的是服務(wù)器BIOS版本太低、服務(wù)器的管理軟件或服務(wù)器的驅(qū)動(dòng)程序有BUG、應(yīng)用程序有沖突及人為造成的軟件故障。下面分別舉例說明各類軟件故障的維修方法。有一臺(tái)萬全3500服務(wù)器,配置為雙PIII 500帶521K高速緩存的CP
11、U、512M內(nèi)存。開機(jī)后,系統(tǒng)日志報(bào)電壓調(diào)節(jié)模塊異常(VRM)的錯(cuò)誤,報(bào)錯(cuò)的信息是:“Voltage Regulator Module (VRM) over/under-voltage 2.88V/0V”。從表面來看,極有可能是服務(wù)器的電壓調(diào)節(jié)模塊或其它硬件出現(xiàn)故障,極容易導(dǎo)致維護(hù)人員認(rèn)為是硬件故障。維護(hù)人員立刻使用其它萬全3500的硬件來測(cè)試,發(fā)現(xiàn)即使使用新的配件,此服務(wù)器依然報(bào)VRM錯(cuò)。就在一籌莫展的時(shí)候,維修工程師帶來了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升級(jí)了CPU管理板塊的FIRMWARE后,服務(wù)器恢復(fù)立即正常。FIRMW
12、ARE升級(jí)方法是, 1) 用軟盤啟動(dòng)計(jì)算機(jī),然后插入firmware軟盤并運(yùn)行上面的相關(guān)文件cabrillo; 2) 系統(tǒng)刷新BMC(主板控制器)和HSC(熱插拔背板控制器); 3) 然后系統(tǒng)詢問執(zhí)行第幾個(gè)選項(xiàng)(通常為2); 4) 然后系統(tǒng)詢問服務(wù)器的電源配置(通常為2); 5) 如果回答有兩個(gè)電源,系統(tǒng)詢問服務(wù)器是否有輔助風(fēng)扇即在第三個(gè)電源(冗余電源)的位置上 是否有風(fēng)扇(通常為N); 6) 然后系統(tǒng)詢問是否重寫B(tài)MC kernel use area;(通常為N)然后系統(tǒng)詢問是否輸入一個(gè)asset tag; (通常為N) 7) 最后系統(tǒng)詢問在刷新后是否要重新啟動(dòng)系統(tǒng);(通常為Y)。這種升級(jí)方
13、法也適合刷新系統(tǒng)BIOS等,命令的參數(shù)不同以及更新FIRMWARE及BIOS文件名不同,參數(shù)請(qǐng)參考服務(wù)器的說明。任何一款服務(wù)器的FIRMWARE及BIOS都會(huì)有不同的BUG,因?yàn)锽UG在所難免,所以我們不能錯(cuò)誤地認(rèn)為服務(wù)器的BIOS程序就很完善,而應(yīng)該經(jīng)常更新服務(wù)器的FIRMWARE及BIOS,只是在升級(jí)之前應(yīng)該小心謹(jǐn)慎,錯(cuò)誤的升級(jí)方法將會(huì)導(dǎo)致嚴(yán)重的后果。目前流行的中高檔服務(wù)器都擁有強(qiáng)大的管理程序,為客戶提供了方便的管理途徑;服務(wù)器也擁有各種操作系統(tǒng)下的驅(qū)動(dòng)程序,方便了客戶在各種操作系統(tǒng)中的使用。但是,世上任何一款程序都會(huì)有一些BUG,這些BUG將影響用戶使用。但是服務(wù)器廠商總是會(huì)在第一時(shí)間內(nèi)
14、開發(fā)出新的程序,客戶只需要及時(shí)更新這些程序就可以避免這類故障。當(dāng)服務(wù)器的軟件故障為此類時(shí),表現(xiàn)的現(xiàn)象也不盡相同。一般來說,管理程序BUG會(huì)導(dǎo)致系統(tǒng)速度變慢,CPU占用率變高,無法正常使用某些功能等;驅(qū)動(dòng)程序的BUG會(huì)導(dǎo)致死機(jī)、與某些軟件有沖突,磁盤工作不穩(wěn)定等。查看管理程序是否出錯(cuò)的最好的辦法就是在系統(tǒng)中首先禁止此類管理工具,再觀察服務(wù)器是否還是異常。由于管理工具是隨著系統(tǒng)啟動(dòng)而啟動(dòng)的,所以應(yīng)首先避免它的啟動(dòng)。以WINDOWS NT4為例,就首先在管理工具服務(wù)中禁用某些服務(wù)器軟件服務(wù),再修改注冊(cè)表中的啟動(dòng)項(xiàng)即可。如果是驅(qū)動(dòng)程序有問題的話,就以安全模式進(jìn)入系統(tǒng),看是否正常。但是需要注意的是,在安
15、全模式中,系統(tǒng)速度變慢是正常的(特別是磁盤I/O方面)。推薦精選服務(wù)器的維護(hù)人員就應(yīng)該經(jīng)常在服務(wù)器網(wǎng)站上下載最新的管理工具程序及驅(qū)動(dòng)程序。這樣會(huì)減少很大一部份軟件故障的發(fā)生。相比之下,軟件沖突造成的故障判斷比較困難,需要管理人員有比較豐富的經(jīng)驗(yàn)以及敏銳的觀察力。曾經(jīng)有一位用戶說,他有一臺(tái)萬全的服務(wù)器無法安裝SQL SERVER 2000,已經(jīng)重裝N次NT了,排除是系統(tǒng)故障。而這唯一的服務(wù)器又將作為非常重要數(shù)據(jù)庫服務(wù)器,因此非常著急。于是維修工程師去了他的公司查看。這臺(tái)服務(wù)器所在的機(jī)房是非常標(biāo)準(zhǔn)、完善的機(jī)房,檢查了這臺(tái)服務(wù)器的情況,發(fā)現(xiàn)并沒有硬件上的故障,于是排除了光驅(qū)讀盤力差的可能。但是,用戶刻的SQL SERVER 2000光盤引起了工程師的懷疑,工程師讓他拿出了正版的SQL SERVER安裝,結(jié)果還是不行。在安裝的過程中,沒有出現(xiàn)絲毫錯(cuò)誤,可就是在運(yùn)行的時(shí)候會(huì)自動(dòng)退出,沒有任何提示。但是,我在管理工具中的事件查看器的系統(tǒng)日志中卻發(fā)現(xiàn)了一條信息:windata.exe導(dǎo)致一個(gè)無效的數(shù)據(jù)溢出。Windata是用戶自己編寫的一個(gè)程序,而且是隨操作系統(tǒng)啟動(dòng)而啟動(dòng)的程序。我立即結(jié)束掉這個(gè)進(jìn)程后,再運(yùn)行SQL一切正常。對(duì)于此類軟件故障,操作員最好先查看有關(guān)的日志,看看系統(tǒng)中是否有可疑的進(jìn)程。目前的服務(wù)器無論是高端還是低端,對(duì)于SQL等標(biāo)準(zhǔn)程序的支持是相當(dāng)可靠的,所以排除的重點(diǎn)就是結(jié)束
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人經(jīng)營性貸款合同協(xié)議
- 個(gè)人公積金貸款合同范本
- 專業(yè)金融顧問委托合同
- 臨時(shí)工程勞務(wù)合同范本
- 二手住宅購買合同范本及詳解
- 二手汽車銷售合同樣本:規(guī)范化二手車買賣協(xié)議
- 個(gè)人停車位使用權(quán)轉(zhuǎn)讓合同
- 2025年房產(chǎn)中介服務(wù)協(xié)議樣本(買方)
- 專利權(quán)轉(zhuǎn)讓合同
- 2025年電商賣家合作協(xié)議書
- 長江委水文局2025年校園招聘17人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年湖南韶山干部學(xué)院公開招聘15人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 廣東省廣州市番禺區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期末數(shù)學(xué)試題
- 智研咨詢發(fā)布:2024年中國MVR蒸汽機(jī)械行業(yè)市場(chǎng)全景調(diào)查及投資前景預(yù)測(cè)報(bào)告
- IF鋼物理冶金原理與關(guān)鍵工藝技術(shù)1
- JGJ46-2024 建筑與市政工程施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)
- 煙花爆竹重大危險(xiǎn)源辨識(shí)AQ 4131-2023知識(shí)培訓(xùn)
- 銷售提成對(duì)賭協(xié)議書范本 3篇
- 企業(yè)動(dòng)火作業(yè)安全管理制度范文
- EPC項(xiàng)目階段劃分及工作結(jié)構(gòu)分解方案
- 《跨學(xué)科實(shí)踐活動(dòng)4 基于特定需求設(shè)計(jì)和制作簡易供氧器》教學(xué)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論