




全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
IBM AIX 小型機(jī)巡檢常用命令及流程第一:首先是機(jī)房溫度以及濕度的檢查,當(dāng)然這些一般情況都沒問題。 參考值:溫度(攝氏 ) 10 40 濕度 8% 80%第二:就是關(guān)于電源的檢測,這個只要不是新裝機(jī),一般沒問題。 參考值: 零-地電壓 小于1V 火-地電壓 200-240V (補(bǔ)充:當(dāng)然59系列的機(jī)器相間380V,相地240V)第三:關(guān)于報(bào)錯。 主要查看硬件的永久性報(bào)錯 #errpt -dH | pg 軟件的永久性報(bào)錯 #errpt -dS | pg 還有系統(tǒng)又沒又報(bào)警燈 第三:機(jī)器的序列號:#uname -Mu第四:操作系統(tǒng)版本:#oslevel -r 注:有時候不能使用是因?yàn)橄到y(tǒng)版本低的原因第五:其他檢測執(zhí)行sysdumpdev l (檢查dump是否設(shè)置為always allow sysdump)執(zhí)行sysdumpdev e (檢查當(dāng)前dump大小應(yīng)該為主dump設(shè)備的大小的80以下)執(zhí)行l(wèi)svg -l rootvg (檢查有否stale狀態(tài)的邏輯卷)執(zhí)行l(wèi)sps -s (檢查內(nèi)存交換區(qū)占用情況)執(zhí)行df k (檢查文件系統(tǒng)的分配狀況,一般不要超過80%)執(zhí)行l(wèi)sdev Cc disk (檢查硬盤狀態(tài)為available)執(zhí)行l(wèi)sdev Cc adapter (檢查PCI卡狀態(tài)為available)執(zhí)行l(wèi)sdev Cc tape (檢查磁帶機(jī)狀態(tài)為available)執(zhí)行l(wèi)sdev Cc processor (檢查CPU狀態(tài)為available)執(zhí)行l(wèi)sattr El sys0|grep autorestart (檢查系統(tǒng)crash后是否自動重新啟動)執(zhí)行l(wèi)sattr El sys0|grep cpuguard (檢查CPU GUARD是否開啟)執(zhí)行l(wèi)sattr El mem0 (檢查內(nèi)存狀態(tài)正常size=goodsize)執(zhí)行 vmstat 2iostat,topas觀察us,sy,pi,po, (內(nèi)存占用率,硬盤讀寫速度等檢查是否有性能瓶頸)執(zhí)行netstat in和netstat rn (觀察網(wǎng)絡(luò)狀態(tài))執(zhí)行entstat d enX (檢測網(wǎng)卡運(yùn)行速率與交換機(jī)速率是否匹配)(網(wǎng)卡速率由10M半工改為自適應(yīng)時,缺省網(wǎng)關(guān)會丟失。更改網(wǎng)卡速率后需要在系統(tǒng)中執(zhí)行smitty route 操作重新激活缺省路由。如果進(jìn)行網(wǎng)卡速率的調(diào)整,請務(wù)必小心。)執(zhí)行ping命令 (檢查網(wǎng)絡(luò)連接狀況)執(zhí)行l(wèi)sdev C|grep aio (檢查異步IO是否可用)執(zhí)行l(wèi)ssrc g cluster (查看是否有三個進(jìn)程均為active狀態(tài))(這個主要看起了幾個HA的進(jìn)程了,有的時候是一個或兩個)執(zhí)行/usr/sbin/cluster/clstat a (查看cluster狀態(tài)是否正常)檢查/etc/hosts, 確保雙機(jī)配置中IP別名不會存在包含關(guān)系(share_ip1包含了share_ip)執(zhí)行 #more /usr/es/adm/cluster.log #more /usr/es/sbin/cluster/history/* #cat /tmp/hacmp.out (檢查這三個日志中是否有error或者fail.)檢查7133面板上的指示燈,如果黃燈亮則需要診斷問題HOTspare 磁盤檢測1、檢查是否有raid保護(hù) # smitty ssaraid-List All Defined SSA RAID Arrays2、檢查是否有Hot Spare # smitty ssaraid-List Components in a Hot Spare Pool對于7133,執(zhí)行Smitty ssaraid? List All Defined SSA RAID Arrays查看7133 raid狀態(tài),正常應(yīng)該為good狀態(tài)。對于7133,執(zhí)行Smitty ssaraid?Change/Show Use of an SSA Physical Disk查看7133硬盤狀態(tài),正常應(yīng)該為member或者spare狀態(tài)對于FastT,分別登錄上兩個controller (登陸方法后面詳細(xì)講解),查看是否有錯誤日志。記錄檢查結(jié)果cpu (主頻*數(shù)量) #lsattr -El proc0內(nèi)置磁盤個數(shù): #lsdev -Cc disk 網(wǎng)卡信息: #lsdev -Cc adapter系統(tǒng)屬性: #lsattr -E -l sys0 1 系統(tǒng)錯誤報(bào)告(Error Log)的檢查: 硬件故障檢測命令:# errpt -d H -T PERM 若有故障執(zhí)行命令# errpt -a -d H -T PERM/tmp/harderror.log保存,分析結(jié)果報(bào)告給客戶 軟件故障檢測命令:# errpt -d S -T PERM 若有故障執(zhí)行命令# errpt -a -d S -T PERM/tmp/softerror.log保存,分析結(jié)果報(bào)告給客戶 2 有否發(fā)給root用戶的錯誤報(bào)告(mail): #mail (1) 觀察所有未讀消息,注意有關(guān)diagela的消息。 (2) 常用命令: h Display headings of group containing message t Display messages in or current message. n Display next message. q Quit (3) 對發(fā)現(xiàn)的問題詳細(xì)分析,結(jié)果報(bào)告給客戶 3 文件系統(tǒng)的檢查: 命令: # df k %Used為文件系統(tǒng)的使用率。所有文件系統(tǒng)的使用率不能大于80%4 通信系統(tǒng)的檢測: (1) 網(wǎng)卡的狀態(tài) 命令: #ifconfig a 輸出判斷: en0: flags=e080863 inet 192.9.200.2 netmask 0xffffff00 broadcast 192.9.200.255 en1: flags=e080863 inet 192.9.201.1 netmask 0xffffff00 broadcast 192.9.200.255 主備網(wǎng)卡的flag為UP屬正常。同時檢查ip地址和netmask是否正確。 (2) 路由的檢測 命令: #lsattr El inet0 authm 65536 Authentication Methods True hostname h24 Host Name True gateway Gateway True route net,0,172.16.23.81 Route True bootup_option no Serial Optical Network Interface True rout6 FDDI Network Interface True (3) 網(wǎng)絡(luò)的檢測 命令: #ping ip address 輸出判斷: 用ping命令對/etc/hosts文件中的IP地址進(jìn)行操作,檢測網(wǎng)絡(luò)是否聯(lián)通。 5系統(tǒng)DUMP設(shè)置的檢查 命令: #sysdumdev l 輸出判斷: 結(jié)果應(yīng)為 primary /dev/hd6 secondary /dev/sysdumpnull copy directory /var/adm/ras forced copy flag TRUE always allow dump FALSE dump compression OFF 若不正確請用下列命令修改: #sysdumdev P p /dev/hd6 s /dev/sysdumpnull 6系統(tǒng)硬件診斷: 命令順序?yàn)椋?(1)#diag (2).Enter (3).Diagnostic Routines (4).System Verification (5).All Resources (6).F7 輸出判斷: 結(jié)果應(yīng)為No trouble was found.7補(bǔ)丁程序(PTF)的檢查 (1) 系統(tǒng)維護(hù)補(bǔ)丁版本為ML09,檢查命令為: #instfix i |grep ML 8系統(tǒng)參數(shù)的檢查 (1)HIGH water mark for pending write I/Os # lsattr -El sys0 |grep maxpout 輸出判斷: 結(jié)果應(yīng)為 maxpout 33 HIGH water mark for pending write I/Os per file True (2)LOW water mark for pending write I/Os # lsattr -El sys0|grep minpout 輸出判斷: 結(jié)果應(yīng)為 minpout 24 LOW water mark for pending write I/Os per file True 更改命令為: #chdev -l sys0 -a maxpout=33 -a minpout=24 (3)Syncd參數(shù) # grep syncd /sbin/rc.boot 輸出判斷: 結(jié)果應(yīng)為 nohup /usr/sbin/syncd 10 /dev/null 2&1 & 更改命令為: #vi /sbin/rc.boot (4)aio參數(shù) # lsdev -Cc aio 輸出判斷: 結(jié)果應(yīng)為 aio0 Available Asynchronous I/O # lsattr -El aio0 輸出判斷: 結(jié)果應(yīng)為 minservers 1 MINIMUM number of servers True maxservers 10 MAXIMUM number of servers True maxreqs 4096 Maximum number of REQUESTS True kprocprio 39 Server PRIORITY True autoconfig available STATE to be configured at system restart True fastpath enable State of fast path True 更改命令為: #smitty aio (5)Limits文件的設(shè)置: #ulimit a 輸出判斷: 結(jié)果應(yīng)為 time(seconds) unlimited file(blocks) 2097151 data(kbytes) 262144 /尤其是這項(xiàng)參數(shù) stack(kbytes) 32768 memory(kbytes) 32768 coredump(blocks) 2097151 nofiles(descriptors) 2000 更改命令為: #vi /etc/security/limits 更改data為5242889.集群狀態(tài)檢查smitty ssaraid List All Defined SSA RAID Arrayshdisk1 40263B2E0DF74CK system good 91.1GB RAID-5 array(如果是good就正常)IBM巡檢流程1、檢查系統(tǒng)硬件情況:設(shè)備故障燈是否有亮 2、系統(tǒng)錯誤報(bào)告(errlog) 3、有否發(fā)給root用戶的錯誤報(bào)告(mail) 4、檢查hacmp.out,smit.log,boot.log 5、關(guān)鍵系統(tǒng)的文件使用率不大于80% 6、邏輯卷有否stale 7、內(nèi)存交換區(qū)使用率是否超過70% 8、內(nèi)存交換區(qū)的大小是否為物理內(nèi)存的1.5倍 9、檢查備份情況(有否系統(tǒng)備份、用戶數(shù)據(jù)備份、磁帶機(jī)是否需要清洗) 10、通信(網(wǎng)卡、IP、路由表、ping、etchosts、DNS設(shè)置等) 11、是否有數(shù)據(jù)保護(hù)方式如RAID10RAID5,是否有Hot spare 12、系統(tǒng)DUMP設(shè)置是否正確 13、檢查系統(tǒng)參數(shù)是否正確 1)etcenviroment中的TZ不能有夏時制 2)如有數(shù)據(jù)庫: Aioavailable 3)HACMP中 IO pacingHigh Water MarkLow Water MArk3324 4)HACMP中 Syncd10 5)HACMP中 Power Monitoroff 14、檢查rootvg是否有鏡象 15、檢查errdemon,srcmstr是否正常運(yùn)行 16、機(jī)房環(huán)境(電壓、濕度) 17、系統(tǒng)性能:有否性能瓶頸(topas,vmstat) 18、補(bǔ)丁程序(PTF)、微碼(是否需要升級) 19、HACMP測試:Cluster Verification 20、系統(tǒng)硬件診斷 21、運(yùn)行#snap -ac,生成文件snap+sn.pax.Z 22、機(jī)器清潔 注115為A類維護(hù)(季度維護(hù)),1618為B類維護(hù)(半年維護(hù)),1922為C類維護(hù)(年度維護(hù))1、檢查系統(tǒng)硬件情況:設(shè)備故障燈是否有亮 2、系統(tǒng)錯誤報(bào)告(errlog) errpt -d H -T PERM 對有懷疑的進(jìn)一步errpt -aj 錯誤代碼more3、有否發(fā)給root用戶的錯誤報(bào)告(mail) mail 4、檢查hacmp.out,smit.log,boot.log #cd tmp ls hacmp.out找到時間最近的字節(jié)不為零的文件,vi查看 如果懷疑系統(tǒng)曾經(jīng)有調(diào)整操作,檢查smit.logalog -ot boot5、關(guān)鍵系統(tǒng)的文件使用率不大于80% #df k (查看%Used)6、邏輯卷有否stale #lsvg -l 卷組名稱 (查看狀態(tài)是否有stale的邏輯卷)7、內(nèi)存交換區(qū)使用率是否超過70% #lsps a (查看占用率是否超過70%) 8、內(nèi)存交換區(qū)的大小是否為物理內(nèi)存的1.5倍 命令同上現(xiàn)在原則有所改變,2G內(nèi)存以下可按照1.5倍的標(biāo)準(zhǔn),2G內(nèi)存以上如果交換區(qū)占用率不高,可用2GB標(biāo)準(zhǔn)9、檢查備份情況(有否系統(tǒng)備份、用戶數(shù)據(jù)備份、磁帶機(jī)是否需要清洗) 口頭詢問:系統(tǒng)備份、數(shù)據(jù)備份 檢查磁帶機(jī)面板,提醒用戶清洗10、通信(網(wǎng)卡、IP、路由表、ping、etchosts、DNS設(shè)置等) #netstat in #netstat rn #netstat I #vi etchosts (檢查DNS相關(guān)文件內(nèi)容)11、是否有數(shù)據(jù)保護(hù)方式如RAID10RAID5,是否有Hot spare 如果是7133,diagTask SelectionSSA Service AidsLink Verification,smitty ssaraidFAStT產(chǎn)品使用其管理軟件Storage Manager查看 ESS使用ESS控制臺查看12、系統(tǒng)DUMP設(shè)置是否正確 sysdumpdev -l 13、檢查系統(tǒng)參數(shù)是否正確1)etcenvironment中的TZ不能有夏時制 #vi etcenvironment檢查環(huán)境變量TZ,其格式應(yīng)該是這樣:TAIST-8,而不能是TAIST-8TAIDT-7這樣的格式2)如有數(shù)據(jù)庫:Aioavailable #lsdev -Cgrep aio (查看其狀態(tài)是否available)如不是:smitty chgaio,將狀態(tài)修
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水電行業(yè)2025年技術(shù)創(chuàng)新動態(tài)與大型水電項(xiàng)目投資效益研究報(bào)告001
- 基于風(fēng)險(xiǎn)管理的2025年文化旅游小鎮(zhèn)開發(fā)社會穩(wěn)定評估報(bào)告
- 2025年元宇宙社交平臺虛擬身份認(rèn)同與用戶體驗(yàn)研究報(bào)告
- 二手交易電商平臺信用體系建設(shè)與信用評級行業(yè)規(guī)范研究報(bào)告001
- 2025年農(nóng)業(yè)新型經(jīng)營主體農(nóng)村金融服務(wù)創(chuàng)新與培育路徑研究報(bào)告
- 2025屆山東省濟(jì)南市萊蕪區(qū)蓮河學(xué)校英語八年級第二學(xué)期期中考試試題含答案
- 2025年農(nóng)業(yè)科技成果轉(zhuǎn)化中的農(nóng)業(yè)技術(shù)培訓(xùn)案例報(bào)告
- 數(shù)字孿生在城市基礎(chǔ)設(shè)施建設(shè)中的應(yīng)用模式及2025年發(fā)展趨勢報(bào)告
- 2025年醫(yī)藥流通供應(yīng)鏈優(yōu)化與成本控制創(chuàng)新策略研究報(bào)告
- 工業(yè)互聯(lián)網(wǎng)平臺數(shù)字水印技術(shù)實(shí)時監(jiān)測與數(shù)據(jù)安全預(yù)警:2025年數(shù)據(jù)保護(hù)解決方案報(bào)告
- 2024年全國“紅旗杯”班組長大賽(復(fù)賽)備考試題庫(簡答、案例分析題)
- 全國住房城鄉(xiāng)建設(shè)行業(yè)職業(yè)技能大賽各賽項(xiàng)技術(shù)文件 C1-建筑信息模型技術(shù)員LS技術(shù)文件
- 北京大學(xué)2024年強(qiáng)基計(jì)劃筆試數(shù)學(xué)試題(解析)
- 2023-2024學(xué)年四川省南充市儀隴縣五年級數(shù)學(xué)第二學(xué)期期末經(jīng)典試題含解析
- 畜禽屠宰企業(yè)獸醫(yī)衛(wèi)生檢驗(yàn)人員考試試題
- 醫(yī)療廢物污水培訓(xùn)課件
- 設(shè)備維保的預(yù)防性維修與預(yù)防性管理
- 2022-2023學(xué)年湖北省黃岡市武穴市七年級(下)期末歷史試卷(含解析)
- 2024年江蘇瑞海投資控股集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 山東省濟(jì)南市南山區(qū)2022-2023學(xué)年六年級下學(xué)期期末考試語文試題
- 《眼球的結(jié)構(gòu)與功能》課件
評論
0/150
提交評論