RSCT 資源管理及監(jiān)控_第1頁
RSCT 資源管理及監(jiān)控_第2頁
RSCT 資源管理及監(jiān)控_第3頁
RSCT 資源管理及監(jiān)控_第4頁
RSCT 資源管理及監(jiān)控_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

IBM RSCT 中的 ERRM(Event response resource Manager) 組件為這一需求提供了一套有效的解決方案。對(duì)于常見的系統(tǒng)指標(biāo)數(shù)值,例如文件系統(tǒng)使用狀況,CPU 工作狀況,內(nèi)存使用狀況以及網(wǎng)卡各種指標(biāo)值等都提供了很好的支持。同時(shí),用戶也可以很方便地定制各種系統(tǒng)資源監(jiān)控。本文將詳細(xì)闡述 RSCT ERRM 在集群系統(tǒng)監(jiān)控中的應(yīng)用。 隨著大規(guī)模集群系統(tǒng)的廣泛應(yīng)用,系統(tǒng)的監(jiān)控變得日趨復(fù)雜,對(duì)于系統(tǒng)各種指標(biāo)數(shù)值的監(jiān)控的顯得愈發(fā)重要。IBM RSCT 中的 ERRM(Event response resource Manager) 組件為這一需求提供了一套有效的解決方案。對(duì)于常見的系統(tǒng)指標(biāo)數(shù)值,例如文件系統(tǒng)使用狀況,CPU 工作狀況,內(nèi)存使用狀況以及網(wǎng)卡各種指標(biāo)值等都提供了很好的支持。同時(shí),用戶也可以很方便地定制各種系統(tǒng)資源監(jiān)控。本文將詳細(xì)闡述 RSCT ERRM 在集群系統(tǒng)監(jiān)控中的應(yīng)用。1. RSCT 框架簡介 RSCT(Reliable Scalable Cluster Technology)是一系列軟件組件的集合,為 IBM 許多集群軟件提供可用性,可擴(kuò)展性及易用性等方面的底層支持。RSCT 包含以下幾個(gè)組件,本文主要討論 RMC 子系統(tǒng)和核心資源管理器 ERRMRMC 子系統(tǒng) (Resource Monitoring and Control subsystem) RSCT 核心資源管理器 (RSCT core resource managers),包括 ERRM, ConfigRM, FSRM,HostRM,SensorRM 等。 RSCT 集群安全服務(wù) (RSCT cluster security services) 拓?fù)浞?wù)子系統(tǒng) (Topology Services subsystem) 組群服務(wù)子系統(tǒng) (Group Services subsystem) 圖 1. RSCT 資源架構(gòu)圖 1 顯示了 RSCT 中資源的架構(gòu), RMC 子系統(tǒng)是整個(gè) RSCT 的核心,它為其它組件提供了一套通用的接口,這樣 RSCT 的上層客戶軟件無需關(guān)心各個(gè)底層的資源管理器的運(yùn)行細(xì)節(jié),只要通過 RMC 提供的接口 (RMC API) 與 RSCT 進(jìn)行通信。同時(shí),底層的資源管理器及服務(wù)只需實(shí)現(xiàn) RMC 指定的接口 (RMF API) 來提供相應(yīng)的功能。本文中的 ERRM 就是 RSCT 核心資源管理器的一種,它主要用于系統(tǒng)監(jiān)控。2. RSCT 資源 / 資源類、域 2.1 資源和資源類 RSCT 中最基礎(chǔ)的概念就是資源 (resource)。所謂資源,在 RSCT 中可以是任意的物理或者邏輯上的實(shí)體,例如集群中的一個(gè)主機(jī)節(jié)點(diǎn),主機(jī)上的一個(gè)網(wǎng)卡或主機(jī)操作系統(tǒng)的根文件系統(tǒng)等等,資源有許多不同的屬性,所有擁有相同屬性而又有不同屬性值的資源組成了資源類 (resource class),資源類負(fù)責(zé)發(fā)現(xiàn)資源,創(chuàng)建資源,刪除資源等等。一個(gè)資源類隸屬于一個(gè)資源管理器(resource manager),而資源管理器可以提供任意數(shù)量的資源類。RSCT 幾乎所有的功能都和資源以及資源類相關(guān)。 在 RSCT 的各個(gè)包被正確安裝以后可以通過 RMC 的命令行接口來顯示系統(tǒng)中的關(guān)于資源和資源類的各種信息。2.1.1. 顯示資源類 / 資源定義 通過 RMC 的命令行接口 lsrsrcdef(該命令位于目錄 /usr/sbin/rsct/bin 中)可以顯示關(guān)于資源和資源類的定義信息,在不帶任何參數(shù)的情況下,該命令會(huì)輸出系統(tǒng)中所有存在的資源類。示例 1 演示了如何使用 lssrcdef 命令來查看系統(tǒng)中所有的 RSCT 資源類(注:該示例是筆者測(cè)試環(huán)境中的輸出,實(shí)際情況可能與此會(huì)有不同): 示例 1c176n11:/ # lsrsrcdefclass_nameIBM.ConditionIBM.EthernetDeviceIBM.EventResponseIBM.FDDIDeviceIBM.HostIBM.FileSystem.可以將資源類作為參數(shù)傳遞給命令 lsrsrcdef 并加上 -c 選項(xiàng)顯示資源類本身的定義,示例 2 是將 IBM.FileSystem 資源類作為參數(shù)傳遞給命令 lsrsrcdef 的輸出,可見 IBM.FileSystem 屬于資源管理器 IBM.FSRM: 示例 2c176n11:/ # lsrsrcdef -c -e IBM.FileSystemResource Class Definition for IBM.FileSystemresource class 1:class_name = IBM.FileSystemclass_id = 9properties = has_rsrc_insts,has_ctrl_interface,mtype_subdivideddisplay_name = File Systemdescription = The FileSystem resource class monitors the attributes andmount status of all resources.locator = NodeNameListclass_pattr_count = 1class_dattr_count = 3class_action_count = 0pattr_count = 32dattr_count = 4action_count = 0error_count = 0rsrc_mgr_count = 1rsrc_mgrs 1:mgr_name = IBM.FSRMfirst_key = 1last_key = 1資源類本身也有一些屬性可以通過 lsrsrcdef -c -A p|d resource_class 來進(jìn)一步顯示,其中 -A 選項(xiàng)表示希望顯示的屬性是永久屬性(-A p), 還是動(dòng)態(tài)屬性(-A d), 這類屬性值可能隨時(shí)發(fā)生變化。如果要顯示資源相關(guān)信息,只要去掉 lsrsrcdef 命令中的 -c 選項(xiàng)并加上 -A d|p 選項(xiàng),其中 -A d 表示顯示動(dòng)態(tài)屬性,-A p 顯示永久屬性。示例 3 顯示 IBM.FileSystem 資源的動(dòng)態(tài)屬性定義: 示例 3c176n11:/ # lsrsrcdef -Ad -e IBM.FileSystemResource Dynamic Attribute Definitions for IBM.FileSystemattribute 1:program_name = OpStatedisplay_name = Operational Stategroup_name = Generalproperties = publicdescription = Whenever the operational state of a resource is changed,this dynamic attribute is asserted.attribute_id = 1group_id = 0data_type = uint32variable_type = statevariety_list = 1,8variety_count = 1init_value = 0min_value = 0max_value = 100expression = OpState != 1expression_description = An event will be generated when the filesystem goes offline.rearm_expression = rearm_description = PTX_name = attribute 2:program_name = PercentTotUsedattribute 3:program_name = PercentINodeUsed可以看出 IBM.FileSystem 資源有三個(gè)動(dòng)態(tài) (-A d 選項(xiàng) ) 屬性,同樣的方法可以顯示出資源的永久屬性。2.1.2. 顯示資源類 / 資源屬性值 RMC 同樣提供了用于顯示資源類和資源屬性值的方法 rmc 接口 lsrsrc。例如,希望得到系統(tǒng)中所有的 IBM.FileSystem 資源及其屬性值??梢酝ㄟ^ lsrsrc -A d|p|b -s “selection_string” IBM.FileSystem 來得到。其中 -A 選項(xiàng)值的 d 代表動(dòng)態(tài)屬性,p 表示永久屬性,b 表示兩者,-s 選項(xiàng)用于過濾希望顯示的 IBM.FileSystem 資源信息。示例 4 顯示了 Name 屬性不等于 (/) 的 IBM.FileSystem 資源的永久屬性值: 示例 4c176n11:/ # lsrsrc -Ap -s Name !=/ IBM.FileSystemResource Persistent Attributes for IBM.FileSystemresource 1:Name = /optMountPoint = /optMountDir = /optDev = /dev/hd10optVfs = jfsLog = Mount = truePermissions = rwAccount = Type = Size = 262144Frag = 512Nbpi = 4096Compress = noBf = falseAg = 8ManualMode = 0ActivePeerDomain = NodeNameList = resource 2:Name = /tmpresource 3:Name = /varresource 4:Name = /usrresource 5:Name = /home2.1.3. 創(chuàng)建資源 一般情況下并不需要手動(dòng)去創(chuàng)建資源,因?yàn)樵诟鱾€(gè)資源管理器初始化的時(shí)候都會(huì)自動(dòng)調(diào)用資源類的發(fā)現(xiàn)程序去檢查系統(tǒng)當(dāng)前屬于該資源類的資源并存儲(chǔ)。例如對(duì)于 IBM.FileSystem 資源類,它屬于資源管理器 IBM.FSRM,當(dāng) IBM.FSRM 初始化的時(shí)候,就會(huì)驅(qū)動(dòng) IBM.FileSystem 發(fā)現(xiàn)程序去檢查系統(tǒng)當(dāng)前存在的文件系統(tǒng)資源并存儲(chǔ)起來。但有時(shí)候還是得手動(dòng)創(chuàng)建一些資源,例如 ERRM 的 IBM.Condition 資源。創(chuàng)建資源的 rmc 接口為 mkrsrc。將 -e 選項(xiàng)和資源類名作為 mkrsrc 的參數(shù)時(shí),會(huì)顯示創(chuàng)建該資源類必須指定的屬性以及可選屬性的例子。示例 5 的輸出顯示了如何創(chuàng)建 IBM.FileSystem 資源:示例 5c176n11:/ # mkrsrc -e IBM.FileSystemSample mkrsrc command with required attributes:mkrsrc IBM.FileSystem Name=char_ptrSample mkrsrc command with required and optional attributes, and command arguments:mkrsrc IBM.FileSystem Name=char_ptr NodeNameList=char_ptr_array NodeIDs=uint64_array2.1.4. 修改資源類 / 資源永久屬性值 對(duì)于已經(jīng)創(chuàng)建或者自動(dòng)發(fā)現(xiàn)的資源,可以通過 rmc 接口 chrsrc 來修改資源的永久屬性值,注意并不是所有的永久屬性值都可以修改的,資源只讀屬性是無法通過 chrsrc 來修改的。可將屬性和資源類作為參數(shù)通過 2.1.1 中 lsrsrcdef 接口檢查資源屬性是否可以手動(dòng)改變,動(dòng)態(tài)屬性值一般不通過 rmc 修改,而是隨著系統(tǒng)變化,屬性值自動(dòng)由各個(gè)資源管理器根據(jù)一定的頻率收集設(shè)置。可以通過 -s 選項(xiàng)來對(duì)滿足特定條件的某個(gè)或者某些資源的屬性值進(jìn)行修改。示例 6 是修改 Name 屬性等于”FSCondition”的 IBM.Condition 資源的 EventExpression 屬性值:示例 6c176n11:/#chrsrc -s Name =FSCondition IBM.Condition EventExpression=Name !=除了 -s 選項(xiàng),可以通過指定在整個(gè) cluster 中是唯一的資源句柄(resource handler)屬性值,來限定某個(gè)資源修改屬性值,資源句柄可以通過 lsrsrc 得到,具體請(qǐng)參見參考文獻(xiàn) 2。修改資源類的屬性值,同樣使用 chrsrc 接口,但比資源多一個(gè) -c 選項(xiàng)表示資源類。2.1.5. 刪除資源 對(duì)于系統(tǒng)中的各種資源,可以通過 rmc 接口 rmrsrc 刪除。如 chrsrc 接口一樣,rmrsrc 支持 -s 選項(xiàng)和基于資源句柄的形式。示例 7 表示刪除系統(tǒng)中所有 IBM.Condition 資源:示例 7c176n11:/ # rmrsrc -s Name != IBM.Condition2.2. RSCT 域RSCT 域表示集群節(jié)點(diǎn)配置目的。集群中的節(jié)點(diǎn)可以配置為 high availability( 高可用性 ) 或者 manageability( 可管理性 ),這樣可以將節(jié)點(diǎn)所處的域或者環(huán)境分為兩種:1)Peer Domain2) Mangement Domain(管理域);Peer Domain 表示該節(jié)點(diǎn)位于這樣一個(gè)集群系統(tǒng)中,集群系統(tǒng)中的節(jié)點(diǎn)的地位都是等同的,一個(gè)節(jié)點(diǎn)知道集群中其余所有節(jié)點(diǎn)的信息,這為高可用性應(yīng)用提供了條件,因?yàn)閺耐饨鐏砜?,整個(gè)集群是一個(gè)整體,任何一個(gè)節(jié)點(diǎn)宕機(jī)都可能有剩余節(jié)點(diǎn)來繼續(xù)提供相應(yīng)的服務(wù);Management Domain,這種集群里,一個(gè)管理服務(wù)器(Management Server)管理若干個(gè)被管理節(jié)點(diǎn)(Managed Node),這種 Domain 中,被管理節(jié)點(diǎn)之間互相不知道對(duì)方的信息。只有管理服務(wù)器知道所有的被管理節(jié)點(diǎn)的信息,這種集群主要是為了簡化系統(tǒng)管理,所有的管理工作都可以在管理服務(wù)器上完成。通常的集群往往是 Peer Domain 和 Mangement Domain 的組合。如圖 2 所示:Node1,Node2,Node3 是管理服務(wù)器的被管理節(jié)點(diǎn)同時(shí)位于 PeerDomain1,Node n-1,Node n 類似。圖 2. 同時(shí)擁有 Peer Domain 和 Management Doman 的集群2.2.1. 建立 Peer Domain建立 Peer Domain 一般可以遵照以下步驟:1)列出需要加入到該 PeerDomain 的所有節(jié)點(diǎn),確保節(jié)點(diǎn)之間都是互通的(各個(gè)節(jié)點(diǎn) /etc/hosts 里面都有所有集群節(jié)點(diǎn)的 Host 名與 IP 信息)而且已經(jīng)正確安裝 RSCT 軟件包。如有 NodeA,NodeB,NodeC,NodeD 需要加入 Peer Domain。2)確定 1)中的一個(gè)節(jié)點(diǎn)為 originator 節(jié)點(diǎn),如 NodeA3)在 NodeB,NodeC,NodeD 上執(zhí)行 preprpnode NodeA,使得節(jié)點(diǎn) NodeA 和這些節(jié)點(diǎn)間建立信任關(guān)系; 4)在 Originator 節(jié)點(diǎn)如 NodeA 上,執(zhí)行 mkrpdomain NodeA NodeB NodeC NodeD5)在任一個(gè)節(jié)點(diǎn)上執(zhí)行 startrpdomain 啟動(dòng)該 Peer Domain,注意一個(gè)節(jié)點(diǎn)可以同時(shí)位于多個(gè) Peer Domain 中,但同時(shí)只能在其中一個(gè) domain 里面 Online。6)Peer Domain 建立以后可以通過 addrpnode,rmrpnode 增加和減少集群中的節(jié)點(diǎn)。通過 stoprpdomain 使得整個(gè)集群 offline,通過 stoprpnode/startrpnode 停止和啟動(dòng)節(jié)點(diǎn)。如果從資源的角度分析 Peer Domain 的建立,相當(dāng)于各個(gè)節(jié)點(diǎn)的系統(tǒng)在后臺(tái)創(chuàng)建了兩種隸屬于資源管理器 IBM.ConfigRM 的資源類 IBM.PeerDomain 和 IBM.PeerNode 的資源。同樣可以通過 lsrsrc 命令顯示這兩種資源的屬性值。2.2.2. 建立 Management Domain對(duì)于建立管理域(Management Domain),目前是通過基于 RSCT 的上層的軟件 CSM 實(shí)現(xiàn)的。將集群中的一個(gè)節(jié)點(diǎn)作為管理服務(wù)器(Management server),其余節(jié)點(diǎn)作為該管理服務(wù)器的被管理節(jié)點(diǎn)。大體步驟如下:列出需要加入到該管理域的所有節(jié)點(diǎn),確保已經(jīng)正確安裝 RSCT 軟件包。 指定其中一個(gè)為管理服務(wù)器,該管理服務(wù)器需要知道所有被管理節(jié)點(diǎn)的 Host 名與 IP 地址(通常將這些信息放在 /etc/hosts 中)。在所有節(jié)點(diǎn)上安裝 CSM 軟件包,相對(duì)于被管理節(jié)點(diǎn),管理服務(wù)器需要安額外裝 csm.server ( 以 AIX 為例 ) 及其依賴的包。反之,被管理節(jié)點(diǎn)需要安裝 csm.client 包而這對(duì)于管理服務(wù)器是可選的(管理服務(wù)器本身也可以成為自身的被管理節(jié)點(diǎn)) 在管理服務(wù)器的上,通過 definenode 定義被管理節(jié)點(diǎn)。設(shè)置資源管理器 IBM.DMSRM 的 AddUnrecognizedNodes 屬性為 1,這樣被管理節(jié)點(diǎn)可以注冊(cè)到該管理服務(wù)器上。 在被管理節(jié)點(diǎn)上執(zhí)行:mgmtsvr -n 以上步驟成功執(zhí)行以后,整個(gè)管理域就建立起來了。從資源的角度分析 Management Domain 的建立,管理服務(wù)器在后臺(tái)創(chuàng)建了隸屬于資源管理器 IBM.DMSRM 的資源類 IBM.ManagedNode 的資源,每個(gè)被管理節(jié)點(diǎn)對(duì)應(yīng)一個(gè) IBM.ManagedNode 資源以存儲(chǔ)被管理節(jié)點(diǎn)的信息;而被管理節(jié)點(diǎn)則創(chuàng)建了對(duì)應(yīng)于 IBM.CSMAgentRM 的資源類 IBM.ManagementServer 的資源以存儲(chǔ)管理服務(wù)器的各種信息。3. RSCT 資源監(jiān)控 資源管理器 IBM ERRM 提供了三個(gè)資源類 IBM.Condition,IBM.EventResponse,IBM.Assosication。系統(tǒng)資源監(jiān)控是 ERRM 主要的功能,即如果系統(tǒng)在某一時(shí)刻某個(gè)條件 (condition) 滿足,與這個(gè)條件關(guān)聯(lián)的預(yù)先定義的動(dòng)作 (response) 就會(huì)被觸發(fā)。這里的條件對(duì)應(yīng)于 ERRM 的 IBM.Condition 資源類,它用于定義用戶關(guān)心的系統(tǒng)資源的狀況,如某個(gè)節(jié)點(diǎn)的 /tmp 文件系統(tǒng)使用比例大于 90% 就是一個(gè)條件;而動(dòng)作對(duì)應(yīng)于 IBM.EventResponse 資源類,它用于定義在某個(gè)條件滿足時(shí),用戶想采取的措施,如當(dāng)上面的 /tmp 使用大于 90% 時(shí)使用郵件通知系統(tǒng)管理員就是一個(gè)動(dòng)作。另外,ERRM 的還有一個(gè)資源類 IBM.Association,一個(gè) IBM.Association 資源用于關(guān)聯(lián)一個(gè) IBM.Condition 資源和一個(gè) IBM.EventResponse。這樣只需定義多個(gè) IBM.Association 資源用于關(guān)聯(lián)不同的 IBM.Condition 資源和 IBM.EventResponse 資源就可以重復(fù)利用已經(jīng)存在的 IBM.Condition 資源和 IBM.EventResponse 資源。同時(shí),只有在 IBM.Condition 資源和 IBM.EventResponse 資源被一個(gè)活動(dòng)的(Active)的 IBM.Association 資源關(guān)聯(lián)的時(shí)候,這些條件和相應(yīng)的動(dòng)作才會(huì)觸發(fā)。 根據(jù)需要,可以創(chuàng)建監(jiān)控不同域范圍的 IBM.Condition 資源,然后關(guān)聯(lián)相應(yīng)的 IBM.EventResponse 資源來達(dá)到資源監(jiān)控的目的。其一般步驟如下:根據(jù)需要建立集群,如獨(dú)立系統(tǒng),Management Domain 或 Peer Domain; 確定需要監(jiān)控的系統(tǒng)資源及其屬性 創(chuàng)建 IBM.Condition 資源并根據(jù)需要設(shè)定監(jiān)控范圍; 創(chuàng)建或使用已存在的,在條件滿足時(shí)觸發(fā)的動(dòng)作即 IBM.EventResponse 資源; 創(chuàng)建 IBM.Assocation 資源關(guān)聯(lián) 3)和 4)中的 IBM.Condition 和 IBM.EventResponse 資源;并使其處于 Active 狀態(tài); 上面 1),2)兩步在上面的章節(jié)中已經(jīng)介紹過。下面闡述如何具體的 IBM.Condition,IBM.EventResponse 以及 IBM.Association 資源。3.1 管理 IBM.Condition 資源 根據(jù) IBM.Condition 資源監(jiān)控范圍的不同,可以將系統(tǒng)監(jiān)控分為對(duì)獨(dú)立系統(tǒng)資源的監(jiān)控,對(duì) Peer Domain 范圍內(nèi)系統(tǒng)資源的監(jiān)控和對(duì) Management Domain 系統(tǒng)范圍資源的監(jiān)控。而這只需在創(chuàng)建 IBM.Condition,將不同的參數(shù)值傳給命令 mkcondition 的 -m 選項(xiàng)。 示例 8 是通過 IBM.ERRM 提供的接口 mkcondition 創(chuàng)建 IBM.Condition 資源的一般形式:示例 8mkcondition r resource_class eevent_expression Erearm_expression d event_description D rearm_description m l m p n node_name1,node_name2. p node_name qnotoggle qtoggle s selection_stringS c w i h TV condition下面是其中的重要選項(xiàng)涵義,-r 表示被監(jiān)控的資源類, -e 表示被監(jiān)控資源的屬性構(gòu)成的某個(gè)條件表達(dá)式其返回值是真或者假,開始監(jiān)控以后 rmc 以一定頻率不斷檢測(cè)該條件的結(jié)果,如果為真變觸發(fā)相應(yīng)的事件,執(zhí)行相應(yīng)的動(dòng)作。 -E 是可選的,意思是如果 -e 中的表達(dá)式為真時(shí),不在重復(fù)檢測(cè) -e 中的條件,轉(zhuǎn)而檢測(cè) -E 中的條件,其主要目的是是避免不斷觸發(fā)重復(fù)事件; -d, -D 分別是對(duì)于 -e,-E 中條件表達(dá)式的描述; -m 表示希望 IBM.Condition 資源監(jiān)控的范圍,l 表示 local 即 Individual Workstation,m 表 Management Domain 中所有節(jié)點(diǎn)資源,p 表示 Peer Domain 中所有節(jié)點(diǎn)的資源 -n 表示在 -m 的指定的范圍內(nèi)的某個(gè)或者某些特定的節(jié)點(diǎn)上監(jiān)控資源,如對(duì)于一個(gè)有三個(gè)節(jié)點(diǎn) NodeA, NodeB, NodeC 的某個(gè) Peer Domain 中,如果只需要監(jiān)控 NodeA 和 NodeB 上的資源,則傳遞 -n NodeA,NodeB 給 mkcondition; -p 表示希望該 IBM.Condition 資源最終被創(chuàng)建在哪個(gè)節(jié)點(diǎn);默認(rèn)為命令執(zhí)行所在的節(jié)點(diǎn); -s 表示篩選滿足該條件的資源進(jìn)行監(jiān)控,默認(rèn)情況下,會(huì)對(duì)屬于由 -r 指定的資源類的所有資源進(jìn)行監(jiān)控。例如只希望監(jiān)控 IBM.FileSystem 資源中的根文件系統(tǒng),可以傳遞 -s “Name = /”給 mkcondition; -TV 表示打印出 mkcondition 命令的詳細(xì)執(zhí)行輸出,一般作為調(diào)試使用。 condition 表示該 IBM.Condition 資源的名字。 示例 9 是在 Peer Domain 中為了監(jiān)控整個(gè) PeerDomain 中所有節(jié)點(diǎn)的根文件系統(tǒng)的空間使用百分比創(chuàng)建 IBM.Condition 資源的例子:示例 9mkcondition -r IBM.FileSystem -e “PercentTotUsed 90”-d “An event will be generated when more than 90 percent of the total space ofthe filesystem is in use.” -E “PercentTotUsed 90” EventDescription=” An event will be generated when more than90 percent of the total space of the filesystem is in use.” RearmDescription=“PercentTotUsed 95” PeerDomainRootFSCondition示例 12 表示對(duì)應(yīng)于 chcondition 命令的 chrsrc 命令形式 示例 12chrsrc -s “Name = PeerDomainRootFSCondition” IBM.Condition EventExpression=” PercentTotUsed 95”顯示系統(tǒng)中所有或者某個(gè) IBM.Condition 資源可以通過 lscondition 命令 , 示例 13 展示如何顯示 PeerDomainRootFSCondition 的定義:示例 13lscondition PeerDomainRootFSCondition示例 14 表示對(duì)應(yīng)于 lscondition 的 lsrsrc 命令形式 :示例 14lsrsrc -s “Name = PeerDomainRootFSCondition” IBM.Condition如果希望刪除該某個(gè) IBM.Condition 資源,可以通過 rmcondition 或者 rmrsrc,承接上面的例子,示例 15 顯示如何刪除一個(gè)條件: 示例 15rmcondition PeerDomainRootFSCondition示例 16 表示對(duì)應(yīng)于 rmcondition 的 rmrsrc 命令形式:示例 16rmrsrc -s “Name = PeerDomainRootFSCondition” IBM.Condition3.2 管理 IBM.EventResponse 資源只有 IBM.Condition 條件還不足夠完成所有的功能,在條件滿足的時(shí)候,必需能夠觸發(fā)相應(yīng)的動(dòng)作,才能達(dá)到資源監(jiān)控的功能,而 IBM.EventResponse 資源的作用正在于此。示例 17 是 IBM.ERRM 組件提供的 mkresponse 接口創(chuàng)建 IBM.EventResponse 資源的其一般形式:示例 17mkresponse n action d days_of_week,days_of_week. t time_of_day,time_of_day. s action_scriptr return_code e a r b oE env_var=value,env_var=value. u p node_nameh TV response-n 表示屬于該 IBM.EventResponse 資源一個(gè)動(dòng)作名,定義 IBM.EventResponse 資源時(shí)只能定義一個(gè) action,但修改時(shí)可以增加; -d 表示該動(dòng)作在一周中的這幾天執(zhí)行,1 表示周日,2 表示周一,其余依次類推??梢酝^-表示一個(gè)時(shí)間段如 1-7 表示整個(gè)星期;用+不連續(xù)的天時(shí)間段如 1+7 表示周日和周一; -t 表示在某天的那個(gè)時(shí)間段該動(dòng)作執(zhí)行;用二十四小時(shí)制的 hhmm 的形式表示,1015 表示 10:15am -s 表示動(dòng)作可執(zhí)行程序,可以是命令或者是可執(zhí)行腳本。RSCT 提供了三個(gè)腳本 logevent,notifyevent 以及 wallevent,可以自己編寫自己需要的腳本。 -p 表示 IBM.EventResponse 資源最終被創(chuàng)建在的節(jié)點(diǎn),默認(rèn)為執(zhí)行命令的節(jié)點(diǎn) response 表示該 IBM.EventResponse 資源的名稱。 下面創(chuàng)建的 IBM.EventResponse 資源表示在工作日工作時(shí)間時(shí)執(zhí)行動(dòng)作 NotifyAdmin,其目的是發(fā)送短消息給系統(tǒng)管理員有相關(guān)信息:mkresponse -n NotifyAdminVia -d 2-6 -t 0900-1600 -s “/bin/sendSMS” NotifyAdminResponse其中 sendSMS 是用戶自己自定義的腳本用于發(fā)送短消息。如果希望修改已經(jīng)定義的 IBM.EventResponse 資源,可以通過 chresponse 完成。示例 18 表示對(duì)于上面的 IBM.EventResponse 資源,如需增加一個(gè)動(dòng)作序列,除了發(fā)送短消息給系統(tǒng)管理員,還希望通過在 console 上輸出一些信息通知已登錄的用戶 , 并改為一周全天候執(zhí)行所有動(dòng)作。示例 18chresponse -a -n NotifyLogonUser “/usr/sbin/rsct/bin/wallevent -c -d 1-7 -t 0000-2400NotifyAdminResponse顯示系統(tǒng)中所有或者某個(gè) IBM. EventResponse 資源可以通過 lsresponse 命令。示例 19 表示顯示 NotifyAdminResponse 資源定義:示例 19lsresponse NotifyAdminResponse示例 20 表示使用 rmresponse 刪除 IBM.EventResponse 資源:示例 20rmresponse NotifyAdm

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論