OpenStack私有云基礎(chǔ)架構(gòu)與運維(openEuler版)(微課版)-實操手冊 項目5 云基礎(chǔ)架構(gòu)平臺管理_第1頁
OpenStack私有云基礎(chǔ)架構(gòu)與運維(openEuler版)(微課版)-實操手冊 項目5 云基礎(chǔ)架構(gòu)平臺管理_第2頁
OpenStack私有云基礎(chǔ)架構(gòu)與運維(openEuler版)(微課版)-實操手冊 項目5 云基礎(chǔ)架構(gòu)平臺管理_第3頁
OpenStack私有云基礎(chǔ)架構(gòu)與運維(openEuler版)(微課版)-實操手冊 項目5 云基礎(chǔ)架構(gòu)平臺管理_第4頁
OpenStack私有云基礎(chǔ)架構(gòu)與運維(openEuler版)(微課版)-實操手冊 項目5 云基礎(chǔ)架構(gòu)平臺管理_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

云基礎(chǔ)架構(gòu)平臺管理模塊簡介對云基礎(chǔ)架構(gòu)平臺進行規(guī)劃管理,包括部門間、項目間安全策略上的資源規(guī)劃,對云基礎(chǔ)架構(gòu)平臺的資源使用狀況、平臺運行狀態(tài)進行監(jiān)控以及對突發(fā)故障的應(yīng)急解決與排查進行處理。模塊知識(1)掌握云平臺資源的管理方法。(2)掌握常見云平臺監(jiān)控管理工具的使用。(3)具備云平臺的運維、管理和排錯的綜合能力。環(huán)境準備云平臺資源規(guī)劃已部署完成的OpenStack集群環(huán)境或AllInOne環(huán)境。云平臺監(jiān)控管理已部署完成的OpenStack集群環(huán)境或AllInOne環(huán)境。云平臺故障排查已部署完成的OpenStack集群環(huán)境或AllInOne環(huán)境。容器化部署Zabbix監(jiān)控系統(tǒng)使用openEuler22.09操作系統(tǒng)容器化部署Zabbix監(jiān)控系統(tǒng),節(jié)點規(guī)劃見表4-1。表4-1Zabbix-Server節(jié)點規(guī)劃IP主機名節(jié)點76zabbix-serverZabbix-Server節(jié)點模塊內(nèi)容實戰(zhàn)案例——云平臺資源規(guī)劃云平臺資源規(guī)劃對于優(yōu)化資源配置、保障業(yè)務(wù)高效運行具有重要意義。下面將逐步深入探討三個核心方面,旨在構(gòu)建一個既保障部門間資源隔離與安全性,又能促進有效資源共享,并借鑒最佳實踐優(yōu)化企業(yè)級云平臺資源規(guī)劃的策略體系。部門資源隔離(1)基于項目的資源隔離創(chuàng)建項目,在云平臺上創(chuàng)建不同的項目,將同一項目的相關(guān)資源放入該項目中,命令如下所示。#openstackprojectcreatewxicproject#openstackprojectcreatewxicproject創(chuàng)建用戶并加入項目中,在項目中分配資源,如計算實例、存儲、網(wǎng)絡(luò)等,確保每個項目都擁有自己獨立的計算、存儲和網(wǎng)絡(luò)資源。創(chuàng)建“wxicuser”用戶加入到“wxicproject”項目中,命令如下所示。#openstackusercreate--projectwxicproject--password000000#openstackusercreate--projectwxicproject--password000000wxicuser每個項目都可以設(shè)置特定的訪問權(quán)限,以確保項目資源只被授權(quán)的用戶或團隊訪問,將項目中的用戶激活,命令如下所示。#openstackuserset--enablewxicuser#openstackuserset--enablewxicuser使用下列命令,將“wxicuser”用戶添加為“admin”角色。#openstackroleadd--projectwxicproject--userwxicuseradmin#openstackroleadd--projectwxicproject--userwxicuseradmin(2)基于安全組的資源隔離云平臺基于安全組的資源隔離是防止不同云服務(wù)之間相互干擾以及對內(nèi)部和外部的攻擊的重要方法。安全組是云平臺中一種實現(xiàn)安全隔離和訪問控制的網(wǎng)絡(luò)級別的安全管理模型。創(chuàng)建“wxicproject”項目對應(yīng)的安全組。#openstacksecuritygroupcreate--projectwxicproject#openstacksecuritygroupcreate--projectwxicprojectwxicsecurity添加流量入口方向規(guī)則,命令如下。#openstacksecuritygrouprulecreate--ingress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--ingress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--ingress--protocoltcpwxicsecurity#openstacksecuritygrouprulecreate--ingress--protocolicmpwxicsecurity添加流量出口方向規(guī)則,命令如下。#openstacksecuritygrouprulecreate--egress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--egress--protocoludpwxicsecurity#openstacksecuritygrouprulecreate--egress--protocoltcpwxicsecurity#openstacksecuritygrouprulecreate--egress--protocolicmpwxicsecurity使用安全組命令,檢測安全組規(guī)則,查看根據(jù)IP協(xié)議創(chuàng)建的規(guī)則,命令如下。#openstacksecuritygrouprulelistwxicsecurity#openstacksecuritygrouprulelistwxicsecurity(3)基于區(qū)域的資源隔離云平臺基于區(qū)域的資源隔離是一種資源隔離方法,將不同的資源放置在不同的區(qū)域中以實現(xiàn)資源的隔離和保護。使用命令創(chuàng)建區(qū)域“wxicdomain”,命令如下。#openstackdomaincreatewxicdomain#openstackdomaincreatewxicdomain激活區(qū)域“wxicdomain”,命令如下。#openstackdomainset--enablewxicdomain#openstackdomainset--enablewxicdomain在域中創(chuàng)建項目,命令如下。#openstackprojectcreate--domainwxicdomainwxicproject#openstackprojectcreate--domainwxicdomainwxicproject激活項目,命令如下。#openstackprojectset--domainwxicdomain--enablewxicproject#openstackprojectset--domainwxicdomain--enablewxicproject查詢當前域下所有項目,命令如下。#openstackprojectlist--domainwxicdomain#openstackprojectlist--domainwxicdomain在域中創(chuàng)建用戶,可以為每個區(qū)域設(shè)定訪問權(quán)限,確保只有授權(quán)用戶才能訪問該區(qū)域中的資源,使用命令創(chuàng)建域用戶,命令如下。#openstackusercreate--domainwxicdomain--password000000#openstackusercreate--domainwxicdomain--password000000wxicuser激活域用戶,命令如下。#openstackuserset--domainwxicdomain--enablewxicuser#openstackuserset--domainwxicdomain--enablewxicuser將創(chuàng)建的域用戶“wxicuser”添加到項目“wxicproject”中,命令如下。##openstackroleadd--project-domainwxicdomain--projectwxicproject--user-domainwxicdomain--userwxicuseradmin部門資源共享(1)共享鏡像共享鏡像是指云平臺上的一種鏡像共享服務(wù),它允許用戶在同一個區(qū)域或跨區(qū)域共享和使用同一份基礎(chǔ)鏡像軟件,而無需經(jīng)過多次的重復(fù)下載。(2)共享網(wǎng)絡(luò)和子網(wǎng)在云平臺上,共享網(wǎng)絡(luò)和子網(wǎng)可以讓多個云主機共享同一個網(wǎng)絡(luò),提高網(wǎng)絡(luò)使用效率和降低成本。企業(yè)云平臺資源規(guī)劃的最佳實踐(1)規(guī)劃各部門可用的資源配額企業(yè)環(huán)境下,通常由平臺管理員進行設(shè)置和調(diào)整云平臺的使用配額。管理人員會通過評估部門的業(yè)務(wù)負載,來將資源分配給不同的主機、環(huán)境。如CPU、內(nèi)存、存儲、帶寬等。(2)資源使用監(jiān)控云平臺資源使用監(jiān)控是保障云服務(wù)穩(wěn)定性和性能優(yōu)化的重要手段。一般而言,云平臺監(jiān)控工具可以提供以下功能:實時監(jiān)控云資源的使用情況,例如CPU使用率、存儲空間使用率、帶寬使用率等。對不同的資源使用情況進行統(tǒng)計分析,例如對CPU使用量的歷史數(shù)據(jù)進行統(tǒng)計分析,以便更好地進行資源規(guī)劃和優(yōu)化。報警功能,當某個資源使用量超過預(yù)設(shè)的閾值時,可以自動發(fā)送警報通知管理員,以便及時采取措施。靈活的可視化界面,以便管理員輕松地查看資源使用情況,并進行直觀的分析和決策。對不同應(yīng)用的資源使用情況進行詳細的跟蹤,以便更好地進行應(yīng)用調(diào)優(yōu)和性能優(yōu)化。實戰(zhàn)案例——云平臺監(jiān)控管理OpenStack平臺自帶監(jiān)控(1)查看平臺狀態(tài)及使用情況OpenStack中的服務(wù)是分布式部署,因此,各個服務(wù)的啟停狀態(tài),決定了此系統(tǒng)的可用性。用戶可以通過OpenStack提供的接口來查看服務(wù)的運行狀態(tài),命令如下。#novaservice-list#novaservice-list#neutronagent-list#cinderservice-list#heatservice-list使用nova相關(guān)命令查詢nova資源使用的信息,命令如下。novausage-list //查看所有租戶的信息//查看單一租戶的信息#novausage#gnocchiarchive-policylist(2)使用Ceilometer監(jiān)控平臺狀態(tài)列出歸檔策略具體如下,命令如下。#gnocchiarchive-policylist顯示當前歸檔策略列表,命令如下。#gnocchiarchive-policy-rulelist#gnocchiarchive-policy-rulelist獲得資源使用列表,命令如下。#gnocchiresourcelist#gnocchiresourcelist獲得資源類型列表,命令如下。#gnocchiresource-typelist#gnocchiresource-typelist管理計量項,命令如下。#gnocchimetriclist#gnocchimetriclist(3)使用Aodh警報服務(wù)監(jiān)控平臺狀態(tài)Aodh支持多種警報類型,例如:閾值警報、復(fù)合警報等,可以選擇適合場景的警報類型來定義相應(yīng)的警報規(guī)則,具體的使用案例如下。設(shè)置特定實例,基于CPU利用率限制,創(chuàng)建面向閾值警報的示例,命令如下。#aodhalarmcreate\#aodhalarmcreate\--namecpu_hi\--typegnocchi_resources_threshold\--description'instancerunninghot'\--metriccpu_util\--threshold70.0\--comparison-operatorgt\--aggregation-methodmean\--granularity600\--evaluation-periods3\--alarm-action'log://'\--resource-idINSTANCE_ID\--resource-typeinstance創(chuàng)建一個復(fù)合警報,當任何一個指定實例的CPU利用率達到80%時,將觸發(fā)該警報,警報將通過HTTP請求通知給指定的地址,命令如下。#aodhalarmcreate\#aodhalarmcreate\--namemeta\--typecomposite\--composite-rule'{"or":[{"threshold":0.8,"metric":"cpu_util",\"type":"gnocchi_resources_threshold","resource_id":INSTANCE_ID1,\"resource_type":"instance","aggregation_method":"last"},\{"threshold":0.8,"metric":"cpu_util",\"type":"gnocchi_resources_threshold","resource_id":INSTANCE_ID2,\"resource_type":"instance","aggregation_method":"last"}]}'\--alarm-action'/notify'基于電源狀態(tài)創(chuàng)建事件警報的示例,命令如下。#aodhalarmcreate\#aodhalarmcreate\--typeevent\--nameinstance_off\--description'InstancepoweredOFF'\--event-type"compute.instance.power_off.*"\--enableTrue\--query"traits.instance_id=string::INSTANCE_ID"\--alarm-action'log://'\--ok-action'log://'\--insufficient-data-action'log://'使用OpenStack相關(guān)命令,刪除cpu_hi警報,命令如下。#openstackalarmdeletecpu_hi#openstackalarmdeletecpu_hi安裝Zabbix監(jiān)控截至2024年3openEuler操作系統(tǒng)的官方軟件倉庫中,社區(qū)創(chuàng)新版本openEuler22.09尚未針對Zabbix監(jiān)控提供預(yù)先構(gòu)建的官方軟件包支持,僅在長期支持版本(LTS)進行了適配,目前最新的長期支持版本(LTS)為openEuler22.03,故在此案例中,使用openEuler22.03系統(tǒng)。(1)節(jié)點規(guī)劃登錄OpenStack云平臺,分發(fā)兩臺openEuler22.03的云主機,云主機類型使用4vCPU/12GB內(nèi)存/60GB硬盤。節(jié)點規(guī)劃見表2-1。表2-1節(jié)點規(guī)劃IP主機名節(jié)點1zabbix-serverZabbixServer節(jié)點2zabbix-agentZabbixAgent節(jié)點(2)安裝ZabbixServer云主機創(chuàng)建完成后,使用SecureCRT連接ZabbixServer節(jié)點,修改主機名為“zabbix-server”,命令如下。#hostnamectlset-hostnamezabbix-server#hostnamectlset-hostnamezabbix-server將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進行實驗,修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD安裝數(shù)據(jù)庫服務(wù),命令如下。#dnf-yinstallmariadbmariadb-server--nogpgcheck#dnf-yinstallmariadbmariadb-server--nogpgcheck安裝Zabbix服務(wù),命令如下。##dnf-yinstall--nogpgcheckzabbix-server-mysqlzabbix-web-mysqlzabbix-nginx-confzabbix-sql-scriptszabbix-selinuxzabbix-agent使用命令啟動數(shù)據(jù)庫服務(wù),并設(shè)置開機自啟,命令如下。#systemctlenable--nowmariadb#systemctlenable--nowmariadb登錄數(shù)據(jù)庫,創(chuàng)建Zabbix庫(中文編碼格式),命令如下。#mysql#mysqlMariaDB[(none)]>createdatabasezabbixcharactersetutf8mb4collateutf8mb4_bin;QueryOK,1rowaffected(0.000sec)MariaDB[(none)]>createuserzabbix@localhostidentifiedby'zabbix';QueryOK,0rowsaffected(0.001sec)授予Zabbix用戶的訪問權(quán)限,命令如下。MariaDBMariaDB[(none)]>grantallprivilegesonzabbix.*tozabbix@localhostidentifiedby'zabbix';QueryOK,0rowsaffected(0.001sec)log_bin_trust_function_creators的值,防止出現(xiàn)安裝或升級MySQL后解決一些函數(shù)和存儲過程的語法問題,命令如下。MariaDBMariaDB[(none)]>setgloballog_bin_trust_function_creators=1;QueryOK,0rowsaffected(0.000sec)在ZabbixServer節(jié)點導(dǎo)入初始模式和數(shù)據(jù),系統(tǒng)提示輸入新創(chuàng)建的密碼,命令如下。##zcat/usr/share/doc/zabbix-sql-scripts/mysql/server.sql.gz|mysql--default-character-set=utf8mb4-uzabbix-pzabbixzabbix導(dǎo)入數(shù)據(jù)庫后,使用數(shù)據(jù)庫編輯命令,禁用log_bin_trust_function_creators選項,命令如下。#mysql-e"setgloballog_bin_trust_function_creators=0;"#mysql-e"setgloballog_bin_trust_function_creators=0;"編輯文件Zabbix配置文件/etc/zabbix/zabbix_server.conf,修改數(shù)據(jù)庫密碼為zabbix,命令如下。DBPasswordDBPassword=zabbix啟動Zabbix服務(wù)器和代理進程,使其在系統(tǒng)啟動時啟動,命令如下。#zabbix_server-c/etc/zabbix/zabbix_server.conf#zabbix_server-c/etc/zabbix/zabbix_server.confzabbix_server:symbollookuperror:zabbix_server:undefinedsymbol:usmDESPrivProtocol//出現(xiàn)這種情況需要先升級net-snmp,然后啟動zabbix-server服務(wù)#dnf-yinstallnet-snmp net-snmp-devel#dnf-yinstallnet-snmp-utils#mv/etc/zabbix/zabbix_server.conf/etc/zabbix/zabbix-server.conf#systemctlrestartzabbix-serverzabbix-agentnginxphp-fpm#systemctlenablezabbix-serverzabbix-agentnginxphp-fpm使用瀏覽器訪問1/zabbix,可在默認頁面選擇語言為中文(簡體),單擊右下角“下一步”按鈕,后續(xù)按照頁面提示進行操作。(3)安裝ZabbixAgent使用SecureCRT連接ZabbixAgent節(jié)點,主機名為“zabbix-agent”,命令如下。#hostnamectlset-hostnamezabbix-agent#hostnamectlset-hostnamezabbix-agent將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進行實驗,修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD安裝zabbix-agent服務(wù),命令如下。#dnf-yinstallzabbix-agent#dnf-yinstallzabbix-agent修改/etc/zabbix/zabbix_agentd.conf配置文件,配置zabbix-agent,修改示例如下。#vi#vi/etc/zabbix/zabbix_agentd.confServer=1ServerActive=1Hostname=Zabbix-agent啟動zabbix-agent服務(wù),命令如下。#systemctlenable--nowzabbix-agent#systemctlenable--nowzabbix-agent回到Web界面,單擊左邊導(dǎo)航欄“監(jiān)測→主機→創(chuàng)建主機”按鈕轉(zhuǎn)到配置主機的頁面,然后填寫配置信息,將zabbix-agent節(jié)點添加到被監(jiān)控機器,主機群組選擇“Linuxservers”,填寫相關(guān)信息,填寫完成后單擊下方“添加”按鈕即可。(4)配置Zabbix監(jiān)控OpenStack平臺宿主機監(jiān)控OpenStack宿主機,需要在“controller”節(jié)點部署ZabbixAgent服務(wù)。將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進行實驗,修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD在controller節(jié)點安裝zabbix-agent,命令如下。#dnf-yinstallzabbix-agent#dnf-yinstallzabbix-agent修改ZabbixAgent配置文件zabbix_agentd.conf,指定Server節(jié)點,修改示例如下。#vi#vi/etc/zabbix/zabbix_agentd.confServer=1ServerActive=1Hostname=controller啟動zabbix-agent服務(wù),命令如下。#systemctlstartzabbix-agent#systemctlstartzabbix-agent回到ZabbixSever節(jié)點的Web界面,選擇左邊導(dǎo)航欄“監(jiān)測→主機→創(chuàng)建主機”命令,跳轉(zhuǎn)到配置主機的頁面,填寫主機名稱、Agent信息,選擇主機群組,然后單擊“更新”按鈕,完成配置監(jiān)控OpenStack主機。(5)配置Zabbix監(jiān)控OpenStack組件使用Zabbix監(jiān)控OpenStack基本上可以分為兩個部分,監(jiān)控物理節(jié)點的系統(tǒng)信息,如控制、網(wǎng)絡(luò)、計算Zabbix自帶的item足以滿足需求。監(jiān)控云主機(實例),需要給云主機綁定一個外網(wǎng)IP(?oatingIP),作為外部訪問的IP,其他配置和監(jiān)控不同主機一樣。除此之外如果想要監(jiān)控OpenStack云環(huán)境中的服務(wù),那就需要自己寫腳本來完成監(jiān)控了。實戰(zhàn)案例——云平臺故障排查云平臺故障排查是確保云計算服務(wù)高效穩(wěn)定的關(guān)鍵實踐,涉及從識別與確認故障范圍到深入解讀OpenStack服務(wù)日志等多個環(huán)節(jié)。確認故障的范圍(1)故障范圍排查在排查云平臺故障,確認故障范圍時,需要采取系統(tǒng)性的方法,從不同的角度進行診斷和分析。在某些情況下,可能需要比較復(fù)雜的排查工作,包括調(diào)試代碼、回滾補丁等操作來解決問題。(2)確認故障是否與物理基礎(chǔ)設(shè)施相關(guān)物理基礎(chǔ)設(shè)施的檢查和診斷是日常維護云平臺正常運行的關(guān)鍵舉措,及時查出故障源頭,以便盡快解決故障,恢復(fù)設(shè)備的正常工作。實際實施過程中,運維人員也可以尋求專業(yè)硬件技術(shù)人員進行協(xié)助和支持。OpenStack服務(wù)日志分析(1)各服務(wù)日志目錄說明/var/log/目錄是日志文件夾的主要存儲位置,根據(jù)服務(wù)名進行進一步文件夾的劃分,各服務(wù)日志文件名也因版本和配置而有所不同,以下列出的為常見的文件目錄結(jié)構(gòu),命令如下。dnf.librepo.logdnf.librepo.loghorizonmessages rabbitmq tallylog wtmpvmware-vmtoolsd-root.logmemcached_exporter prometheus swtpmheatvmware-vgauthsvc.log.0vmware-vmsvc-root.loghawkey.log mariadbprivateswiftsssdgnocchimai1logplacementchronycindercronbtmp firewalld lastlognova skylinevmware-network.3.logceilometer glance libvirtopenvswitchspoolervmware-network.lognginx secure vmware-network.2.logkeystoneaudit dnf.rpm.logzabbixxferlog#ls/var/log/anaconda dnf.loghttpd neutronREADME vmware-network.1.log(2)如何有效查看相關(guān)服務(wù)的日志在OpenStack中,每個組件服都有各自的日志文件,查看和分析這些日志文件有助于用戶發(fā)現(xiàn)和診斷各種問題。以下是一些有效查看OpenStack相關(guān)服務(wù)日志的方法:使用命令行工具查看日志。在OpenStack節(jié)點上安裝的組件可以通過命令行工具進行訪問和管理,因此可以使用該工具查看日志。使用OpenStackDashboard查看日志。在控制節(jié)點上安裝了OpenStackDashboard組件,可以通過它訪問HorizonWeb界面,從而可以查看組件日志。、Logstash和Kibana)和Prometheus這樣的開源日志管理平臺。這些開源工具提供了一個完整的日志解決方案,包括可視化、警報、搜索、過濾器等。無論哪種方法,總是應(yīng)該能夠根據(jù)需要輕松地搜索、分析和查看OpenStack服務(wù)產(chǎn)生的各種日志信息,從而保持OpenStack環(huán)境的最佳狀態(tài)。常見故障及解決方案(1)OpenStack服務(wù)故障排查OpenStack云平臺中的服務(wù)故障排查是一項需要耐心和技巧的任務(wù)。通常情況下,可以嘗試以下一些故障排查的基本步驟:第一,記錄錯誤信息。OpenStack服務(wù)往往會輸出一些錯誤信息和日志,這些信息能很好地提示服務(wù)出現(xiàn)的故障。針對異常問題,首先應(yīng)該在服務(wù)日志中查找相關(guān)信息。第二,檢查服務(wù)狀態(tài)??梢栽诳刂乒?jié)點上使用命令行工具或面板查看服務(wù)的狀態(tài)。對于故障服務(wù),可以使用systemctlstatus命令來查看詳細的狀態(tài)信息。第三,檢查網(wǎng)絡(luò)連接。所有OpenStack服務(wù)都涉及網(wǎng)絡(luò)通信,有時網(wǎng)絡(luò)問題是產(chǎn)生錯誤的罪魁禍首??梢允褂胮ing、nslookup、tracerout等命令來檢查相應(yīng)IP地址或主機名稱在網(wǎng)絡(luò)上的可到達性。第四,檢查配置信息。在OpenStack的配置文件中可能存在錯誤或不一致的配置項,導(dǎo)致服務(wù)無法正常運行。第五,再次縮小范圍。如果在前幾個步驟中沒有找到失敗的根本原因,那么應(yīng)該再次縮小故障范圍??梢允褂胹trace、tcpdump、sysdig、gdb和其他調(diào)試工具來進一步排查逐層的問題。(2)宿主機故障排查OpenStack宿主機故障會給云平臺正常運轉(zhuǎn)帶來很大威脅。宿主機的故障排查,需要優(yōu)先查看宿主機進程狀態(tài),通過top或者ps命令可以查看宿主機上所有正在運行的進程。如果發(fā)現(xiàn)宿主機正在執(zhí)行任何意外的進程,例如病毒或者惡意軟件,需要對宿主機進行一次完整的檢測,可以通過查看/var/log/wtmp來發(fā)現(xiàn)異常信息。/var/log/wtmp是一個二進制文件,記錄每個用戶的登錄次數(shù)和持續(xù)時間等信息。該日志文件永久記錄每個用戶登錄、注銷及系統(tǒng)的啟動、停機的事件。因此隨著系統(tǒng)正常運行時間的增加,該文件的大小也會越來越大,增加的速度取決于系統(tǒng)用戶登錄的次數(shù)。該日志文件可以用來查看用戶的登錄記錄,但是需要使用last命令訪問這個文件獲得這些信息,命令如下。#last-f/var/log/wtmp#last-f/var/log/wtmp命令輸出結(jié)果會以逆序從后向前顯示用戶的登錄記錄,last也能根據(jù)用戶、終端tty或時間顯示相應(yīng)的記錄,命令如下。#lastroot-f/var/log/wtmp#lastroot-f/var/log/wtmp#last-t2024-01-0108:00:00-f/var/log/wtmp(3)網(wǎng)絡(luò)故障排查OpenStack網(wǎng)絡(luò)故障是一項常見的問題。通常會使用以下方式解決OpenStack網(wǎng)絡(luò)故障問題:確認網(wǎng)絡(luò)拓撲:檢查OpenStack網(wǎng)絡(luò)拓撲,包括網(wǎng)絡(luò)配置、VLAN的創(chuàng)建和配置。確保拓撲中的物理網(wǎng)絡(luò)、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)連接工作正常。檢查虛擬網(wǎng)絡(luò)配置:檢查虛擬交換機、租戶路由器和所有相關(guān)虛擬網(wǎng)絡(luò)設(shè)備。確保網(wǎng)絡(luò)設(shè)備可以成功啟動,并啟用相應(yīng)的服務(wù)。檢查網(wǎng)絡(luò)資源:檢查OpenStack網(wǎng)絡(luò)資源,確保沒有沖突或資源耗盡的問題。確保計算節(jié)點的狀態(tài),以及計算節(jié)點與其他節(jié)點之間的正常通信,命令如下。#neutronagent-list#neutronagent-list檢查網(wǎng)絡(luò)服務(wù):檢查OpenStack網(wǎng)絡(luò)服務(wù)是否正常,測試和檢查所有網(wǎng)絡(luò)服務(wù)是否正常工作,命令如下。#neutronagent-list#neutronagent-list檢查虛擬機網(wǎng)絡(luò):檢查虛擬機的網(wǎng)絡(luò)連接,確保配置了正確的供應(yīng)商網(wǎng)絡(luò)類型、網(wǎng)絡(luò)地址及網(wǎng)關(guān)IP地址。檢查虛擬路由器:檢查路由器的接口,確保虛擬路由器正常工作。檢查日志和錯誤:檢查所有錯誤信息,找到任何有用的日志,以及“/var/log”中的任何有用信息。網(wǎng)絡(luò)問題往往是頻繁出現(xiàn)和難以解決的問題,需要仔細地分析和檢查各種網(wǎng)絡(luò)組件和服務(wù),以找到問題的根本原因。(4)存儲故障排查OpenStack平臺存儲故障排查通常很棘手,因為存儲層是OpenStack的核心組成部分之一,失敗可能會導(dǎo)致整個系統(tǒng)的帶寬不足、易出現(xiàn)瓶頸和錯誤。以下是一些可能有用的建議,以解決OpenStack存儲故障問題:檢查磁盤空間:檢查OpenStack存儲的基本磁盤空間和網(wǎng)絡(luò)文件系統(tǒng)等,例如NFS,確保磁盤正確格式化且空間充足,命令如下。#df-Th#df-Th檢查存儲狀態(tài):檢查存儲節(jié)點的狀態(tài),例如Ceph集群、LVM和各類存儲后端。確保存儲后端能夠成功啟動,并啟用相應(yīng)的存儲服務(wù),命令如下。#systemctlstatusopenstack-nova*#systemctlstatusopenstack-nova*檢查硬件狀態(tài):檢查存儲系統(tǒng)的硬件狀態(tài),確保磁盤等硬件正常工作。檢查存儲資源:檢查存儲資源,確保沒有沖突或資源耗盡的問題。如果有默認配額,就要調(diào)整配額以滿足實際存儲需求。在OpenStack中新建的云主機都存放在計算節(jié)點/var/lib/nova/instances目錄下,在新建虛擬機存儲不夠用時,可以將云主機轉(zhuǎn)移到新的存儲位置,查看云主機存放目錄的命令如下。#ll/var/lib/nova/instances#ll/var/lib/nova/instances檢查卷狀態(tài):根據(jù)卷的類型和創(chuàng)建方法,驗證目標設(shè)備的正確性和狀態(tài),盡可能排除卷與其預(yù)期功能不符,命令如下。#lsblk#lsblk檢查日志和錯誤:檢查所有與存儲相關(guān)的錯誤信息并找到有用的日志,例如Cinder、Glance的日志信息。實戰(zhàn)案例——容器化部署Zabbix監(jiān)控系統(tǒng)Zabbix作為一款功能強大且廣泛應(yīng)用的企業(yè)級監(jiān)控解決方案,其傳統(tǒng)的部署方式在面臨復(fù)雜環(huán)境和大規(guī)模應(yīng)用時,可能會面臨組件眾多、依賴關(guān)系復(fù)雜以及升級維護困難等問題。因此,采用容器化部署配置Zabbix-Server節(jié)點基礎(chǔ)環(huán)境修改主機名,命令如下所示。#hostnamectlset-hostnamezabbix-server#hostnamectlset-hostnamezabbix-server#execbash關(guān)閉防火墻和SELinux,命令如下所示。(此步驟線上環(huán)境不需要)#systemctldisable–nowfirewalld#systemctldisable–nowfirewalld#setenforce0#sed-i's/^SELINUX=.*/SELINUX=permissive/g'/etc/selinux/config將提供的zabbix6.2-repo文件上傳到系統(tǒng)的/opt目錄,使用離線源進行實驗,修改方式如下。#mv/etc/yum.repos.d/*/media/#mv/etc/yum.repos.d/*/media/#cat<<MXD>/etc/yum.repos.d/openEuler.repo[openEuler22.03]name=zabbix6.2baseurl=file:///opt/zabbix6.2-repo/gpgcheck=0MXD安裝Docker服務(wù),命令如下所示。#dnf-yinstalldocker-engine#dnf-yinstalldocker-engine設(shè)置Docker服務(wù)開機自啟并立即啟動,命令如下所示。#systemctlenable--nowdocker#systemctlenable--nowdocker容器化部署Zabbix監(jiān)控系統(tǒng)將提供的離線鏡像文件導(dǎo)入節(jié)點,命令如下。#gunzip-cmysql.tar.gz|dockerload#gunzip-cmysql.tar.gz|dockerload#gunzip-czabbix-server-mys

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論