版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、技術(shù)創(chuàng)新,變革未來MySQL集群告警系統(tǒng)設(shè)計(jì)一. 告警的選型二. Alertmanager的實(shí)現(xiàn) 三. Alertmanager的實(shí)踐錄CONTENTS告警的選型告警需求方案選型告警的對接告警的收斂告警的可用性告警需求多樣的告警源多樣的告警目標(biāo)告警需求-告警的對接告警短信多關(guān)聯(lián)告警多運(yùn)維期間不希望收到告警告警需求-告警的收斂告警系統(tǒng)的高可用隔離的故障域告警需求-告警的可用性告警需求方案選型告警的選型PrometheusZabbix Open-falcon方案選型-備選方案告警的對接告警源告警目標(biāo)Zabbix多通道多通道Open-falcon多通道多通道Prometheus多通道多通道方案選型-
2、方案對比告警的收斂收斂通知次數(shù)Zabbix無支持Open-falcon簡單收斂支持Prometheus靈活規(guī)則不支持方案選型-方案對比告警的可用性故障域HAZabbix大單點(diǎn)Open-falcon小單點(diǎn)Prometheus小HA方案選型-方案對比其他配置語言Zabbix基于模版C+Open-falcon基于模版Go/PythonPrometheus樹形結(jié)構(gòu)Go方案選型-方案對比告警選型的背景-方案選型zabbixopen-falconprometheus監(jiān)控對象主要監(jiān)控集群主要監(jiān)控集群主要監(jiān)控集群可擴(kuò)展性分層設(shè)計(jì),可擴(kuò)展分層設(shè)計(jì),可擴(kuò)展分層設(shè)計(jì),可擴(kuò)展告警支持告警支持告警支持(監(jiān)控告警項(xiàng)目分離
3、)監(jiān)控?cái)?shù)據(jù)存儲MySQLPGMySQL+Redis+OpentsdbOpentsdb監(jiān)控節(jié)點(diǎn)規(guī)模1000+1000+1000+編程語言C+Go+PythonGo優(yōu)點(diǎn)1.成熟穩(wěn)定,應(yīng)用廣泛2.部署簡單,運(yùn)維方便3.圖形化配置1.架構(gòu)無單點(diǎn)2.微服務(wù)設(shè)計(jì)思路3.時(shí)序存儲4.支持grafana等多種展示方 式1.客戶端豐富 2.google系,社區(qū)熱度大3.容器監(jiān)控方案4.支持grafana等多種展示方 式缺點(diǎn)1.關(guān)系型存儲,集群大容易 卡慢2.沒有告警收斂1.項(xiàng)目時(shí)間短,社區(qū)穩(wěn)定性 考驗(yàn)2.架構(gòu)復(fù)雜,運(yùn)維成本大1.文檔相對缺位2.監(jiān)控?cái)?shù)據(jù)保留時(shí)間短場景中型規(guī)模,私有云中大型規(guī)模,私有云中大型規(guī)模,
4、私有云、容器一.告警的選型二.Alertmanager的實(shí)現(xiàn) 三.Alertmanager的實(shí)踐錄CONTENTSAlertmanager的實(shí)現(xiàn)架構(gòu)對接收斂配置可 用 性Alertmanager的實(shí)現(xiàn)-架構(gòu)Alertmanager的實(shí)現(xiàn)-架構(gòu)Alertmanager的實(shí)現(xiàn)-架構(gòu)Alertmanager的實(shí)現(xiàn)架構(gòu)對接收斂配置可 用 性Alertmanager的實(shí)現(xiàn)-對接告警對接時(shí)需要滿足什么要求?接收不同告警源發(fā)送的告警將不同的告警發(fā)往不同的接收者PrometheusAlert generatorAlertmanagersmtpwechatAPIwebhookAlertmanager的實(shí)現(xiàn)-對接
5、接收HTTP API(/api/v1/alerts)發(fā)送# The unique name of the receiver. name: # Configurations for several notification integrations. - , . - , . - , . email_configs: webhook_configs: wechat_configs:Alertmanager的實(shí)現(xiàn)架構(gòu)對接收斂配置可 用 性Alertmanager的實(shí)現(xiàn)-收斂分組抑制靜默延時(shí)Alertmanager的實(shí)現(xiàn)-分組減少告警消息的數(shù)量同類告警的聚合幫助運(yùn)維排查問題一堆關(guān)于MySQL的告警實(shí)例
6、1的告警實(shí)例2的告警郵件1郵件2Alertmanager的實(shí)現(xiàn)-分組alertname=mysql_cpu_high id=mysql-A alertname=mysql_uptime id=mysql-B alertname=mysql_slave_sql_thread_downid=mysql-Balertname=mysql_slave_io_thread_down id=mysql-Balertname=mysql_cpu_high id=mysql-A alertname=mysql_uptime id=mysql-B alertname=mysql_slave_sql_thread
7、_downid=mysql-Balertname=mysql_slave_io_thread_down id=mysql-Bgroup_by: idAlertmanager的實(shí)現(xiàn)-收斂分組抑制靜默延時(shí)消除了冗余的告警Alertmanager的實(shí)現(xiàn)-抑制主機(jī)1掛掉主機(jī)1的MySQL服務(wù)掛掉主機(jī)1掛掉alertname=mysql_uptime server=server-A alertname=server_uptime server=server-A alertname=server_uptime server=server-A server_uptime 抑制mysql_uptimeAler
8、tmanager的實(shí)現(xiàn)-抑制Alertmanager的實(shí)現(xiàn)-收斂分組抑制靜默延時(shí)Alertmanager的實(shí)現(xiàn)-靜默阻止發(fā)送可預(yù)期的告警一堆的告警(實(shí)例1,實(shí)例2,實(shí)例3)靜默實(shí)例1一堆的告警(實(shí)例2,實(shí)例3)alertname=qps_more_than_3000 id=mysql-A alertname=tps_more_than_2000 id=mysql-A alertname=thread_running_more_than_200 id=mysql-A alertname=thread_running_more_than_200 id=mysql-B”靜默mysql-A的告警ale
9、rtname=thread_running_more_than_20 id=mysql- B”Alertmanager的實(shí)現(xiàn)-靜默Alertmanager的實(shí)現(xiàn)-收斂分組抑制靜默延時(shí)Alertmanager的實(shí)現(xiàn)-延時(shí)不希望頻繁的收到重復(fù)的告警消息怎么辦?Repeat interval需要及時(shí)發(fā)送告警消息?Group interval故障剛發(fā)生時(shí),接連收到幾個(gè)告警消息怎么辦?Group waitAlertmanager的實(shí)現(xiàn)架構(gòu)對接收斂配置可 用 性分組A:a1,a2,a3 分組B:b1,b2a1a2a1a2Group wait:5sGroup interval:5mRepeat interv
10、al:60ma1a2a1a25s5m55mb1b2b1b2b1b2Alertmanager的實(shí)現(xiàn)-告警收斂5sa1a2 a1a25mb1b260mb1b25ma1a2 a35sa1a2a1a2 a3a1a2 a355ma1a2a3使用樹形的路由配置,每個(gè)節(jié)點(diǎn)都定義了路 由規(guī)則,匹配路由規(guī)則的告警都發(fā)往同一個(gè) 接收者匹配條件接收者id=.+默認(rèn)負(fù)責(zé)人id=mongo-a-zA-z0-9+MongoDB運(yùn)維id=mysql-a-zA-Z0-9+MySQL運(yùn)維group=group1業(yè)務(wù)1負(fù)責(zé)人group=group2業(yè)務(wù)2負(fù)責(zé)人Alertmanager的實(shí)現(xiàn)-配置route:receiver: d
11、efault-receiver group_wait: 5s group_interval: 5mrepeat_interval: 1h group_by: db_type routes:receiver: mongo_ops_receiver group_wait: 10smatch_re:service: mongo-a-zA-Z0-9+receiver: mysql_ops_receiver group_by: mysql_idmatch:group:group1Alertmanager的實(shí)現(xiàn)-配置Alertmanager的實(shí)現(xiàn)架構(gòu)對接收斂配置可 用 性microservice1micr
12、oservice2microservice3microservice1microservice2microservice3prometheusprometheusalertmanageralertmanagerGossipAlertmanager的實(shí)現(xiàn)-可用性一.告警的選型二.Alertmanager的實(shí)現(xiàn) 三.Alertmanager的實(shí)踐錄CONTENTSAlertmanager的實(shí)踐架構(gòu)調(diào)度層級SREalertmanagerWechatEmail管理界面分組/抑制/收斂顯示核心區(qū)HAagentagent采集采集MySQLMySQLMongo受管區(qū)APIprometheusAlertmanager的實(shí)踐-架構(gòu)Alertmanager的實(shí)踐架構(gòu)調(diào)度層級SREAlertmanager的實(shí)踐-調(diào)度層級監(jiān)控管理端監(jiān)控客戶端受管服務(wù)opsAlertmanagerPrometheuseAlertmanager的實(shí)踐架構(gòu)調(diào)度層級SREAlertmanager的實(shí)踐-SREGoogle SRE 對監(jiān)控系統(tǒng)的建議報(bào)警信息應(yīng)由系統(tǒng)自動解決,僅當(dāng)需要的時(shí)候才通知用戶收到報(bào)警的用戶需要立即執(zhí)行某種操作,以解決已發(fā)生的 問題或避免即將發(fā)生的問題A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學(xué)能力測試試卷A卷附答案
- 2024年度山西省高校教師資格證之高等教育法規(guī)每日一練試卷A卷含答案
- 四川省網(wǎng)約配送員職業(yè)技能競賽理論考試題及答案
- 三年級數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)匯編及答案集錦
- 2024建筑施工協(xié)議代理業(yè)務(wù)規(guī)范稿
- 2024投標(biāo)專用協(xié)議樣本解析
- 基于網(wǎng)絡(luò)空間安全的個(gè)人信息保護(hù)研究
- 2024年復(fù)婚二次離婚協(xié)議規(guī)范樣本
- 2024專業(yè)紅娘服務(wù)會員協(xié)議
- 2024年度高品質(zhì)防盜門供應(yīng)協(xié)議范例
- 消防安全-情系你我他
- 短視頻的拍攝與剪輯
- 產(chǎn)品設(shè)計(jì)-淺談智能藍(lán)牙音響的外觀創(chuàng)新設(shè)計(jì)
- 江蘇省南京江寧聯(lián)合體2023-2024學(xué)年八年級上學(xué)期期中考試英語試卷
- 快速康復(fù)外科(ERAS)護(hù)理
- 醫(yī)療機(jī)構(gòu)安全檢查表
- 第六章-巷道支護(hù)01
- 應(yīng)急管理法律法規(guī)及國標(biāo)行標(biāo)清單
- 監(jiān)理規(guī)劃、監(jiān)理細(xì)則審批表
- 香菇種植示范基地項(xiàng)目可行性策劃實(shí)施方案
- 施工現(xiàn)場材料使用明細(xì)表
評論
0/150
提交評論