




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Amazon
Aurora高可用與容災(zāi)白皮書注意事項(xiàng)客戶須根據(jù)實(shí)際業(yè)務(wù)情況酌情參考本文檔中的信息。本文檔:(a)
僅供參考;(b)
基于當(dāng)前亞馬遜云科技產(chǎn)品和用途。如有更改,恕不另行通知;(c)
不代表亞馬遜云科技及其附屬公司、供應(yīng)商或許可方作出任何承諾或保證。文中涉及的亞馬遜云科技產(chǎn)品或服務(wù)均“按原樣”,不包含任何形式的保證、陳述或條件,無論是明示還是暗示。亞馬遜云科技對客戶的責(zé)任和義務(wù)受雙方協(xié)議約束,本文檔與亞馬遜云科技和客戶之間簽訂的任何協(xié)議無關(guān),亦不影響任何此類協(xié)議。?
2024
Amazon
Web
Services,
Inc.
或其附屬公司保留所有權(quán)利2摘要與簡介3摘要目錄您的架構(gòu)是否符合良好架構(gòu)原則?簡介04040405Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨區(qū)域擴(kuò)展高可用性和容災(zāi)071212監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件1314最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略15151516編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程16常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大
Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀1726303132摘要與簡介摘要Amazon
Aurora
是一款全托管的關(guān)系型數(shù)據(jù)庫,提供超高性能、全球規(guī)模的可用性,并與
MySQL
和
PostgreSQL
完全兼容。Amazon
Aurora提供單區(qū)域和跨區(qū)域的高可用性
(HA)
和容災(zāi)
(DR)
能力。本白皮書探討了
Amazon
Aurora
提供的高可用性和容災(zāi)能力,展示了支撐構(gòu)建具有韌性的全球化應(yīng)用程序的設(shè)計(jì)模式,闡述了如何利用
Amazon
Aurora的多可用區(qū)
(AZ)
部署和
Global
Database(全球數(shù)據(jù)庫)功能,以及如何在單個(gè)區(qū)域內(nèi)和跨區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)。您的架構(gòu)是否符合良好架構(gòu)原則?Amazon
Well-Architected
Framework
可幫助您權(quán)衡在云端構(gòu)建系統(tǒng)時(shí)所做決策的利弊。該框架的六大支柱助您在設(shè)計(jì)和運(yùn)營可靠、安全、高效、經(jīng)濟(jì)實(shí)惠且可持續(xù)的系統(tǒng)時(shí)實(shí)現(xiàn)架構(gòu)最佳實(shí)踐。借助
Amazon
Well-Architected
Tool(可在亞馬遜云科技管理控制臺中免費(fèi)使用),可以衡量針對每個(gè)支柱的系列問題,評估您的工作負(fù)載是否遵循這些最佳實(shí)踐。在亞馬遜云科技上的工作負(fù)載容災(zāi):云端恢復(fù)白皮書中,我們描述了一套經(jīng)客戶驗(yàn)證的最佳實(shí)踐,用于設(shè)計(jì)架構(gòu)良好的容災(zāi)工作負(fù)載。如需獲得更多關(guān)于云架構(gòu)的專家指導(dǎo)和最佳實(shí)踐資源(包括參考架構(gòu)部署、圖表和白皮書),請?jiān)L問亞馬遜云科技架構(gòu)中心。4簡介Amazon
Aurora
是完全兼容
MySQL
和
PostgreSQL
的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)
(RDBMS)。Amazon
Aurora
能夠以十分之一的成本提供媲美商業(yè)數(shù)據(jù)庫的性能和可用性。Amazon
Aurora
也是一款全托管數(shù)據(jù)庫服務(wù),可實(shí)現(xiàn)全自動(dòng)化管理數(shù)據(jù)庫,例如高可用性
(HA)、容災(zāi)
(DR)、復(fù)制、擴(kuò)展、備份、恢復(fù)和監(jiān)控。本白皮書將探討
Amazon
Aurora
的高可用性和容災(zāi)能力,以及如何利用常見的架構(gòu)模式,在單個(gè)區(qū)域和多個(gè)區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)。注意:除非另有說明,本白皮書涵蓋的所有特性、功能和架構(gòu)模式均適用于
在探索
AmazonAurora
的高可用性和容災(zāi)功能之前,讓我們先理解高可用性和容災(zāi)的含義。5高可用可性用是衡性量系統(tǒng)韌性的常用定量指標(biāo)。工作負(fù)載的可用性指其可訪問時(shí)間占總運(yùn)行時(shí)間的百分比。該百分比在一定時(shí)間范圍內(nèi)(如一個(gè)月或一年)計(jì)算得出(可用時(shí)間/總時(shí)間),例如99.99%(4
個(gè)
9)。具備高可用性的數(shù)據(jù)庫能在硬件、軟件或網(wǎng)絡(luò)故障等問題發(fā)生時(shí),以最少或無需人工介入的方式確保服務(wù)等級協(xié)議規(guī)定的運(yùn)行性能。傳統(tǒng)的高可用性實(shí)現(xiàn)方式是在與源數(shù)據(jù)庫隔離的硬件上創(chuàng)建一個(gè)主數(shù)據(jù)庫的副本。1當(dāng)發(fā)生中斷時(shí),該副本將被提升為新的主數(shù)據(jù)庫。數(shù)據(jù)庫與應(yīng)用程序的連接可通過虛擬
IP
(VIP)、域名系統(tǒng)
(DNS)
重定向或Proxy
層等方式進(jìn)行管理。2系統(tǒng)可結(jié)合仲裁投票和心跳機(jī)制等多種方法監(jiān)控主數(shù)據(jù)庫健康狀態(tài),從而檢測中斷情況。3容災(zāi)容災(zāi)和高可用性是高韌性數(shù)據(jù)庫架構(gòu)的兩個(gè)完全獨(dú)立但同等重要的能力。容災(zāi)是指企業(yè)在自然災(zāi)害或人為災(zāi)難發(fā)生后恢復(fù)
IT
基礎(chǔ)設(shè)施訪問和功能的方法。容災(zāi)策略可能需要人工干預(yù),例如運(yùn)行腳本、更改端點(diǎn)和調(diào)整基礎(chǔ)設(shè)施規(guī)模。容災(zāi)通常不僅局限于數(shù)據(jù)庫層面。例如,發(fā)生重大自然災(zāi)害后,整個(gè)數(shù)據(jù)中心可能無法訪問。在這種情況下,容災(zāi)流程可用于恢復(fù)數(shù)據(jù)庫和應(yīng)用程序,使應(yīng)用能在另一個(gè)未受影響的亞馬遜云科技區(qū)域繼續(xù)運(yùn)行。容災(zāi)流程通常包括完善的備份策略。備份可讓數(shù)據(jù)庫恢復(fù)到災(zāi)難發(fā)生前的特定時(shí)間點(diǎn)。設(shè)計(jì)容災(zāi)流程時(shí),需要考慮的兩個(gè)關(guān)鍵因素是恢復(fù)時(shí)間目標(biāo)
(RTO)
和恢復(fù)點(diǎn)目標(biāo)
(RPO)。RTO和
RPO取決于應(yīng)用程序及其底層數(shù)據(jù)庫的業(yè)務(wù)需求。即使在同一企業(yè)或部門內(nèi),不同的應(yīng)用程序和工作負(fù)載也可能有不同的
RTO
和
RPO
要求。RPO
是指從最近數(shù)據(jù)恢復(fù)點(diǎn)算起可接受的最大間隔長度。它決定了在數(shù)據(jù)庫中斷與最近一個(gè)恢復(fù)點(diǎn)之間可允許的數(shù)據(jù)丟失量。例如,如果您將
RPO
定義為
15
分鐘,那么在發(fā)生災(zāi)難時(shí),您最多可能丟失
15
分鐘的數(shù)據(jù)。RTO
是指從數(shù)據(jù)庫中斷到服務(wù)恢復(fù)的最大可接受延遲時(shí)間。它決定了可接受的數(shù)據(jù)庫不可用時(shí)間窗口。例如,如果您確定應(yīng)用程序的
RTO
為
5
分鐘,那么您的容災(zāi)策略應(yīng)該能讓應(yīng)用程序(包括數(shù)據(jù)庫和其他應(yīng)用程序組件)在
5
分鐘內(nèi)恢復(fù)服務(wù)。高可用性是系統(tǒng)的一種特性,旨在確保系統(tǒng)的運(yùn)行性能水平(通常指正常運(yùn)行時(shí)間)高于一般水平。Proxy(如
Amazon
RDSProxy)是一種中間服務(wù),可以池化和共享應(yīng)用程序的數(shù)據(jù)庫連接,從而提升應(yīng)用程序的擴(kuò)展能力。借助
Proxy
服務(wù),您可以應(yīng)對不可預(yù)測的數(shù)據(jù)庫流量突增,快速建立連接,避免連接數(shù)超出數(shù)據(jù)庫配置。通過消除對
DNS
的依賴,Proxy
還可以縮短高可用性配置中的故障轉(zhuǎn)移時(shí)間。分布式系統(tǒng)通過仲裁投票機(jī)制來執(zhí)行一致性操作。規(guī)范的仲裁機(jī)制通過獲得最小投票數(shù)來決定是否允許事務(wù)執(zhí)行。心跳是系統(tǒng)以預(yù)設(shè)的時(shí)間間隔產(chǎn)生的信號,用于向其伙伴系統(tǒng)表明自身運(yùn)行正常。心跳機(jī)制是一種常用于高可用系統(tǒng)的同步技術(shù)。摘要與簡介摘要您的架構(gòu)是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨區(qū)域擴(kuò)展高可用性和容災(zāi)監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂6Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能分布式存儲(chǔ)Amazon
Aurora
架構(gòu)從設(shè)計(jì)之初就考慮了高可用性和容災(zāi)能力。Amazon
Aurora
的存儲(chǔ)子系統(tǒng)是分布式的,專為
Amazon
Aurora
量身打造。Amazon
Aurora
采用六副本方式,同時(shí)在三個(gè)可用區(qū)復(fù)制新寫入數(shù)據(jù)庫的數(shù)據(jù)。即使在極少發(fā)生的整個(gè)可用區(qū)故障加上另一個(gè)可用區(qū)并發(fā)存儲(chǔ)節(jié)點(diǎn)故障(AZ+1
故障)的情況下,分布式存儲(chǔ)仍能確保您的數(shù)據(jù)保持完整。這種分布式存儲(chǔ)架構(gòu)還能利用存儲(chǔ)節(jié)點(diǎn)間的
peer-to-peer協(xié)議自動(dòng)擴(kuò)展和自我修復(fù),比如應(yīng)對節(jié)點(diǎn)故障和恢復(fù)丟失的數(shù)據(jù)庫寫入。7盡管
Amazon
Aurora
分布式存儲(chǔ)子系統(tǒng)提供了增強(qiáng)的數(shù)據(jù)持久性,但它本身并不能使數(shù)據(jù)庫實(shí)現(xiàn)高可用性。下面我們來討論
Amazon
Aurora
數(shù)據(jù)庫集群的高可用性方案。Amazon
Aurora
單可用區(qū)架構(gòu)示例Amazon
Aurora
架構(gòu)中,計(jì)算資源與存儲(chǔ)解耦,從而允許計(jì)算和存儲(chǔ)子系統(tǒng)獨(dú)立地從故障中恢復(fù)??梢詫⒁粋€(gè)
Aurora
數(shù)據(jù)庫集群部署到單個(gè)區(qū)域中的一個(gè)或多個(gè)可用區(qū)中。單可用區(qū)Aurora
數(shù)據(jù)庫集群由一個(gè)寫入實(shí)例組成,該實(shí)例可接受讀取和寫入請求。應(yīng)用程序
A只讀實(shí)例端點(diǎn)集群端點(diǎn)區(qū)域
1可用區(qū)
1寫入實(shí)例數(shù)據(jù)副本數(shù)據(jù)副本數(shù)據(jù)副本集群存儲(chǔ)卷Amazon
Aurora
數(shù)據(jù)庫集群寫入讀取摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂8Amazon
Aurora
多可用區(qū)架構(gòu)示例多可用區(qū)
Aurora
數(shù)據(jù)庫集群由一個(gè)寫入數(shù)據(jù)庫實(shí)例和至少一個(gè)(最多
15
個(gè))只讀數(shù)據(jù)庫實(shí)例組成。只讀數(shù)據(jù)庫實(shí)例作為低延遲讀取副本,只能接受讀請求。多可用區(qū)
Aurora
數(shù)據(jù)庫集群是一種全托管的單區(qū)域高可用性方案。多可用區(qū)
Aurora
數(shù)據(jù)庫集群需要一個(gè)寫入數(shù)據(jù)庫實(shí)例和一個(gè)或多個(gè)只讀數(shù)據(jù)庫實(shí)例,且只讀實(shí)例與寫入實(shí)例必須部署在不同的可用區(qū)中。以多可用區(qū)模式部署時(shí),Amazon
Aurora
提供
99.99%(4
個(gè)
9)的運(yùn)行時(shí)間服務(wù)級別協(xié)議
(SLA)。Aurora數(shù)據(jù)庫集群提供一個(gè)集群端點(diǎn)(或?qū)懭雽?shí)例端點(diǎn)),該端點(diǎn)始終連接至當(dāng)前的寫實(shí)例,可接受讀取和寫入請求。Aurora數(shù)據(jù)庫集群還提供一個(gè)連接至只讀實(shí)例的只讀端點(diǎn)。如果存在多個(gè)只讀實(shí)例,Amazon
Aurora
會(huì)對所有可用的只讀實(shí)例進(jìn)行負(fù)載均衡。采用多可用區(qū)架構(gòu)時(shí),Amazon
Aurora
自動(dòng)檢測寫入實(shí)例中斷,并自動(dòng)實(shí)現(xiàn)故障轉(zhuǎn)移,切換到數(shù)據(jù)庫集群中的某個(gè)只讀實(shí)例。如果存在多個(gè)只讀實(shí)例,可以配置參數(shù)值
(0–15)
為它們分配優(yōu)先級順序。優(yōu)先級最高(參數(shù)值為
0)的只讀實(shí)例將被選為首要故障轉(zhuǎn)移目標(biāo)。故障轉(zhuǎn)移成功后,使用寫入端點(diǎn)重新連接的應(yīng)用程序會(huì)自動(dòng)被重定向到新的寫入實(shí)例。因此,應(yīng)用程序無需任何改動(dòng)即可在故障轉(zhuǎn)移后重新連接至數(shù)據(jù)庫。故障轉(zhuǎn)移最多可能需要
60
秒完成。在此期間及之前應(yīng)用程序提交的請求都會(huì)失敗,因此需要應(yīng)用程序重新提交那些請求。使用Amazon
Relational
Database
Service
(Amazon
RDS)
Proxy
可以進(jìn)一步縮短故障轉(zhuǎn)移時(shí)間,它能在保持應(yīng)用程序連接的同時(shí)自動(dòng)連接至新的數(shù)據(jù)庫實(shí)例。當(dāng)故障轉(zhuǎn)移發(fā)生時(shí),Amazon
RDSProxy
會(huì)直接將請求路由至新的數(shù)據(jù)庫實(shí)例,可將
Aurora
數(shù)據(jù)庫的故障轉(zhuǎn)移時(shí)間最多縮短66%。集群端點(diǎn)應(yīng)用程序
A只讀實(shí)例端點(diǎn)區(qū)域
1可用區(qū)
1可用區(qū)
2可用區(qū)
3只讀實(shí)例只讀實(shí)例寫入實(shí)例數(shù)據(jù)副本 數(shù)據(jù)副本 數(shù)據(jù)副本 集群存儲(chǔ)卷 AmazonAurora數(shù)據(jù)庫集群寫入讀取讀取讀取摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂9Amazon
Aurora
還支持在
Amazon
Web
Services
JDBC
Driver
中使用一個(gè)增強(qiáng)型
Java
數(shù)據(jù)庫連接
(JDBC)
封裝器。該封裝器是現(xiàn)有的開源
JDBC的擴(kuò)展。其作用是擴(kuò)展驅(qū)動(dòng)程序功能,使應(yīng)用程序能夠充分利用
Amazon
Aurora
的功能。Amazon
Web
Services
JDBC
Driver
支持
PostgreSQL和
MySQL(PostgreSQL
JDBC
Driver
或MySQL
JDBC
Driver)。Amazon
Web
Services
JDBCDriver
能夠感知故障轉(zhuǎn)移,并與
Amazon
Aurora
集群協(xié)同工作,以最大限度減少停機(jī)時(shí)間,并在數(shù)據(jù)庫實(shí)例發(fā)生故障時(shí)快速恢復(fù)連接。Amazon
Aurora
提供全托管備份能力。您可以為您的
Aurora
數(shù)據(jù)庫集群啟用自動(dòng)備份功能,并將備份保留時(shí)間設(shè)置為
1
到35
天。配置完成后,Amazon
Aurora
將自動(dòng)持續(xù)備份您的數(shù)據(jù)庫集群。如果需要保留超出備份保留期限的數(shù)據(jù),您可以為
Amazon
Aurora
集群存儲(chǔ)卷中的數(shù)據(jù)創(chuàng)建快照。請注意,Amazon
Aurora
數(shù)據(jù)庫集群快照不會(huì)自動(dòng)過期,如果不再需要,您必須手動(dòng)將其刪除。您可以利用時(shí)間點(diǎn)恢復(fù)
(PITR)
功能,將
Aurora
數(shù)據(jù)庫恢復(fù)到備份保留期內(nèi)的任意時(shí)間點(diǎn)。除此之外,您也可以使用
Amazon
Backup
服務(wù)來管理
Amazon
Aurora
數(shù)據(jù)庫集群的備份。AmazonAuroraGlobalDatabaseAmazon
Aurora
還提供
Amazon
Aurora
Global
Database,可以實(shí)現(xiàn)數(shù)據(jù)庫集群跨多個(gè)區(qū)域運(yùn)行。Aurora
Global
Database
采用異步復(fù)制方式復(fù)制數(shù)據(jù),一般延遲不到1
秒,同時(shí)保持?jǐn)?shù)據(jù)庫高可用以運(yùn)行應(yīng)用程序工作負(fù)載。一個(gè)
Aurora
Global
Database
最多可部署到
5
個(gè)備區(qū)域。每個(gè)備區(qū)域中最多可配置
15
個(gè)只讀實(shí)例。這種架構(gòu)將讀節(jié)點(diǎn)規(guī)模擴(kuò)展到最多支持
5
個(gè)備區(qū)域和
90
個(gè)只讀實(shí)例。Aurora
Global
Database
支持在每個(gè)區(qū)域進(jìn)行低延遲的快速本地讀取,并能從區(qū)域級故障中快速恢復(fù)。如果主區(qū)域發(fā)生故障,您可以將其中一個(gè)備區(qū)域提升為承擔(dān)讀/寫處理的主區(qū)域。即使在整個(gè)區(qū)域服務(wù)完全中斷的情況下,Amazon
Aurora
數(shù)據(jù)庫集群通常也能在
1
分鐘內(nèi)恢復(fù)。這可以使您的應(yīng)用程序?qū)崿F(xiàn)
1
秒
RPO
和
1
分鐘
RTO,為
Amazon
Aurora數(shù)據(jù)庫集群的全球業(yè)務(wù)連續(xù)性奠定堅(jiān)實(shí)基礎(chǔ)。Amazon
Aurora
Global
Database
可以助您快速應(yīng)對區(qū)域性故障,在發(fā)生故障后迅速恢復(fù)應(yīng)用可用性。根據(jù)具體情況,Amazon
Aurora
Global
Database
支持兩種不同的切換方法:GlobalDatabase
Switchover(主備切換)和
Global
Database
Failover(故障轉(zhuǎn)移)。Global
DatabaseSwitchover
要求部署的所有區(qū)域的數(shù)據(jù)庫集群都處于可用狀態(tài)。您可以通過執(zhí)行
GlobalDatabase
Switchover
來交換主集群和備集群的角色。常見的使用場景包括為滿足合規(guī)要求的跨區(qū)域容災(zāi)測試和運(yùn)維場景。利用
Global
Database
Switchover
功能,您可以通過調(diào)用SwitchoverGlobalCluster
API
或執(zhí)行
switchover-global-cluster
CLI
命令,快速將其中一個(gè)備區(qū)域提升為主區(qū)域。
請注意,此功能會(huì)在切換至備區(qū)域后自動(dòng)逆轉(zhuǎn)數(shù)據(jù)復(fù)制的流向。GlobalDatabase
Switchover
功能還支持將主區(qū)域切換回原來的主區(qū)域。此外,Global
DatabaseSwitchover
還可用于區(qū)域輪換等使用場景,以實(shí)現(xiàn)全天侯運(yùn)行模式。10摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨區(qū)域擴(kuò)展高可用性和容災(zāi)監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂userid:549683,docid:169851,date:2024-07-31,Global
Database
Failover
是一個(gè)跨區(qū)域的數(shù)據(jù)庫故障轉(zhuǎn)移過程??稍谥鲄^(qū)域發(fā)生故障(如區(qū)域級或服務(wù)中斷)時(shí),從備區(qū)域發(fā)起故障轉(zhuǎn)移流程。您可以通過控制臺,調(diào)用
FailoverGlobalClusterAPI
或執(zhí)行
failover-global-cluster
CLI
命令并設(shè)置
AllowDataLoss
參數(shù),發(fā)起
Global
DatabaseFailover。Global
Database
Failover
會(huì)將選定的備區(qū)域數(shù)據(jù)庫集群提升為主集群,并使用新的主區(qū)域數(shù)據(jù)庫集群的快照重新初始化數(shù)據(jù)庫拓?fù)渲械乃锌捎脗鋮^(qū)域。當(dāng)舊的主區(qū)域從故障中恢復(fù)后,Amazon
Aurora
會(huì)使用當(dāng)前主區(qū)域數(shù)據(jù)庫集群的快照恢復(fù)數(shù)據(jù),將該區(qū)域重新添加至您的數(shù)據(jù)庫拓?fù)渲?。此外,Amazon
Aurora
還會(huì)創(chuàng)建快照,從而保留故障轉(zhuǎn)移前的數(shù)據(jù)。由于Aurora
Global
Database
采用異步復(fù)制,因此,Global
Database
Failover
可能會(huì)導(dǎo)致丟失故障轉(zhuǎn)移時(shí)尚未復(fù)制到備區(qū)域的數(shù)據(jù)。關(guān)于
Global
Database
Failover
和
Global
DatabaseSwitchover
的具體細(xì)節(jié),請參閱
Amazon
Aurora
用戶指南。Amazon
AuroraPostgreSQL
Global
Database
提供
Managed
RPO
機(jī)制,讓您能夠?yàn)槟臄?shù)據(jù)庫規(guī)劃和實(shí)施
RPO。Amazon
Aurora
Global
Database
還提供寫入轉(zhuǎn)發(fā)功能,可將備區(qū)域的寫入操作轉(zhuǎn)發(fā)至主區(qū)域。Amazon
Aurora
GlobalDatabase架構(gòu)示例Amazon
Aurora
還提供托管式藍(lán)/綠部署,可減少重大變更操作導(dǎo)致的停機(jī)時(shí)間,例如數(shù)據(jù)庫引擎大小版本升級、測試新的數(shù)據(jù)庫和應(yīng)用程序功能,以及
Schema
維護(hù)或變更。AmazonAurora
提供零停機(jī)打補(bǔ)丁
(ZDP)
功能,可顯著降低小版本升級期間應(yīng)用程序的停機(jī)時(shí)間。在Amazon
Aurora
小版本升級過程中,零停機(jī)打補(bǔ)丁功能會(huì)盡最大可能保持客戶端連接。如果零停機(jī)打補(bǔ)丁順利完成,在升級過程中,數(shù)據(jù)庫引擎重啟,但應(yīng)用程序會(huì)話會(huì)始終保持連接。數(shù)據(jù)庫引擎重啟可能導(dǎo)致吞吐量下降,持續(xù)時(shí)間從幾秒到
1
分鐘不等。入站復(fù)制A集群端點(diǎn)B只讀實(shí)例端點(diǎn)只讀實(shí)例端點(diǎn)可用區(qū)
2可用區(qū)
3可用區(qū)
1可用區(qū)
2出站復(fù)制主區(qū)域可用區(qū)
1備區(qū)域
1摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性環(huán)監(jiān)境控高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂入站復(fù)制11單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)Amazon
Aurora
提供全托管的自動(dòng)備份功能,支持制定滿足業(yè)務(wù)和合規(guī)性要求的單區(qū)域容災(zāi)策略。如果需要長期保留備份,可以使用
Amazon
Backup
通過集中策略管理創(chuàng)建手動(dòng)快照,或者將數(shù)據(jù)庫集群快照數(shù)據(jù)導(dǎo)出至
Amazon
S3
存儲(chǔ)桶:導(dǎo)出在后臺運(yùn)行,不會(huì)影響運(yùn)行中集群的性能。要在單個(gè)區(qū)域內(nèi)構(gòu)建高可用
Aurora
數(shù)據(jù)庫,可將數(shù)據(jù)庫集群部署到多個(gè)可用區(qū)中。多可用區(qū)數(shù)據(jù)庫集群包括一個(gè)寫入數(shù)據(jù)庫實(shí)例,以及至少一個(gè)部署在不同可用區(qū)的只讀數(shù)據(jù)庫實(shí)例,提供故障轉(zhuǎn)移冗余。對于此類數(shù)據(jù)庫,服務(wù)等級協(xié)議保證
99.99%(4
個(gè)
9)的正常運(yùn)行時(shí)間。多可用區(qū)配置可自動(dòng)檢測和緩解故障,例如當(dāng)寫入實(shí)例發(fā)生故障時(shí),自動(dòng)進(jìn)行故障轉(zhuǎn)移,將指定的只讀實(shí)例提升為新的主實(shí)例。您無需重新配置應(yīng)用程序,應(yīng)用程序可通過集群端點(diǎn)和只讀實(shí)例端點(diǎn)無縫連接新提升的實(shí)例。在多可用區(qū)配置中,如果發(fā)生數(shù)據(jù)庫實(shí)例故障,底層實(shí)例會(huì)在故障轉(zhuǎn)移后自動(dòng)切換;而在單可用區(qū)配置中,在新實(shí)例可用之前可能會(huì)出現(xiàn)數(shù)分鐘的停機(jī)時(shí)間。跨區(qū)域擴(kuò)展高可用性和容災(zāi)常見的跨區(qū)域容災(zāi)模式是在備區(qū)域配置快照備份。這是一種具有較高
RTO
和
RPO
容忍度的跨區(qū)域容災(zāi)模式。在主區(qū)域故障時(shí),備區(qū)域快照備份不受主區(qū)域故障影響,因此可以通過備區(qū)域備份來實(shí)施恢復(fù)策略。相比于單區(qū)域
Aurora
數(shù)據(jù)庫集群部署提供的標(biāo)準(zhǔn)高可用性,Amazon
Aurora
Global
Database提供了更強(qiáng)大的業(yè)務(wù)連續(xù)性和容災(zāi)方案。Amazon
Aurora
的解耦架構(gòu)設(shè)計(jì)使單個(gè)數(shù)據(jù)庫集群能夠跨多個(gè)區(qū)域運(yùn)行,在提供低延遲本地讀取的同時(shí),還能應(yīng)對區(qū)域級故障,這使
AmazonAurora
成為擴(kuò)展高可用性和容災(zāi)策略的理想跨區(qū)域解決方案。Amazon
Aurora
Global
Database
可通過
GlobalDatabase
Failover
功能,在主區(qū)域發(fā)生故障時(shí)將工作負(fù)載快速故障轉(zhuǎn)移到備區(qū)域,從而實(shí)現(xiàn)分鐘級
RTO。對于區(qū)域輪換、全天候式應(yīng)用程序或容災(zāi)演練等場景,在主區(qū)域和備區(qū)域均可用且運(yùn)行正常的情況下,可以使用
GlobalDatabase
Switchover
功能。此外,Amazon
Aurora
Global
Database
還支持對備區(qū)域采用
headless
集群配置,即備集群只包含
Amazon
Aurora
存儲(chǔ)卷,不包含任何數(shù)據(jù)庫實(shí)例。Headless
配置作為容災(zāi)策略的一部分,除了可以節(jié)約成本,還能確保備份不受主區(qū)域故障影響。您可以在將備區(qū)域提升為主區(qū)域前,為備區(qū)域集群添加一個(gè)數(shù)據(jù)庫實(shí)例。此外,您還可以選擇在備區(qū)域預(yù)配
Amazon
Aurora
Serverlessv2
實(shí)例,這是一種經(jīng)濟(jì)高效的部署方案。如果您考慮采用headless
配置,建議您權(quán)衡
RTO
和成本控制。摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂12監(jiān)控高可用性和容災(zāi)環(huán)境Amazon
Aurora
提供多種可觀察性工具,包括
Amazon
CloudWatchLogs、增強(qiáng)監(jiān)控和
Amazon
RDS
Performance
Insights,用于監(jiān)控?cái)?shù)據(jù)庫集群的運(yùn)行狀況、可用性和性能。監(jiān)控單區(qū)域
Aurora
數(shù)據(jù)庫集群的關(guān)鍵
CloudWatch
指標(biāo)包括:請參閱
Amazon
Aurora
指標(biāo)參考和監(jiān)控工具,了解監(jiān)控
AmazonAurora
數(shù)據(jù)庫集群的其他指標(biāo)和工具。監(jiān)控跨區(qū)數(shù)據(jù)庫的關(guān)鍵CloudWatch
指標(biāo)包括:注意:
AuroraGlobalDBRPOLag
僅監(jiān)測用戶
transaction
的延遲。AuroraGlobalDBProgressLag
還監(jiān)測了健康檢查
transaction
的延遲。因此,即便用戶
transaction
很少或者沒有
transaction
時(shí),您也可以通過監(jiān)測
AuroraGlobalDBProgressLag
來查看健康檢查transaction
的延遲,來診斷網(wǎng)絡(luò)問題。此外,Amazon
Aurora
PostgreSQL
Global
Database
還提供以下兩個(gè)函數(shù):CPUUtilizationDatabaseConnectionsNetworkThroughputNetworkTransmitThroughputNetworkReceiveThroughputStorageNetworkThroughputStorageNetworkTransmitThroughputStorageNetworkReceiveThroughputAuroraReplicaLagaurora_global_db_status顯示
Global
Database
的備數(shù)據(jù)庫集群的延遲時(shí)間。aurora_global_db_instance_status列出主數(shù)據(jù)庫集群和備數(shù)據(jù)庫集群下的所有備數(shù)據(jù)庫實(shí)例。請參閱監(jiān)控
AmazonAuroraPostgreSQL
Global
Database
了解如何使用這些函數(shù)的更多信息。AuroraGlobalDBDataTransferBytesAuroraGlobalDBProgressLagAuroraGlobalDBReplicatedWriteIOAuroraGlobalDBReplicationLagAuroraGlobalDBRPOLag13監(jiān)控Amazon
Aurora
事件Amazon
RDS
事件的生成表明
Amazon
Aurora
環(huán)境發(fā)生了變化。例如,當(dāng)為數(shù)據(jù)庫集群打補(bǔ)丁時(shí),Amazon
Aurora
會(huì)生成一個(gè)事件。Amazon
Aurora
會(huì)幾乎實(shí)時(shí)地將事件傳遞至
AmazonCloudWatch
Events
和
Amazon
EventBridge。Amazon
RDS
將事件分為不同的類別,您可以訂閱這些類別,當(dāng)某個(gè)類別中發(fā)生事件時(shí)就會(huì)收到通知。有關(guān)更多詳細(xì)信息,請參閱
AmazonAurora
用戶指南中的使用
Amazon
RDS
事件通知。摘要與簡介摘要良您好的架構(gòu)原是則否?符合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨區(qū)域擴(kuò)展高可用性和容災(zāi)監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂14最佳實(shí)踐指定
RTO
和
RPO根據(jù)業(yè)務(wù)需求制定容災(zāi)策略。首先,為每個(gè)工作負(fù)載指定
RPO
和
RTO。您可以進(jìn)一步將工作負(fù)載分為不同層級,關(guān)鍵任務(wù)層級的工作負(fù)載有更嚴(yán)格的服務(wù)等級(如更低的
RTO
和
RPO),而較低層級工作負(fù)載的限制條件則相應(yīng)放寬,同時(shí)要考慮相關(guān)成本影響。請務(wù)必根據(jù)業(yè)務(wù)優(yōu)先級設(shè)置
RTO
和
RPO
目標(biāo),因?yàn)楦鼑?yán)格的恢復(fù)目標(biāo)通常需要權(quán)衡取舍,比如更高的運(yùn)營成本。制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略高可用性策略:創(chuàng)建多可用區(qū)
Aurora
數(shù)據(jù)庫集群,在單個(gè)區(qū)域內(nèi)實(shí)現(xiàn)高度可用的Aurora
數(shù)據(jù)庫部署,由
AmazonAurora
提供
99.99%(4
個(gè)
9)的正常運(yùn)行時(shí)間
SLA
保障。此外,您還可以添加
Aurora
只讀實(shí)例作為故障轉(zhuǎn)移目標(biāo),在寫入實(shí)例故障時(shí)隨時(shí)接管工作負(fù)載。Amazon
Aurora
自動(dòng)管理故障轉(zhuǎn)移過程。容災(zāi)策略:在確定
RTO
和
RPO
后,您需要設(shè)置與其相匹配的自動(dòng)備份保留時(shí)間。自動(dòng)備份的保留期限決定了您可以將
Aurora
數(shù)據(jù)庫集群還原到多久之前的時(shí)間點(diǎn)。默認(rèn)情況下,Amazon
Aurora
的自動(dòng)備份保留時(shí)間為1天,但您可以將備份保留時(shí)間延長至
35
天。保留期越長,可用于恢復(fù)的歷史數(shù)據(jù)就越多,這直接影響
RTO。根據(jù)您的容災(zāi)策略,可能手動(dòng)快照需要保留更長時(shí)間。此外,在不同的區(qū)域和賬戶中保存?zhèn)浞莞北?,可以提供額外的韌性保障。使用Amazon
Backup
可簡化這一過程。Amazon
Backup
提供手動(dòng)快照的生命周期管理和集中式備份計(jì)劃配置。15編寫并測試高可用性和容災(zāi)流程文檔請?jiān)敿?xì)記錄實(shí)現(xiàn)高可用性和容災(zāi)流程。Amazon
Aurora
數(shù)據(jù)庫管理員手冊中包含了高可用性和容災(zāi)流程,如自動(dòng)備份、備份時(shí)段、維護(hù)時(shí)段和故障轉(zhuǎn)移配置等。您還可以使用故障注入查詢來測試
Aurora
數(shù)據(jù)庫集群的容錯(cuò)能力。不過,務(wù)必要?jiǎng)?chuàng)建一份包含所有相關(guān)細(xì)節(jié)的操作手冊,例如腳本位置、需要收集的數(shù)據(jù)點(diǎn),以及按何種順序執(zhí)行哪些流程。這些細(xì)節(jié)需要記錄在案,并在災(zāi)難發(fā)生時(shí)明確傳達(dá)。編寫完成后,定期開展容災(zāi)演練來測試該流程。根據(jù)需要更新操作手冊。定工作期負(fù)測載本試身和會(huì)審發(fā)生查變高化可,這用種性變化及可容能災(zāi)影響實(shí)當(dāng)現(xiàn)前流高可程用性和容災(zāi)流程的有效性。制定流程,定期測試實(shí)現(xiàn)高可用性和容災(zāi)的流程,驗(yàn)證其有效性,并找出任何需要改進(jìn)的地方。例如,數(shù)據(jù)庫的規(guī)??赡芤呀?jīng)增長,導(dǎo)致備份和恢復(fù)時(shí)間比最初設(shè)計(jì)的更長,您需要做好響應(yīng)的準(zhǔn)備。摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂16常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式使用場景:多區(qū)域應(yīng)用程序通過容災(zāi)區(qū)域?qū)崿F(xiàn)讀/寫能力在備區(qū)域部署應(yīng)用程序,除了能在多個(gè)區(qū)域?yàn)橛脩籼峁┑脱舆t讀取服務(wù),備區(qū)域上的應(yīng)用程序還可能向數(shù)據(jù)庫寫入數(shù)據(jù)。例如,寫入轉(zhuǎn)發(fā)功能可以允許遠(yuǎn)程用戶將數(shù)據(jù)寫入就近備區(qū)域中的只讀實(shí)例,而無需直接寫入主區(qū)域,這樣可以降低全球分布式應(yīng)用程序的延遲。設(shè)計(jì)模式:通過全球只讀副本實(shí)現(xiàn)寫入轉(zhuǎn)發(fā)使用
Amazon
Aurora
Global
Database
的容災(zāi)只讀實(shí)例進(jìn)行就近讀取,根據(jù)用戶距離選擇就近實(shí)例,提升性能。這種情況下,備區(qū)域不僅僅是用于被動(dòng)容災(zāi)。寫入轉(zhuǎn)發(fā)允許應(yīng)用程序?qū)懭氩僮髦赶虮镜氐闹蛔x實(shí)例。這種直接寫入方式能夠透明地處理會(huì)話和事務(wù)上下文,確保寫入與后續(xù)讀取之間的一致性。主數(shù)據(jù)庫集群是權(quán)威數(shù)據(jù)源,其數(shù)據(jù)更改首先被保存到存儲(chǔ)層,然后復(fù)制
Aurora
Global
Database
的備集群。這種架構(gòu)允許將寫入操作定向到您的
Aurora
Global
Database
的任何遠(yuǎn)程集群,簡化了應(yīng)用程序開發(fā)。17Amazon
Aurora
GlobalDatabase寫入轉(zhuǎn)發(fā)示例有關(guān)更多詳細(xì)信息,請參閱
Amazon
Aurora
用戶指南中的在
Amazon
Aurora
Global
Database中使用寫入轉(zhuǎn)發(fā)。使如果用您場正景在尋:找節(jié)一省種經(jīng)容濟(jì)災(zāi)實(shí)成惠且本亞秒級
RPO
延遲的多區(qū)域韌性解決方案,Amazon
AuroraGlobal
Database
是很好的選擇。Aurora
Global
Database
的
headless
集群模式允許備區(qū)域僅包含存儲(chǔ)卷而無數(shù)據(jù)庫實(shí)例。這種方法適用于
RTO
超過在備區(qū)域配置數(shù)據(jù)庫實(shí)例所需時(shí)間(通常最多為
10
分鐘)的容災(zāi)場景。設(shè)計(jì)模式:AmazonAuroraGlobal
Database
中的
headless
集群Aurora
GlobalDatabase
中的
headless
備集群不含任何數(shù)據(jù)庫實(shí)例,而主區(qū)域的集群由一個(gè)寫入實(shí)例、一個(gè)或多個(gè)只讀實(shí)例,以及存儲(chǔ)主數(shù)據(jù)的集群存儲(chǔ)卷組成。在這種配置下,備區(qū)域僅包含存儲(chǔ)備數(shù)據(jù)的備集群存儲(chǔ)卷。Amazon
Aurora
使用專用基礎(chǔ)設(shè)施,通過亞馬遜云科技骨干網(wǎng)絡(luò)跨區(qū)域復(fù)制數(shù)據(jù),延遲很低。這種
headless
集群配置方式可以降低您的
Aurora
Global
Database
的資源成本,因?yàn)榧軜?gòu)中存儲(chǔ)與計(jì)算解耦,未配置數(shù)據(jù)庫實(shí)例的備區(qū)域不產(chǎn)生計(jì)算資源費(fèi)用。Amazon
AuroraGlobalDatabase
headless
集群示例有關(guān)更多詳細(xì)信息,請參閱
Amazon
Aurora
用戶指南中的在備區(qū)域創(chuàng)建headless
Aurora
數(shù)據(jù)庫集群。應(yīng)用程序
A主區(qū)域備區(qū)域
1可用區(qū)
1可用區(qū)
2可用區(qū)
3只讀實(shí)例寫入實(shí)例只讀實(shí)例存儲(chǔ)
存儲(chǔ) 應(yīng)用程序
B1.寫入只讀端點(diǎn)備區(qū)域
1可用區(qū)
1可用區(qū)
2主區(qū)域可用區(qū)1只讀實(shí)例可用區(qū)3寫入實(shí)例2.寫入請求被轉(zhuǎn)發(fā)至主區(qū)域的寫入實(shí)例只讀實(shí)例只讀實(shí)例3.提交寫請求4.復(fù)制更新到備區(qū)域存儲(chǔ)可用區(qū)2只讀實(shí)例存儲(chǔ)出站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測流試程和審查高可用性和常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂出站復(fù)制18使用場景:限制最大
RPO
損失在某些情況下(如網(wǎng)絡(luò)或工作負(fù)載導(dǎo)致的事件),從主集群到備集群的復(fù)制可能會(huì)出現(xiàn)延遲,可能導(dǎo)致
RPO
延遲增加。對于數(shù)據(jù)保護(hù)要求較高的應(yīng)用程序,此設(shè)計(jì)模式可以緩解備集群RPO
延遲增加問題。設(shè)計(jì)模式:Managed
RPO注意:這種架構(gòu)模式只適用于
Amazon
Aurora
PostgreSQL
Global
Database。對于
AmazonAurora
PostgreSQL
GlobalDatabase,可以通過
rds.global_db_rpo參數(shù)來管理
RPO。Amazon
Aurora
會(huì)監(jiān)控AuroraGlobalDBRPOLag指標(biāo),確保至少有一個(gè)集群符合指定
RPO窗口期。只要有任何一個(gè)備集群的
RPO
延遲在指定范圍內(nèi),就會(huì)提交主集群上的事務(wù)。如果所有備集群的延遲都超出指定
RPO
延遲范圍,主集群事務(wù)將被阻止,直到一個(gè)備集群數(shù)據(jù)完全同步,以保證符合
RPO
要求。設(shè)置RPO
(rds.global_db_rpo=
20
秒)。兩個(gè)備區(qū)域的RPO
延遲都在指定范圍內(nèi)。備區(qū)域
1應(yīng)用程序
A可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO
延遲:15
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)
rds.global_db_rpo
的值設(shè)為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:10
秒入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能和單容區(qū)災(zāi)域?qū)崿F(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測流試程和審查高可用性和常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂19其中一個(gè)備區(qū)域的
RPO
延遲仍在指定范圍內(nèi),寫入操作繼續(xù)進(jìn)行兩個(gè)備區(qū)域的延遲都超出了允許的
RPO
延遲范圍,主區(qū)域的寫入操作被暫停備區(qū)域
1應(yīng)用程序
A可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO
延遲:35
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)
rds.global_db_rpo
的值設(shè)為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:22
秒備區(qū)域
1應(yīng)用程序
A可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO
延遲:25
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)
rds.global_db_rpo
的值設(shè)為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:10
秒入站復(fù)制入站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂20其中一個(gè)備區(qū)域的延遲恢復(fù)到目標(biāo)范圍內(nèi),寫入操作得以恢復(fù)使用場景:滿足容災(zāi)測試的監(jiān)管合規(guī)性要求常見標(biāo)準(zhǔn)做法是,在區(qū)域間定期輪換運(yùn)行主系統(tǒng)。這不僅可以確保流程的完整性和準(zhǔn)確性,還能確保員工為容災(zāi)場景做好準(zhǔn)備。Global
Database
Switchover
支持的使用場景包括容災(zāi)演練、主數(shù)據(jù)庫輪換,或無需重新創(chuàng)建集群即可還原到之前的主區(qū)域。設(shè)計(jì)模式:Global
Database
SwitchoverGlobalDatabase
Switchover
可將
Amazon
AuroraGlobalDatabase
的主集群例行遷移至不同區(qū)域,適用于運(yùn)維和計(jì)劃流程等受控場景。例如,一家在多地設(shè)有分支機(jī)構(gòu)的金融機(jī)構(gòu)可能采用這種方法,每個(gè)季度在指定的備區(qū)域間輪換運(yùn)行主集群。在切換過程中,當(dāng)前主區(qū)域的主集群會(huì)轉(zhuǎn)為只讀狀態(tài),同時(shí)同步數(shù)據(jù)到備區(qū)域的存儲(chǔ)卷,確保數(shù)據(jù)零丟失
(RPO
=
0)。被選中的備集群會(huì)被提升為主集群,維持?jǐn)?shù)據(jù)復(fù)制拓?fù)浣Y(jié)構(gòu),所有區(qū)域的數(shù)據(jù)庫實(shí)例都會(huì)重啟,這會(huì)導(dǎo)致幾分鐘內(nèi)的短暫不可用。備區(qū)域
1應(yīng)用程序
A可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO
延遲:35
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)
rds.global_db_rpo
的值設(shè)為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:15
秒入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編寫并測試高可用性和容災(zāi)流程文檔定容期災(zāi)測流試程和審查高可用性和常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂21Amazon
Aurora
GlobalDatabase三區(qū)域架構(gòu)示例切換完成后,備區(qū)域
1
成為新的主區(qū)域。在舊主區(qū)域停止寫入的同時(shí),備區(qū)域的數(shù)據(jù)完成完全同步,實(shí)現(xiàn)
RPO=0。備區(qū)域
1應(yīng)用程序
A可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)備區(qū)域
1應(yīng)用程序
A可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)入站復(fù)制入站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂主區(qū)域可用區(qū)
122主區(qū)域可用區(qū)
1新的主區(qū)域允許寫入操作且維持?jǐn)?shù)據(jù)復(fù)制拓?fù)浣Y(jié)構(gòu)有關(guān)更多詳細(xì)信息,請參閱
Amazon
Aurora
用戶指南中的
執(zhí)行 Global
DatabaseSwitchover。使在極用少場數(shù)情景況:下從,A區(qū)ma域zo故n
A障uro中ra快Glo速ba恢l
D復(fù)atabase
的主區(qū)域可能發(fā)生意外中斷,導(dǎo)致主集群及其寫入數(shù)據(jù)庫實(shí)例不可用,同時(shí)數(shù)據(jù)復(fù)制也會(huì)停止。在這種情況下,Global
DatabaseFailover
的設(shè)計(jì)模式可以最大程度減少停機(jī)時(shí)間和數(shù)據(jù)丟失。設(shè)計(jì)模式:Global
Database
Failover(“區(qū)域故障”場景)下線應(yīng)用程序,防止寫入發(fā)送至主集群。檢查數(shù)據(jù)庫的所有備集群的延遲時(shí)間,選擇復(fù)制延遲最短的備區(qū)域(AuroraGlobalDBRPOLag);使用這個(gè)備區(qū)域可最大限度減少當(dāng)前故障主區(qū)域的數(shù)據(jù)丟失。重新配置應(yīng)用程序,將所有寫入操作指向新提升的主區(qū)域中的
Aurora
Global
Database
集群,并更新端點(diǎn)引用。在
Amazon
RDS
Proxy
中重定向?qū)懭氩僮鳎ㄈ邕m用)。舊主區(qū)域恢復(fù)后,Amazon
Aurora
將自動(dòng)把它作為備區(qū)域重新添加至您的
Aurora
GlobalDatabase
配置。這樣就保持了全球集群的原始拓?fù)浣Y(jié)構(gòu)。有關(guān)更多詳細(xì)信息,請參閱Amazon
Aurora
用戶指南中的
執(zhí)行Global
Database
Failover。應(yīng)用程序
A主區(qū)域可用區(qū)
1可用區(qū)
2寫入實(shí)例只讀實(shí)例備區(qū)域
1可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例只讀實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例入站復(fù)制存儲(chǔ)入站復(fù)制出站復(fù)制摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPORTO RPO的制高定可與用性和和容災(zāi)策略相匹配編容寫災(zāi)并流測程試文高檔可用性和容定災(zāi)期流測程試和審查高可用性和常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂23Amazon
Aurora
GlobalDatabase三區(qū)域架構(gòu)示例發(fā)生故障轉(zhuǎn)移時(shí),主區(qū)域停止接受寫請求。識別出復(fù)制延遲最短的某個(gè)備區(qū)域(本例為備區(qū)域
1)。備區(qū)域
1應(yīng)用程序
A可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例可用區(qū)
2可用區(qū)
3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)
1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)A2主區(qū)域21備區(qū)域
21備區(qū)域
1入站復(fù)制入站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂主區(qū)域可用區(qū)
124故障轉(zhuǎn)移完成后,備區(qū)域
1
提升為新的主區(qū)域。應(yīng)用程序A連接的端點(diǎn)切換至新主區(qū)域中的數(shù)據(jù)庫集群端點(diǎn)。舊主區(qū)域恢復(fù)后,Amazon
Aurora
自動(dòng)將其作為備區(qū)域重新添加至該Global
Database拓?fù)浣Y(jié)構(gòu)中應(yīng)用程序
A主區(qū)域可用區(qū)
1可用區(qū)
2寫入實(shí)例只讀實(shí)例存儲(chǔ)應(yīng)用程序
A主區(qū)域可用區(qū)
1可用區(qū)
2寫入實(shí)例只讀實(shí)例備區(qū)域
1可用區(qū)
1可用區(qū)
2存儲(chǔ)只讀實(shí)例只讀實(shí)例可用區(qū)3只讀實(shí)例備區(qū)域
2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例入站復(fù)制存儲(chǔ)入站復(fù)制出站復(fù)制摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控
Amazon
Aurora
事件最佳實(shí)踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂25在打補(bǔ)丁、升級和重大
Schema變更期間保持可用性計(jì)劃內(nèi)停機(jī)(通常由版本升級、打補(bǔ)丁和
Schema
變更等維護(hù)任務(wù)所需)可能持續(xù)幾分鐘到幾天不等。使用數(shù)據(jù)庫副本執(zhí)行這些任務(wù),然后將生產(chǎn)流量切換至新提升的副本上,有助于減少停機(jī)時(shí)間。然而,復(fù)制設(shè)置、提升和切換過程可能很復(fù)雜,容易出錯(cuò),特別是在大規(guī)模場景下。Amazon
Aurora
藍(lán)/綠部署提供托管式解決方案,極大簡化了復(fù)制流程。Amazon
Aurora
藍(lán)/綠部署Amazon
Aurora
的藍(lán)/綠部署功能支持創(chuàng)建與生產(chǎn)環(huán)境保持同步的預(yù)生產(chǎn)環(huán)境。生產(chǎn)環(huán)境(藍(lán)環(huán)境)和預(yù)生產(chǎn)環(huán)境(綠環(huán)境)通過邏輯日志復(fù)制保持同步。綠環(huán)境可快速提升為生產(chǎn)環(huán)境,且不會(huì)丟失數(shù)據(jù)。切換期間會(huì)阻止對兩個(gè)環(huán)境的寫入,確保數(shù)據(jù)同步。將生產(chǎn)流量切換至新提升的綠環(huán)境通常會(huì)導(dǎo)致不到
1分鐘的短暫停機(jī),但根據(jù)實(shí)際工作負(fù)載情況,停機(jī)時(shí)長可能更長。切換完成后,藍(lán)環(huán)境的名稱和端點(diǎn)將分配給新提升的綠環(huán)境,無需對應(yīng)用程序進(jìn)行任何更改。26生產(chǎn)環(huán)境讀取訪問讀/寫訪問生產(chǎn)環(huán)境應(yīng)用程序讀取訪問只讀實(shí)例(auroradb-instance-2)只端讀點(diǎn)實(shí)例復(fù)制AmazonAurora可用區(qū)
2AmazonAurora只端讀點(diǎn)實(shí)例集群端點(diǎn)只讀實(shí)例(auroradb-instance-3)可用區(qū)
1AmazonAurora復(fù)制可用區(qū)
3區(qū)域
1摘要與簡介摘要良您好的架構(gòu)是原否則符?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 抖音賬號IP人設(shè)深度定制與內(nèi)容制作合作協(xié)議
- 春季傳染病的預(yù)防
- 酒店管理實(shí)習(xí)協(xié)議書
- 食品經(jīng)營誠信協(xié)議書
- 魚池定制訂購協(xié)議書
- 裝修公共損壞協(xié)議書
- 認(rèn)繳公司設(shè)立協(xié)議書
- 銀行取消代扣協(xié)議書
- 購銷合同三方協(xié)議書
- 雕塑維護(hù)保養(yǎng)協(xié)議書
- 折扣零售業(yè)態(tài)在社區(qū)商業(yè)中的布局策略與盈利模式研究報(bào)告
- 醫(yī)院護(hù)工面試題及答案
- 高校學(xué)生資助誠信教育主題活動(dòng)
- 跨國公司海外人力資源外包與派遣管理合同
- 河南中考:歷史必背知識點(diǎn)
- LNG 加氣站防雷安全培訓(xùn)與應(yīng)急演練記錄 202505
- 普惠金融專員試題及答案
- 【課件】認(rèn)識民法典+課件統(tǒng)編版道德與法治七年級下冊
- 2025年航天知識競賽題庫及答案
- 臍橙代銷銷售合同協(xié)議
- 2025年人教版小學(xué)小升初科學(xué)模擬試卷(含答案解析)
評論
0/150
提交評論