【亞馬遜云科技】2024年AmazonAurora數(shù)據(jù)庫高可用及容災(zāi)白皮書323mb_第1頁
【亞馬遜云科技】2024年AmazonAurora數(shù)據(jù)庫高可用及容災(zāi)白皮書323mb_第2頁
【亞馬遜云科技】2024年AmazonAurora數(shù)據(jù)庫高可用及容災(zāi)白皮書323mb_第3頁
【亞馬遜云科技】2024年AmazonAurora數(shù)據(jù)庫高可用及容災(zāi)白皮書323mb_第4頁
【亞馬遜云科技】2024年AmazonAurora數(shù)據(jù)庫高可用及容災(zāi)白皮書323mb_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Amazon

Aurora高可用與容災(zāi)白皮書注意事項(xiàng)客戶須根據(jù)實(shí)際業(yè)務(wù)情況酌情參考本文檔中的信息。本文檔:(a)

僅供參考;(b)

基于當(dāng)前亞馬遜云科技產(chǎn)品和用途。如有更改,恕不另行通知;(c)

不代表亞馬遜云科技及其附屬公司、供應(yīng)商或許可方作出任何承諾或保證。文中涉及的亞馬遜云科技產(chǎn)品或服務(wù)均“按原樣”,不包含任何形式的保證、陳述或條件,無論是明示還是暗示。亞馬遜云科技對客戶的責(zé)任和義務(wù)受雙方協(xié)議約束,本文檔與亞馬遜云科技和客戶之間簽訂的任何協(xié)議無關(guān),亦不影響任何此類協(xié)議。?

2024

Amazon

Web

Services,

Inc.

或其附屬公司保留所有權(quán)利2摘要與簡介3摘要目錄您的架構(gòu)是否符合良好架構(gòu)原則?簡介04040405Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨區(qū)域擴(kuò)展高可用性和容災(zāi)071212監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件1314最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略15151516編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程16常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大

Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀1726303132摘要與簡介摘要Amazon

Aurora

是一款全托管的關(guān)系型數(shù)據(jù)庫,提供超高性能、全球規(guī)模的可用性,并與

MySQL

PostgreSQL

完全兼容。Amazon

Aurora提供單區(qū)域和跨區(qū)域的高可用性

(HA)

和容災(zāi)

(DR)

能力。本白皮書探討了

Amazon

Aurora

提供的高可用性和容災(zāi)能力,展示了支撐構(gòu)建具有韌性的全球化應(yīng)用程序的設(shè)計(jì)模式,闡述了如何利用

Amazon

Aurora的多可用區(qū)

(AZ)

部署和

Global

Database(全球數(shù)據(jù)庫)功能,以及如何在單個(gè)區(qū)域內(nèi)和跨區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)。您的架構(gòu)是否符合良好架構(gòu)原則?Amazon

Well-Architected

Framework

可幫助您權(quán)衡在云端構(gòu)建系統(tǒng)時(shí)所做決策的利弊。該框架的六大支柱助您在設(shè)計(jì)和運(yùn)營可靠、安全、高效、經(jīng)濟(jì)實(shí)惠且可持續(xù)的系統(tǒng)時(shí)實(shí)現(xiàn)架構(gòu)最佳實(shí)踐。借助

Amazon

Well-Architected

Tool(可在亞馬遜云科技管理控制臺中免費(fèi)使用),可以衡量針對每個(gè)支柱的系列問題,評估您的工作負(fù)載是否遵循這些最佳實(shí)踐。在亞馬遜云科技上的工作負(fù)載容災(zāi):云端恢復(fù)白皮書中,我們描述了一套經(jīng)客戶驗(yàn)證的最佳實(shí)踐,用于設(shè)計(jì)架構(gòu)良好的容災(zāi)工作負(fù)載。如需獲得更多關(guān)于云架構(gòu)的專家指導(dǎo)和最佳實(shí)踐資源(包括參考架構(gòu)部署、圖表和白皮書),請?jiān)L問亞馬遜云科技架構(gòu)中心。4簡介Amazon

Aurora

是完全兼容

MySQL

PostgreSQL

的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)

(RDBMS)。Amazon

Aurora

能夠以十分之一的成本提供媲美商業(yè)數(shù)據(jù)庫的性能和可用性。Amazon

Aurora

也是一款全托管數(shù)據(jù)庫服務(wù),可實(shí)現(xiàn)全自動(dòng)化管理數(shù)據(jù)庫,例如高可用性

(HA)、容災(zāi)

(DR)、復(fù)制、擴(kuò)展、備份、恢復(fù)和監(jiān)控。本白皮書將探討

Amazon

Aurora

的高可用性和容災(zāi)能力,以及如何利用常見的架構(gòu)模式,在單個(gè)區(qū)域和多個(gè)區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)。注意:除非另有說明,本白皮書涵蓋的所有特性、功能和架構(gòu)模式均適用于

在探索

AmazonAurora

的高可用性和容災(zāi)功能之前,讓我們先理解高可用性和容災(zāi)的含義。5高可用可性用是衡性量系統(tǒng)韌性的常用定量指標(biāo)。工作負(fù)載的可用性指其可訪問時(shí)間占總運(yùn)行時(shí)間的百分比。該百分比在一定時(shí)間范圍內(nèi)(如一個(gè)月或一年)計(jì)算得出(可用時(shí)間/總時(shí)間),例如99.99%(4

個(gè)

9)。具備高可用性的數(shù)據(jù)庫能在硬件、軟件或網(wǎng)絡(luò)故障等問題發(fā)生時(shí),以最少或無需人工介入的方式確保服務(wù)等級協(xié)議規(guī)定的運(yùn)行性能。傳統(tǒng)的高可用性實(shí)現(xiàn)方式是在與源數(shù)據(jù)庫隔離的硬件上創(chuàng)建一個(gè)主數(shù)據(jù)庫的副本。1當(dāng)發(fā)生中斷時(shí),該副本將被提升為新的主數(shù)據(jù)庫。數(shù)據(jù)庫與應(yīng)用程序的連接可通過虛擬

IP

(VIP)、域名系統(tǒng)

(DNS)

重定向或Proxy

層等方式進(jìn)行管理。2系統(tǒng)可結(jié)合仲裁投票和心跳機(jī)制等多種方法監(jiān)控主數(shù)據(jù)庫健康狀態(tài),從而檢測中斷情況。3容災(zāi)容災(zāi)和高可用性是高韌性數(shù)據(jù)庫架構(gòu)的兩個(gè)完全獨(dú)立但同等重要的能力。容災(zāi)是指企業(yè)在自然災(zāi)害或人為災(zāi)難發(fā)生后恢復(fù)

IT

基礎(chǔ)設(shè)施訪問和功能的方法。容災(zāi)策略可能需要人工干預(yù),例如運(yùn)行腳本、更改端點(diǎn)和調(diào)整基礎(chǔ)設(shè)施規(guī)模。容災(zāi)通常不僅局限于數(shù)據(jù)庫層面。例如,發(fā)生重大自然災(zāi)害后,整個(gè)數(shù)據(jù)中心可能無法訪問。在這種情況下,容災(zāi)流程可用于恢復(fù)數(shù)據(jù)庫和應(yīng)用程序,使應(yīng)用能在另一個(gè)未受影響的亞馬遜云科技區(qū)域繼續(xù)運(yùn)行。容災(zāi)流程通常包括完善的備份策略。備份可讓數(shù)據(jù)庫恢復(fù)到災(zāi)難發(fā)生前的特定時(shí)間點(diǎn)。設(shè)計(jì)容災(zāi)流程時(shí),需要考慮的兩個(gè)關(guān)鍵因素是恢復(fù)時(shí)間目標(biāo)

(RTO)

和恢復(fù)點(diǎn)目標(biāo)

(RPO)。RTO和

RPO取決于應(yīng)用程序及其底層數(shù)據(jù)庫的業(yè)務(wù)需求。即使在同一企業(yè)或部門內(nèi),不同的應(yīng)用程序和工作負(fù)載也可能有不同的

RTO

RPO

要求。RPO

是指從最近數(shù)據(jù)恢復(fù)點(diǎn)算起可接受的最大間隔長度。它決定了在數(shù)據(jù)庫中斷與最近一個(gè)恢復(fù)點(diǎn)之間可允許的數(shù)據(jù)丟失量。例如,如果您將

RPO

定義為

15

分鐘,那么在發(fā)生災(zāi)難時(shí),您最多可能丟失

15

分鐘的數(shù)據(jù)。RTO

是指從數(shù)據(jù)庫中斷到服務(wù)恢復(fù)的最大可接受延遲時(shí)間。它決定了可接受的數(shù)據(jù)庫不可用時(shí)間窗口。例如,如果您確定應(yīng)用程序的

RTO

5

分鐘,那么您的容災(zāi)策略應(yīng)該能讓應(yīng)用程序(包括數(shù)據(jù)庫和其他應(yīng)用程序組件)在

5

分鐘內(nèi)恢復(fù)服務(wù)。高可用性是系統(tǒng)的一種特性,旨在確保系統(tǒng)的運(yùn)行性能水平(通常指正常運(yùn)行時(shí)間)高于一般水平。Proxy(如

Amazon

RDSProxy)是一種中間服務(wù),可以池化和共享應(yīng)用程序的數(shù)據(jù)庫連接,從而提升應(yīng)用程序的擴(kuò)展能力。借助

Proxy

服務(wù),您可以應(yīng)對不可預(yù)測的數(shù)據(jù)庫流量突增,快速建立連接,避免連接數(shù)超出數(shù)據(jù)庫配置。通過消除對

DNS

的依賴,Proxy

還可以縮短高可用性配置中的故障轉(zhuǎn)移時(shí)間。分布式系統(tǒng)通過仲裁投票機(jī)制來執(zhí)行一致性操作。規(guī)范的仲裁機(jī)制通過獲得最小投票數(shù)來決定是否允許事務(wù)執(zhí)行。心跳是系統(tǒng)以預(yù)設(shè)的時(shí)間間隔產(chǎn)生的信號,用于向其伙伴系統(tǒng)表明自身運(yùn)行正常。心跳機(jī)制是一種常用于高可用系統(tǒng)的同步技術(shù)。摘要與簡介摘要您的架構(gòu)是否符合良好架構(gòu)原則?簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨區(qū)域擴(kuò)展高可用性和容災(zāi)監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂6Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能分布式存儲(chǔ)Amazon

Aurora

架構(gòu)從設(shè)計(jì)之初就考慮了高可用性和容災(zāi)能力。Amazon

Aurora

的存儲(chǔ)子系統(tǒng)是分布式的,專為

Amazon

Aurora

量身打造。Amazon

Aurora

采用六副本方式,同時(shí)在三個(gè)可用區(qū)復(fù)制新寫入數(shù)據(jù)庫的數(shù)據(jù)。即使在極少發(fā)生的整個(gè)可用區(qū)故障加上另一個(gè)可用區(qū)并發(fā)存儲(chǔ)節(jié)點(diǎn)故障(AZ+1

故障)的情況下,分布式存儲(chǔ)仍能確保您的數(shù)據(jù)保持完整。這種分布式存儲(chǔ)架構(gòu)還能利用存儲(chǔ)節(jié)點(diǎn)間的

peer-to-peer協(xié)議自動(dòng)擴(kuò)展和自我修復(fù),比如應(yīng)對節(jié)點(diǎn)故障和恢復(fù)丟失的數(shù)據(jù)庫寫入。7盡管

Amazon

Aurora

分布式存儲(chǔ)子系統(tǒng)提供了增強(qiáng)的數(shù)據(jù)持久性,但它本身并不能使數(shù)據(jù)庫實(shí)現(xiàn)高可用性。下面我們來討論

Amazon

Aurora

數(shù)據(jù)庫集群的高可用性方案。Amazon

Aurora

單可用區(qū)架構(gòu)示例Amazon

Aurora

架構(gòu)中,計(jì)算資源與存儲(chǔ)解耦,從而允許計(jì)算和存儲(chǔ)子系統(tǒng)獨(dú)立地從故障中恢復(fù)??梢詫⒁粋€(gè)

Aurora

數(shù)據(jù)庫集群部署到單個(gè)區(qū)域中的一個(gè)或多個(gè)可用區(qū)中。單可用區(qū)Aurora

數(shù)據(jù)庫集群由一個(gè)寫入實(shí)例組成,該實(shí)例可接受讀取和寫入請求。應(yīng)用程序

A只讀實(shí)例端點(diǎn)集群端點(diǎn)區(qū)域

1可用區(qū)

1寫入實(shí)例數(shù)據(jù)副本數(shù)據(jù)副本數(shù)據(jù)副本集群存儲(chǔ)卷Amazon

Aurora

數(shù)據(jù)庫集群寫入讀取摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂8Amazon

Aurora

多可用區(qū)架構(gòu)示例多可用區(qū)

Aurora

數(shù)據(jù)庫集群由一個(gè)寫入數(shù)據(jù)庫實(shí)例和至少一個(gè)(最多

15

個(gè))只讀數(shù)據(jù)庫實(shí)例組成。只讀數(shù)據(jù)庫實(shí)例作為低延遲讀取副本,只能接受讀請求。多可用區(qū)

Aurora

數(shù)據(jù)庫集群是一種全托管的單區(qū)域高可用性方案。多可用區(qū)

Aurora

數(shù)據(jù)庫集群需要一個(gè)寫入數(shù)據(jù)庫實(shí)例和一個(gè)或多個(gè)只讀數(shù)據(jù)庫實(shí)例,且只讀實(shí)例與寫入實(shí)例必須部署在不同的可用區(qū)中。以多可用區(qū)模式部署時(shí),Amazon

Aurora

提供

99.99%(4

個(gè)

9)的運(yùn)行時(shí)間服務(wù)級別協(xié)議

(SLA)。Aurora數(shù)據(jù)庫集群提供一個(gè)集群端點(diǎn)(或?qū)懭雽?shí)例端點(diǎn)),該端點(diǎn)始終連接至當(dāng)前的寫實(shí)例,可接受讀取和寫入請求。Aurora數(shù)據(jù)庫集群還提供一個(gè)連接至只讀實(shí)例的只讀端點(diǎn)。如果存在多個(gè)只讀實(shí)例,Amazon

Aurora

會(huì)對所有可用的只讀實(shí)例進(jìn)行負(fù)載均衡。采用多可用區(qū)架構(gòu)時(shí),Amazon

Aurora

自動(dòng)檢測寫入實(shí)例中斷,并自動(dòng)實(shí)現(xiàn)故障轉(zhuǎn)移,切換到數(shù)據(jù)庫集群中的某個(gè)只讀實(shí)例。如果存在多個(gè)只讀實(shí)例,可以配置參數(shù)值

(0–15)

為它們分配優(yōu)先級順序。優(yōu)先級最高(參數(shù)值為

0)的只讀實(shí)例將被選為首要故障轉(zhuǎn)移目標(biāo)。故障轉(zhuǎn)移成功后,使用寫入端點(diǎn)重新連接的應(yīng)用程序會(huì)自動(dòng)被重定向到新的寫入實(shí)例。因此,應(yīng)用程序無需任何改動(dòng)即可在故障轉(zhuǎn)移后重新連接至數(shù)據(jù)庫。故障轉(zhuǎn)移最多可能需要

60

秒完成。在此期間及之前應(yīng)用程序提交的請求都會(huì)失敗,因此需要應(yīng)用程序重新提交那些請求。使用Amazon

Relational

Database

Service

(Amazon

RDS)

Proxy

可以進(jìn)一步縮短故障轉(zhuǎn)移時(shí)間,它能在保持應(yīng)用程序連接的同時(shí)自動(dòng)連接至新的數(shù)據(jù)庫實(shí)例。當(dāng)故障轉(zhuǎn)移發(fā)生時(shí),Amazon

RDSProxy

會(huì)直接將請求路由至新的數(shù)據(jù)庫實(shí)例,可將

Aurora

數(shù)據(jù)庫的故障轉(zhuǎn)移時(shí)間最多縮短66%。集群端點(diǎn)應(yīng)用程序

A只讀實(shí)例端點(diǎn)區(qū)域

1可用區(qū)

1可用區(qū)

2可用區(qū)

3只讀實(shí)例只讀實(shí)例寫入實(shí)例數(shù)據(jù)副本 數(shù)據(jù)副本 數(shù)據(jù)副本 集群存儲(chǔ)卷 AmazonAurora數(shù)據(jù)庫集群寫入讀取讀取讀取摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂9Amazon

Aurora

還支持在

Amazon

Web

Services

JDBC

Driver

中使用一個(gè)增強(qiáng)型

Java

數(shù)據(jù)庫連接

(JDBC)

封裝器。該封裝器是現(xiàn)有的開源

JDBC的擴(kuò)展。其作用是擴(kuò)展驅(qū)動(dòng)程序功能,使應(yīng)用程序能夠充分利用

Amazon

Aurora

的功能。Amazon

Web

Services

JDBC

Driver

支持

PostgreSQL和

MySQL(PostgreSQL

JDBC

Driver

或MySQL

JDBC

Driver)。Amazon

Web

Services

JDBCDriver

能夠感知故障轉(zhuǎn)移,并與

Amazon

Aurora

集群協(xié)同工作,以最大限度減少停機(jī)時(shí)間,并在數(shù)據(jù)庫實(shí)例發(fā)生故障時(shí)快速恢復(fù)連接。Amazon

Aurora

提供全托管備份能力。您可以為您的

Aurora

數(shù)據(jù)庫集群啟用自動(dòng)備份功能,并將備份保留時(shí)間設(shè)置為

1

到35

天。配置完成后,Amazon

Aurora

將自動(dòng)持續(xù)備份您的數(shù)據(jù)庫集群。如果需要保留超出備份保留期限的數(shù)據(jù),您可以為

Amazon

Aurora

集群存儲(chǔ)卷中的數(shù)據(jù)創(chuàng)建快照。請注意,Amazon

Aurora

數(shù)據(jù)庫集群快照不會(huì)自動(dòng)過期,如果不再需要,您必須手動(dòng)將其刪除。您可以利用時(shí)間點(diǎn)恢復(fù)

(PITR)

功能,將

Aurora

數(shù)據(jù)庫恢復(fù)到備份保留期內(nèi)的任意時(shí)間點(diǎn)。除此之外,您也可以使用

Amazon

Backup

服務(wù)來管理

Amazon

Aurora

數(shù)據(jù)庫集群的備份。AmazonAuroraGlobalDatabaseAmazon

Aurora

還提供

Amazon

Aurora

Global

Database,可以實(shí)現(xiàn)數(shù)據(jù)庫集群跨多個(gè)區(qū)域運(yùn)行。Aurora

Global

Database

采用異步復(fù)制方式復(fù)制數(shù)據(jù),一般延遲不到1

秒,同時(shí)保持?jǐn)?shù)據(jù)庫高可用以運(yùn)行應(yīng)用程序工作負(fù)載。一個(gè)

Aurora

Global

Database

最多可部署到

5

個(gè)備區(qū)域。每個(gè)備區(qū)域中最多可配置

15

個(gè)只讀實(shí)例。這種架構(gòu)將讀節(jié)點(diǎn)規(guī)模擴(kuò)展到最多支持

5

個(gè)備區(qū)域和

90

個(gè)只讀實(shí)例。Aurora

Global

Database

支持在每個(gè)區(qū)域進(jìn)行低延遲的快速本地讀取,并能從區(qū)域級故障中快速恢復(fù)。如果主區(qū)域發(fā)生故障,您可以將其中一個(gè)備區(qū)域提升為承擔(dān)讀/寫處理的主區(qū)域。即使在整個(gè)區(qū)域服務(wù)完全中斷的情況下,Amazon

Aurora

數(shù)據(jù)庫集群通常也能在

1

分鐘內(nèi)恢復(fù)。這可以使您的應(yīng)用程序?qū)崿F(xiàn)

1

RPO

1

分鐘

RTO,為

Amazon

Aurora數(shù)據(jù)庫集群的全球業(yè)務(wù)連續(xù)性奠定堅(jiān)實(shí)基礎(chǔ)。Amazon

Aurora

Global

Database

可以助您快速應(yīng)對區(qū)域性故障,在發(fā)生故障后迅速恢復(fù)應(yīng)用可用性。根據(jù)具體情況,Amazon

Aurora

Global

Database

支持兩種不同的切換方法:GlobalDatabase

Switchover(主備切換)和

Global

Database

Failover(故障轉(zhuǎn)移)。Global

DatabaseSwitchover

要求部署的所有區(qū)域的數(shù)據(jù)庫集群都處于可用狀態(tài)。您可以通過執(zhí)行

GlobalDatabase

Switchover

來交換主集群和備集群的角色。常見的使用場景包括為滿足合規(guī)要求的跨區(qū)域容災(zāi)測試和運(yùn)維場景。利用

Global

Database

Switchover

功能,您可以通過調(diào)用SwitchoverGlobalCluster

API

或執(zhí)行

switchover-global-cluster

CLI

命令,快速將其中一個(gè)備區(qū)域提升為主區(qū)域。

請注意,此功能會(huì)在切換至備區(qū)域后自動(dòng)逆轉(zhuǎn)數(shù)據(jù)復(fù)制的流向。GlobalDatabase

Switchover

功能還支持將主區(qū)域切換回原來的主區(qū)域。此外,Global

DatabaseSwitchover

還可用于區(qū)域輪換等使用場景,以實(shí)現(xiàn)全天侯運(yùn)行模式。10摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨區(qū)域擴(kuò)展高可用性和容災(zāi)監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂userid:549683,docid:169851,date:2024-07-31,Global

Database

Failover

是一個(gè)跨區(qū)域的數(shù)據(jù)庫故障轉(zhuǎn)移過程??稍谥鲄^(qū)域發(fā)生故障(如區(qū)域級或服務(wù)中斷)時(shí),從備區(qū)域發(fā)起故障轉(zhuǎn)移流程。您可以通過控制臺,調(diào)用

FailoverGlobalClusterAPI

或執(zhí)行

failover-global-cluster

CLI

命令并設(shè)置

AllowDataLoss

參數(shù),發(fā)起

Global

DatabaseFailover。Global

Database

Failover

會(huì)將選定的備區(qū)域數(shù)據(jù)庫集群提升為主集群,并使用新的主區(qū)域數(shù)據(jù)庫集群的快照重新初始化數(shù)據(jù)庫拓?fù)渲械乃锌捎脗鋮^(qū)域。當(dāng)舊的主區(qū)域從故障中恢復(fù)后,Amazon

Aurora

會(huì)使用當(dāng)前主區(qū)域數(shù)據(jù)庫集群的快照恢復(fù)數(shù)據(jù),將該區(qū)域重新添加至您的數(shù)據(jù)庫拓?fù)渲?。此外,Amazon

Aurora

還會(huì)創(chuàng)建快照,從而保留故障轉(zhuǎn)移前的數(shù)據(jù)。由于Aurora

Global

Database

采用異步復(fù)制,因此,Global

Database

Failover

可能會(huì)導(dǎo)致丟失故障轉(zhuǎn)移時(shí)尚未復(fù)制到備區(qū)域的數(shù)據(jù)。關(guān)于

Global

Database

Failover

Global

DatabaseSwitchover

的具體細(xì)節(jié),請參閱

Amazon

Aurora

用戶指南。Amazon

AuroraPostgreSQL

Global

Database

提供

Managed

RPO

機(jī)制,讓您能夠?yàn)槟臄?shù)據(jù)庫規(guī)劃和實(shí)施

RPO。Amazon

Aurora

Global

Database

還提供寫入轉(zhuǎn)發(fā)功能,可將備區(qū)域的寫入操作轉(zhuǎn)發(fā)至主區(qū)域。Amazon

Aurora

GlobalDatabase架構(gòu)示例Amazon

Aurora

還提供托管式藍(lán)/綠部署,可減少重大變更操作導(dǎo)致的停機(jī)時(shí)間,例如數(shù)據(jù)庫引擎大小版本升級、測試新的數(shù)據(jù)庫和應(yīng)用程序功能,以及

Schema

維護(hù)或變更。AmazonAurora

提供零停機(jī)打補(bǔ)丁

(ZDP)

功能,可顯著降低小版本升級期間應(yīng)用程序的停機(jī)時(shí)間。在Amazon

Aurora

小版本升級過程中,零停機(jī)打補(bǔ)丁功能會(huì)盡最大可能保持客戶端連接。如果零停機(jī)打補(bǔ)丁順利完成,在升級過程中,數(shù)據(jù)庫引擎重啟,但應(yīng)用程序會(huì)話會(huì)始終保持連接。數(shù)據(jù)庫引擎重啟可能導(dǎo)致吞吐量下降,持續(xù)時(shí)間從幾秒到

1

分鐘不等。入站復(fù)制A集群端點(diǎn)B只讀實(shí)例端點(diǎn)只讀實(shí)例端點(diǎn)可用區(qū)

2可用區(qū)

3可用區(qū)

1可用區(qū)

2出站復(fù)制主區(qū)域可用區(qū)

1備區(qū)域

1摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性環(huán)監(jiān)境控高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂入站復(fù)制11單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)Amazon

Aurora

提供全托管的自動(dòng)備份功能,支持制定滿足業(yè)務(wù)和合規(guī)性要求的單區(qū)域容災(zāi)策略。如果需要長期保留備份,可以使用

Amazon

Backup

通過集中策略管理創(chuàng)建手動(dòng)快照,或者將數(shù)據(jù)庫集群快照數(shù)據(jù)導(dǎo)出至

Amazon

S3

存儲(chǔ)桶:導(dǎo)出在后臺運(yùn)行,不會(huì)影響運(yùn)行中集群的性能。要在單個(gè)區(qū)域內(nèi)構(gòu)建高可用

Aurora

數(shù)據(jù)庫,可將數(shù)據(jù)庫集群部署到多個(gè)可用區(qū)中。多可用區(qū)數(shù)據(jù)庫集群包括一個(gè)寫入數(shù)據(jù)庫實(shí)例,以及至少一個(gè)部署在不同可用區(qū)的只讀數(shù)據(jù)庫實(shí)例,提供故障轉(zhuǎn)移冗余。對于此類數(shù)據(jù)庫,服務(wù)等級協(xié)議保證

99.99%(4

個(gè)

9)的正常運(yùn)行時(shí)間。多可用區(qū)配置可自動(dòng)檢測和緩解故障,例如當(dāng)寫入實(shí)例發(fā)生故障時(shí),自動(dòng)進(jìn)行故障轉(zhuǎn)移,將指定的只讀實(shí)例提升為新的主實(shí)例。您無需重新配置應(yīng)用程序,應(yīng)用程序可通過集群端點(diǎn)和只讀實(shí)例端點(diǎn)無縫連接新提升的實(shí)例。在多可用區(qū)配置中,如果發(fā)生數(shù)據(jù)庫實(shí)例故障,底層實(shí)例會(huì)在故障轉(zhuǎn)移后自動(dòng)切換;而在單可用區(qū)配置中,在新實(shí)例可用之前可能會(huì)出現(xiàn)數(shù)分鐘的停機(jī)時(shí)間。跨區(qū)域擴(kuò)展高可用性和容災(zāi)常見的跨區(qū)域容災(zāi)模式是在備區(qū)域配置快照備份。這是一種具有較高

RTO

RPO

容忍度的跨區(qū)域容災(zāi)模式。在主區(qū)域故障時(shí),備區(qū)域快照備份不受主區(qū)域故障影響,因此可以通過備區(qū)域備份來實(shí)施恢復(fù)策略。相比于單區(qū)域

Aurora

數(shù)據(jù)庫集群部署提供的標(biāo)準(zhǔn)高可用性,Amazon

Aurora

Global

Database提供了更強(qiáng)大的業(yè)務(wù)連續(xù)性和容災(zāi)方案。Amazon

Aurora

的解耦架構(gòu)設(shè)計(jì)使單個(gè)數(shù)據(jù)庫集群能夠跨多個(gè)區(qū)域運(yùn)行,在提供低延遲本地讀取的同時(shí),還能應(yīng)對區(qū)域級故障,這使

AmazonAurora

成為擴(kuò)展高可用性和容災(zāi)策略的理想跨區(qū)域解決方案。Amazon

Aurora

Global

Database

可通過

GlobalDatabase

Failover

功能,在主區(qū)域發(fā)生故障時(shí)將工作負(fù)載快速故障轉(zhuǎn)移到備區(qū)域,從而實(shí)現(xiàn)分鐘級

RTO。對于區(qū)域輪換、全天候式應(yīng)用程序或容災(zāi)演練等場景,在主區(qū)域和備區(qū)域均可用且運(yùn)行正常的情況下,可以使用

GlobalDatabase

Switchover

功能。此外,Amazon

Aurora

Global

Database

還支持對備區(qū)域采用

headless

集群配置,即備集群只包含

Amazon

Aurora

存儲(chǔ)卷,不包含任何數(shù)據(jù)庫實(shí)例。Headless

配置作為容災(zāi)策略的一部分,除了可以節(jié)約成本,還能確保備份不受主區(qū)域故障影響。您可以在將備區(qū)域提升為主區(qū)域前,為備區(qū)域集群添加一個(gè)數(shù)據(jù)庫實(shí)例。此外,您還可以選擇在備區(qū)域預(yù)配

Amazon

Aurora

Serverlessv2

實(shí)例,這是一種經(jīng)濟(jì)高效的部署方案。如果您考慮采用headless

配置,建議您權(quán)衡

RTO

和成本控制。摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測實(shí)試現(xiàn)和流審程查高可用性及常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂12監(jiān)控高可用性和容災(zāi)環(huán)境Amazon

Aurora

提供多種可觀察性工具,包括

Amazon

CloudWatchLogs、增強(qiáng)監(jiān)控和

Amazon

RDS

Performance

Insights,用于監(jiān)控?cái)?shù)據(jù)庫集群的運(yùn)行狀況、可用性和性能。監(jiān)控單區(qū)域

Aurora

數(shù)據(jù)庫集群的關(guān)鍵

CloudWatch

指標(biāo)包括:請參閱

Amazon

Aurora

指標(biāo)參考和監(jiān)控工具,了解監(jiān)控

AmazonAurora

數(shù)據(jù)庫集群的其他指標(biāo)和工具。監(jiān)控跨區(qū)數(shù)據(jù)庫的關(guān)鍵CloudWatch

指標(biāo)包括:注意:

AuroraGlobalDBRPOLag

僅監(jiān)測用戶

transaction

的延遲。AuroraGlobalDBProgressLag

還監(jiān)測了健康檢查

transaction

的延遲。因此,即便用戶

transaction

很少或者沒有

transaction

時(shí),您也可以通過監(jiān)測

AuroraGlobalDBProgressLag

來查看健康檢查transaction

的延遲,來診斷網(wǎng)絡(luò)問題。此外,Amazon

Aurora

PostgreSQL

Global

Database

還提供以下兩個(gè)函數(shù):CPUUtilizationDatabaseConnectionsNetworkThroughputNetworkTransmitThroughputNetworkReceiveThroughputStorageNetworkThroughputStorageNetworkTransmitThroughputStorageNetworkReceiveThroughputAuroraReplicaLagaurora_global_db_status顯示

Global

Database

的備數(shù)據(jù)庫集群的延遲時(shí)間。aurora_global_db_instance_status列出主數(shù)據(jù)庫集群和備數(shù)據(jù)庫集群下的所有備數(shù)據(jù)庫實(shí)例。請參閱監(jiān)控

AmazonAuroraPostgreSQL

Global

Database

了解如何使用這些函數(shù)的更多信息。AuroraGlobalDBDataTransferBytesAuroraGlobalDBProgressLagAuroraGlobalDBReplicatedWriteIOAuroraGlobalDBReplicationLagAuroraGlobalDBRPOLag13監(jiān)控Amazon

Aurora

事件Amazon

RDS

事件的生成表明

Amazon

Aurora

環(huán)境發(fā)生了變化。例如,當(dāng)為數(shù)據(jù)庫集群打補(bǔ)丁時(shí),Amazon

Aurora

會(huì)生成一個(gè)事件。Amazon

Aurora

會(huì)幾乎實(shí)時(shí)地將事件傳遞至

AmazonCloudWatch

Events

Amazon

EventBridge。Amazon

RDS

將事件分為不同的類別,您可以訂閱這些類別,當(dāng)某個(gè)類別中發(fā)生事件時(shí)就會(huì)收到通知。有關(guān)更多詳細(xì)信息,請參閱

AmazonAurora

用戶指南中的使用

Amazon

RDS

事件通知。摘要與簡介摘要良您好的架構(gòu)原是則否?符合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨區(qū)域擴(kuò)展高可用性和容災(zāi)監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂14最佳實(shí)踐指定

RTO

RPO根據(jù)業(yè)務(wù)需求制定容災(zāi)策略。首先,為每個(gè)工作負(fù)載指定

RPO

RTO。您可以進(jìn)一步將工作負(fù)載分為不同層級,關(guān)鍵任務(wù)層級的工作負(fù)載有更嚴(yán)格的服務(wù)等級(如更低的

RTO

RPO),而較低層級工作負(fù)載的限制條件則相應(yīng)放寬,同時(shí)要考慮相關(guān)成本影響。請務(wù)必根據(jù)業(yè)務(wù)優(yōu)先級設(shè)置

RTO

RPO

目標(biāo),因?yàn)楦鼑?yán)格的恢復(fù)目標(biāo)通常需要權(quán)衡取舍,比如更高的運(yùn)營成本。制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略高可用性策略:創(chuàng)建多可用區(qū)

Aurora

數(shù)據(jù)庫集群,在單個(gè)區(qū)域內(nèi)實(shí)現(xiàn)高度可用的Aurora

數(shù)據(jù)庫部署,由

AmazonAurora

提供

99.99%(4

個(gè)

9)的正常運(yùn)行時(shí)間

SLA

保障。此外,您還可以添加

Aurora

只讀實(shí)例作為故障轉(zhuǎn)移目標(biāo),在寫入實(shí)例故障時(shí)隨時(shí)接管工作負(fù)載。Amazon

Aurora

自動(dòng)管理故障轉(zhuǎn)移過程。容災(zāi)策略:在確定

RTO

RPO

后,您需要設(shè)置與其相匹配的自動(dòng)備份保留時(shí)間。自動(dòng)備份的保留期限決定了您可以將

Aurora

數(shù)據(jù)庫集群還原到多久之前的時(shí)間點(diǎn)。默認(rèn)情況下,Amazon

Aurora

的自動(dòng)備份保留時(shí)間為1天,但您可以將備份保留時(shí)間延長至

35

天。保留期越長,可用于恢復(fù)的歷史數(shù)據(jù)就越多,這直接影響

RTO。根據(jù)您的容災(zāi)策略,可能手動(dòng)快照需要保留更長時(shí)間。此外,在不同的區(qū)域和賬戶中保存?zhèn)浞莞北?,可以提供額外的韌性保障。使用Amazon

Backup

可簡化這一過程。Amazon

Backup

提供手動(dòng)快照的生命周期管理和集中式備份計(jì)劃配置。15編寫并測試高可用性和容災(zāi)流程文檔請?jiān)敿?xì)記錄實(shí)現(xiàn)高可用性和容災(zāi)流程。Amazon

Aurora

數(shù)據(jù)庫管理員手冊中包含了高可用性和容災(zāi)流程,如自動(dòng)備份、備份時(shí)段、維護(hù)時(shí)段和故障轉(zhuǎn)移配置等。您還可以使用故障注入查詢來測試

Aurora

數(shù)據(jù)庫集群的容錯(cuò)能力。不過,務(wù)必要?jiǎng)?chuàng)建一份包含所有相關(guān)細(xì)節(jié)的操作手冊,例如腳本位置、需要收集的數(shù)據(jù)點(diǎn),以及按何種順序執(zhí)行哪些流程。這些細(xì)節(jié)需要記錄在案,并在災(zāi)難發(fā)生時(shí)明確傳達(dá)。編寫完成后,定期開展容災(zāi)演練來測試該流程。根據(jù)需要更新操作手冊。定工作期負(fù)測載本試身和會(huì)審發(fā)生查變高化可,這用種性變化及可容能災(zāi)影響實(shí)當(dāng)現(xiàn)前流高可程用性和容災(zāi)流程的有效性。制定流程,定期測試實(shí)現(xiàn)高可用性和容災(zāi)的流程,驗(yàn)證其有效性,并找出任何需要改進(jìn)的地方。例如,數(shù)據(jù)庫的規(guī)??赡芤呀?jīng)增長,導(dǎo)致備份和恢復(fù)時(shí)間比最初設(shè)計(jì)的更長,您需要做好響應(yīng)的準(zhǔn)備。摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性及容災(zāi)實(shí)現(xiàn)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂16常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式使用場景:多區(qū)域應(yīng)用程序通過容災(zāi)區(qū)域?qū)崿F(xiàn)讀/寫能力在備區(qū)域部署應(yīng)用程序,除了能在多個(gè)區(qū)域?yàn)橛脩籼峁┑脱舆t讀取服務(wù),備區(qū)域上的應(yīng)用程序還可能向數(shù)據(jù)庫寫入數(shù)據(jù)。例如,寫入轉(zhuǎn)發(fā)功能可以允許遠(yuǎn)程用戶將數(shù)據(jù)寫入就近備區(qū)域中的只讀實(shí)例,而無需直接寫入主區(qū)域,這樣可以降低全球分布式應(yīng)用程序的延遲。設(shè)計(jì)模式:通過全球只讀副本實(shí)現(xiàn)寫入轉(zhuǎn)發(fā)使用

Amazon

Aurora

Global

Database

的容災(zāi)只讀實(shí)例進(jìn)行就近讀取,根據(jù)用戶距離選擇就近實(shí)例,提升性能。這種情況下,備區(qū)域不僅僅是用于被動(dòng)容災(zāi)。寫入轉(zhuǎn)發(fā)允許應(yīng)用程序?qū)懭氩僮髦赶虮镜氐闹蛔x實(shí)例。這種直接寫入方式能夠透明地處理會(huì)話和事務(wù)上下文,確保寫入與后續(xù)讀取之間的一致性。主數(shù)據(jù)庫集群是權(quán)威數(shù)據(jù)源,其數(shù)據(jù)更改首先被保存到存儲(chǔ)層,然后復(fù)制

Aurora

Global

Database

的備集群。這種架構(gòu)允許將寫入操作定向到您的

Aurora

Global

Database

的任何遠(yuǎn)程集群,簡化了應(yīng)用程序開發(fā)。17Amazon

Aurora

GlobalDatabase寫入轉(zhuǎn)發(fā)示例有關(guān)更多詳細(xì)信息,請參閱

Amazon

Aurora

用戶指南中的在

Amazon

Aurora

Global

Database中使用寫入轉(zhuǎn)發(fā)。使如果用您場正景在尋:找節(jié)一省種經(jīng)容濟(jì)災(zāi)實(shí)成惠且本亞秒級

RPO

延遲的多區(qū)域韌性解決方案,Amazon

AuroraGlobal

Database

是很好的選擇。Aurora

Global

Database

headless

集群模式允許備區(qū)域僅包含存儲(chǔ)卷而無數(shù)據(jù)庫實(shí)例。這種方法適用于

RTO

超過在備區(qū)域配置數(shù)據(jù)庫實(shí)例所需時(shí)間(通常最多為

10

分鐘)的容災(zāi)場景。設(shè)計(jì)模式:AmazonAuroraGlobal

Database

中的

headless

集群Aurora

GlobalDatabase

中的

headless

備集群不含任何數(shù)據(jù)庫實(shí)例,而主區(qū)域的集群由一個(gè)寫入實(shí)例、一個(gè)或多個(gè)只讀實(shí)例,以及存儲(chǔ)主數(shù)據(jù)的集群存儲(chǔ)卷組成。在這種配置下,備區(qū)域僅包含存儲(chǔ)備數(shù)據(jù)的備集群存儲(chǔ)卷。Amazon

Aurora

使用專用基礎(chǔ)設(shè)施,通過亞馬遜云科技骨干網(wǎng)絡(luò)跨區(qū)域復(fù)制數(shù)據(jù),延遲很低。這種

headless

集群配置方式可以降低您的

Aurora

Global

Database

的資源成本,因?yàn)榧軜?gòu)中存儲(chǔ)與計(jì)算解耦,未配置數(shù)據(jù)庫實(shí)例的備區(qū)域不產(chǎn)生計(jì)算資源費(fèi)用。Amazon

AuroraGlobalDatabase

headless

集群示例有關(guān)更多詳細(xì)信息,請參閱

Amazon

Aurora

用戶指南中的在備區(qū)域創(chuàng)建headless

Aurora

數(shù)據(jù)庫集群。應(yīng)用程序

A主區(qū)域備區(qū)域

1可用區(qū)

1可用區(qū)

2可用區(qū)

3只讀實(shí)例寫入實(shí)例只讀實(shí)例存儲(chǔ)

存儲(chǔ) 應(yīng)用程序

B1.寫入只讀端點(diǎn)備區(qū)域

1可用區(qū)

1可用區(qū)

2主區(qū)域可用區(qū)1只讀實(shí)例可用區(qū)3寫入實(shí)例2.寫入請求被轉(zhuǎn)發(fā)至主區(qū)域的寫入實(shí)例只讀實(shí)例只讀實(shí)例3.提交寫請求4.復(fù)制更新到備區(qū)域存儲(chǔ)可用區(qū)2只讀實(shí)例存儲(chǔ)出站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測流試程和審查高可用性和常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂出站復(fù)制18使用場景:限制最大

RPO

損失在某些情況下(如網(wǎng)絡(luò)或工作負(fù)載導(dǎo)致的事件),從主集群到備集群的復(fù)制可能會(huì)出現(xiàn)延遲,可能導(dǎo)致

RPO

延遲增加。對于數(shù)據(jù)保護(hù)要求較高的應(yīng)用程序,此設(shè)計(jì)模式可以緩解備集群RPO

延遲增加問題。設(shè)計(jì)模式:Managed

RPO注意:這種架構(gòu)模式只適用于

Amazon

Aurora

PostgreSQL

Global

Database。對于

AmazonAurora

PostgreSQL

GlobalDatabase,可以通過

rds.global_db_rpo參數(shù)來管理

RPO。Amazon

Aurora

會(huì)監(jiān)控AuroraGlobalDBRPOLag指標(biāo),確保至少有一個(gè)集群符合指定

RPO窗口期。只要有任何一個(gè)備集群的

RPO

延遲在指定范圍內(nèi),就會(huì)提交主集群上的事務(wù)。如果所有備集群的延遲都超出指定

RPO

延遲范圍,主集群事務(wù)將被阻止,直到一個(gè)備集群數(shù)據(jù)完全同步,以保證符合

RPO

要求。設(shè)置RPO

(rds.global_db_rpo=

20

秒)。兩個(gè)備區(qū)域的RPO

延遲都在指定范圍內(nèi)。備區(qū)域

1應(yīng)用程序

A可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO

延遲:15

秒主區(qū)域可用區(qū)

1可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)

rds.global_db_rpo

的值設(shè)為

20(秒)有效的RPO

值范圍從

20

秒到2,147,483,647

秒RPO

延遲:10

秒入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能和單容區(qū)災(zāi)域?qū)崿F(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編容寫災(zāi)并流測程試文高檔可用性和定容期災(zāi)測流試程和審查高可用性和常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂19其中一個(gè)備區(qū)域的

RPO

延遲仍在指定范圍內(nèi),寫入操作繼續(xù)進(jìn)行兩個(gè)備區(qū)域的延遲都超出了允許的

RPO

延遲范圍,主區(qū)域的寫入操作被暫停備區(qū)域

1應(yīng)用程序

A可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO

延遲:35

秒主區(qū)域可用區(qū)

1可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)

rds.global_db_rpo

的值設(shè)為

20(秒)有效的RPO

值范圍從

20

秒到2,147,483,647

秒RPO

延遲:22

秒備區(qū)域

1應(yīng)用程序

A可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO

延遲:25

秒主區(qū)域可用區(qū)

1可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)

rds.global_db_rpo

的值設(shè)為

20(秒)有效的RPO

值范圍從

20

秒到2,147,483,647

秒RPO

延遲:10

秒入站復(fù)制入站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂20其中一個(gè)備區(qū)域的延遲恢復(fù)到目標(biāo)范圍內(nèi),寫入操作得以恢復(fù)使用場景:滿足容災(zāi)測試的監(jiān)管合規(guī)性要求常見標(biāo)準(zhǔn)做法是,在區(qū)域間定期輪換運(yùn)行主系統(tǒng)。這不僅可以確保流程的完整性和準(zhǔn)確性,還能確保員工為容災(zāi)場景做好準(zhǔn)備。Global

Database

Switchover

支持的使用場景包括容災(zāi)演練、主數(shù)據(jù)庫輪換,或無需重新創(chuàng)建集群即可還原到之前的主區(qū)域。設(shè)計(jì)模式:Global

Database

SwitchoverGlobalDatabase

Switchover

可將

Amazon

AuroraGlobalDatabase

的主集群例行遷移至不同區(qū)域,適用于運(yùn)維和計(jì)劃流程等受控場景。例如,一家在多地設(shè)有分支機(jī)構(gòu)的金融機(jī)構(gòu)可能采用這種方法,每個(gè)季度在指定的備區(qū)域間輪換運(yùn)行主集群。在切換過程中,當(dāng)前主區(qū)域的主集群會(huì)轉(zhuǎn)為只讀狀態(tài),同時(shí)同步數(shù)據(jù)到備區(qū)域的存儲(chǔ)卷,確保數(shù)據(jù)零丟失

(RPO

=

0)。被選中的備集群會(huì)被提升為主集群,維持?jǐn)?shù)據(jù)復(fù)制拓?fù)浣Y(jié)構(gòu),所有區(qū)域的數(shù)據(jù)庫實(shí)例都會(huì)重啟,這會(huì)導(dǎo)致幾分鐘內(nèi)的短暫不可用。備區(qū)域

1應(yīng)用程序

A可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例RPO

延遲:35

秒主區(qū)域可用區(qū)

1可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)RPO:將參數(shù)

rds.global_db_rpo

的值設(shè)為

20(秒)有效的RPO

值范圍從

20

秒到2,147,483,647

秒RPO

延遲:15

秒入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單區(qū)域?qū)崿F(xiàn)高可用性和容災(zāi)跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO的制高定可與用RT性O(shè)和和容R災(zāi)PO策略相匹配編寫并測試高可用性和容災(zāi)流程文檔定容期災(zāi)測流試程和審查高可用性和常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂21Amazon

Aurora

GlobalDatabase三區(qū)域架構(gòu)示例切換完成后,備區(qū)域

1

成為新的主區(qū)域。在舊主區(qū)域停止寫入的同時(shí),備區(qū)域的數(shù)據(jù)完成完全同步,實(shí)現(xiàn)

RPO=0。備區(qū)域

1應(yīng)用程序

A可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)備區(qū)域

1應(yīng)用程序

A可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)入站復(fù)制入站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂主區(qū)域可用區(qū)

122主區(qū)域可用區(qū)

1新的主區(qū)域允許寫入操作且維持?jǐn)?shù)據(jù)復(fù)制拓?fù)浣Y(jié)構(gòu)有關(guān)更多詳細(xì)信息,請參閱

Amazon

Aurora

用戶指南中的

執(zhí)行 Global

DatabaseSwitchover。使在極用少場數(shù)情景況:下從,A區(qū)ma域zo故n

A障uro中ra快Glo速ba恢l

D復(fù)atabase

的主區(qū)域可能發(fā)生意外中斷,導(dǎo)致主集群及其寫入數(shù)據(jù)庫實(shí)例不可用,同時(shí)數(shù)據(jù)復(fù)制也會(huì)停止。在這種情況下,Global

DatabaseFailover

的設(shè)計(jì)模式可以最大程度減少停機(jī)時(shí)間和數(shù)據(jù)丟失。設(shè)計(jì)模式:Global

Database

Failover(“區(qū)域故障”場景)下線應(yīng)用程序,防止寫入發(fā)送至主集群。檢查數(shù)據(jù)庫的所有備集群的延遲時(shí)間,選擇復(fù)制延遲最短的備區(qū)域(AuroraGlobalDBRPOLag);使用這個(gè)備區(qū)域可最大限度減少當(dāng)前故障主區(qū)域的數(shù)據(jù)丟失。重新配置應(yīng)用程序,將所有寫入操作指向新提升的主區(qū)域中的

Aurora

Global

Database

集群,并更新端點(diǎn)引用。在

Amazon

RDS

Proxy

中重定向?qū)懭氩僮鳎ㄈ邕m用)。舊主區(qū)域恢復(fù)后,Amazon

Aurora

將自動(dòng)把它作為備區(qū)域重新添加至您的

Aurora

GlobalDatabase

配置。這樣就保持了全球集群的原始拓?fù)浣Y(jié)構(gòu)。有關(guān)更多詳細(xì)信息,請參閱Amazon

Aurora

用戶指南中的

執(zhí)行Global

Database

Failover。應(yīng)用程序

A主區(qū)域可用區(qū)

1可用區(qū)

2寫入實(shí)例只讀實(shí)例備區(qū)域

1可用區(qū)

1可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例只讀實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例入站復(fù)制存儲(chǔ)入站復(fù)制出站復(fù)制摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPORTO RPO的制高定可與用性和和容災(zāi)策略相匹配編容寫災(zāi)并流測程試文高檔可用性和容定災(zāi)期流測程試和審查高可用性和常場見景的與高設(shè)可計(jì)用模性式和容災(zāi)使用在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂23Amazon

Aurora

GlobalDatabase三區(qū)域架構(gòu)示例發(fā)生故障轉(zhuǎn)移時(shí),主區(qū)域停止接受寫請求。識別出復(fù)制延遲最短的某個(gè)備區(qū)域(本例為備區(qū)域

1)。備區(qū)域

1應(yīng)用程序

A可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例可用區(qū)

2可用區(qū)

3存儲(chǔ)只讀實(shí)例只讀實(shí)例寫入實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)

1只讀實(shí)例可用區(qū)2只讀實(shí)例出站復(fù)制存儲(chǔ)A2主區(qū)域21備區(qū)域

21備區(qū)域

1入站復(fù)制入站復(fù)制入站復(fù)制入站復(fù)制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)控高可用性和容災(zāi)環(huán)境監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂主區(qū)域可用區(qū)

124故障轉(zhuǎn)移完成后,備區(qū)域

1

提升為新的主區(qū)域。應(yīng)用程序A連接的端點(diǎn)切換至新主區(qū)域中的數(shù)據(jù)庫集群端點(diǎn)。舊主區(qū)域恢復(fù)后,Amazon

Aurora

自動(dòng)將其作為備區(qū)域重新添加至該Global

Database拓?fù)浣Y(jié)構(gòu)中應(yīng)用程序

A主區(qū)域可用區(qū)

1可用區(qū)

2寫入實(shí)例只讀實(shí)例存儲(chǔ)應(yīng)用程序

A主區(qū)域可用區(qū)

1可用區(qū)

2寫入實(shí)例只讀實(shí)例備區(qū)域

1可用區(qū)

1可用區(qū)

2存儲(chǔ)只讀實(shí)例只讀實(shí)例可用區(qū)3只讀實(shí)例備區(qū)域

2存儲(chǔ)可用區(qū)1只讀實(shí)例可用區(qū)2只讀實(shí)例入站復(fù)制存儲(chǔ)入站復(fù)制出站復(fù)制摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon

Aurora

架構(gòu)及其高可用性和容災(zāi)功能單和區(qū)容域?yàn)?zāi)實(shí)現(xiàn)高可用性跨和區(qū)容域?yàn)?zāi)擴(kuò)展高可用性監(jiān)環(huán)控境高可用性和容災(zāi)監(jiān)控

Amazon

Aurora

事件最佳實(shí)踐指定

RTO

RPO制定與

RTO

RPO

相匹配的高可用性和容災(zāi)策略編寫并測試高可用性和容災(zāi)流程文檔定期測試和審查高可用性和容災(zāi)流程常見的高可用性和容災(zāi)使用場景與設(shè)計(jì)模式在打補(bǔ)丁、升級和重大Schema

變更期間保持可用性總結(jié)貢獻(xiàn)者延伸閱讀文檔修訂25在打補(bǔ)丁、升級和重大

Schema變更期間保持可用性計(jì)劃內(nèi)停機(jī)(通常由版本升級、打補(bǔ)丁和

Schema

變更等維護(hù)任務(wù)所需)可能持續(xù)幾分鐘到幾天不等。使用數(shù)據(jù)庫副本執(zhí)行這些任務(wù),然后將生產(chǎn)流量切換至新提升的副本上,有助于減少停機(jī)時(shí)間。然而,復(fù)制設(shè)置、提升和切換過程可能很復(fù)雜,容易出錯(cuò),特別是在大規(guī)模場景下。Amazon

Aurora

藍(lán)/綠部署提供托管式解決方案,極大簡化了復(fù)制流程。Amazon

Aurora

藍(lán)/綠部署Amazon

Aurora

的藍(lán)/綠部署功能支持創(chuàng)建與生產(chǎn)環(huán)境保持同步的預(yù)生產(chǎn)環(huán)境。生產(chǎn)環(huán)境(藍(lán)環(huán)境)和預(yù)生產(chǎn)環(huán)境(綠環(huán)境)通過邏輯日志復(fù)制保持同步。綠環(huán)境可快速提升為生產(chǎn)環(huán)境,且不會(huì)丟失數(shù)據(jù)。切換期間會(huì)阻止對兩個(gè)環(huán)境的寫入,確保數(shù)據(jù)同步。將生產(chǎn)流量切換至新提升的綠環(huán)境通常會(huì)導(dǎo)致不到

1分鐘的短暫停機(jī),但根據(jù)實(shí)際工作負(fù)載情況,停機(jī)時(shí)長可能更長。切換完成后,藍(lán)環(huán)境的名稱和端點(diǎn)將分配給新提升的綠環(huán)境,無需對應(yīng)用程序進(jìn)行任何更改。26生產(chǎn)環(huán)境讀取訪問讀/寫訪問生產(chǎn)環(huán)境應(yīng)用程序讀取訪問只讀實(shí)例(auroradb-instance-2)只端讀點(diǎn)實(shí)例復(fù)制AmazonAurora可用區(qū)

2AmazonAurora只端讀點(diǎn)實(shí)例集群端點(diǎn)只讀實(shí)例(auroradb-instance-3)可用區(qū)

1AmazonAurora復(fù)制可用區(qū)

3區(qū)域

1摘要與簡介摘要良您好的架構(gòu)是原否則符?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論