




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Amazon
Aurora高可用與容災白皮書注意事項客戶須根據(jù)實際業(yè)務情況酌情參考本文檔中的信息。本文檔:(a)
僅供參考;(b)
基于當前亞馬遜云科技產(chǎn)品和用途。如有更改,恕不另行通知;(c)
不代表亞馬遜云科技及其附屬公司、供應商或許可方作出任何承諾或保證。文中涉及的亞馬遜云科技產(chǎn)品或服務均“按原樣”,不包含任何形式的保證、陳述或條件,無論是明示還是暗示。亞馬遜云科技對客戶的責任和義務受雙方協(xié)議約束,本文檔與亞馬遜云科技和客戶之間簽訂的任何協(xié)議無關(guān),亦不影響任何此類協(xié)議。?
2024
Amazon
Web
Services,
Inc.
或其附屬公司保留所有權(quán)利2摘要與簡介3摘要目錄您的架構(gòu)是否符合良好架構(gòu)原則?簡介04040405Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨區(qū)域擴展高可用性和容災071212監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件1314最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略15151516編寫并測試高可用性和容災流程文檔定期測試和審查高可用性及容災實現(xiàn)流程16常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大
Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀1726303132摘要與簡介摘要Amazon
Aurora
是一款全托管的關(guān)系型數(shù)據(jù)庫,提供超高性能、全球規(guī)模的可用性,并與
MySQL
和
PostgreSQL
完全兼容。Amazon
Aurora提供單區(qū)域和跨區(qū)域的高可用性
(HA)
和容災
(DR)
能力。本白皮書探討了
Amazon
Aurora
提供的高可用性和容災能力,展示了支撐構(gòu)建具有韌性的全球化應用程序的設計模式,闡述了如何利用
Amazon
Aurora的多可用區(qū)
(AZ)
部署和
Global
Database(全球數(shù)據(jù)庫)功能,以及如何在單個區(qū)域內(nèi)和跨區(qū)域?qū)崿F(xiàn)高可用性和容災。您的架構(gòu)是否符合良好架構(gòu)原則?Amazon
Well-Architected
Framework
可幫助您權(quán)衡在云端構(gòu)建系統(tǒng)時所做決策的利弊。該框架的六大支柱助您在設計和運營可靠、安全、高效、經(jīng)濟實惠且可持續(xù)的系統(tǒng)時實現(xiàn)架構(gòu)最佳實踐。借助
Amazon
Well-Architected
Tool(可在亞馬遜云科技管理控制臺中免費使用),可以衡量針對每個支柱的系列問題,評估您的工作負載是否遵循這些最佳實踐。在亞馬遜云科技上的工作負載容災:云端恢復白皮書中,我們描述了一套經(jīng)客戶驗證的最佳實踐,用于設計架構(gòu)良好的容災工作負載。如需獲得更多關(guān)于云架構(gòu)的專家指導和最佳實踐資源(包括參考架構(gòu)部署、圖表和白皮書),請訪問亞馬遜云科技架構(gòu)中心。4簡介Amazon
Aurora
是完全兼容
MySQL
和
PostgreSQL
的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)
(RDBMS)。Amazon
Aurora
能夠以十分之一的成本提供媲美商業(yè)數(shù)據(jù)庫的性能和可用性。Amazon
Aurora
也是一款全托管數(shù)據(jù)庫服務,可實現(xiàn)全自動化管理數(shù)據(jù)庫,例如高可用性
(HA)、容災
(DR)、復制、擴展、備份、恢復和監(jiān)控。本白皮書將探討
Amazon
Aurora
的高可用性和容災能力,以及如何利用常見的架構(gòu)模式,在單個區(qū)域和多個區(qū)域?qū)崿F(xiàn)高可用性和容災。注意:除非另有說明,本白皮書涵蓋的所有特性、功能和架構(gòu)模式均適用于
在探索
AmazonAurora
的高可用性和容災功能之前,讓我們先理解高可用性和容災的含義。5高可用可性用是衡性量系統(tǒng)韌性的常用定量指標。工作負載的可用性指其可訪問時間占總運行時間的百分比。該百分比在一定時間范圍內(nèi)(如一個月或一年)計算得出(可用時間/總時間),例如99.99%(4
個
9)。具備高可用性的數(shù)據(jù)庫能在硬件、軟件或網(wǎng)絡故障等問題發(fā)生時,以最少或無需人工介入的方式確保服務等級協(xié)議規(guī)定的運行性能。傳統(tǒng)的高可用性實現(xiàn)方式是在與源數(shù)據(jù)庫隔離的硬件上創(chuàng)建一個主數(shù)據(jù)庫的副本。1當發(fā)生中斷時,該副本將被提升為新的主數(shù)據(jù)庫。數(shù)據(jù)庫與應用程序的連接可通過虛擬
IP
(VIP)、域名系統(tǒng)
(DNS)
重定向或Proxy
層等方式進行管理。2系統(tǒng)可結(jié)合仲裁投票和心跳機制等多種方法監(jiān)控主數(shù)據(jù)庫健康狀態(tài),從而檢測中斷情況。3容災容災和高可用性是高韌性數(shù)據(jù)庫架構(gòu)的兩個完全獨立但同等重要的能力。容災是指企業(yè)在自然災害或人為災難發(fā)生后恢復
IT
基礎(chǔ)設施訪問和功能的方法。容災策略可能需要人工干預,例如運行腳本、更改端點和調(diào)整基礎(chǔ)設施規(guī)模。容災通常不僅局限于數(shù)據(jù)庫層面。例如,發(fā)生重大自然災害后,整個數(shù)據(jù)中心可能無法訪問。在這種情況下,容災流程可用于恢復數(shù)據(jù)庫和應用程序,使應用能在另一個未受影響的亞馬遜云科技區(qū)域繼續(xù)運行。容災流程通常包括完善的備份策略。備份可讓數(shù)據(jù)庫恢復到災難發(fā)生前的特定時間點。設計容災流程時,需要考慮的兩個關(guān)鍵因素是恢復時間目標
(RTO)
和恢復點目標
(RPO)。RTO和
RPO取決于應用程序及其底層數(shù)據(jù)庫的業(yè)務需求。即使在同一企業(yè)或部門內(nèi),不同的應用程序和工作負載也可能有不同的
RTO
和
RPO
要求。RPO
是指從最近數(shù)據(jù)恢復點算起可接受的最大間隔長度。它決定了在數(shù)據(jù)庫中斷與最近一個恢復點之間可允許的數(shù)據(jù)丟失量。例如,如果您將
RPO
定義為
15
分鐘,那么在發(fā)生災難時,您最多可能丟失
15
分鐘的數(shù)據(jù)。RTO
是指從數(shù)據(jù)庫中斷到服務恢復的最大可接受延遲時間。它決定了可接受的數(shù)據(jù)庫不可用時間窗口。例如,如果您確定應用程序的
RTO
為
5
分鐘,那么您的容災策略應該能讓應用程序(包括數(shù)據(jù)庫和其他應用程序組件)在
5
分鐘內(nèi)恢復服務。高可用性是系統(tǒng)的一種特性,旨在確保系統(tǒng)的運行性能水平(通常指正常運行時間)高于一般水平。Proxy(如
Amazon
RDSProxy)是一種中間服務,可以池化和共享應用程序的數(shù)據(jù)庫連接,從而提升應用程序的擴展能力。借助
Proxy
服務,您可以應對不可預測的數(shù)據(jù)庫流量突增,快速建立連接,避免連接數(shù)超出數(shù)據(jù)庫配置。通過消除對
DNS
的依賴,Proxy
還可以縮短高可用性配置中的故障轉(zhuǎn)移時間。分布式系統(tǒng)通過仲裁投票機制來執(zhí)行一致性操作。規(guī)范的仲裁機制通過獲得最小投票數(shù)來決定是否允許事務執(zhí)行。心跳是系統(tǒng)以預設的時間間隔產(chǎn)生的信號,用于向其伙伴系統(tǒng)表明自身運行正常。心跳機制是一種常用于高可用系統(tǒng)的同步技術(shù)。摘要與簡介摘要您的架構(gòu)是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨區(qū)域擴展高可用性和容災監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO的制高定可與用RT性O和和容R災PO策略相匹配編容寫災并流測程試文高檔可用性和定容期災測實試現(xiàn)和流審程查高可用性及常場見景的與高設可計用模性式和容災使用在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂6Amazon
Aurora
架構(gòu)及其高可用性和容災功能分布式存儲Amazon
Aurora
架構(gòu)從設計之初就考慮了高可用性和容災能力。Amazon
Aurora
的存儲子系統(tǒng)是分布式的,專為
Amazon
Aurora
量身打造。Amazon
Aurora
采用六副本方式,同時在三個可用區(qū)復制新寫入數(shù)據(jù)庫的數(shù)據(jù)。即使在極少發(fā)生的整個可用區(qū)故障加上另一個可用區(qū)并發(fā)存儲節(jié)點故障(AZ+1
故障)的情況下,分布式存儲仍能確保您的數(shù)據(jù)保持完整。這種分布式存儲架構(gòu)還能利用存儲節(jié)點間的
peer-to-peer協(xié)議自動擴展和自我修復,比如應對節(jié)點故障和恢復丟失的數(shù)據(jù)庫寫入。7盡管
Amazon
Aurora
分布式存儲子系統(tǒng)提供了增強的數(shù)據(jù)持久性,但它本身并不能使數(shù)據(jù)庫實現(xiàn)高可用性。下面我們來討論
Amazon
Aurora
數(shù)據(jù)庫集群的高可用性方案。Amazon
Aurora
單可用區(qū)架構(gòu)示例Amazon
Aurora
架構(gòu)中,計算資源與存儲解耦,從而允許計算和存儲子系統(tǒng)獨立地從故障中恢復??梢詫⒁粋€
Aurora
數(shù)據(jù)庫集群部署到單個區(qū)域中的一個或多個可用區(qū)中。單可用區(qū)Aurora
數(shù)據(jù)庫集群由一個寫入實例組成,該實例可接受讀取和寫入請求。應用程序
A只讀實例端點集群端點區(qū)域
1可用區(qū)
1寫入實例數(shù)據(jù)副本數(shù)據(jù)副本數(shù)據(jù)副本集群存儲卷Amazon
Aurora
數(shù)據(jù)庫集群寫入讀取摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定容期災測實試現(xiàn)和流審程查高可用性及常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂8Amazon
Aurora
多可用區(qū)架構(gòu)示例多可用區(qū)
Aurora
數(shù)據(jù)庫集群由一個寫入數(shù)據(jù)庫實例和至少一個(最多
15
個)只讀數(shù)據(jù)庫實例組成。只讀數(shù)據(jù)庫實例作為低延遲讀取副本,只能接受讀請求。多可用區(qū)
Aurora
數(shù)據(jù)庫集群是一種全托管的單區(qū)域高可用性方案。多可用區(qū)
Aurora
數(shù)據(jù)庫集群需要一個寫入數(shù)據(jù)庫實例和一個或多個只讀數(shù)據(jù)庫實例,且只讀實例與寫入實例必須部署在不同的可用區(qū)中。以多可用區(qū)模式部署時,Amazon
Aurora
提供
99.99%(4
個
9)的運行時間服務級別協(xié)議
(SLA)。Aurora數(shù)據(jù)庫集群提供一個集群端點(或?qū)懭雽嵗它c),該端點始終連接至當前的寫實例,可接受讀取和寫入請求。Aurora數(shù)據(jù)庫集群還提供一個連接至只讀實例的只讀端點。如果存在多個只讀實例,Amazon
Aurora
會對所有可用的只讀實例進行負載均衡。采用多可用區(qū)架構(gòu)時,Amazon
Aurora
自動檢測寫入實例中斷,并自動實現(xiàn)故障轉(zhuǎn)移,切換到數(shù)據(jù)庫集群中的某個只讀實例。如果存在多個只讀實例,可以配置參數(shù)值
(0–15)
為它們分配優(yōu)先級順序。優(yōu)先級最高(參數(shù)值為
0)的只讀實例將被選為首要故障轉(zhuǎn)移目標。故障轉(zhuǎn)移成功后,使用寫入端點重新連接的應用程序會自動被重定向到新的寫入實例。因此,應用程序無需任何改動即可在故障轉(zhuǎn)移后重新連接至數(shù)據(jù)庫。故障轉(zhuǎn)移最多可能需要
60
秒完成。在此期間及之前應用程序提交的請求都會失敗,因此需要應用程序重新提交那些請求。使用Amazon
Relational
Database
Service
(Amazon
RDS)
Proxy
可以進一步縮短故障轉(zhuǎn)移時間,它能在保持應用程序連接的同時自動連接至新的數(shù)據(jù)庫實例。當故障轉(zhuǎn)移發(fā)生時,Amazon
RDSProxy
會直接將請求路由至新的數(shù)據(jù)庫實例,可將
Aurora
數(shù)據(jù)庫的故障轉(zhuǎn)移時間最多縮短66%。集群端點應用程序
A只讀實例端點區(qū)域
1可用區(qū)
1可用區(qū)
2可用區(qū)
3只讀實例只讀實例寫入實例數(shù)據(jù)副本 數(shù)據(jù)副本 數(shù)據(jù)副本 集群存儲卷 AmazonAurora數(shù)據(jù)庫集群寫入讀取讀取讀取摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定期測試和審查高可用性及容災實現(xiàn)流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂9Amazon
Aurora
還支持在
Amazon
Web
Services
JDBC
Driver
中使用一個增強型
Java
數(shù)據(jù)庫連接
(JDBC)
封裝器。該封裝器是現(xiàn)有的開源
JDBC的擴展。其作用是擴展驅(qū)動程序功能,使應用程序能夠充分利用
Amazon
Aurora
的功能。Amazon
Web
Services
JDBC
Driver
支持
PostgreSQL和
MySQL(PostgreSQL
JDBC
Driver
或MySQL
JDBC
Driver)。Amazon
Web
Services
JDBCDriver
能夠感知故障轉(zhuǎn)移,并與
Amazon
Aurora
集群協(xié)同工作,以最大限度減少停機時間,并在數(shù)據(jù)庫實例發(fā)生故障時快速恢復連接。Amazon
Aurora
提供全托管備份能力。您可以為您的
Aurora
數(shù)據(jù)庫集群啟用自動備份功能,并將備份保留時間設置為
1
到35
天。配置完成后,Amazon
Aurora
將自動持續(xù)備份您的數(shù)據(jù)庫集群。如果需要保留超出備份保留期限的數(shù)據(jù),您可以為
Amazon
Aurora
集群存儲卷中的數(shù)據(jù)創(chuàng)建快照。請注意,Amazon
Aurora
數(shù)據(jù)庫集群快照不會自動過期,如果不再需要,您必須手動將其刪除。您可以利用時間點恢復
(PITR)
功能,將
Aurora
數(shù)據(jù)庫恢復到備份保留期內(nèi)的任意時間點。除此之外,您也可以使用
Amazon
Backup
服務來管理
Amazon
Aurora
數(shù)據(jù)庫集群的備份。AmazonAuroraGlobalDatabaseAmazon
Aurora
還提供
Amazon
Aurora
Global
Database,可以實現(xiàn)數(shù)據(jù)庫集群跨多個區(qū)域運行。Aurora
Global
Database
采用異步復制方式復制數(shù)據(jù),一般延遲不到1
秒,同時保持數(shù)據(jù)庫高可用以運行應用程序工作負載。一個
Aurora
Global
Database
最多可部署到
5
個備區(qū)域。每個備區(qū)域中最多可配置
15
個只讀實例。這種架構(gòu)將讀節(jié)點規(guī)模擴展到最多支持
5
個備區(qū)域和
90
個只讀實例。Aurora
Global
Database
支持在每個區(qū)域進行低延遲的快速本地讀取,并能從區(qū)域級故障中快速恢復。如果主區(qū)域發(fā)生故障,您可以將其中一個備區(qū)域提升為承擔讀/寫處理的主區(qū)域。即使在整個區(qū)域服務完全中斷的情況下,Amazon
Aurora
數(shù)據(jù)庫集群通常也能在
1
分鐘內(nèi)恢復。這可以使您的應用程序?qū)崿F(xiàn)
1
秒
RPO
和
1
分鐘
RTO,為
Amazon
Aurora數(shù)據(jù)庫集群的全球業(yè)務連續(xù)性奠定堅實基礎(chǔ)。Amazon
Aurora
Global
Database
可以助您快速應對區(qū)域性故障,在發(fā)生故障后迅速恢復應用可用性。根據(jù)具體情況,Amazon
Aurora
Global
Database
支持兩種不同的切換方法:GlobalDatabase
Switchover(主備切換)和
Global
Database
Failover(故障轉(zhuǎn)移)。Global
DatabaseSwitchover
要求部署的所有區(qū)域的數(shù)據(jù)庫集群都處于可用狀態(tài)。您可以通過執(zhí)行
GlobalDatabase
Switchover
來交換主集群和備集群的角色。常見的使用場景包括為滿足合規(guī)要求的跨區(qū)域容災測試和運維場景。利用
Global
Database
Switchover
功能,您可以通過調(diào)用SwitchoverGlobalCluster
API
或執(zhí)行
switchover-global-cluster
CLI
命令,快速將其中一個備區(qū)域提升為主區(qū)域。
請注意,此功能會在切換至備區(qū)域后自動逆轉(zhuǎn)數(shù)據(jù)復制的流向。GlobalDatabase
Switchover
功能還支持將主區(qū)域切換回原來的主區(qū)域。此外,Global
DatabaseSwitchover
還可用于區(qū)域輪換等使用場景,以實現(xiàn)全天侯運行模式。10摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨區(qū)域擴展高可用性和容災監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO的制高定可與用RT性O和和容R災PO策略相匹配編寫并測試高可用性和容災流程文檔定期測試和審查高可用性及容災實現(xiàn)流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂userid:549683,docid:169851,date:2024-07-31,Global
Database
Failover
是一個跨區(qū)域的數(shù)據(jù)庫故障轉(zhuǎn)移過程??稍谥鲄^(qū)域發(fā)生故障(如區(qū)域級或服務中斷)時,從備區(qū)域發(fā)起故障轉(zhuǎn)移流程。您可以通過控制臺,調(diào)用
FailoverGlobalClusterAPI
或執(zhí)行
failover-global-cluster
CLI
命令并設置
AllowDataLoss
參數(shù),發(fā)起
Global
DatabaseFailover。Global
Database
Failover
會將選定的備區(qū)域數(shù)據(jù)庫集群提升為主集群,并使用新的主區(qū)域數(shù)據(jù)庫集群的快照重新初始化數(shù)據(jù)庫拓撲中的所有可用備區(qū)域。當舊的主區(qū)域從故障中恢復后,Amazon
Aurora
會使用當前主區(qū)域數(shù)據(jù)庫集群的快照恢復數(shù)據(jù),將該區(qū)域重新添加至您的數(shù)據(jù)庫拓撲中。此外,Amazon
Aurora
還會創(chuàng)建快照,從而保留故障轉(zhuǎn)移前的數(shù)據(jù)。由于Aurora
Global
Database
采用異步復制,因此,Global
Database
Failover
可能會導致丟失故障轉(zhuǎn)移時尚未復制到備區(qū)域的數(shù)據(jù)。關(guān)于
Global
Database
Failover
和
Global
DatabaseSwitchover
的具體細節(jié),請參閱
Amazon
Aurora
用戶指南。Amazon
AuroraPostgreSQL
Global
Database
提供
Managed
RPO
機制,讓您能夠為您的數(shù)據(jù)庫規(guī)劃和實施
RPO。Amazon
Aurora
Global
Database
還提供寫入轉(zhuǎn)發(fā)功能,可將備區(qū)域的寫入操作轉(zhuǎn)發(fā)至主區(qū)域。Amazon
Aurora
GlobalDatabase架構(gòu)示例Amazon
Aurora
還提供托管式藍/綠部署,可減少重大變更操作導致的停機時間,例如數(shù)據(jù)庫引擎大小版本升級、測試新的數(shù)據(jù)庫和應用程序功能,以及
Schema
維護或變更。AmazonAurora
提供零停機打補丁
(ZDP)
功能,可顯著降低小版本升級期間應用程序的停機時間。在Amazon
Aurora
小版本升級過程中,零停機打補丁功能會盡最大可能保持客戶端連接。如果零停機打補丁順利完成,在升級過程中,數(shù)據(jù)庫引擎重啟,但應用程序會話會始終保持連接。數(shù)據(jù)庫引擎重啟可能導致吞吐量下降,持續(xù)時間從幾秒到
1
分鐘不等。入站復制A集群端點B只讀實例端點只讀實例端點可用區(qū)
2可用區(qū)
3可用區(qū)
1可用區(qū)
2出站復制主區(qū)域可用區(qū)
1備區(qū)域
1摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨和區(qū)容域災擴展高可用性環(huán)監(jiān)境控高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編容寫災并流測程試文高檔可用性和定容期災測實試現(xiàn)和流審程查高可用性及常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂入站復制11單區(qū)域?qū)崿F(xiàn)高可用性和容災Amazon
Aurora
提供全托管的自動備份功能,支持制定滿足業(yè)務和合規(guī)性要求的單區(qū)域容災策略。如果需要長期保留備份,可以使用
Amazon
Backup
通過集中策略管理創(chuàng)建手動快照,或者將數(shù)據(jù)庫集群快照數(shù)據(jù)導出至
Amazon
S3
存儲桶:導出在后臺運行,不會影響運行中集群的性能。要在單個區(qū)域內(nèi)構(gòu)建高可用
Aurora
數(shù)據(jù)庫,可將數(shù)據(jù)庫集群部署到多個可用區(qū)中。多可用區(qū)數(shù)據(jù)庫集群包括一個寫入數(shù)據(jù)庫實例,以及至少一個部署在不同可用區(qū)的只讀數(shù)據(jù)庫實例,提供故障轉(zhuǎn)移冗余。對于此類數(shù)據(jù)庫,服務等級協(xié)議保證
99.99%(4
個
9)的正常運行時間。多可用區(qū)配置可自動檢測和緩解故障,例如當寫入實例發(fā)生故障時,自動進行故障轉(zhuǎn)移,將指定的只讀實例提升為新的主實例。您無需重新配置應用程序,應用程序可通過集群端點和只讀實例端點無縫連接新提升的實例。在多可用區(qū)配置中,如果發(fā)生數(shù)據(jù)庫實例故障,底層實例會在故障轉(zhuǎn)移后自動切換;而在單可用區(qū)配置中,在新實例可用之前可能會出現(xiàn)數(shù)分鐘的停機時間。跨區(qū)域擴展高可用性和容災常見的跨區(qū)域容災模式是在備區(qū)域配置快照備份。這是一種具有較高
RTO
和
RPO
容忍度的跨區(qū)域容災模式。在主區(qū)域故障時,備區(qū)域快照備份不受主區(qū)域故障影響,因此可以通過備區(qū)域備份來實施恢復策略。相比于單區(qū)域
Aurora
數(shù)據(jù)庫集群部署提供的標準高可用性,Amazon
Aurora
Global
Database提供了更強大的業(yè)務連續(xù)性和容災方案。Amazon
Aurora
的解耦架構(gòu)設計使單個數(shù)據(jù)庫集群能夠跨多個區(qū)域運行,在提供低延遲本地讀取的同時,還能應對區(qū)域級故障,這使
AmazonAurora
成為擴展高可用性和容災策略的理想跨區(qū)域解決方案。Amazon
Aurora
Global
Database
可通過
GlobalDatabase
Failover
功能,在主區(qū)域發(fā)生故障時將工作負載快速故障轉(zhuǎn)移到備區(qū)域,從而實現(xiàn)分鐘級
RTO。對于區(qū)域輪換、全天候式應用程序或容災演練等場景,在主區(qū)域和備區(qū)域均可用且運行正常的情況下,可以使用
GlobalDatabase
Switchover
功能。此外,Amazon
Aurora
Global
Database
還支持對備區(qū)域采用
headless
集群配置,即備集群只包含
Amazon
Aurora
存儲卷,不包含任何數(shù)據(jù)庫實例。Headless
配置作為容災策略的一部分,除了可以節(jié)約成本,還能確保備份不受主區(qū)域故障影響。您可以在將備區(qū)域提升為主區(qū)域前,為備區(qū)域集群添加一個數(shù)據(jù)庫實例。此外,您還可以選擇在備區(qū)域預配
Amazon
Aurora
Serverlessv2
實例,這是一種經(jīng)濟高效的部署方案。如果您考慮采用headless
配置,建議您權(quán)衡
RTO
和成本控制。摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO的制高定可與用RT性O和和容R災PO策略相匹配編容寫災并流測程試文高檔可用性和定容期災測實試現(xiàn)和流審程查高可用性及常場見景的與高設可計用模性式和容災使用在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂12監(jiān)控高可用性和容災環(huán)境Amazon
Aurora
提供多種可觀察性工具,包括
Amazon
CloudWatchLogs、增強監(jiān)控和
Amazon
RDS
Performance
Insights,用于監(jiān)控數(shù)據(jù)庫集群的運行狀況、可用性和性能。監(jiān)控單區(qū)域
Aurora
數(shù)據(jù)庫集群的關(guān)鍵
CloudWatch
指標包括:請參閱
Amazon
Aurora
指標參考和監(jiān)控工具,了解監(jiān)控
AmazonAurora
數(shù)據(jù)庫集群的其他指標和工具。監(jiān)控跨區(qū)數(shù)據(jù)庫的關(guān)鍵CloudWatch
指標包括:注意:
AuroraGlobalDBRPOLag
僅監(jiān)測用戶
transaction
的延遲。AuroraGlobalDBProgressLag
還監(jiān)測了健康檢查
transaction
的延遲。因此,即便用戶
transaction
很少或者沒有
transaction
時,您也可以通過監(jiān)測
AuroraGlobalDBProgressLag
來查看健康檢查transaction
的延遲,來診斷網(wǎng)絡問題。此外,Amazon
Aurora
PostgreSQL
Global
Database
還提供以下兩個函數(shù):CPUUtilizationDatabaseConnectionsNetworkThroughputNetworkTransmitThroughputNetworkReceiveThroughputStorageNetworkThroughputStorageNetworkTransmitThroughputStorageNetworkReceiveThroughputAuroraReplicaLagaurora_global_db_status顯示
Global
Database
的備數(shù)據(jù)庫集群的延遲時間。aurora_global_db_instance_status列出主數(shù)據(jù)庫集群和備數(shù)據(jù)庫集群下的所有備數(shù)據(jù)庫實例。請參閱監(jiān)控
AmazonAuroraPostgreSQL
Global
Database
了解如何使用這些函數(shù)的更多信息。AuroraGlobalDBDataTransferBytesAuroraGlobalDBProgressLagAuroraGlobalDBReplicatedWriteIOAuroraGlobalDBReplicationLagAuroraGlobalDBRPOLag13監(jiān)控Amazon
Aurora
事件Amazon
RDS
事件的生成表明
Amazon
Aurora
環(huán)境發(fā)生了變化。例如,當為數(shù)據(jù)庫集群打補丁時,Amazon
Aurora
會生成一個事件。Amazon
Aurora
會幾乎實時地將事件傳遞至
AmazonCloudWatch
Events
和
Amazon
EventBridge。Amazon
RDS
將事件分為不同的類別,您可以訂閱這些類別,當某個類別中發(fā)生事件時就會收到通知。有關(guān)更多詳細信息,請參閱
AmazonAurora
用戶指南中的使用
Amazon
RDS
事件通知。摘要與簡介摘要良您好的架構(gòu)原是則否?符合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨區(qū)域擴展高可用性和容災監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定期測試和審查高可用性及容災實現(xiàn)流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂14最佳實踐指定
RTO
和
RPO根據(jù)業(yè)務需求制定容災策略。首先,為每個工作負載指定
RPO
和
RTO。您可以進一步將工作負載分為不同層級,關(guān)鍵任務層級的工作負載有更嚴格的服務等級(如更低的
RTO
和
RPO),而較低層級工作負載的限制條件則相應放寬,同時要考慮相關(guān)成本影響。請務必根據(jù)業(yè)務優(yōu)先級設置
RTO
和
RPO
目標,因為更嚴格的恢復目標通常需要權(quán)衡取舍,比如更高的運營成本。制定與
RTO
和
RPO
相匹配的高可用性和容災策略高可用性策略:創(chuàng)建多可用區(qū)
Aurora
數(shù)據(jù)庫集群,在單個區(qū)域內(nèi)實現(xiàn)高度可用的Aurora
數(shù)據(jù)庫部署,由
AmazonAurora
提供
99.99%(4
個
9)的正常運行時間
SLA
保障。此外,您還可以添加
Aurora
只讀實例作為故障轉(zhuǎn)移目標,在寫入實例故障時隨時接管工作負載。Amazon
Aurora
自動管理故障轉(zhuǎn)移過程。容災策略:在確定
RTO
和
RPO
后,您需要設置與其相匹配的自動備份保留時間。自動備份的保留期限決定了您可以將
Aurora
數(shù)據(jù)庫集群還原到多久之前的時間點。默認情況下,Amazon
Aurora
的自動備份保留時間為1天,但您可以將備份保留時間延長至
35
天。保留期越長,可用于恢復的歷史數(shù)據(jù)就越多,這直接影響
RTO。根據(jù)您的容災策略,可能手動快照需要保留更長時間。此外,在不同的區(qū)域和賬戶中保存?zhèn)浞莞北?,可以提供額外的韌性保障。使用Amazon
Backup
可簡化這一過程。Amazon
Backup
提供手動快照的生命周期管理和集中式備份計劃配置。15編寫并測試高可用性和容災流程文檔請詳細記錄實現(xiàn)高可用性和容災流程。Amazon
Aurora
數(shù)據(jù)庫管理員手冊中包含了高可用性和容災流程,如自動備份、備份時段、維護時段和故障轉(zhuǎn)移配置等。您還可以使用故障注入查詢來測試
Aurora
數(shù)據(jù)庫集群的容錯能力。不過,務必要創(chuàng)建一份包含所有相關(guān)細節(jié)的操作手冊,例如腳本位置、需要收集的數(shù)據(jù)點,以及按何種順序執(zhí)行哪些流程。這些細節(jié)需要記錄在案,并在災難發(fā)生時明確傳達。編寫完成后,定期開展容災演練來測試該流程。根據(jù)需要更新操作手冊。定工作期負測載本試身和會審發(fā)生查變高化可,這用種性變化及可容能災影響實當現(xiàn)前流高可程用性和容災流程的有效性。制定流程,定期測試實現(xiàn)高可用性和容災的流程,驗證其有效性,并找出任何需要改進的地方。例如,數(shù)據(jù)庫的規(guī)??赡芤呀?jīng)增長,導致備份和恢復時間比最初設計的更長,您需要做好響應的準備。摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定期測試和審查高可用性及容災實現(xiàn)流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂16常見的高可用性和容災使用場景與設計模式使用場景:多區(qū)域應用程序通過容災區(qū)域?qū)崿F(xiàn)讀/寫能力在備區(qū)域部署應用程序,除了能在多個區(qū)域為用戶提供低延遲讀取服務,備區(qū)域上的應用程序還可能向數(shù)據(jù)庫寫入數(shù)據(jù)。例如,寫入轉(zhuǎn)發(fā)功能可以允許遠程用戶將數(shù)據(jù)寫入就近備區(qū)域中的只讀實例,而無需直接寫入主區(qū)域,這樣可以降低全球分布式應用程序的延遲。設計模式:通過全球只讀副本實現(xiàn)寫入轉(zhuǎn)發(fā)使用
Amazon
Aurora
Global
Database
的容災只讀實例進行就近讀取,根據(jù)用戶距離選擇就近實例,提升性能。這種情況下,備區(qū)域不僅僅是用于被動容災。寫入轉(zhuǎn)發(fā)允許應用程序?qū)懭氩僮髦赶虮镜氐闹蛔x實例。這種直接寫入方式能夠透明地處理會話和事務上下文,確保寫入與后續(xù)讀取之間的一致性。主數(shù)據(jù)庫集群是權(quán)威數(shù)據(jù)源,其數(shù)據(jù)更改首先被保存到存儲層,然后復制
Aurora
Global
Database
的備集群。這種架構(gòu)允許將寫入操作定向到您的
Aurora
Global
Database
的任何遠程集群,簡化了應用程序開發(fā)。17Amazon
Aurora
GlobalDatabase寫入轉(zhuǎn)發(fā)示例有關(guān)更多詳細信息,請參閱
Amazon
Aurora
用戶指南中的在
Amazon
Aurora
Global
Database中使用寫入轉(zhuǎn)發(fā)。使如果用您場正景在尋:找節(jié)一省種經(jīng)容濟災實成惠且本亞秒級
RPO
延遲的多區(qū)域韌性解決方案,Amazon
AuroraGlobal
Database
是很好的選擇。Aurora
Global
Database
的
headless
集群模式允許備區(qū)域僅包含存儲卷而無數(shù)據(jù)庫實例。這種方法適用于
RTO
超過在備區(qū)域配置數(shù)據(jù)庫實例所需時間(通常最多為
10
分鐘)的容災場景。設計模式:AmazonAuroraGlobal
Database
中的
headless
集群Aurora
GlobalDatabase
中的
headless
備集群不含任何數(shù)據(jù)庫實例,而主區(qū)域的集群由一個寫入實例、一個或多個只讀實例,以及存儲主數(shù)據(jù)的集群存儲卷組成。在這種配置下,備區(qū)域僅包含存儲備數(shù)據(jù)的備集群存儲卷。Amazon
Aurora
使用專用基礎(chǔ)設施,通過亞馬遜云科技骨干網(wǎng)絡跨區(qū)域復制數(shù)據(jù),延遲很低。這種
headless
集群配置方式可以降低您的
Aurora
Global
Database
的資源成本,因為架構(gòu)中存儲與計算解耦,未配置數(shù)據(jù)庫實例的備區(qū)域不產(chǎn)生計算資源費用。Amazon
AuroraGlobalDatabase
headless
集群示例有關(guān)更多詳細信息,請參閱
Amazon
Aurora
用戶指南中的在備區(qū)域創(chuàng)建headless
Aurora
數(shù)據(jù)庫集群。應用程序
A主區(qū)域備區(qū)域
1可用區(qū)
1可用區(qū)
2可用區(qū)
3只讀實例寫入實例只讀實例存儲
存儲 應用程序
B1.寫入只讀端點備區(qū)域
1可用區(qū)
1可用區(qū)
2主區(qū)域可用區(qū)1只讀實例可用區(qū)3寫入實例2.寫入請求被轉(zhuǎn)發(fā)至主區(qū)域的寫入實例只讀實例只讀實例3.提交寫請求4.復制更新到備區(qū)域存儲可用區(qū)2只讀實例存儲出站復制入站復制入站復制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO的制高定可與用RT性O和和容R災PO策略相匹配編容寫災并流測程試文高檔可用性和定容期災測流試程和審查高可用性和常場見景的與高設可計用模性式和容災使用在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂出站復制18使用場景:限制最大
RPO
損失在某些情況下(如網(wǎng)絡或工作負載導致的事件),從主集群到備集群的復制可能會出現(xiàn)延遲,可能導致
RPO
延遲增加。對于數(shù)據(jù)保護要求較高的應用程序,此設計模式可以緩解備集群RPO
延遲增加問題。設計模式:Managed
RPO注意:這種架構(gòu)模式只適用于
Amazon
Aurora
PostgreSQL
Global
Database。對于
AmazonAurora
PostgreSQL
GlobalDatabase,可以通過
rds.global_db_rpo參數(shù)來管理
RPO。Amazon
Aurora
會監(jiān)控AuroraGlobalDBRPOLag指標,確保至少有一個集群符合指定
RPO窗口期。只要有任何一個備集群的
RPO
延遲在指定范圍內(nèi),就會提交主集群上的事務。如果所有備集群的延遲都超出指定
RPO
延遲范圍,主集群事務將被阻止,直到一個備集群數(shù)據(jù)完全同步,以保證符合
RPO
要求。設置RPO
(rds.global_db_rpo=
20
秒)。兩個備區(qū)域的RPO
延遲都在指定范圍內(nèi)。備區(qū)域
1應用程序
A可用區(qū)
1只讀實例可用區(qū)2只讀實例RPO
延遲:15
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)
1只讀實例可用區(qū)2只讀實例出站復制存儲RPO:將參數(shù)
rds.global_db_rpo
的值設為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:10
秒入站復制入站復制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能和單容區(qū)災域?qū)崿F(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編容寫災并流測程試文高檔可用性和定容期災測流試程和審查高可用性和常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂19其中一個備區(qū)域的
RPO
延遲仍在指定范圍內(nèi),寫入操作繼續(xù)進行兩個備區(qū)域的延遲都超出了允許的
RPO
延遲范圍,主區(qū)域的寫入操作被暫停備區(qū)域
1應用程序
A可用區(qū)
1只讀實例可用區(qū)2只讀實例RPO
延遲:35
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)1只讀實例可用區(qū)2只讀實例出站復制存儲RPO:將參數(shù)
rds.global_db_rpo
的值設為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:22
秒備區(qū)域
1應用程序
A可用區(qū)
1只讀實例可用區(qū)2只讀實例RPO
延遲:25
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)
1只讀實例可用區(qū)2只讀實例出站復制存儲RPO:將參數(shù)
rds.global_db_rpo
的值設為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:10
秒入站復制入站復制入站復制入站復制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO的制高定可與用RT性O和和容R災PO策略相匹配編寫并測試高可用性和容災流程文檔定期測試和審查高可用性和容災流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂20其中一個備區(qū)域的延遲恢復到目標范圍內(nèi),寫入操作得以恢復使用場景:滿足容災測試的監(jiān)管合規(guī)性要求常見標準做法是,在區(qū)域間定期輪換運行主系統(tǒng)。這不僅可以確保流程的完整性和準確性,還能確保員工為容災場景做好準備。Global
Database
Switchover
支持的使用場景包括容災演練、主數(shù)據(jù)庫輪換,或無需重新創(chuàng)建集群即可還原到之前的主區(qū)域。設計模式:Global
Database
SwitchoverGlobalDatabase
Switchover
可將
Amazon
AuroraGlobalDatabase
的主集群例行遷移至不同區(qū)域,適用于運維和計劃流程等受控場景。例如,一家在多地設有分支機構(gòu)的金融機構(gòu)可能采用這種方法,每個季度在指定的備區(qū)域間輪換運行主集群。在切換過程中,當前主區(qū)域的主集群會轉(zhuǎn)為只讀狀態(tài),同時同步數(shù)據(jù)到備區(qū)域的存儲卷,確保數(shù)據(jù)零丟失
(RPO
=
0)。被選中的備集群會被提升為主集群,維持數(shù)據(jù)復制拓撲結(jié)構(gòu),所有區(qū)域的數(shù)據(jù)庫實例都會重啟,這會導致幾分鐘內(nèi)的短暫不可用。備區(qū)域
1應用程序
A可用區(qū)
1只讀實例可用區(qū)2只讀實例RPO
延遲:35
秒主區(qū)域可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)1只讀實例可用區(qū)2只讀實例出站復制存儲RPO:將參數(shù)
rds.global_db_rpo
的值設為
20(秒)有效的RPO
值范圍從
20
秒到2,147,483,647
秒RPO
延遲:15
秒入站復制入站復制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單區(qū)域?qū)崿F(xiàn)高可用性和容災跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO的制高定可與用RT性O和和容R災PO策略相匹配編寫并測試高可用性和容災流程文檔定容期災測流試程和審查高可用性和常場見景的與高設可計用模性式和容災使用在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂21Amazon
Aurora
GlobalDatabase三區(qū)域架構(gòu)示例切換完成后,備區(qū)域
1
成為新的主區(qū)域。在舊主區(qū)域停止寫入的同時,備區(qū)域的數(shù)據(jù)完成完全同步,實現(xiàn)
RPO=0。備區(qū)域
1應用程序
A可用區(qū)
1只讀實例可用區(qū)2只讀實例可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)1只讀實例可用區(qū)2只讀實例出站復制存儲備區(qū)域
1應用程序
A可用區(qū)1只讀實例可用區(qū)2只讀實例可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)1只讀實例可用區(qū)2只讀實例出站復制存儲入站復制入站復制入站復制入站復制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定期測試和審查高可用性和容災流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂主區(qū)域可用區(qū)
122主區(qū)域可用區(qū)
1新的主區(qū)域允許寫入操作且維持數(shù)據(jù)復制拓撲結(jié)構(gòu)有關(guān)更多詳細信息,請參閱
Amazon
Aurora
用戶指南中的
執(zhí)行 Global
DatabaseSwitchover。使在極用少場數(shù)情景況:下從,A區(qū)ma域zo故n
A障uro中ra快Glo速ba恢l
D復atabase
的主區(qū)域可能發(fā)生意外中斷,導致主集群及其寫入數(shù)據(jù)庫實例不可用,同時數(shù)據(jù)復制也會停止。在這種情況下,Global
DatabaseFailover
的設計模式可以最大程度減少停機時間和數(shù)據(jù)丟失。設計模式:Global
Database
Failover(“區(qū)域故障”場景)下線應用程序,防止寫入發(fā)送至主集群。檢查數(shù)據(jù)庫的所有備集群的延遲時間,選擇復制延遲最短的備區(qū)域(AuroraGlobalDBRPOLag);使用這個備區(qū)域可最大限度減少當前故障主區(qū)域的數(shù)據(jù)丟失。重新配置應用程序,將所有寫入操作指向新提升的主區(qū)域中的
Aurora
Global
Database
集群,并更新端點引用。在
Amazon
RDS
Proxy
中重定向?qū)懭氩僮鳎ㄈ邕m用)。舊主區(qū)域恢復后,Amazon
Aurora
將自動把它作為備區(qū)域重新添加至您的
Aurora
GlobalDatabase
配置。這樣就保持了全球集群的原始拓撲結(jié)構(gòu)。有關(guān)更多詳細信息,請參閱Amazon
Aurora
用戶指南中的
執(zhí)行Global
Database
Failover。應用程序
A主區(qū)域可用區(qū)
1可用區(qū)
2寫入實例只讀實例備區(qū)域
1可用區(qū)
1可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例只讀實例備區(qū)域
2存儲可用區(qū)
1只讀實例可用區(qū)2只讀實例入站復制存儲入站復制出站復制摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPORTO RPO的制高定可與用性和和容災策略相匹配編容寫災并流測程試文高檔可用性和容定災期流測程試和審查高可用性和常場見景的與高設可計用模性式和容災使用在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂23Amazon
Aurora
GlobalDatabase三區(qū)域架構(gòu)示例發(fā)生故障轉(zhuǎn)移時,主區(qū)域停止接受寫請求。識別出復制延遲最短的某個備區(qū)域(本例為備區(qū)域
1)。備區(qū)域
1應用程序
A可用區(qū)
1只讀實例可用區(qū)2只讀實例可用區(qū)
2可用區(qū)
3存儲只讀實例只讀實例寫入實例備區(qū)域
2存儲可用區(qū)
1只讀實例可用區(qū)2只讀實例出站復制存儲A2主區(qū)域21備區(qū)域
21備區(qū)域
1入站復制入站復制入站復制入站復制摘要與簡介摘要良您好的架構(gòu)是原否則符?合簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)控高可用性和容災環(huán)境監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定期測試和審查高可用性和容災流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂主區(qū)域可用區(qū)
124故障轉(zhuǎn)移完成后,備區(qū)域
1
提升為新的主區(qū)域。應用程序A連接的端點切換至新主區(qū)域中的數(shù)據(jù)庫集群端點。舊主區(qū)域恢復后,Amazon
Aurora
自動將其作為備區(qū)域重新添加至該Global
Database拓撲結(jié)構(gòu)中應用程序
A主區(qū)域可用區(qū)
1可用區(qū)
2寫入實例只讀實例存儲應用程序
A主區(qū)域可用區(qū)
1可用區(qū)
2寫入實例只讀實例備區(qū)域
1可用區(qū)
1可用區(qū)
2存儲只讀實例只讀實例可用區(qū)3只讀實例備區(qū)域
2存儲可用區(qū)1只讀實例可用區(qū)2只讀實例入站復制存儲入站復制出站復制摘要與簡介摘要您的 是否符合良好架構(gòu)原則?簡介Amazon
Aurora
架構(gòu)及其高可用性和容災功能單和區(qū)容域災實現(xiàn)高可用性跨和區(qū)容域災擴展高可用性監(jiān)環(huán)控境高可用性和容災監(jiān)控
Amazon
Aurora
事件最佳實踐指定
RTO
和
RPO制定與
RTO
和
RPO
相匹配的高可用性和容災策略編寫并測試高可用性和容災流程文檔定期測試和審查高可用性和容災流程常見的高可用性和容災使用場景與設計模式在打補丁、升級和重大Schema
變更期間保持可用性總結(jié)貢獻者延伸閱讀文檔修訂25在打補丁、升級和重大
Schema變更期間保持可用性計劃內(nèi)停機(通常由版本升級、打補丁和
Schema
變更等維護任務所需)可能持續(xù)幾分鐘到幾天不等。使用數(shù)據(jù)庫副本執(zhí)行這些任務,然后將生產(chǎn)流量切換至新提升的副本上,有助于減少停機時間。然而,復制設置、提升和切換過程可能很復雜,容易出錯,特別是在大規(guī)模場景下。Amazon
Aurora
藍/綠部署提供托管式解決方案,極大簡化了復制流程。Amazon
Aurora
藍/綠部署Amazon
Aurora
的藍/綠部署功能支持創(chuàng)建與生產(chǎn)環(huán)境保持同步的預生產(chǎn)環(huán)境。生產(chǎn)環(huán)境(藍環(huán)境)和預生產(chǎn)環(huán)境(綠環(huán)境)通過邏輯日志復制保持同步。綠環(huán)境可快速提升為生產(chǎn)環(huán)境,且不會丟失數(shù)據(jù)。切換期間會阻止對兩個環(huán)境的寫入,確保數(shù)據(jù)同步。將生產(chǎn)流量切換至新提升的綠環(huán)境通常會導致不到
1分鐘的短暫停機,但根據(jù)實際工作負載情況,停機時長可能更長。切換完成后,藍環(huán)境的名稱和端點將分配給新提升的綠環(huán)境,無需對應用程序進行任何更改。26生產(chǎn)環(huán)境讀取訪問讀/寫訪問生產(chǎn)環(huán)境應用程序讀取訪問只讀實例(auroradb-instance-2)只端讀點實例復制AmazonAurora可用區(qū)
2AmazonAurora只端讀點實例集群端點只讀實例(auroradb-instance-3)可用區(qū)
1AmazonAurora復制可用區(qū)
3區(qū)域
1摘要與簡介摘要良您好的架構(gòu)是原否則符?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件開發(fā)周期中各階段考核試題及答案
- 經(jīng)濟全球化與地方化的相互影響探討試題及答案
- 軟件工程與項目管理在實際中的應用題目及答案
- 網(wǎng)絡安全防護技術(shù)概述試題及答案
- 網(wǎng)絡管理員考試全面協(xié)調(diào)試題及答案
- 嚴格備考2025年網(wǎng)絡管理員考試試題及答案
- 2025合同法下勞動者解除勞動合同詳解
- 營造安全舒適的學習環(huán)境計劃
- 在實踐中逐步提升編程能力2025年計算機二級VB考試試題及答案
- 光線折射試題及答案
- 高校學生資助誠信教育主題活動
- 跨國公司海外人力資源外包與派遣管理合同
- LNG 加氣站防雷安全培訓與應急演練記錄 202505
- 普惠金融專員試題及答案
- 【課件】認識民法典+課件統(tǒng)編版道德與法治七年級下冊
- 2025年航天知識競賽題庫及答案
- 2025年人教版小學小升初科學模擬試卷(含答案解析)
- 《金屬疲勞與斷裂》課件
- 2025年《民法典》應知應會知識競賽題庫(含各題型)
- 灸法完整版本
- 劇場協(xié)議合同范例
評論
0/150
提交評論