




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 0 頁, 共 54 頁 a 公司異地容災(zāi)系統(tǒng)建設(shè)項目 設(shè)設(shè)計計方方案案 編編 制制 單單 位:位:北京眾志和達信息技術(shù)有限公司北京眾志和達信息技術(shù)有限公司 編編 制制 日日 期:期:20102010 年年 0404 月月 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 1 頁, 共 54 頁 目目 錄錄 目目 錄錄.i 第一章第一章 概述概述.4 第二章第二章 企業(yè)災(zāi)備系統(tǒng)建設(shè)面臨的問題企業(yè)災(zāi)備系統(tǒng)建設(shè)面臨的問題.5 2.1 企業(yè)容災(zāi)系統(tǒng)建設(shè)現(xiàn)狀.5 2.2 幾類導致數(shù)據(jù)失效的原因以及現(xiàn)有容災(zāi)方
2、式的不足.6 2.3 設(shè)計災(zāi)難復(fù)制系統(tǒng)面臨的問題.7 第三章第三章 容災(zāi)方案設(shè)計分析容災(zāi)方案設(shè)計分析.9 3.1 容災(zāi)系統(tǒng)策略類型說明.9 3.2 幾種數(shù)據(jù)容災(zāi)技術(shù)方案比較.10 3.2.1 遠程容災(zāi)技術(shù)介紹.10 3.2.1.1 遠程數(shù)據(jù)庫復(fù)制技術(shù) .10 3.2.1.2 基于邏輯磁盤卷的遠程容災(zāi)技術(shù) .12 3.2.1.3 基于智能存儲的遠程容災(zāi)技術(shù) .13 3.2.1.4 基于智能虛擬磁帶庫(vtl)間的遠程容災(zāi)復(fù)制技術(shù).13 3.2.1.5 基于智能系統(tǒng)的持續(xù)數(shù)據(jù)保護和遠程容災(zāi)復(fù)制技術(shù) .15 3.2.2 各種技術(shù)的優(yōu)勢與劣勢比較分析.16 3.2.2.1 遠程數(shù)據(jù)庫復(fù)制技術(shù)優(yōu)劣勢分析
3、 .16 3.2.2.2 基于邏輯磁盤卷的遠程容災(zāi)技術(shù)優(yōu)劣勢分析 .17 3.2.2.3 基于智能存儲的遠程容災(zāi)技術(shù)優(yōu)劣勢分析 .17 3.2.2.4 基于智能虛擬磁帶庫(vtl)間的遠程復(fù)制技術(shù)優(yōu)劣勢分析.18 3.2.2.5 基于智能系統(tǒng)的持續(xù)數(shù)據(jù)保護和遠程容災(zāi)復(fù)制技術(shù)優(yōu)劣勢分析 .19 第四章第四章 a 公司容災(zāi)系統(tǒng)建設(shè)規(guī)劃公司容災(zāi)系統(tǒng)建設(shè)規(guī)劃.20 4.1 容災(zāi)設(shè)計綜述.20 4.2 用戶需求分析.20 4.3 數(shù)據(jù)容災(zāi)設(shè)計目標和初步方法.21 4.4 應(yīng)用容災(zāi)設(shè)計目標和初步方法.22 4.5 容災(zāi)流程設(shè)計.22 4.6 本項目中需要注意的幾個要點.23 4.7 系統(tǒng)設(shè)計原則.25 4
4、.8 推薦解決方案原理示意圖.26 4.9 推薦解決方案原理說明.27 4.9.1 “一鍵式”裸機恢復(fù)原理說明.28 4.9.1.1 對核心業(yè)務(wù)服務(wù)器的系統(tǒng)保護 .28 4.9.1.2 對個人電腦的系統(tǒng)保護 .29 4.9.1.3 系統(tǒng)的遠程恢復(fù) .29 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 2 頁, 共 54 頁 4.9.2 真正的 cdp 實現(xiàn)“任意時間點”恢復(fù) rpo 接近于 0.30 4.9.3 異地 cdp 復(fù)制和應(yīng)用級 dr,rto 和 rpo 都接近業(yè)界極限.31 4.9.3.1 遠程 cdp 復(fù)制保護.31 4.9.3.2 遠程故障切換 .3
5、3 4.9.4 遠程接管服務(wù)器虛擬化方案說明.33 4.9.5 虛擬磁帶庫工作原理說明.33 4.9.6 帶寬管理及容災(zāi)智能評估系統(tǒng)原理說明.34 第五章第五章 災(zāi)備系統(tǒng)管理災(zāi)備系統(tǒng)管理.35 5.1 建立災(zāi)備的專門機構(gòu)或工作小組.35 5.2 定期檢查災(zāi)備數(shù)據(jù)復(fù)制情況.35 5.3 定期檢查生產(chǎn)中心備份情況.36 5.4 數(shù)據(jù)恢復(fù)管理.36 5.5 數(shù)據(jù)恢復(fù)的周期性演練制度.37 第六章第六章 項目售后服務(wù)體系項目售后服務(wù)體系.39 6.1 總體目標.39 6.2 運行維護計劃.39 6.2.1 運行維護隊伍.39 6.2.2 運行維護內(nèi)容.40 6.2.2.1 存儲系統(tǒng)維護 .40 6.2
6、.2.1.1 例行檢查服務(wù).40 6.2.2.1.2 系統(tǒng)運行維護服務(wù).40 6.2.2.2 備份系統(tǒng)維護 .41 6.2.2.2.1 監(jiān)測服務(wù).41 6.2.2.2.2 數(shù)據(jù)庫備份和恢復(fù).41 6.2.2.2.3 性能調(diào)整.41 6.2.2.2.4 故障排除.41 6.2.2.3 其他服務(wù)內(nèi)容 .41 6.2.3 運行維護制度建設(shè).41 6.3 服務(wù)保障計劃.42 6.3.1 項目實施階段.42 6.3.1.1 服務(wù)方式 .42 6.3.1.2 責任和承諾 .42 6.3.2 免費維護階段.43 6.3.2.1 服務(wù)方式 .43 6.3.2.2 責任及承諾 .44 6.3.2.3 服務(wù)內(nèi)容
7、.44 6.3.3 收費服務(wù)階段.45 6.3.3.1 可選擇的服務(wù)方式 .45 6.3.3.2 可選擇的服務(wù)內(nèi)容 .45 6.4 故障響應(yīng)計劃.46 6.4.1 技術(shù)支持服務(wù)流程.46 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 3 頁, 共 54 頁 6.4.1.1 設(shè)備維修與更換處理流程 .47 6.4.1.2 系統(tǒng)故障報告與預(yù)防處理流程 .48 6.4.1.3 突發(fā)事件處理流程 .49 6.4.1.4 突發(fā)事件處理流程 .49 6.4.1.5 定期進行預(yù)防性系統(tǒng)維護 .50 6.4.1.6 軟件版本升級與增強 .50 6.4.2 客戶服務(wù)響應(yīng)方式.51 6
8、.4.2.1 電話、傳真和網(wǎng)絡(luò) .51 6.4.2.2 現(xiàn)場響應(yīng)服務(wù) .51 6.4.2.3 定期巡檢 .51 6.4.2.4 技術(shù)業(yè)務(wù)咨詢與培訓 .51 6.4.2.5 網(wǎng)站服務(wù) .51 6.4.2.6 客戶服務(wù)中心 .52 6.4.3 維護響應(yīng)計劃.52 6.4.3.1 故障級別 .52 6.4.3.2 響應(yīng)時間 .52 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 4 頁, 共 54 頁 第一章第一章 概概述述 隨著企業(yè)信息化建設(shè)的不斷完善,人們對信息的依賴性也就越來越強,目前企業(yè) 數(shù)據(jù)都向著集中存儲、集中管理方向發(fā)展,而大集中帶來優(yōu)化管理的同時也意味著數(shù) 據(jù)
9、的風險在集中,又讓我們無法回避另一個話題災(zāi)難備份。 追述 2001 年震驚世界的“9.11”事件,隨著紐約世貿(mào)大廈的轟然倒塌,使 1000 多家公司蒙受毀滅性打擊,造成的直接經(jīng)濟損失超過 1000 億美元。在 1000 多家公司 中,凡是做了異地備份的,當天就在其他地方恢復(fù)辦公,沒有做備份的,有的當時就 消失了,有的逐漸倒閉和消亡。統(tǒng)計表明,至少有一半以上的沒做備份的公司經(jīng)過這 場災(zāi)難后完全跨掉了。與此同時,世界金融界也創(chuàng)造了兩個奇跡,這就是位于世貿(mào)大 廈第 25 層的摩根斯坦利(morgan stanley)銀行,盡管其一層樓面都被花為灰燼, 但它卻在第二天神話般地宣布全線營業(yè),追其原因是因
10、為該銀行在離紐約數(shù)英里的新 澤西州的蒂內(nèi)克建立了一個完善的“災(zāi)難備份中心” ,憑借著該中心的完整無缺的數(shù)據(jù) 挽救了摩根斯坦利銀行的生命。作為災(zāi)難備份系統(tǒng)的另一成功案例是德意志銀行, 盡管 9.11 恐怖襲擊摧毀了德意志銀行設(shè)在紐約世貿(mào)大廈的辦公中心,這家德國銀行業(yè) 巨擎頓時失去了與世界金融市場的業(yè)務(wù)聯(lián)系,不過幾乎與此同時,它遠在愛爾蘭的備 份系統(tǒng)立即啟用,德意志銀行就在當天繼續(xù)完成了超過 3000 億美元的巨額交易。上述 兩個案例都雄辯地說明了“災(zāi)難備份系統(tǒng)”所發(fā)揮的巨大威力。 人類無法避免天災(zāi)人禍,而當信息系統(tǒng)日益成為國家的重要基礎(chǔ)設(shè)施時,任何天 災(zāi)人禍對信息系統(tǒng)的破壞都有可能影響到國家安全
11、、人民利益、社會穩(wěn)定,關(guān)系到每 一個老百姓的切實生活。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 5 頁, 共 54 頁 第二章第二章 企業(yè)災(zāi)備系統(tǒng)建設(shè)面臨的問題企業(yè)災(zāi)備系統(tǒng)建設(shè)面臨的問題 2.1 企業(yè)容災(zāi)系統(tǒng)建設(shè)現(xiàn)狀企業(yè)容災(zāi)系統(tǒng)建設(shè)現(xiàn)狀 由于容災(zāi)體系建設(shè)是一個復(fù)雜的系統(tǒng)工程,涉及到網(wǎng)絡(luò)、主機、存儲、數(shù)據(jù)庫、 數(shù)據(jù)備份、應(yīng)用系統(tǒng)、運維管理、災(zāi)難恢復(fù)和業(yè)務(wù)連續(xù)性等諸多業(yè)務(wù)和技術(shù)的方方面 面。特別是與 a 公司核心業(yè)務(wù)應(yīng)用系統(tǒng)的架構(gòu)設(shè)計、數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)設(shè)計、應(yīng)用結(jié) 構(gòu)設(shè)計以及業(yè)務(wù)系統(tǒng)容災(zāi)系統(tǒng)維護管理人員的技術(shù)素質(zhì)有極大的相關(guān)性。 目前,各企業(yè)及政府部門在容災(zāi)系統(tǒng)建
12、設(shè)方面均剛剛起步,缺乏建設(shè)和維護經(jīng)驗, 特別是在容災(zāi)系統(tǒng)運行管理和災(zāi)難恢復(fù)方面的經(jīng)驗更加欠缺,業(yè)務(wù)系統(tǒng)更是如此。另 外,業(yè)務(wù)系統(tǒng)的容災(zāi)體系建設(shè)又有其特殊性。 第一,由于業(yè)務(wù)核心業(yè)務(wù)處理均集中在公司總部的數(shù)據(jù)中心。所以,數(shù)據(jù)中心將 面對公司總部和各地分公司數(shù)據(jù)中心的多個系統(tǒng)進行災(zāi)備,形成“一備多(多點、多 系統(tǒng))”的格局,容災(zāi)的復(fù)雜度高,難度大。 第二,硬件平臺的非統(tǒng)一性。由于目前各省主機、存儲設(shè)備的異構(gòu)性,特別是今 后主機、存儲平臺進行招標采購的不確定性,難以保證主機、存儲平臺的同構(gòu)。這大 大增加了容災(zāi)技術(shù)方案制定、實施以及運維管理的難度和復(fù)雜度。 第三,a 公司核心業(yè)務(wù)應(yīng)用系統(tǒng)的業(yè)務(wù)整合程度
13、、系統(tǒng)整體架構(gòu)、數(shù)據(jù)庫設(shè)計、 子系統(tǒng)數(shù)量等均不可知。因而,容災(zāi)系統(tǒng)設(shè)計的不確定因素諸多。 第四,由于容災(zāi)系統(tǒng)建設(shè)尚處開始階段,系統(tǒng)內(nèi)嚴重缺乏有較深造詣的數(shù)據(jù)庫管 理、數(shù)據(jù)備份技術(shù)、遠程數(shù)據(jù)備份管理軟件和主機、存儲方面的技術(shù)力量,這將使得 容災(zāi)系統(tǒng)的建設(shè)、系統(tǒng)實施、運維管理和災(zāi)難恢復(fù)等諸方面工作難度加大。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 6 頁, 共 54 頁 2.2 幾類導致數(shù)據(jù)失效的原因以及現(xiàn)有容災(zāi)方式的不足 (1) 計算機系統(tǒng)的故障分類以及故障發(fā)生的概率分析 a a 類:計算機軟硬件故障類:計算機軟硬件故障 發(fā)生概率:對于企業(yè),發(fā)生可能性最大,也最
14、頻繁,是經(jīng)常發(fā)生的一類故障; 預(yù)防方法:本地雙機熱備,實現(xiàn)系統(tǒng)冗余,增強業(yè)務(wù)系統(tǒng)的高可用性。 b b 類:人為操作故障類:人為操作故障 發(fā)生概率:對管理較嚴、人員素質(zhì)較高,偶爾發(fā)生;對管理較松、人員培訓不 足,會經(jīng)常發(fā)生; 預(yù)防方法:提高系統(tǒng)自動化運行管理水平,做好本地數(shù)據(jù)冷備份,減少人的操 作與干預(yù),或制定嚴格的管理規(guī)范,避免誤操作。 c c 類:資源不足引起的計劃性停機類:資源不足引起的計劃性停機 發(fā)生概率:對于企業(yè),隨著業(yè)務(wù)的快速增長,平均每年均會發(fā)生如軟、硬件升 級、系統(tǒng)資源擴充等事件,業(yè)務(wù)增長越快的企業(yè),發(fā)生亦越頻繁; 預(yù)防方法:本地雙機,系統(tǒng)冗余。 d d 類:客戶端的災(zāi)難類:客戶
15、端的災(zāi)難 發(fā)生概率:對于企業(yè),發(fā)生概率較大; 預(yù)防方法:災(zāi)難恢復(fù)中心。 e 類:病毒的入侵類:病毒的入侵 發(fā)生概率:對于中、大型企事業(yè)單位,沒有統(tǒng)一的殺毒軟件和病毒服務(wù)器,發(fā) 生概率較大; 預(yù)防方法:安裝網(wǎng)絡(luò)版防病毒軟件,定時升級,加強管理 (2)現(xiàn)有備份方式的不足 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 7 頁, 共 54 頁 幾年前我們主要采用主機內(nèi)置或外置的磁帶機對數(shù)據(jù)進行冷備份或者沒有備份系 統(tǒng),這種方式在數(shù)據(jù)量不大,操作系統(tǒng)種類單一,服務(wù)器數(shù)量有限的情況下,不失為 一種既經(jīng)濟又簡明的備份手段。但隨著計算機規(guī)模的擴大,數(shù)據(jù)量幾何級的增長以及 分布式網(wǎng)絡(luò)
16、環(huán)境的興起,企業(yè)將越來越多的業(yè)務(wù)分布在不同的機器、不同的操作平臺 上,這種單機的人工冷備份甚至是無備份的方式越來越不適應(yīng)當今分布式網(wǎng)絡(luò)環(huán)境, 存在以下種種弊端: 1.數(shù)據(jù)管理工作難以形成制度化,數(shù)據(jù)丟失現(xiàn)象難以避免; 2.數(shù)據(jù)分散在不同的機器、不同的應(yīng)用上,管理分散,安全性得不到保障; 3.難以實現(xiàn)數(shù)據(jù)庫數(shù)據(jù)的高效在線備份; 4.運行著的系統(tǒng)使得維護人員寸步難離,業(yè)務(wù)人員工作效率下降; 5.存儲媒體管理困難,如今,用來存儲數(shù)據(jù)的介質(zhì)越來越多,各種不同系統(tǒng)下存 儲產(chǎn)生的軟盤、磁帶、光盤將給管理帶來很大的困難; 6.歷史數(shù)據(jù)保留比較困難; 7.來自非計算機系統(tǒng)因素的隱患,如火災(zāi)、地震等災(zāi)難后的系統(tǒng)
17、重建和業(yè)務(wù)數(shù)據(jù)運 作。 2.3 設(shè)計災(zāi)難復(fù)制系統(tǒng)面臨的問題 用戶在選取遠程數(shù)據(jù)保護系統(tǒng)時,主要需要面對的問題有: 是否支持異構(gòu)存儲系統(tǒng),保護投資,大大降低其成本 是否受距離的限制 是否受帶寬限制,節(jié)約帶寬的方案顯然非常受歡迎 是否需要對原有系統(tǒng)進行比較大的改動 恢復(fù)時間如何 管理是否方便 是否與當前存儲網(wǎng)絡(luò)的體系方便集成 由于對網(wǎng)絡(luò)安全的考慮是隨著數(shù)據(jù)的重要性和數(shù)據(jù)量而不斷發(fā)展的,因此用戶可 能保留有多種品牌、多種檔次的磁盤存儲介質(zhì),因此能夠在容災(zāi)系統(tǒng)中能夠使用它們, 對企業(yè)在構(gòu)造容災(zāi)系統(tǒng)時節(jié)約成本非常有幫助;而且,由于容災(zāi)數(shù)據(jù)中心的使用率非 技術(shù)方案建議書 2010-04-0808soul(
18、眾志和達)保留所有權(quán)第 8 頁, 共 54 頁 常低,因此如果能夠在容災(zāi)數(shù)據(jù)中心采用較低檔次的存儲備份系統(tǒng),也能夠大大降低 其成本。 容災(zāi)方案如果能夠克服距離的限制,就能夠比較好地幫助很多企業(yè)選擇分支機構(gòu) 作為容災(zāi)數(shù)據(jù)中心,減少建設(shè)新的容災(zāi)中心的成本; 主數(shù)據(jù)中心和容災(zāi)數(shù)據(jù)中心之間的數(shù)據(jù)傳輸帶寬,往往占整個方案中一個非常大 的比例,因此,節(jié)約帶寬的方案顯然非常受歡迎; 當原始數(shù)據(jù)中心的數(shù)據(jù)出現(xiàn)一些問題時,從容災(zāi)數(shù)據(jù)中心恢復(fù)數(shù)據(jù)的速度,是考 量容災(zāi)方案中一個非常重要的部分; 管理容災(zāi)方案的可操作性和簡便性,是容災(zāi)方案成功的一個關(guān)鍵,因為真正出現(xiàn) 災(zāi)害情形時,復(fù)雜和難于執(zhí)行的方案,會大大增加系統(tǒng)恢
19、復(fù)的所需時間; 新的容災(zāi)方案是否能夠與現(xiàn)存的網(wǎng)絡(luò)體系非常吻合,非常容易地進行集成而不影 響現(xiàn)有系統(tǒng)的工作,是用戶需要仔細考量的一個重要環(huán)節(jié),很多重要的系統(tǒng)具有連續(xù) 運行的高可靠性,系統(tǒng)維護時間非常少。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 9 頁, 共 54 頁 第三章第三章 容災(zāi)方案設(shè)計分析容災(zāi)方案設(shè)計分析 3.1 容災(zāi)系統(tǒng)策略類型說明 根據(jù)容災(zāi)系統(tǒng)的原始數(shù)據(jù)中心和容災(zāi)數(shù)據(jù)中心復(fù)制的數(shù)據(jù)之間時間長短的差異, 我們可以將容災(zāi)系統(tǒng)分成以下幾種: 同步系統(tǒng) 準同步系統(tǒng) 異步系統(tǒng) 時間點系統(tǒng) 同步系統(tǒng)同步系統(tǒng):將每一個寫盤指令同時發(fā)送到主從存儲系統(tǒng),并在得到兩個存
20、儲系統(tǒng) 的應(yīng)答后,才進行下一次的寫盤操作;所以同步系統(tǒng)的優(yōu)點就是主從存儲系統(tǒng)的 數(shù)據(jù)在災(zāi)難發(fā)生的時刻,是完全一樣的。為了保證整個存儲系統(tǒng)的高效率,因此一般 來說,要求主節(jié)點和從節(jié)點采用相同檔次的高速磁盤系統(tǒng),并且是高速連接,從而距 離會有嚴格的限制; 準同步系統(tǒng):準同步系統(tǒng):將每一個寫盤指令同時發(fā)送到主從存儲系統(tǒng),只需要主節(jié)點的應(yīng)答 后,就進行下一次的寫盤操作,但是間隔一定次數(shù)寫操作后,需要從存儲系統(tǒng)的應(yīng)答; 準同步系統(tǒng)由于加大了從存儲系統(tǒng)的應(yīng)答間隔,所以從技術(shù)上可以使容災(zāi)數(shù)據(jù)中心與 主數(shù)據(jù)中心的距離能夠進一步擴大,減少大型災(zāi)難發(fā)生時整個系統(tǒng)數(shù)據(jù)完全失效的可 能性,同時增大了建立容災(zāi)數(shù)據(jù)中心可
21、以選擇的范圍; 異步系統(tǒng):異步系統(tǒng):將每一個寫盤指令同時發(fā)送到主從存儲系統(tǒng),只需要主存儲系統(tǒng)的應(yīng) 答后,就進行下一次的寫盤操作,從存儲系統(tǒng)不需要應(yīng)答;異步系統(tǒng)與同步系統(tǒng)相比 較,由于不需要從存儲系統(tǒng)的應(yīng)答,因此技術(shù)上可以使容災(zāi)數(shù)據(jù)中心與主數(shù)據(jù)中心的 距離能夠大大增加;其帶來的問題是,災(zāi)難發(fā)生時可能造成的數(shù)據(jù)丟失的時間間隔也 更大,丟失的事務(wù)數(shù)也更多; 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 10 頁, 共 54 頁 總之,不管是同步系統(tǒng)還是異步系統(tǒng),由于是將寫磁盤的數(shù)據(jù)完全發(fā)送到從存儲 系統(tǒng),所以需要傳送的數(shù)據(jù)量仍然非常大,對傳輸?shù)膸捯蠛芨摺?時間點系統(tǒng)時
22、間點系統(tǒng):是定期將主存儲或備份系統(tǒng)的映像復(fù)制到各地市分公司存儲(備份) 系統(tǒng),根據(jù)實際的情況,時間點之間的間隔可以從數(shù)秒鐘到數(shù)小時不等。由于時間點 的間隔選擇可以調(diào)整,因此,傳輸?shù)臄?shù)據(jù)量也可以隨著間隔的變化而變化,以適應(yīng)不 同的帶寬條件。同樣,時間點系統(tǒng)支持的傳輸距離也因此能夠大大增加。比較起來它 是四種系統(tǒng)中,災(zāi)難發(fā)生時可能丟失的事務(wù)數(shù)是最大的。一般會丟失 12 個小時的數(shù)據(jù)。 所以,這四個不同的容災(zāi)系統(tǒng),以同步系統(tǒng)數(shù)據(jù)最精確和全面,以時間點系統(tǒng)的 數(shù)據(jù)差異為最大。但是,同步系統(tǒng)支持的主從存儲系統(tǒng)間的距離最小,帶寬要求最高; 時間點系統(tǒng)支持的主從存儲系統(tǒng)間的距離最大,帶寬要求最靈活。 通常,
23、用戶需要根據(jù)自己的情況,選擇某一種系統(tǒng)。不能在一個系統(tǒng)中,同時擁 有多種系統(tǒng)的技術(shù)特點。 3.2 幾種數(shù)據(jù)容災(zāi)技術(shù)方案比較 為防范由于自然、人為等因素所引發(fā)的災(zāi)難而導致信息系統(tǒng)嚴重故障或系統(tǒng)癱瘓 的風險, a 公司將建設(shè)核心生產(chǎn)業(yè)務(wù)應(yīng)用系統(tǒng)的容災(zāi)體系,以保證災(zāi)難發(fā)生時,核心 生產(chǎn)業(yè)務(wù)應(yīng)用系統(tǒng)能夠不間斷運行。 容災(zāi)體系建設(shè)的成功與否首先取決于容災(zāi)系統(tǒng)建設(shè)關(guān)鍵技術(shù)路線的選擇。因此, 一條正確的容災(zāi)系統(tǒng)建設(shè)關(guān)鍵技術(shù)路線是容災(zāi)體系建設(shè)的基礎(chǔ)。關(guān)鍵技術(shù)路線的確定 涉及多方面的因素,既要考慮備份技術(shù)本身的科學性、成熟性和先進性,同時又要結(jié) 合業(yè)務(wù)系統(tǒng)的實際情況考慮它的可行性、可靠性和實用性,二者不可偏廢。
24、只有這樣 才能確保容災(zāi)體系建設(shè)的成功。 3.2.1 遠程容災(zāi)技術(shù)介紹遠程容災(zāi)技術(shù)介紹 3.2.1.1 遠程數(shù)據(jù)庫復(fù)制技術(shù)遠程數(shù)據(jù)庫復(fù)制技術(shù) 遠程數(shù)據(jù)庫復(fù)制技術(shù)是由數(shù)據(jù)庫重做日志(redologs)來實現(xiàn)數(shù)據(jù)庫的遠程復(fù)制 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 11 頁, 共 54 頁 和同步。即:將生產(chǎn)數(shù)據(jù)庫產(chǎn)生的歸檔日志實時傳輸?shù)綖?zāi)備端,利用日志向備份數(shù)據(jù) 庫追加數(shù)據(jù),保持備份數(shù)據(jù)與生產(chǎn)數(shù)據(jù)同步。在復(fù)制過程中,使用自動沖突檢測和解 決的手段保證數(shù)據(jù)一致性不受破壞。基于數(shù)據(jù)庫的復(fù)制方式可分為實時復(fù)制、定時復(fù) 制和存儲轉(zhuǎn)發(fā)復(fù)制。主流產(chǎn)品有 dataguard、g
25、oldengate、shareplex 等,其中 dataguard 是傳輸日志到災(zāi)備端,然后在災(zāi)備端通過數(shù)據(jù)庫前滾進行恢復(fù),網(wǎng)絡(luò)上傳 輸?shù)氖菤w檔日志,而以 goldengate、shareplex 為代表的備份軟件是在生產(chǎn)端解析日志, 通過網(wǎng)絡(luò)把解析出的 sql 語句傳輸?shù)綖?zāi)備端執(zhí)行,相比之下備份軟件更加節(jié)省帶寬, 操作更為靈活。 1.實時復(fù)制:當生產(chǎn)中心的數(shù)據(jù)庫內(nèi)容被修改時,容災(zāi)中心的數(shù)據(jù)庫內(nèi)容實時地 被修改,此種復(fù)制方式對網(wǎng)絡(luò)可靠性要求高。 2.定時復(fù)制:當生產(chǎn)中心的數(shù)據(jù)庫內(nèi)容被修改時,容災(zāi)中心的數(shù)據(jù)庫內(nèi)容會按照 時間間隔,周期性地按照生產(chǎn)中心的更新情況進行刷新,時間間隔可長(幾天或幾個
26、月)可 短(幾分鐘或幾秒鐘)。 3.存儲轉(zhuǎn)發(fā)復(fù)制:當生產(chǎn)中心的數(shù)據(jù)庫內(nèi)容被修改時,生產(chǎn)中心的數(shù)據(jù)庫服務(wù)器 會先將修改操作 log 存儲于本地,待時機成熟再轉(zhuǎn)發(fā)給容災(zāi)中心。遠程數(shù)據(jù)庫復(fù)制的 實質(zhì)是實現(xiàn)主、備用系統(tǒng)的數(shù)據(jù)庫的數(shù)據(jù)同步(實時或者準實時同步)。即是將主用 系統(tǒng)數(shù)據(jù)庫操作 log 實時或周期性地復(fù)制到備用系統(tǒng)數(shù)據(jù)庫中執(zhí)行,實現(xiàn)二者數(shù)據(jù)的 一致性。遠程數(shù)據(jù)庫復(fù)制對主機的性能有一定影響,可能增加對磁盤存儲容量的需求 (包括對 log 的存儲)。 為遠程數(shù)據(jù)庫復(fù)制邏輯結(jié)構(gòu)(舉例)示意。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 12 頁, 共 54 頁 圖圖 1
27、:遠程數(shù)據(jù)庫復(fù)制示意圖遠程數(shù)據(jù)庫復(fù)制示意圖 遠程數(shù)據(jù)庫復(fù)制需要主機同構(gòu),存儲可異構(gòu),數(shù)據(jù)庫、操作系統(tǒng)其中 oracle data guard 要求數(shù)據(jù)庫和操作系統(tǒng)同構(gòu),而以 golden gate、shareplex 為代表的備 份軟件支持操作系統(tǒng)異構(gòu),中間件版本必須同構(gòu)。 3.2.1.2 基于邏輯磁盤卷的遠程容災(zāi)技術(shù)基于邏輯磁盤卷的遠程容災(zāi)技術(shù) 將物理存儲設(shè)備劃分為一個或者多個邏輯磁盤卷(volume),便于數(shù)據(jù)的存儲規(guī) 劃和管理。邏輯磁盤卷可以理解為在物理存儲設(shè)備和操作系統(tǒng)之間增加一個邏輯存儲 管理層。基于邏輯磁盤卷的遠程容災(zāi)是指根據(jù)需要將一個或者多個卷進行遠程同步 (或者異步)復(fù)制。該方
28、案的實現(xiàn)通常通過軟件來實現(xiàn),基本配置包括卷管理軟件和 遠程復(fù)制控制管理軟件。 遠程復(fù)制控制管理軟件將主用節(jié)點系統(tǒng)的卷上每次 i/o 的操作數(shù)據(jù)實時(或者準 實時、或者延時)復(fù)制到遠程節(jié)點的相應(yīng)卷上,從而實現(xiàn)遠程兩個卷之間的數(shù)據(jù)同步 (或準同步)。主、備節(jié)點之間通常需要配置相應(yīng)帶寬的 ip 通道。根據(jù)數(shù)據(jù)的更新頻 度、廣域通信條件和質(zhì)量等因素,可將容災(zāi)設(shè)置成同步、準同步或者定期同步等方式 (或者自動適應(yīng))。 基于邏輯磁盤卷的遠程容災(zāi)會增加各節(jié)點主機的一些處理性能要求,增加主機負 載。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 13 頁, 共 54 頁 3.2.1.
29、3 基于智能存儲的遠程容災(zāi)技術(shù)基于智能存儲的遠程容災(zāi)技術(shù) 基于智能存儲的容災(zāi)是基于盤控的復(fù)制技術(shù),通過存儲在其本身的容災(zāi)軟件(磁 盤鏡像軟件)實現(xiàn)數(shù)據(jù)的遠程復(fù)制和同步,即智能存儲系統(tǒng)將對本地系統(tǒng)中的存儲器 i/o 操作 log 復(fù)制到災(zāi)備端的存儲系統(tǒng)中并執(zhí)行,來保證數(shù)據(jù)的一致性。磁盤陣列將 磁盤鏡像功能的處理負荷從主機轉(zhuǎn)移到智能磁盤控制器智能存儲系統(tǒng)上。由于在這 種方式下,容災(zāi)軟件運行在系統(tǒng)內(nèi),因此較容易實現(xiàn)生產(chǎn)端和備份端操作系統(tǒng)、數(shù)據(jù) 庫、系統(tǒng)庫和目錄的實時拷貝維護能力,一般不會影響生產(chǎn)端主機系統(tǒng)的性能。 圖圖 2 基于智能存儲容災(zāi)示意圖基于智能存儲容災(zāi)示意圖 基于智能存儲的遠程容災(zāi)技術(shù)要求
30、存儲、主機、數(shù)據(jù)庫、操作系統(tǒng)、中間件版本 都同構(gòu)。 3.2.1.4 基于智能虛擬磁帶庫(基于智能虛擬磁帶庫(vtl)間的遠程容災(zāi)復(fù)制技術(shù))間的遠程容災(zāi)復(fù)制技術(shù) vtl 提供基于以太網(wǎng)(wan)的復(fù)制功能(vtl replication),無需借助備份軟件或 第三方工具即可實現(xiàn)。 vtl 推出的基于以太網(wǎng)的復(fù)制功能,提供數(shù)據(jù)容災(zāi)能力,并可進行即時的數(shù)據(jù)訪 問和數(shù)據(jù)恢復(fù)。同時,消除物理磁帶庫與手工操作相關(guān)的風險。無論是兩臺還是多臺 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 14 頁, 共 54 頁 vtl 設(shè)備之間的數(shù)據(jù)遷移,通過復(fù)制功能,vtl 都能提供完整的數(shù)據(jù)
31、保護解決方案。 分公司分公司 a:vtl1000 公司總部:公司總部: vtl3000 分公司分公司 b:vtl1000 分公司分公司 c:vtl1000 lan/wa n 容災(zāi)中心:容災(zāi)中心: vtl3000 圖圖 3 基于智能虛擬磁帶庫間的遠程容災(zāi)復(fù)制技術(shù)基于智能虛擬磁帶庫間的遠程容災(zāi)復(fù)制技術(shù) vtl 復(fù)制功能: 支持通過 ip 網(wǎng)絡(luò)在多臺 vtl 之前實現(xiàn)備份數(shù)據(jù)的復(fù)制; 支持手工發(fā)起和策略制定,容災(zāi)自動化完成; 支持復(fù)制方式:單對單、單對多、多對單; 支持增量復(fù)制,斷點續(xù)傳; 可設(shè)置復(fù)制占用的網(wǎng)絡(luò)帶寬,優(yōu)化利用網(wǎng)絡(luò)資源; 基于瀏覽器的完善系統(tǒng)狀態(tài)和報告顯示機制; 提供快速的本地和遠程恢
32、復(fù),支持本地操作恢復(fù)和遠程災(zāi)難恢復(fù); 支持網(wǎng)絡(luò)加密和壓縮。 vtl 復(fù)制具有如下特點: vtl 自主功能實現(xiàn),無需借助第三方備份軟件,無需改變原有策略; 自動化容災(zāi)代替人工操作,確保數(shù)據(jù)安全傳送與存儲,防止了病毒與黑客攻 擊,避免數(shù)據(jù)丟失、被盜等風險,從而節(jié)省管理時間和人力資源成本; 重復(fù)數(shù)據(jù)刪除后再復(fù)制,節(jié)省帶寬,同時帶寬控制技術(shù)優(yōu)化網(wǎng)絡(luò)資源; 支持直接從遠程 vtl 的災(zāi)難恢復(fù)功能,雙重保障,避免單點造成的數(shù)據(jù)丟 失; vtl 無論是單臺對單臺、單臺對多臺還是多臺對多臺,通過復(fù)制功能都能 實現(xiàn)數(shù)據(jù)容災(zāi)復(fù)制。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 15 頁
33、, 共 54 頁 3.2.1.5 基于智能系統(tǒng)的持續(xù)數(shù)據(jù)保護和遠程容災(zāi)復(fù)制技術(shù)基于智能系統(tǒng)的持續(xù)數(shù)據(jù)保護和遠程容災(zāi)復(fù)制技術(shù) 持續(xù)數(shù)據(jù)保護(cdp)的初衷是以比每日備份更高的頻度來保護數(shù)據(jù)免于丟失、 損壞或者未經(jīng)授權(quán)的修改。這種將文件、數(shù)據(jù)集或者整個數(shù)據(jù)庫進行時間回溯并重置 到某一事件(例如手動刪除或者意外的損壞)發(fā)生前的狀態(tài)的能力,滿足了增量保護 和恢復(fù)數(shù)據(jù)的需求。 由于具有這種解決數(shù)據(jù)問題的能力,通過 cdp 的建設(shè),最大程度的改善 rpo(recovery point objective 恢復(fù)點目標- rpo)和 rto(recovery time objective 恢復(fù) 時間目標 -
34、rto)服務(wù)水平,通過連續(xù)的 i/o 日志記錄保存應(yīng)用和系統(tǒng)的每一次完整 寫操作,這樣如果系統(tǒng)由于各種原因造成宕機或者數(shù)據(jù)丟地,都可以從恢復(fù)的時間軸 上任意選擇你所需要恢復(fù)的時間點。 目前的本地 cdp 技術(shù)和遠程容災(zāi)技術(shù)都通過一個智能的磁盤存儲子系統(tǒng)完成,用 戶只需要選擇需要的容量和運算單元,然后在需要進行 cdp 保護的主機端安裝相應(yīng)的 agent 即可,大大的簡化了用戶在選擇、布置、實施以及維護等方面的操作過程。 和現(xiàn)有備份軟件的集成。提供嵌入現(xiàn)有的數(shù)據(jù)保護架構(gòu)內(nèi)的監(jiān)控和管理功能的 cdp 軟件更易于集成和管理,并能保護其它存儲層級上的數(shù)據(jù)。 cdp 及遠程容災(zāi)如何工作及遠程容災(zāi)如何工作
35、 cdp 系統(tǒng)可能基于塊級、文件級或者應(yīng)用級,并提供精細的可恢復(fù)對象粒度以及 無限的恢復(fù)點。簡單來說,連續(xù)數(shù)據(jù)保護包括如下的基本功能: -數(shù)據(jù)原始狀態(tài)的基準參考點一個所有未來的改變所基于的原始備份。 -連續(xù)或者準連續(xù)的跟蹤文件、塊或者卷狀態(tài)的改變,來檢測發(fā)生的改變,并將改 變記錄在備份系統(tǒng)中。 -顆粒式地從數(shù)據(jù)的多個時間點狀態(tài)進行恢復(fù)。 cdp 的工作原理是在一段時間內(nèi)或者記錄、文件或者塊信息被創(chuàng)建或修改時增量 備份數(shù)據(jù)狀態(tài)的變化。在某些情況下,只有一次原始的完全備份,隨后的所有備份都 是基于原始備份的增量備份。這一“永遠增量”方式和傳統(tǒng)的數(shù)據(jù)備份技術(shù)不同,但是 正在得到更廣泛的接受。 技術(shù)方
36、案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 16 頁, 共 54 頁 遠程容災(zāi)的布置是建立在本地 cdp 保護基礎(chǔ)之上,通過在遠端放置的相同的設(shè)備 完成本地和遠程之間的數(shù)據(jù)傳輸。這樣,記錄在本地的 cdp 恢復(fù)點可以快速的復(fù)制到 遠程容災(zāi)端。如果業(yè)務(wù)有開發(fā)、測試的需要,在遠程容災(zāi)端可以將做好的恢復(fù)點進行 異機恢復(fù),對新的應(yīng)用提供服務(wù)。 3.2.2 各種技術(shù)的優(yōu)勢與劣勢各種技術(shù)的優(yōu)勢與劣勢比較分析比較分析 3.2.2.1 遠程數(shù)據(jù)庫復(fù)制技術(shù)遠程數(shù)據(jù)庫復(fù)制技術(shù)優(yōu)劣勢分析優(yōu)劣勢分析 優(yōu)勢:優(yōu)勢: 1、由于是通過日志來復(fù)制,對存儲容量要求較低,災(zāi)備端的備份存儲空間只需和 生產(chǎn)端
37、配備相同空間即可(不含操作運行和測試空間),并且支持異構(gòu)存儲設(shè)備。 2、由于網(wǎng)絡(luò)上傳輸?shù)闹皇侵刈鋈罩荆ㄈ?dataguard),或是 sql 語句(如 goldengate、shareplex),因而,網(wǎng)絡(luò)資源占用相對較少。 3、由于災(zāi)備端數(shù)據(jù)庫時刻處于激活狀態(tài),隨時可以確認數(shù)據(jù)庫狀態(tài),接管時間相 對較短。 劣勢:劣勢: 1、災(zāi)備端服務(wù)器檔次、配置相對較高高。由于是通過數(shù)據(jù)庫重做日志方式實現(xiàn)復(fù) 制,災(zāi)備端需配備與生產(chǎn)端數(shù)據(jù)庫主機檔次、配置相近的數(shù)據(jù)庫服務(wù)器。 2、由于是通過數(shù)據(jù)庫重做日志方式實現(xiàn)復(fù)制,生產(chǎn)端主機需要通過額外進程來捕 獲、傳輸重做日志。因而,容災(zāi)時影響生產(chǎn)端數(shù)據(jù)庫主機性能。 3、
38、只支持數(shù)據(jù)庫災(zāi)備,不支持操作系統(tǒng)、應(yīng)用等文件類型災(zāi)備。 4、容災(zāi)系統(tǒng)的實施部署、管理維護程序復(fù)雜,難度較大。生產(chǎn)端的數(shù)據(jù)庫級發(fā)生 變更、災(zāi)備端數(shù)據(jù)庫系統(tǒng)需隨時進行維護,以保證兩端數(shù)據(jù)的一致性。如果多個業(yè)務(wù) 系統(tǒng)需要做容災(zāi),容災(zāi)系統(tǒng)維護工作量和難度成倍增加。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 17 頁, 共 54 頁 3.2.2.2 基于邏輯磁盤卷的遠程容災(zāi)技術(shù)基于邏輯磁盤卷的遠程容災(zāi)技術(shù)優(yōu)劣勢分析優(yōu)劣勢分析 優(yōu)勢:優(yōu)勢: 1支持異構(gòu)存儲,由于是通過操作系統(tǒng)邏輯卷管理軟件來實現(xiàn)復(fù)制,對存儲進行 邏輯虛擬化,支持異構(gòu)存儲。 2對應(yīng)用透明,支持在該邏輯卷上所有
39、數(shù)據(jù)的災(zāi)備,無論是數(shù)據(jù)庫數(shù)據(jù)還是操作 系統(tǒng)、應(yīng)用等文件數(shù)據(jù)。 劣勢:劣勢: 1由于是基于邏輯磁盤卷的遠程容災(zāi),災(zāi)備端需配備與生產(chǎn)端數(shù)據(jù)庫主機相同檔 次、配置的數(shù)據(jù)庫服務(wù)器。 2影響生產(chǎn)端主機處理性能?;谶壿嫶疟P卷的遠程容災(zāi),只有在生產(chǎn)端主機性 能和通信帶寬的要求得到滿足時,遠程復(fù)制效率和數(shù)據(jù)一致性才可以得到保證。因此, 該技術(shù)對生產(chǎn)端主機性能影響較大。 3對帶寬要求高,由于操作系統(tǒng)的 i/o 請求都是基于毫秒級,異地邏輯卷的響應(yīng) 速度必須有高速可靠的網(wǎng)絡(luò)加以保證。與存儲遠程復(fù)制對通訊帶寬的要求屬于同數(shù)量 級。 3.2.2.3 基于智能存儲的遠程容災(zāi)技術(shù)基于智能存儲的遠程容災(zāi)技術(shù)優(yōu)劣勢分析優(yōu)劣
40、勢分析 優(yōu)勢:優(yōu)勢: 1不占用生產(chǎn)端主機資源。由于是通過智能存儲上的處理器來實現(xiàn)數(shù)據(jù)的復(fù)制和 一致性控制,因而,對生產(chǎn)系統(tǒng)主機性能無影響。 2對應(yīng)用透明,支持在該存儲上所有數(shù)據(jù)類型的災(zāi)備,無論是數(shù)據(jù)庫數(shù)據(jù)還是操 作系統(tǒng)、應(yīng)用等文件數(shù)據(jù)。部署實施較容易。 3傳輸數(shù)據(jù)的級別最低,實現(xiàn)底層數(shù)據(jù)的透明傳輸,生產(chǎn)端的運維操作全部透明 地傳輸?shù)綖?zāi)備中心,災(zāi)備端無需過多干預(yù)。因而,容災(zāi)系統(tǒng)整體的可靠性和可維護性 較高,操作控制、管理運維簡單,維護成本較低。特別是在多點、多個系統(tǒng)需要災(zāi)備 時,維護工作的復(fù)雜度和難度明顯較小。 4對“多對一”或者“一對多”的遠程容災(zāi)支持較好,在同時對多點、多個應(yīng)用 技術(shù)方案建議
41、書 2010-04-0808soul(眾志和達)保留所有權(quán)第 18 頁, 共 54 頁 系統(tǒng)進行容災(zāi)的情況下,可以通過在容災(zāi)中心磁盤陣列上劃分不同的磁盤卷方式,實 現(xiàn)多點、多個不同應(yīng)用系統(tǒng)的復(fù)制或鏡像。 劣勢:劣勢: 1由于是最底層的數(shù)據(jù)透明傳輸,對網(wǎng)絡(luò)帶寬和穩(wěn)定性的要求非常高。 2對生產(chǎn)端和災(zāi)備端存儲容量要求較高。由于容災(zāi)一致性的需求,容災(zāi)需通過備 份卷來實現(xiàn),這就需要增加額外存儲空間來滿足災(zāi)備需求。并且對異構(gòu)存儲的支持不 好。 3容災(zāi),沒有時間點記錄,只能通過有限的快照記錄,但快照頻度非常小。 4. 遠程數(shù)據(jù)不能直接讀寫,必須通過額外的軟件 5. 要求容災(zāi)兩端的存儲必須為同一廠家同一檔次的
42、產(chǎn)品,在產(chǎn)品選型時有很大限 制。 6. 后期演練復(fù)雜度高. 3.2.2.4 基于基于智能虛擬磁帶庫(智能虛擬磁帶庫(vtl)間的遠程復(fù)制技術(shù)優(yōu)劣勢分析)間的遠程復(fù)制技術(shù)優(yōu)劣勢分析 優(yōu)勢:優(yōu)勢: 1.vtl自主功能實現(xiàn),無需借助第三方備份軟件,無需改變原有策略; 2.成本小,管理簡單; 3.vtl容災(zāi)方案的實施對原有生產(chǎn)系統(tǒng)沒有影響,只需要對其備份系統(tǒng)加以 完善即可; 4.自動化容災(zāi)代替人工操作,確保數(shù)據(jù)安全傳送與存儲,防止了病毒與黑客 攻擊,避免數(shù)據(jù)丟失、被盜等風險,從而節(jié)省管理時間和人力資源成本; 5.重復(fù)數(shù)據(jù)刪除后再復(fù)制,節(jié)省帶寬,同時帶寬控制技術(shù)優(yōu)化網(wǎng)絡(luò)資源; 6.支持直接從遠程vtl的
43、災(zāi)難恢復(fù)功能,雙重保障,避免單點造成的數(shù)據(jù)丟 失; 7.vtl無論是單臺對單臺、單臺對多臺還是多臺對多臺,通過復(fù)制功能都能 實現(xiàn)數(shù)據(jù)容災(zāi)復(fù)制; 8.容災(zāi)的兩地沒有備份軟件必須統(tǒng)一的限制,不同站點間的備份軟件和物理 磁帶庫可以是不同品牌; 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 19 頁, 共 54 頁 9.容災(zāi)演練簡單,并且對生產(chǎn)系統(tǒng)影響最小。 劣勢:劣勢: 1備份的數(shù)據(jù)需要恢復(fù)才可以使用; 2rpo 和 rto 較大,一般需要半天時間。 3.2.2.5 基于智能系統(tǒng)的持續(xù)數(shù)據(jù)保護和遠程容災(zāi)復(fù)制技術(shù)優(yōu)劣勢分析基于智能系統(tǒng)的持續(xù)數(shù)據(jù)保護和遠程容災(zāi)復(fù)制技術(shù)優(yōu)劣勢分
44、析 優(yōu)勢:優(yōu)勢: 1.rpo接近于0,rto幾分鐘; 2.對有效數(shù)據(jù)進行應(yīng)用程序感知、交易狀態(tài)一致的恢復(fù); 3.事件標記,用于按需的時間點數(shù)據(jù)恢復(fù); 4.帶外數(shù)據(jù)復(fù)制,不影響應(yīng)用服務(wù)器運行,性能高,支持異構(gòu)存儲; 5.支持多異構(gòu)主機,支持卷組一致性數(shù)據(jù)復(fù)制,可以按時間點恢復(fù); 6.壓縮復(fù)制的數(shù)據(jù)和帶寬控制; 7.基于智能交換機的數(shù)據(jù)拆分,不需在業(yè)務(wù)主機加載任何程序; 8.sure save idp是個成型的產(chǎn)品,安裝即可使用,安裝及恢復(fù)簡單。 劣勢:劣勢: 1基于智能光纖交換機方式,成本稍高。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 20 頁, 共 54 頁
45、第四章第四章 a 公司容災(zāi)系統(tǒng)建設(shè)公司容災(zāi)系統(tǒng)建設(shè)規(guī)劃規(guī)劃 4.1 容災(zāi)設(shè)計綜述容災(zāi)設(shè)計綜述 從容災(zāi)架構(gòu)設(shè)計的角度來分析,可以分為數(shù)據(jù)、網(wǎng)絡(luò)、應(yīng)用、流程四個方面,通 過這四方面的有機配合,才能提高業(yè)務(wù)系統(tǒng)端到端的穩(wěn)定性和容災(zāi)能力。 數(shù)據(jù)的容災(zāi)保護提供最基本的容災(zāi)底線保證,確保在任何預(yù)計之外的災(zāi)難發(fā)生后, 業(yè)務(wù)系統(tǒng)都可以在允許損失一些數(shù)據(jù)的情況下,在一個確定的時間內(nèi)恢復(fù),數(shù)據(jù)容災(zāi) 同時也是邏輯錯誤和部分數(shù)據(jù)庫軟件 bug 的容災(zāi)應(yīng)對出發(fā)點; 網(wǎng)絡(luò)容災(zāi)提供了數(shù)據(jù)的可訪問性,當災(zāi)難發(fā)生時,可以通過容災(zāi)的網(wǎng)絡(luò)系統(tǒng)將業(yè) 務(wù)訪問從生產(chǎn)中心路由到容災(zāi)中心,容災(zāi)網(wǎng)絡(luò)也是容災(zāi)數(shù)據(jù)復(fù)制的承載線路; 應(yīng)用容災(zāi)目的是
46、重新初始化應(yīng)用系統(tǒng),在容災(zāi)中心重新運行或接管生產(chǎn)中心的業(yè) 務(wù); 容災(zāi)流程是人員操作、管理過程的綜合,完好設(shè)計的容災(zāi)流程能夠保證以上幾部 分容災(zāi)工作能夠順利、有效地執(zhí)行。 4.2 用戶需求分析用戶需求分析 a 公司這種應(yīng)用關(guān)鍵在于要保障數(shù)據(jù)的完整性,因此,需要提供一種實時的數(shù)據(jù) 復(fù)制解決方案。在此基礎(chǔ)上,要提供如下的兩個方面的附加要求: 1) 災(zāi)備數(shù)據(jù)的可處理性,包括對數(shù)據(jù)的讀寫操作。災(zāi)備數(shù)據(jù)的可處理性,包括對數(shù)據(jù)的讀寫操作。 所謂的讀操作,是指災(zāi)備數(shù)據(jù)要具有可用性,要為其他的應(yīng)用提供查詢功能,為 其他分析應(yīng)用提供數(shù)據(jù)來源,但是,由于這種分析類數(shù)據(jù)并非是一種實時的需求,因 此,我們建議災(zāi)備數(shù)據(jù)要
47、提供上本天之前的所有數(shù)據(jù),而并不需要提供實時(最新)的 數(shù)據(jù)。也就是對于管理者或數(shù)據(jù)查詢者可以在任意時間查詢到昨天和昨天以前的所有 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 21 頁, 共 54 頁 數(shù)據(jù)。 所謂的數(shù)據(jù)寫操作,是考慮利用災(zāi)備數(shù)據(jù)提供諸如員工培訓、系統(tǒng)應(yīng)用測試、后續(xù)軟 件軟件調(diào)試或其他臨時應(yīng)用的可能。這樣,可以為上述應(yīng)用帶來最大的便利性。但是, 為了保持和原始數(shù)據(jù)的一致性,系統(tǒng)應(yīng)該支持上述寫入操作的 reset(重置)操作,使得 在上述任務(wù)結(jié)束后,可以方便地把數(shù)據(jù)恢復(fù)到?jīng)]有進行寫入操作之前的狀態(tài),維持災(zāi) 備數(shù)據(jù)和源數(shù)據(jù)的嚴格一致。 2)應(yīng)用的可切換
48、支持。)應(yīng)用的可切換支持。 災(zāi)備中心不應(yīng)該作為純粹的備用系統(tǒng),在提供諸如數(shù)據(jù)查詢等應(yīng)用的同時,還要 提供自動的應(yīng)用切換等支持,一旦在生產(chǎn)中心發(fā)生故障后,災(zāi)備中心的系統(tǒng)可以自動 接管生產(chǎn)系統(tǒng),提供持續(xù)的應(yīng)用保障。但是,對于系統(tǒng)的可切換時間應(yīng)該根據(jù)應(yīng)用的 實際情況給出適合的要求,從而,采用性價比最高的解決方案。 4.3 數(shù)據(jù)容災(zāi)設(shè)計目標和初步方法數(shù)據(jù)容災(zāi)設(shè)計目標和初步方法 數(shù)據(jù)容災(zāi)的設(shè)計目標有三個,分別是數(shù)據(jù)的一致性、數(shù)據(jù)的完整性和數(shù)據(jù)的可用 性。 數(shù)據(jù)的完整性意味著確保容災(zāi)、生產(chǎn)數(shù)據(jù)之間完全相同;數(shù)據(jù)一致性是在不能保 證數(shù)據(jù)完全不會丟失的時候,能夠按照一定的時間順序丟失數(shù)據(jù),不會出現(xiàn)時間序列 中
49、間的數(shù)據(jù)缺失;而數(shù)據(jù)的可用性是指在任何時候都可以訪問數(shù)據(jù),包括容災(zāi)數(shù)據(jù)。 系統(tǒng)中數(shù)據(jù)庫的數(shù)據(jù)對這三個容災(zāi)目標的要求最高,需要完全保證數(shù)據(jù)的一致性,最 大限度保障完整性和可用性。 系統(tǒng)中的數(shù)據(jù)類型可以分為靜態(tài)數(shù)據(jù)、準靜態(tài)數(shù)據(jù)和交易數(shù)據(jù)三種。靜態(tài)數(shù)據(jù)是 應(yīng)用程序、操作系統(tǒng)的程序文件,這些數(shù)據(jù)在數(shù)據(jù)生存周期中幾乎沒有任何變化,只 有很少的程序版本更新才會造成數(shù)據(jù)變化,這些數(shù)據(jù)的容災(zāi)設(shè)計需要與容災(zāi)系統(tǒng)管理 流程結(jié)合,在進行程序調(diào)整的時候,同步更新容災(zāi)的程序數(shù)據(jù);準靜態(tài)數(shù)據(jù)通常是各 種應(yīng)用程序的配置參數(shù)文件和用戶信息等數(shù)據(jù),這些數(shù)據(jù)的變化周期比較長,造成變 化的操作很明顯,一般是由系統(tǒng)、程序管理員手工操
50、作完成,在本項目中,可以與靜 態(tài)數(shù)據(jù)歸為一類,用同樣的方法進行數(shù)據(jù)容災(zāi);交易數(shù)據(jù)是實時發(fā)生變化的數(shù)據(jù),每 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 22 頁, 共 54 頁 一次客戶操作都可能造成交易數(shù)據(jù)的變化,因此是數(shù)據(jù)容災(zāi)中最需要通過技術(shù)解決的 問題。 由于同時要最大限度保證完整性、一致性、可用性與投資、管理、性能之間的平 衡,對于不同類型的交易數(shù)據(jù)需要采用不同的技術(shù)。在本設(shè)計中對于系統(tǒng)的 oracle 數(shù) 據(jù)庫數(shù)據(jù)以及其它數(shù)據(jù)將使用 sure save idp(cdp)進行數(shù)據(jù)的復(fù)制。概括來說,數(shù) 據(jù)容災(zāi)的初步方法如下: 靜態(tài)數(shù)據(jù)采用虛擬磁帶庫備份,配合變
51、更管理流程 準靜態(tài)數(shù)據(jù)采用手工備份,紙介質(zhì)備份,參數(shù)文檔結(jié)合管理的方式 交易數(shù)據(jù)通過 suresave idp(cdp)進行復(fù)制 4.4 應(yīng)用容災(zāi)設(shè)計目標和初步方法應(yīng)用容災(zāi)設(shè)計目標和初步方法 應(yīng)用容災(zāi)主要涉及的內(nèi)容是在進行容災(zāi)切換后,重新初始化應(yīng)用程序。應(yīng)用程序 可以分為兩類,一類應(yīng)用程序負責網(wǎng)絡(luò)連接或者流程處理,沒有復(fù)雜的數(shù)據(jù)結(jié)構(gòu),重 新啟動后,無需作任何操作,直接可以投入生產(chǎn);另一類應(yīng)用程序進行數(shù)據(jù)處理,例 如數(shù)據(jù)庫,如果異常故障,將導致磁盤數(shù)據(jù)混亂,重新啟動后,需要通過內(nèi)部機制進 行磁盤數(shù)據(jù)恢復(fù),通常這個恢復(fù)過程很長,可能需要幾十分鐘到幾小時。 為了提高容災(zāi) rto,在設(shè)計中使用雙活的數(shù)
52、據(jù)庫方式,容災(zāi)數(shù)據(jù)庫一直處于啟動 狀態(tài),切換后無需恢復(fù)工作,這樣大大減少了數(shù)據(jù)庫恢復(fù)的時間,接管生產(chǎn)時間可以 控制在幾分鐘之內(nèi)。 4.5 容災(zāi)流程設(shè)計容災(zāi)流程設(shè)計 容災(zāi)流程是提高系統(tǒng)容災(zāi)能力的根本方法,盡管各種技術(shù)手段能夠提供自動、高 效的容災(zāi)能力,但是技術(shù)不能解決所有問題。技術(shù)設(shè)計的前提是一些假設(shè),只有在這 些假設(shè)范圍之內(nèi)發(fā)生的故障、災(zāi)難才能由技術(shù)手段解決。實際上現(xiàn)實中有許多假設(shè)范 圍之外的事件發(fā)生,往往技術(shù)手段不能解決,或者解決過程本身容易因此導致更多的 問題,在這種情況下,就顯示出了容災(zāi)流程的作用。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 23 頁, 共
53、 54 頁 由于流程設(shè)計涉及到系統(tǒng)上線運行的具體操作,因此在設(shè)計初期無法給出具體操 作步驟,但是對于各種技術(shù)的基本操作流程,在實施方案中都有分別介紹。 最終需要配合業(yè)務(wù)系統(tǒng),完成具體命令操作設(shè)計(在 bcp/drp 中) 。 4.6 本項目中需要注意的幾個要點本項目中需要注意的幾個要點 通過在對用戶的具體環(huán)境和需求作了細致的分析之后,我們認為用戶對該數(shù)據(jù)容 災(zāi)系統(tǒng)給以了充分的重視,所提出的觀點和要求是十分詳細和具體的,在此,從我們 方案提供商的角度,對此作如下的概括,便于整體方案的分析。 容容災(zāi)災(zāi)方方案案的的通通用用性性。 這種通用性體現(xiàn)在兩個方面:一是異構(gòu)平臺、存儲設(shè)備的支持性,二是對不同應(yīng)
54、 用類型數(shù)據(jù)的適用性,只有這樣的方案才可以較好地保障用戶當前投資,達到與應(yīng)用 類型無關(guān)、與平臺無關(guān)以及與磁盤陣列等存儲設(shè)備無關(guān)的適用性最廣的解決方案。在 當前,數(shù)據(jù)主要以 oracle 類型為主,但是隨著應(yīng)用類型的增加,產(chǎn)生不同類型數(shù)據(jù)的 可能性還是很有可能的。如果現(xiàn)在選用了僅僅支持如 oracle 數(shù)據(jù)的解決方案,那末臨 時性的其他數(shù)據(jù)將無法得到及時的復(fù)制,或者今后的應(yīng)用擴展將受到很大的制約。 實實時時的的數(shù)數(shù)據(jù)據(jù)復(fù)復(fù)制制解解決決方方案案。 我們認為最終用戶已經(jīng)對不同應(yīng)用數(shù)據(jù)的安全性要求做出了很好的分析和劃分, 其中關(guān)鍵數(shù)據(jù)要求不丟失,或盡量少地丟失。因此,我們認為必須要采用真正的實時 的數(shù)
55、據(jù)復(fù)制解決方案才可以滿足這種要求。在條件具備的情況下,應(yīng)該做到無延遲數(shù) 據(jù)復(fù)制。而建議采用非實時或準實時復(fù)制方案。 災(zāi)災(zāi)備備數(shù)數(shù)據(jù)據(jù)的的可可用用性性 分為兩個方面,一是數(shù)據(jù)的實時復(fù)制的可靠性,要求復(fù)制數(shù)據(jù)要和源數(shù)據(jù)保持嚴 格一致,嚴格按照源數(shù)據(jù)的寫入順序進行復(fù)制,使得災(zāi)備數(shù)據(jù)具有可用性。二是在需 要的時候可以很便利地對災(zāi)備數(shù)據(jù)進行讀寫操作,但是,這種讀寫操作不應(yīng)該對數(shù)據(jù) 的實時復(fù)制產(chǎn)生影響。還有,在對災(zāi)備數(shù)據(jù)進行修改(如進行員工培訓、軟件測試等 操作時對數(shù)據(jù)的采集或調(diào)整測試)后可以恢復(fù)到原有狀況,從而確保數(shù)據(jù)的一致性和 安全性。 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留
56、所有權(quán)第 24 頁, 共 54 頁 擴擴展展的的便便利利性性 包括對當前和今后非 oracle 應(yīng)用類型數(shù)據(jù)的實時復(fù)制的擴展,復(fù)制距離的擴展以 及復(fù)制節(jié)點數(shù)量的擴展等多個方面,在當前選擇方案的時候面對未來的需求進行全面 考慮。 數(shù)數(shù)據(jù)據(jù)的的丟丟失失量量 對于關(guān)鍵應(yīng)用要求數(shù)據(jù)不丟失,因此,不建議采用諸如當前在主機上開辟一定的 緩存(buffer)空間,用來存放待復(fù)制的數(shù)據(jù),利用異步的方式發(fā)送到遠程。這樣的 產(chǎn)品無疑會因為各種原因?qū)е聰?shù)據(jù)的丟失率較大,如當主機資源意外掉電或宕機時, 上述 buffer(緩存)中的數(shù)據(jù)必然會被丟失。我們推薦在主機產(chǎn)生寫入操作的同時數(shù) 據(jù)被發(fā)送出去,這樣,數(shù)據(jù)始終保持
57、和本地的寫入同步,這樣的方案才可以真正做到 數(shù)據(jù)的無丟失。同樣,對系統(tǒng)本身的影響也相對較大,需要對業(yè)務(wù)類型作具體分析, 然后選擇合適的方式。 數(shù)數(shù)據(jù)據(jù)的的可可回回滾滾性性 不可避免地會在某些情況下,最新復(fù)制的數(shù)據(jù)不可用的情況下,尤其對于 oracle 數(shù)據(jù)庫,很可能在管理員發(fā)現(xiàn)故障時,其內(nèi)部已經(jīng)在幾分鐘之前就已經(jīng)出現(xiàn)了問題, 那末,被復(fù)制過去的數(shù)據(jù)肯定也是不能夠被使用的。此時,我們必須要具有數(shù)據(jù)的回 滾性支持,比如可以往前回滾 30 秒、1 分鐘或 2 分鐘,并利用這些數(shù)據(jù)獲得可用數(shù)據(jù) 同時數(shù)據(jù)的丟失量最小化。 災(zāi)災(zāi)備備自自身身系系統(tǒng)統(tǒng)實實施施及及恢恢復(fù)復(fù)的的便便利利( (簡簡易易 ) )性性
58、 災(zāi)備系統(tǒng)的實施不應(yīng)該對現(xiàn)有的應(yīng)用系統(tǒng)作任何調(diào)整,尤其是對當前運行較穩(wěn)定 的系統(tǒng)。當然,即使需要一定的調(diào)整。這種調(diào)整夜必須是系統(tǒng)管理員可以理解并接受 的。同樣,對于災(zāi)備系統(tǒng)自身而言,發(fā)生問題后的解決或全面的恢復(fù)也要簡易化,要 支持如 web 管理,圖形化管理,而不應(yīng)該需要較復(fù)雜的配置。否則,今后如果需要作 系統(tǒng)調(diào)整,那末,系統(tǒng)管理員將無法面對這種配置和管理,甚至導致日常的維護也不 敢動手的現(xiàn)狀。 對對系系統(tǒng)統(tǒng)的的影影響響最最小小化化 主機資源不能夠因為災(zāi)備系統(tǒng)的實施而顯得緊張,包括內(nèi)存、cpu 等資源的占用 技術(shù)方案建議書 2010-04-0808soul(眾志和達)保留所有權(quán)第 25 頁,
59、共 54 頁 應(yīng)力求最小化。當然這種影響我們認為同樣包括實施時候?qū)ο到y(tǒng)、對數(shù)據(jù)庫、對應(yīng)用 的調(diào)整等多個方面。 災(zāi)災(zāi)備備方方案案要要支支持持策策略略化化配配置置 便于不同的應(yīng)用數(shù)據(jù)具有不同的復(fù)制優(yōu)先級別,以確保關(guān)鍵數(shù)據(jù)不丟失。 災(zāi)災(zāi)備備系系統(tǒng)統(tǒng)的的管管理理簡簡易易性性 為了確保災(zāi)備系統(tǒng)的正常運行,在日常的管理中必須要進行一定的演練,以保障 需要時候的迅捷相應(yīng)和確認災(zāi)備系統(tǒng)可用性。那末,這種日常的的演練活動必須要簡 單,也就是災(zāi)備系統(tǒng)自身必須要具有簡易的人性化的管理,同時,在對災(zāi)備數(shù)據(jù)作驗 證時不應(yīng)當對生產(chǎn)系統(tǒng)產(chǎn)生任何影響。 還有,系統(tǒng)自身故障后應(yīng)該具有很便利的方式直接來恢復(fù),而不需要重新配置。
60、相相關(guān)關(guān)故故障障的的自自恢恢復(fù)復(fù)故故障障報報警警功功能能 系統(tǒng)涉及到大量的專業(yè)設(shè)備或技術(shù),因此,災(zāi)備系統(tǒng)必須要具有很強的相關(guān)故障 自恢復(fù)功能。如 wan 故障、主機故障、應(yīng)用系統(tǒng)故障等相關(guān)因素在恢復(fù)正常后,災(zāi)備 系統(tǒng)也應(yīng)該自動恢復(fù)運行,保持數(shù)據(jù)的實時復(fù)制。 另外,災(zāi)備系統(tǒng)自身應(yīng)該具有完善的日志和報警機制,減輕管理員的負擔。 災(zāi)災(zāi)備備系系統(tǒng)統(tǒng)具具有有較較強強的的數(shù)數(shù)據(jù)據(jù)傳傳輸輸性性能能(如如高高度度的的壓壓縮縮等等能能力力) 由于系統(tǒng)基于 ip 鏈路設(shè)計,因此,必須要具有很高的數(shù)據(jù)傳輸能力,才可以保障 在有限的帶寬資源環(huán)境下提高數(shù)據(jù)的復(fù)制性能。這種性能的提高很大程度上是靠較高 的壓縮率來時實現(xiàn)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 接地系統(tǒng)安裝工藝與技術(shù)研究
- 普寧私人學校管理辦法
- 內(nèi)部車輛停放管理辦法
- 春節(jié)慰問發(fā)放管理辦法
- 江蘇企業(yè)能耗管理辦法
- 新疆文明施工管理辦法
- 公園微氣候調(diào)控-洞察及研究
- 水利水電工程的安全生產(chǎn)費用提取標準為5%
- 煤礦安全員個人總結(jié)
- 安全生產(chǎn)活動報告
- 2025屆遼寧省大連市高新園區(qū)七年級數(shù)學第二學期期末考試試題含解析
- 2025+NCCN非小細胞肺癌診療指南解讀
- ECMO治療暴發(fā)性心肌炎
- 2025CSCO乳腺癌診療指南解讀課件
- 社會單位消防安全評估導則
- 衛(wèi)生系列高級職稱申報工作量統(tǒng)計表(醫(yī)療類)
- 寵物店聘用合同協(xié)議
- 食堂外人出入管理制度
- 大數(shù)據(jù)驅(qū)動設(shè)備優(yōu)化設(shè)計-全面剖析
- 晉升環(huán)境主管述職報告
- 管理學基礎(chǔ)(第三版) 課件 徐洪燦 第1-5章 管理概述-組織與組織設(shè)計
評論
0/150
提交評論