




已閱讀5頁,還剩64頁未讀, 繼續(xù)免費閱讀
(計算機(jī)系統(tǒng)結(jié)構(gòu)專業(yè)論文)基于lvm2和nbd的遠(yuǎn)程復(fù)制系統(tǒng)設(shè)計與性能優(yōu)化.pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
摘要 摘要 遠(yuǎn)程鏡像又叫遠(yuǎn)程復(fù)制,是容災(zāi)備份的核心技術(shù),同時也是保持遠(yuǎn)程數(shù)據(jù) 同步和實現(xiàn)災(zāi)難恢復(fù)的基礎(chǔ)。它通過網(wǎng)絡(luò)將物理位置上分離的存儲設(shè)備相連接, 在遠(yuǎn)程維護(hù)數(shù)據(jù)鏡像,一旦災(zāi)難發(fā)生時,分布在異地存儲器上的數(shù)據(jù)備份并不 會受到波及。遠(yuǎn)程鏡像按主機(jī)端請求的執(zhí)行是否需要遠(yuǎn)程鏡像站點的確認(rèn)信息, 又可分為同步遠(yuǎn)程鏡像和異步遠(yuǎn)程鏡像。 本文討論了基于l i n u x 邏輯卷管理裂1 i l v m 2 ( l o g i c a lv o l u m em a n a g e r 2 ) 和 網(wǎng)絡(luò)塊設(shè)備 2 1 ( n e t w o r kb l o c kd e v i c e ) 的高性能、高安全性遠(yuǎn)程復(fù)制系統(tǒng)設(shè)計 與實現(xiàn)中的一些問題。 我們將遠(yuǎn)程復(fù)制機(jī)制嵌入到l i n u x 系統(tǒng)的l v m 2 組件d e v i c em a p p e r 目標(biāo)設(shè) 備d m r e m o t e c o p y 模塊中,利用l v m 2 便捷的磁盤空間管理性能,屏蔽了因物理 存儲設(shè)備的差異而導(dǎo)致的系統(tǒng)設(shè)計的復(fù)雜性和實現(xiàn)的難度。該遠(yuǎn)程復(fù)制系統(tǒng)基 本工作原理是:生產(chǎn)中心在d m r e m o t e c o p y 模塊中截獲用戶的寫操作請求,通過 i o 邏輯重映射將請求發(fā)送到本地設(shè)備的i o 操作隊列,即本地設(shè)備寫操作完成; 同時將寫操作數(shù)據(jù)副本和i o 請求按照本地設(shè)備( 即生產(chǎn)中心) 的寫操作順序記 錄到遠(yuǎn)程復(fù)制i o 請求隊列中。n b d 從遠(yuǎn)程復(fù)制請求隊列中提取寫操作請求, 同樣按照本地數(shù)據(jù)的寫操作順序,通過n b d 協(xié)議將寫請求及相應(yīng)的數(shù)據(jù)副本發(fā) 送到容災(zāi)中心,完成生產(chǎn)中心向容災(zāi)中心數(shù)據(jù)的更新。 在異步傳輸?shù)幕A(chǔ)上,我們設(shè)計了自適應(yīng)網(wǎng)絡(luò)傳輸機(jī)制,可根據(jù)網(wǎng)絡(luò)傳輸 的情況,動態(tài)的調(diào)節(jié)每次發(fā)送的請求量,從而達(dá)到網(wǎng)絡(luò)條件動態(tài)變化情況下的 高效傳輸。為了在較低網(wǎng)絡(luò)帶寬條件下獲得較好性能,我們設(shè)計實現(xiàn)了數(shù)據(jù)壓 縮功能,在同等帶寬條件下可傳輸更多用戶數(shù)據(jù)。同時為了加強(qiáng)網(wǎng)絡(luò)傳輸?shù)陌?全,我們引入了分組密碼加密機(jī)制,使數(shù)據(jù)在廣域網(wǎng)環(huán)境里傳輸更加安全可靠。 我們在高速局域剛和模擬廣域網(wǎng)環(huán)境中對遠(yuǎn)程復(fù)制系統(tǒng)進(jìn)行了較為全面的 壓力測試。實驗結(jié)果表明,系統(tǒng)運行穩(wěn)定,效能良好。 關(guān)鍵詞:遠(yuǎn)程復(fù)制,l v m 2 ,n b d ,批次傳輸,數(shù)據(jù)壓縮,數(shù)據(jù)加密 a b s t r a c t _ 、 一i ab s t r a c t r e m o t em i r r o ri sa l s oc a l l e dr e m o t e r e p l i c a t i o n ;i ti st h ec e n t r a lt e c h n o l o g yf o r d a t ad i s a s t e rt o l e r a n c eb a c k u p i ti sa l s ot h eb a s eo f m a i n t a i n i n gr e m o t ed a c a c o n s i s t e n c ya n dd i s a s t e rr e c o v e r y s e p a r a t es t o r a g es y s t e mc o n n e c t e df r o mn e t 、o r k i nd i f f e r e n tp l a c e si su s e dt om a i n t a i nad a t ai m a g e w h e n d i s a s t e ro c c u n e d t h ed a c a d i s t r i b u t e di nd i f f e r e n tp l a c e sw i l lb en o ta f f e c t e d r e m o t er e p l i c a t i o n s y s t e mi s d i v i d e di n t os y n c h r o n o u sr e m o t er e p l i c a t i o na n d a s y n c h r o n o u sr e m o t er e p l i c a t i o n a c c o r d i n gt ow h e t h e rt h er e p l yf r o mr e m o t es t a t i o ni sn e e d e db yt h er e q u e s ts e r v e r a r e m o t er e p l i c a t i o ns y s t e mb a s e do n l v m 2 ( l o g i c a lv o l u m em a n a g e r ) a n d n b d ( n e t w o r kb l o c kd e v i c e ) i sd e s i g n e da n dd e v e l o p e db yt h i sp a p e r ,a n ds o m e p r o b l e m si nt h ed e s i g ni sd i s c u s s e d w ee m b e dt h er e m o t er e p l i c a t i o nm e c h a n i s mi n t ot h el v m 2 t a r g e td e v i c e d m 。r e m o t e c o p ym o d u l eo fl i n u xo s ,u s et h es u p e r i o rd i s km a n a g e m e n tc a p a b i l i t yo f l v m 2t os h i e l dt h e d e s i g nc o m p l e x i t ya n dt h ed i f f i c u l t i e sc a u s e db yt h ed i s c r e p a n c y m p h y s i c a ls t o r a g ed e v i c e t h eb a s i co p e r a t i o n p r i n c i p l ei s :t h ep r o d u c t i o nc e n t e r i n t e r c e p t st h eu p d a t er e q u e s t si nl v m 2t a r g e td e v i c ed m r e m o t e c o p yl a y e r , s e i l dt h e m t ot h ev oo p e r a t i o nq u e u e t h r o u g ht h ei ol o g i c a lr e m a p p i n gi nl v m 2t a r g e td e v i c e s ot h eu p d a t ef o rd o m e s t i ci sd o n e m e a n w h i l e ,t h er e p l i c a t i o n sa n d r e q u e s t sa r es e n t t ot n er e m o t er e p l i c a t i o nr e q u e s tq u e u e i np r e v i o u so r d e r t h er e q u e s t ss h o u l db es e n t t ot h ed i s a s t e rt o l e r a n c ec e n t e rb yn b d p r o t o c o la n dt h eu p d a t e sw i l lb ec o m p l e t e d f r o mp r o d u c t i o nc e n t e rt od i s a s t e rt o l e r a n c ec e n t e r b a s e do na s y n c h r o n o u sr e m o t er e p l i c a t i o n , w ei m p l e m e n t e ds e l f - a d a p t i n g 。b a t c h 。t r a n s m i s s i o no nt h es y s t e m ,t h i sm e c h a n i s mc a n a c c o m m o d a t ei or e q u e s t n u m b e rt ot r a n s m i t si t s e l fa c c o r d i n gt on e t w o r kc o n d i t i o n ,i no r d e rt oi m p r o v e d p e r t o r m a n c eo fs y s t e mw h e nn e t w o r kc o n d i t i o nc h a n g ed y n a m i c a l l y w ea l s o i m p l e m e n t e dd a t ac o m p r e s s i o nf u n c t i o no nt h es y s t e mi no r d e rt og e tg o o d p e r f o r m a n c ei nt h eb a dn e t w o r kc o n d i t i o n t h i sw o u l di n c r e a s et h ep e r f l o n 呦c eo f s y s t e mg r e a t l yb e c a u s ei tc a nt r a n s m i tm o r ed a t au n d e rs a m en e t w o r kc o n d “i o n a t a b s t r a c t t h es a m et i m e ,w ea d d e dd a t ae n c r y p t i o nm e c h a n i s mi n t os y s t e mf o r t h es a k eo fd a t a s e c u r i t yw h i l et r a n s m i t so nw a n a f t e rs t r i c tt e s to i lt h el a na n dw a n ,w ef m dt h a tt h er e m o t ed a t ar e p l i c a t i o n r u n sw e l l k e y w o r d s :r e m o t er e p l i c a t i o n ,n b d ,l v m 2 ,b a t c ht r a n s m i s s i o n ,d a t a c o m p r e s s i o n , d a t ae n c r y p t i o n i i i 圖目錄 圖目錄 圖2 1 定時復(fù)制示意圖5 圖3 1l v m 2 組織結(jié)構(gòu)圖1 2 圖3 2d e v i c em a p p e r 框架結(jié)構(gòu)1 4 圖3 3l 、,m 2 內(nèi)核通信流程15 圖3 4n b d 示意圖l6 圖3 5n b d 模塊流程圖l7 圖3 6n b d 報文格式1 9 圖4 1 遠(yuǎn)程復(fù)制系統(tǒng)框架圖2 2 圖4 2 遠(yuǎn)程復(fù)制層次圖2 4 圖4 3 請求處理流程2 5 圖4 5 數(shù)據(jù)不一致示意圖2 9 圖4 6 加密輪數(shù)與密鑰長度關(guān)系3 7 圖4 7a e s 加解密流程3 8 圖4 8p r o v i d e r 獲取信息結(jié)構(gòu)圖4 1 圖4 9 網(wǎng)絡(luò)延遲4 2 圖5 1 不同請求大小時順序?qū)懶阅軐Ρ? 4 圖5 2 不同請求下與異步傳輸順序?qū)懶阅軐Ρ? 5 圖5 3 口因子對復(fù)制系統(tǒng)的影響4 6 圖5 4 一段時間內(nèi)時間間隔和分組變化4 6 圖5 5 內(nèi)存大小對性能影響4 7 圖5 6i o m e t e r 測試不同請求大小的隨機(jī)寫性能4 8 圖5 7r c t 測試實時隨機(jī)寫性能4 8 圖5 8w a n e m 工作原理圖4 9 圖5 1 1 網(wǎng)絡(luò)延遲對遠(yuǎn)程復(fù)制性能的影響一5 1 圖5 1 2 丟包率對遠(yuǎn)程復(fù)制性能的影響。5 2 圖5 1 3 緩沖區(qū)限制對遠(yuǎn)程復(fù)制性能的影響5 3 圖5 1 4 壓縮前后的性能對比5 4 圖目錄 圖5 15 壓縮比5 4 圖5 1 6 加密后性能對比5 5 圖5 1 7 內(nèi)存大小對加密影響5 6 南開大學(xué)學(xué)位論文使用授權(quán)書 根據(jù)南開大學(xué)關(guān)于研究生學(xué)位論文收藏和利用管理辦法,我校的博士、碩士學(xué)位獲 得者均須向南開大學(xué)提交本人的學(xué)位論文紙質(zhì)本及相應(yīng)電子版。 本人完全了解南開大學(xué)有關(guān)研究生學(xué)位論文收藏和利用的管理規(guī)定。南開大學(xué)擁有在 著作權(quán)法規(guī)定范圍內(nèi)的學(xué)位論文使用權(quán),即:( 1 ) 學(xué)位獲得者必須按規(guī)定提交學(xué)位論文( 包 括紙質(zhì)印刷本及電子版) ,學(xué)??梢圆捎糜坝?、縮印或其他復(fù)制手段保存研究生學(xué)位論文, 并編入南開大學(xué)博碩士學(xué)位論文全文數(shù)據(jù)庫;( 2 ) 為教學(xué)和科研目的,學(xué)??梢詫⒐_ 的學(xué)位論文作為資料在圖書館等場所提供校內(nèi)師生閱讀,在校園網(wǎng)上提供論文目錄檢索、文 摘以及論文全文瀏覽、下載等免費信息服務(wù);( 3 ) 根據(jù)教育部有關(guān)規(guī)定,南開大學(xué)向教育部 指定單位提交公開的學(xué)位論文;( 4 ) 學(xué)位論文作者授權(quán)學(xué)校向中國科技信息研究所和中國學(xué) 術(shù)期刊( 光盤) 電子出版社提交規(guī)定范圍的學(xué)位論文及其電子版并收入相應(yīng)學(xué)位論文數(shù)據(jù)庫, 通過其相關(guān)網(wǎng)站對外進(jìn)行信息服務(wù)。同時本人保留在其他媒體發(fā)表論文的權(quán)利。 非公開學(xué)位論文,保密期限內(nèi)不向外提交和提供服務(wù),解密后提交和服務(wù)同公開論文 論文電子版提交至校圖書館網(wǎng)站:h t t p :h 2 0 2 1 1 3 2 0 1 6 1 :8 0 0 1 i n d e x h t m 本人承諾:本人的學(xué)位論文是在南開大學(xué)學(xué)習(xí)期間創(chuàng)作完成的作品,并已通過論文答辯; 提交的學(xué)位論文電子版與紙質(zhì)本論文的內(nèi)容一致,如因不同造成不良后果由本人自負(fù)。 本人同意遵守上述規(guī)定。本授權(quán)書簽署一式兩份,由研究生院和圖書館留存。 作者暨授權(quán)人簽字: 2 0 年月日 南開大學(xué)研究生學(xué)位論文作者信息 注:本授權(quán)書適用我校授予的所有博士、碩士的學(xué)位論文。由作者填寫( 一式兩份) 簽字后交校圖書 館,非公開學(xué)位論文須附南開大學(xué)研究生申請非公開學(xué)位論文審批表。 南開大學(xué)學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下,進(jìn)行 研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外j 本學(xué)位論文 的研究成果不包含任何他人創(chuàng)作的、已公開發(fā)表或者沒有公開發(fā)表的 作品的內(nèi)容。對本論文所涉及的研究工作做出貢獻(xiàn)的其他個人和集 體,均已在文中以明確方式標(biāo)明。本學(xué)位論文原創(chuàng)性聲明的法律責(zé)任 由本人承擔(dān)。 學(xué)位論文作者簽名: 年月 日 第一章緒論 第一章緒論 第一節(jié)遠(yuǎn)程復(fù)制應(yīng)用背景 隨著企業(yè)信息系統(tǒng)的普及和整個社會電子商務(wù)的發(fā)展,現(xiàn)代企業(yè)的運作日 益依賴于信息技術(shù)。越來越多的關(guān)鍵數(shù)據(jù)被存儲在計算機(jī)系統(tǒng)中,這些數(shù)據(jù)的 丟失和損壞將對企業(yè)造成難以估量的損失,同時企業(yè)對于數(shù)據(jù)可用性的要求也 大為提高,因為短時間的系統(tǒng)停機(jī)也將造成業(yè)務(wù)停頓和經(jīng)濟(jì)損失。 雖然傳統(tǒng)的數(shù)據(jù)備份技術(shù)和服務(wù)器集群技術(shù),可以避免軟硬件故障、人為 操作失誤和病毒侵襲帶來的破壞,有效的保護(hù)數(shù)據(jù)安全。但是,面對大范圍的 災(zāi)害性突發(fā)事件,如地震、火災(zāi)、恐怖襲擊時,上述技術(shù)就無能為力。若想迅 速恢復(fù)應(yīng)用系統(tǒng)的數(shù)據(jù),保持系統(tǒng)的正常運行,就必須建立異地的災(zāi)難備份系 統(tǒng)( 即容災(zāi)系統(tǒng)) ; 根據(jù)美國勞工部的統(tǒng)計數(shù)據(jù),9 3 的有嚴(yán)重數(shù)據(jù)丟失的公司在5 年之內(nèi)破 產(chǎn)。美國威斯康星大學(xué)的統(tǒng)計結(jié)果也顯示,4 3 的美國公司在數(shù)據(jù)災(zāi)難后關(guān)門, 而2 9 的公司在兩年之內(nèi)破產(chǎn)。這些統(tǒng)計數(shù)字表明,提供可靠的數(shù)據(jù)存儲保證 是至關(guān)重要的。在“9 1 1 ”恐怖事件造成世貿(mào)大樓倒塌后,名列財富5 0 0 強(qiáng)的 金融機(jī)構(gòu)摩根斯坦利公司在新澤西州災(zāi)難備份中心立刻切換運行,從而保障了 公司全球業(yè)務(wù)的不間斷運行,有效降低了災(zāi)難對于整個企業(yè)發(fā)展的影響,而很 多沒有建立數(shù)據(jù)容災(zāi)系統(tǒng)的企業(yè)卻沒有這樣幸運。這一事例再次喚起了人們對 容災(zāi)技術(shù)的重視。 在所有的數(shù)據(jù)容災(zāi)方案中,數(shù)據(jù)復(fù)制系統(tǒng)是其重要的組成部分。數(shù)據(jù)復(fù)制 系統(tǒng)不等同于一般意義上的業(yè)務(wù)數(shù)據(jù)備份與恢復(fù),數(shù)據(jù)備份恢復(fù)只是數(shù)據(jù)復(fù)制 系統(tǒng)中涵蓋的一個方面。數(shù)據(jù)復(fù)制系統(tǒng)還包括最大范圍地容災(zāi)、最大限度地減 少數(shù)據(jù)丟失、實時切換、短時間恢復(fù)等多項內(nèi)容??梢哉f,數(shù)據(jù)復(fù)制系統(tǒng)正在 成為保護(hù)企業(yè)關(guān)鍵數(shù)據(jù)的一種有效手段。 數(shù)據(jù)復(fù)制系統(tǒng)除了能有效防止企業(yè)、部門由于重要數(shù)據(jù)丟失所造成的不可 彌補(bǔ)的損失以外,還能使企業(yè)從繁瑣的數(shù)據(jù)備份和恢復(fù)工作中解放出來,大幅 度提高工作效率。目前國內(nèi)大部分企業(yè)對于重要數(shù)據(jù)都采用手工備份的方式, 這種備份需要維護(hù)人員手工、定期進(jìn)行,其工作繁瑣,并且容易因為操作失誤 第一章緒論 產(chǎn)生問題。使用了數(shù)據(jù)復(fù)制系統(tǒng)后,只要進(jìn)行簡單的配置,就可以實現(xiàn)動態(tài)、 自動復(fù)制,達(dá)到安全備份的目的。在意外發(fā)生時,可以利用數(shù)據(jù)恢復(fù)系統(tǒng)的恢 復(fù)功能進(jìn)行自動恢復(fù)或者把應(yīng)用程序遷移到從服務(wù)器上運行。 第二節(jié)本論文的工作與結(jié)構(gòu) 本文主要描述基于l v m 2 和n b d 的遠(yuǎn)程復(fù)制系統(tǒng),主要完成工作如下: l 、了解當(dāng)前國內(nèi)外遠(yuǎn)程復(fù)制技術(shù)的研究現(xiàn)狀。 2 、對邏輯卷管理器( l v m 2 ) 進(jìn)行深入分析并了解l v m 2 的架構(gòu)。 3 、對網(wǎng)絡(luò)塊設(shè)備( n b d ) 進(jìn)行深入分析并了解其整體架構(gòu)。 4 、設(shè)計并實現(xiàn)基于l v m 2 和n b d 的遠(yuǎn)程復(fù)制系統(tǒng)。 5 、在異步遠(yuǎn)程復(fù)制的基礎(chǔ)上增加自適應(yīng)組傳輸功能。 6 、實現(xiàn)傳輸過程中的數(shù)據(jù)壓縮和數(shù)據(jù)加密。 7 、對遠(yuǎn)程復(fù)制系統(tǒng)進(jìn)行測試,討論了當(dāng)前工作的不足和下一步改進(jìn)。 各章節(jié)組織如下: 第一章介紹數(shù)據(jù)復(fù)制技術(shù)的應(yīng)用背景和本文的組織結(jié)構(gòu)。 第二章介紹數(shù)據(jù)復(fù)制技術(shù)的基本原理,指出數(shù)據(jù)復(fù)制技術(shù)的必要性和現(xiàn)在 主要復(fù)制技術(shù)的優(yōu)點和缺點。 第三章介紹邏輯卷管理器( l v m 2 ) 和網(wǎng)絡(luò)塊設(shè)備( n b d ) 的組織結(jié)構(gòu)和功 能。 第四章介紹基于l v m 2 和n b d 的遠(yuǎn)程復(fù)制系統(tǒng)的詳細(xì)設(shè)計以及組傳輸、壓 縮、加密功能的原理和實現(xiàn)。 第五章介紹遠(yuǎn)程復(fù)制系統(tǒng)的測試性能和討論分析。 第六章總結(jié)了本文工作并對下一步工作進(jìn)行展望。 2 第二章數(shù)據(jù)復(fù)制技術(shù) 第二章數(shù)據(jù)復(fù)制技術(shù) 2 1 1 容災(zāi)系統(tǒng)組成結(jié)構(gòu) 第一節(jié)基本原理 容災(zāi)技術(shù)是通過在異地建立和維護(hù)一個備份系統(tǒng),利用地理上分散性來保 證數(shù)據(jù)對于災(zāi)難性事件的抵御能力。一個完整的容災(zāi)系統(tǒng)應(yīng)該具有以下幾個組 成部分: 本地的高可用系統(tǒng)確保本地發(fā)生局部故障或單點故障時的系統(tǒng)安全 數(shù)據(jù)備份系統(tǒng)用于抵御用戶誤操作、病毒入侵、黑客攻擊等威脅 數(shù)據(jù)遠(yuǎn)程復(fù)制系統(tǒng)保證本地數(shù)據(jù)中心和遠(yuǎn)程備份中心的數(shù)據(jù)一致 遠(yuǎn)程的高可用管理系統(tǒng)實現(xiàn)遠(yuǎn)程廣域范圍的數(shù)據(jù)管理,基于本地的高 可用系統(tǒng)之上,遠(yuǎn)程實現(xiàn)故障的診斷、分類和相應(yīng)的故障處理。 數(shù)據(jù)的遠(yuǎn)程復(fù)制技術(shù)是容災(zāi)系統(tǒng)的核心技術(shù),是保持遠(yuǎn)程數(shù)據(jù)同步和實現(xiàn) 災(zāi)難恢復(fù)的基礎(chǔ)。數(shù)據(jù)復(fù)制技術(shù)存在兩種主流模式:硬件數(shù)據(jù)復(fù)制技術(shù)和軟件 數(shù)據(jù)復(fù)制技術(shù)。硬件數(shù)據(jù)復(fù)制技術(shù)是指通過專線實現(xiàn)硬盤存儲設(shè)備之間的數(shù)據(jù) 交換,由存儲系統(tǒng)的專用硬件控制實現(xiàn),復(fù)制時主機(jī)開銷較小,但磁盤開銷大, 傳輸距離有限;軟件的數(shù)據(jù)復(fù)制技術(shù)是指通過備份軟件進(jìn)行系統(tǒng)邏輯卷的復(fù)制, 它可以通過廣域網(wǎng)絡(luò)基于i p 實現(xiàn)。 2 1 2 遠(yuǎn)程復(fù)制技術(shù) 數(shù)據(jù)復(fù)制【3j 就是將數(shù)據(jù)從一個源設(shè)備復(fù)制到一個或多個目標(biāo)設(shè)備的技術(shù),目 標(biāo)設(shè)備可以是本地設(shè)備或者是遠(yuǎn)程設(shè)備。這里的設(shè)備是一個比較寬泛的概念, 可以是塊設(shè)備,也可以是文件系統(tǒng)或其它對象等。 數(shù)據(jù)復(fù)制有兩個方面的含義: 數(shù)據(jù)的傳播:通過將數(shù)據(jù)傳播到多個設(shè)備,這樣不同的地方都可以擁有該 數(shù)據(jù),并可以利用該數(shù)據(jù)進(jìn)行進(jìn)一步的工作。 第二蘋數(shù)據(jù)復(fù)制技術(shù) 數(shù)據(jù)的統(tǒng)一:雖然在多個設(shè)備上都擁有該數(shù)據(jù),但是其它設(shè)備上的數(shù)據(jù)都 必須與源設(shè)備保持一致。 數(shù)據(jù)傳播的途徑有很多種,可以通過主機(jī)數(shù)據(jù)線、微波、光纖通道或以太 網(wǎng)絡(luò)等媒介來進(jìn)行。目前比較多的是通過光纖通道和以太網(wǎng)絡(luò)來進(jìn)行數(shù)據(jù)的傳 輸。數(shù)據(jù)傳播的方式也有很多種,常用的是通過主從式來進(jìn)行傳播,主從式就 是指有源設(shè)備作為主端,目標(biāo)設(shè)備作為從端與主端進(jìn)行連接并獲取數(shù)據(jù),這種 方式當(dāng)目標(biāo)設(shè)備較多時,主端性能會有一定的影響。當(dāng)然還有p 2 p 的數(shù)據(jù)傳播 方式,多個目標(biāo)設(shè)備之間可以交換得到的數(shù)據(jù),像類似b t 一樣,數(shù)據(jù)可以得到 很快的大規(guī)模傳播,這種方式有效的減小了主端的負(fù)擔(dān),但是如果要復(fù)制的數(shù) 據(jù)是不斷的產(chǎn)生的,而不是固定的數(shù)據(jù),則傳播的效率反而很低。 數(shù)據(jù)統(tǒng)一重要的意義就是目標(biāo)設(shè)備上的數(shù)據(jù)可以直接被上層應(yīng)用使用,而 不需要進(jìn)行其它額外的糾正,就好像是源設(shè)備上的數(shù)據(jù)在某個時刻的一個快照 一樣。它的重點在于目標(biāo)設(shè)備上的數(shù)據(jù)要與源設(shè)備上的數(shù)據(jù)保持?jǐn)?shù)據(jù)的一致性。 保持?jǐn)?shù)據(jù)一致性的方法有許多,但是最常用的也是最有效的方法是在進(jìn)行 數(shù)據(jù)復(fù)制的過程中保持源設(shè)備數(shù)據(jù)的寫順序。即按照在源設(shè)備上的更新順序, 將請求依次發(fā)送到目標(biāo)設(shè)備,目標(biāo)設(shè)備上的數(shù)據(jù)更新順序要與源設(shè)備保持完全 相同。當(dāng)然僅僅是保持寫順序還遠(yuǎn)遠(yuǎn)不夠,當(dāng)系統(tǒng)在運行過程中遇到一些意外 情況時,就需要一些其它的機(jī)制來維持?jǐn)?shù)據(jù)一致性,這些技術(shù)包括原子操作, d m c 機(jī)制和狀態(tài)維護(hù)機(jī)制等。 第二節(jié)目前的發(fā)展 由于在容災(zāi),數(shù)據(jù)備份和數(shù)據(jù)鏡像方面的需求日益增多,許多研究機(jī)構(gòu)提 出了很多方案,系統(tǒng)廠商、數(shù)據(jù)庫、存儲設(shè)備和軟件廠商也開發(fā)了許多系統(tǒng), 實現(xiàn)了數(shù)據(jù)復(fù)制技術(shù),來幫助用戶管理數(shù)據(jù)。 從數(shù)據(jù)復(fù)制的時間來看,數(shù)據(jù)復(fù)制技術(shù)可分為兩大類:定時復(fù)制、實時復(fù) 制。 1 、定時復(fù)制 定時復(fù)制顧名思義就是在按照設(shè)定的復(fù)制計劃來復(fù)制數(shù)據(jù)。圖2 1 就是一個 典型的定時復(fù)制的例子,在圖中,定時復(fù)制可以分為三個步驟:( a ) 找到要復(fù)制 的設(shè)備的列表;( b ) 得到源設(shè)備數(shù)據(jù)和目標(biāo)設(shè)備數(shù)據(jù)之間的差異;( c ) 將數(shù)據(jù)的 4 第二章數(shù)據(jù)復(fù)制技術(shù) 差異拷貝到目標(biāo)設(shè)備上。 定時復(fù)制雖然提供了一定程度上的數(shù)據(jù)保護(hù),但是它還是有很多不足之處。 它沒有為企業(yè)在最大可能的程度上對數(shù)據(jù)進(jìn)行保護(hù),不能滿足商業(yè)上對數(shù)據(jù)持 續(xù)地保護(hù)的要求。如果在兩次數(shù)據(jù)復(fù)制時間之間發(fā)生了災(zāi)難,則在第一次數(shù)據(jù) 復(fù)制后的所有更新都會丟失,這會給企業(yè)和政府機(jī)構(gòu)帶來無法估計的損失。 總的來說定時復(fù)制只適用于用戶對恢復(fù)時間和容忍數(shù)據(jù)丟失要求不高的情 況。 圖2 1 定時復(fù)制示意圖 2 、實時復(fù)制 在實時復(fù)制技術(shù)中,數(shù)據(jù)的復(fù)制發(fā)生在數(shù)據(jù)發(fā)生改變的時候,無論數(shù)據(jù)什 么時候發(fā)生了改變,更新都會傳播到目標(biāo)設(shè)備上去。實時復(fù)制可以通過純軟件 來實現(xiàn),也可以通過硬件和軟件相結(jié)合的方法來實現(xiàn)。由于數(shù)據(jù)的丟失僅僅限 于當(dāng)請求提交后還沒來得及寫到磁盤上的數(shù)據(jù),實時復(fù)制能提供給數(shù)據(jù)更好的 保護(hù)。 實時數(shù)據(jù)復(fù)制可以通過同步和異步方式來進(jìn)行數(shù)據(jù)的傳播1 4 ,5 】。 當(dāng)采用同步數(shù)據(jù)復(fù)制方式時,源設(shè)備和目標(biāo)設(shè)備之間數(shù)據(jù)互為鏡像,保持 完全一致。這種方式實時性強(qiáng),當(dāng)災(zāi)難發(fā)生時目標(biāo)設(shè)備數(shù)據(jù)與源設(shè)備數(shù)據(jù)完全 相同,保證高度的完整性和一致性。源設(shè)備所在主機(jī)的i o 操作一直等待,直到 數(shù)據(jù)被傳送到目標(biāo)設(shè)備并安全地存儲完成后,才回復(fù)主機(jī)i 0 完成。在一些實現(xiàn) 方法中,目標(biāo)設(shè)備數(shù)據(jù)必須真正寫到目標(biāo)磁盤上后,源設(shè)備所在主機(jī)的i o 操作 才認(rèn)為更新己完成;在另外一些實現(xiàn)方法中,數(shù)據(jù)被存儲在緩存中,不同的實 現(xiàn)方法導(dǎo)致對應(yīng)用系統(tǒng)的響應(yīng)時間明顯不同。采用同步數(shù)據(jù)復(fù)制會對主機(jī)工作 效率有一些影響。從傳輸距離上說,同步復(fù)制對網(wǎng)絡(luò)延遲有嚴(yán)格的要求,數(shù)據(jù) 傳輸距離較短,源設(shè)備和目標(biāo)設(shè)備的距離一般最多只能是幾十公里。 在使用異步數(shù)據(jù)復(fù)制方式時,目標(biāo)設(shè)備的數(shù)據(jù)和源設(shè)備的數(shù)據(jù)相比存在一 些差異。異步數(shù)據(jù)復(fù)制是將本地生產(chǎn)數(shù)據(jù)通過后臺同步的方式復(fù)制到異地。這 第二章數(shù)據(jù)復(fù)制技術(shù) 種方式可能有分鐘級的短時間數(shù)據(jù)丟失,很難達(dá)到零數(shù)據(jù)丟失。異步復(fù)制的原 理是對源設(shè)備的寫操作完成后,不必等待目標(biāo)設(shè)備的寫完成,主機(jī)立即可處理 下一個i 0 。因此,對本地主機(jī)性能影響很小。 對于許多對i 0 響應(yīng)時間敏感的應(yīng)用系統(tǒng)來說,異步遠(yuǎn)程數(shù)據(jù)鏡像技術(shù)不失 為一種實用技術(shù),若此類應(yīng)用采用同步技術(shù),遠(yuǎn)程數(shù)據(jù)存儲的響應(yīng)時間可能對 用戶來說會變得無法容忍。從傳輸距離上說,異步數(shù)據(jù)復(fù)制的傳輸距離較長, 能夠達(dá)到幾千公里。 采用異步遠(yuǎn)程數(shù)據(jù)備份需要考慮在響應(yīng)時間得到改進(jìn)的同時,備份數(shù)據(jù)中 心與主數(shù)據(jù)中心間數(shù)據(jù)狀態(tài)的一致性問題,采用異步方式復(fù)制數(shù)據(jù),很難確定 哪些更新己在備份中心執(zhí)行,哪些還沒有執(zhí)行,雖然可恢復(fù)的文件系統(tǒng)和數(shù)據(jù) 庫系統(tǒng)通??梢栽谑『蠡謴?fù)數(shù)據(jù)的一致性,但這些功能將增加恢復(fù)的時間, 且不能保證恢復(fù)所有的數(shù)據(jù)。所以異步方式的數(shù)據(jù)恢復(fù)功能只適用于允許部分 數(shù)據(jù)丟失的應(yīng)用場合,同時能夠容忍文件系統(tǒng)和數(shù)據(jù)庫恢復(fù)工具恢復(fù)數(shù)據(jù)所需 要的時間。 從數(shù)據(jù)復(fù)制實現(xiàn)的層次的角度來看,主要有基于磁盤陣列的遠(yuǎn)程復(fù)制系統(tǒng), 基于文件系統(tǒng)或者應(yīng)用程序的遠(yuǎn)程復(fù)制系統(tǒng)和基于塊設(shè)備的遠(yuǎn)程復(fù)制系統(tǒng)。 1 、基于磁盤陣列的遠(yuǎn)程復(fù)制系統(tǒng) 基于磁盤陣列的數(shù)據(jù)復(fù)制系統(tǒng)可復(fù)制特定磁盤陣列上任意數(shù)據(jù),通用性較 強(qiáng),而且復(fù)制速度非常快,但是通常需要購買高端磁盤陣列并且需要建立專門 的c f 網(wǎng)絡(luò)【6 1 ,僅購買兩個支持遠(yuǎn)程復(fù)制高端磁盤至少需要1 0 0 多萬元,因此投 資巨大,只有少數(shù)企業(yè)才有能力建立這種容災(zāi)系統(tǒng)。另外,由于目前不同磁盤 陣列廠商生產(chǎn)的系統(tǒng)互不兼容,基于磁盤陣列的遠(yuǎn)程復(fù)制一般只能在同一廠家 的同一類型的磁盤陣列間進(jìn)行,這使得其擴(kuò)展性較差。 2 、基于文件系統(tǒng)或者應(yīng)用程序的遠(yuǎn)程復(fù)制系統(tǒng) 基于文件系統(tǒng)或者應(yīng)用程序的數(shù)據(jù)復(fù)制系統(tǒng)能夠理解上層語意,這樣它就 可以針對應(yīng)用做出相應(yīng)的優(yōu)化,通常系統(tǒng)需要復(fù)制的數(shù)據(jù)量比較小。但是它有 個很大的缺點在于通用性較差,只能復(fù)制特定文件系統(tǒng)的文件或者應(yīng)用程序的 數(shù)據(jù),而不能對任意組織格式的數(shù)據(jù)進(jìn)行復(fù)制,如果用戶有多種數(shù)據(jù)需要進(jìn)行 遠(yuǎn)程復(fù)制,則需要購買多個復(fù)制系統(tǒng)。 3 、基于塊設(shè)備的遠(yuǎn)程復(fù)制系統(tǒng) 基于塊設(shè)備的數(shù)據(jù)復(fù)制系統(tǒng)有非常好的通用性,可以用于各種類型用戶數(shù) 6 第二章數(shù)據(jù)復(fù)制技術(shù) 據(jù)的復(fù)制,對于上層應(yīng)用是透明的。系統(tǒng)中的塊設(shè)備可以是一個實際的設(shè)備, 也可以是由其它驅(qū)動提供的虛擬設(shè)備。但是它無法理解上層的數(shù)據(jù)語意,無法 對數(shù)據(jù)進(jìn)行優(yōu)化,復(fù)制的數(shù)據(jù)量可能比較大。 第三節(jié)主要產(chǎn)品和解決方案 l 、i b ms 3 9 0 業(yè)務(wù)恢復(fù)存儲解決方案 i b m 地理分散并行系統(tǒng)( g e o g r a p h i c a l l yd i s p e r s e dp a r a l l e ls y s p l e x ,g d p s ) 【7 1 的s 3 9 0 多站點應(yīng)用可用性解決方案,將s 3 9 0 并行s y s p l e x 技術(shù)【引與遠(yuǎn)程拷貝 技術(shù)集成在一起,提高了系統(tǒng)的可用性和災(zāi)難恢復(fù)能力。g d p s 具有管理遠(yuǎn)程拷 貝配置和存儲子系統(tǒng)、自動執(zhí)行并行s y s p l e x 操作任務(wù),從單一控制點執(zhí)行故障 恢復(fù)等功能,從而達(dá)到提高可用性的目的。 i b m 推出兩種遠(yuǎn)程拷貝功能,一種為對等遠(yuǎn)程拷貝( p e e r - t o p e e rc o p y , p p r c ) ,遠(yuǎn)程備份距離可達(dá)1 0 3 公里;另一種為擴(kuò)展遠(yuǎn)程拷貝( e x t e n d e dr e m o t e c o p y , x r c ) ,提供廣域網(wǎng)范圍的數(shù)據(jù)備份。通過g d p s 和p p r c ,i b m 使災(zāi)難 恢復(fù)時間縮減到分鐘級。 2 、v e r i t a s 異地備份容災(zāi)方案 v e r i t a s 公司的v e r i t a s t 9 】容災(zāi)系統(tǒng)分成三部分:備份中心主機(jī)網(wǎng)絡(luò)存儲系統(tǒng); 數(shù)據(jù)同步傳輸系統(tǒng);基于廣域網(wǎng)的集群系統(tǒng)。數(shù)據(jù)復(fù)制軟件采用v e r i t a s 的v o l u m e r e p l i e a t o r ( v v r ) ,v v r 采用可靠的連接和監(jiān)聽協(xié)議,支持廣域網(wǎng)節(jié)點間數(shù)據(jù) 的同步和異步復(fù)制,支持多點到多點的復(fù)制。一份數(shù)據(jù)最多可同時復(fù)制到3 2 個 節(jié)點。 v e r i t a s 的g l o b a lc l u s t e rm a n a g e r ( g c m ) 軟件可實現(xiàn)廣域網(wǎng)的集群管理。 g c m 軟件可與v e r i t a sc l u s t e rs e r v e r 有機(jī)集成,從單控制臺管理多達(dá)3 2 個地域 的v c s 集群系統(tǒng),實時檢測運行狀態(tài),根據(jù)用戶應(yīng)用要求制定多種切換策略。 3 、e m cs r d f 遠(yuǎn)程數(shù)據(jù)備份系統(tǒng) e m c 的遠(yuǎn)程數(shù)據(jù)備份軟件( s y m m e t r i xr e m o t ed a t af a c i l i t y ,s r d f ) 1 0 j ,是 一個在線的數(shù)據(jù)鏡像存儲解決方案,可在1 6 個本地或遠(yuǎn)程的s y m m e t r i x 系統(tǒng)問 提供完整的數(shù)據(jù)備份。在數(shù)據(jù)中心操作發(fā)生故障時,系統(tǒng)管理人員可以迅速的 從源系統(tǒng)切換到目標(biāo)系統(tǒng)。當(dāng)主節(jié)點故障排除后,通信線路被重新建立,s r d f 能夠自動的在節(jié)點間進(jìn)行數(shù)據(jù)同步,從而使正常工作得以恢復(fù)。 7 第二章數(shù)據(jù)復(fù)制技術(shù) s r d f 提供三種工作模式: 同步模式:在源系統(tǒng)和遠(yuǎn)程目標(biāo)系統(tǒng)之間提供實時數(shù)據(jù)鏡像,在i o 結(jié)束之 前,數(shù)據(jù)被實時同步的寫入兩個系統(tǒng)的高速緩存中,從而確保數(shù)據(jù)的最高可靠 性。 半同步模式:數(shù)據(jù)寫入源系統(tǒng),完成輸入輸出,然后使目標(biāo)系統(tǒng)中的數(shù)據(jù) 同步化,在目標(biāo)系統(tǒng)實現(xiàn)同步化前,對本地相關(guān)數(shù)據(jù)的第二個寫操作不被接受 自適應(yīng)拷貝模式:數(shù)據(jù)從源數(shù)據(jù)傳到目標(biāo)系統(tǒng)的過程中不需要等待確認(rèn)。 4 、c ab r i 殍h t s t o r 系統(tǒng) c a 的備份和容災(zāi)系統(tǒng)通過簡單明了的管理界面,實現(xiàn)自動、智能、跨平臺 的備份和恢復(fù)。產(chǎn)品包括b r i g h t s t o re n t e r p r i s eb a c k u p 以及相應(yīng)的管理模塊 b a c k u pa g e n t f o ru n i x 、b a c k u pa g e n tf o rd a t a b a s e l o t u s e x c h a n g e s a p 等,支持 s a n 和基于裸機(jī)的災(zāi)難恢復(fù),通過該功能可以使企業(yè)在數(shù)據(jù)災(zāi)難后,最簡潔而 快速地將系統(tǒng)恢復(fù)到災(zāi)難之前的狀態(tài)。 5 、耶容災(zāi)方案 h p 的方案由主數(shù)據(jù)中心和備份中心組成,主數(shù)據(jù)中心系統(tǒng)配置主機(jī)包括兩 臺或多臺h p u n i x 服務(wù)器,通過h pm c s e r v i c e g u a r d 軟件組成,數(shù)據(jù)存儲在磁 盤陣列x p 4 8 或x p 5 1 2 中,備份中心采用相同的配置。距離小于4 3 公里時,通 過e s c o n 光纖連接,較遠(yuǎn)時使用電信的e l e 3 信道。通過惠普的災(zāi)難恢復(fù)軟件 ( h pc o n t i n h o l i sa c c e s sx p ) 可以自動實現(xiàn)實時完全備份。 6 、康柏d r m 災(zāi)難恢復(fù)方案 康柏d r m 解決方案利用數(shù)據(jù)復(fù)制管理器d r m 進(jìn)行硬盤鏡像,可在1 0 公 里或者更遠(yuǎn)的遠(yuǎn)程備份中心進(jìn)行備份,每次進(jìn)行事物處理時,數(shù)據(jù)均同步更新。 康柏還提供基于硬件的異地容災(zāi)方案,數(shù)據(jù)復(fù)制由光纖通道存儲陣列控制器完 成,不占用服務(wù)器內(nèi)存和操作系統(tǒng)資源。 第四節(jié)當(dāng)前技術(shù)主要問題 由于國外企業(yè)對于數(shù)據(jù)存儲的安全性和可靠性的重視,目前國外已有了一 些遠(yuǎn)程容災(zāi)系統(tǒng)軟件,然而大多數(shù)系統(tǒng)都是在一些昂貴的硬件設(shè)備的基礎(chǔ)上實 現(xiàn)的,而且其地理距離也不可能達(dá)到i n t e r n e t 網(wǎng)的廣度。而國內(nèi)的許多企業(yè)對于 數(shù)據(jù)沒有給予應(yīng)有的重視,也還沒有相應(yīng)的系統(tǒng)。而且現(xiàn)在己有的許多系統(tǒng)都 8 第二章數(shù)據(jù)復(fù)制技術(shù) 存在著以下的問題: 基于磁盤陣列的遠(yuǎn)程復(fù)制系統(tǒng)通常需要購買高端磁盤陣列并且需要建立專 門的f c 網(wǎng)絡(luò),僅購買兩個支持遠(yuǎn)程復(fù)制高端磁盤至少需要1 0 0 多萬元,因此投 資巨大,只有少數(shù)企業(yè)才有能力建立這種容災(zāi)系統(tǒng)。另外,由于目前不同磁盤 陣列廠商生產(chǎn)的產(chǎn)品互不兼容,基于磁盤陣列的遠(yuǎn)程復(fù)制一般只能在同一廠家 的同一類型的磁盤陣列間進(jìn)行,這使得其擴(kuò)展性較差。 基于文件系統(tǒng)或者應(yīng)用程序的遠(yuǎn)程復(fù)制軟件只能復(fù)制特定文件系統(tǒng)的文件 或者應(yīng)用程序的數(shù)據(jù),而不能對任意組織格式的數(shù)據(jù)進(jìn)行復(fù)制,通用性較差, 如果用戶有多種數(shù)據(jù)需要進(jìn)行遠(yuǎn)程復(fù)制,則需要購買多個復(fù)制系統(tǒng),變相增加 了用戶的投資額。另外,由于該類系統(tǒng)一般不是采用塊設(shè)備操作,操作的效 率較低,因此對應(yīng)用程序的性能影響較大。 已有的其他平臺( 例如惠普的h p u x t7 j 或者s u n 的s o l a r i s t 8 】) 上的遠(yuǎn)程卷 復(fù)制系統(tǒng)建立費用普遍較高,建立費用包括主機(jī)購買費用、操作系統(tǒng)購買費用 和卷管理系統(tǒng)購買費用等。例如卷管理系統(tǒng)和遠(yuǎn)程卷復(fù)制系統(tǒng)一般就需要三十 萬元以上。另外,已有的其他平臺遠(yuǎn)程卷復(fù)制系統(tǒng)不支持以跨卷組的復(fù)制卷組 為單位進(jìn)行復(fù)制。由于許多己經(jīng)在運行的大型應(yīng)用程序可能使用了多個卷組的 多個不同的卷,為了進(jìn)行遠(yuǎn)程復(fù)制不得不停止應(yīng)用程序并重新進(jìn)行配置,這種 限制是許多用戶不愿意接受的。 而基于l i n u x 的遠(yuǎn)程卷復(fù)制系統(tǒng)作為一種綜合利用操作系統(tǒng)技術(shù)、存儲管理 技術(shù)和網(wǎng)絡(luò)技術(shù)的系統(tǒng)。在國外,只有美國的v e r i t a t 9 j 公司的l i n u x 平臺遠(yuǎn)程 卷復(fù)制產(chǎn)品不需要專門的網(wǎng)絡(luò),也不需要購買其他設(shè)備,用戶在兩臺以上l i n u x 服務(wù)器和t c p i p 網(wǎng)絡(luò)的基礎(chǔ)上,即可輕松建立數(shù)據(jù)容災(zāi)系統(tǒng)。 9 第三章l v m 2 和n b d 簡介 第三章l v m 2 和n b d 簡介 第一節(jié)l v m 2 簡介 l v m 是邏輯盤卷管理( l o g i c a lv o l u m em a n a g e r ) 的簡稱,l v m 2 為第二版, 是一個新的用戶空間工具集,它為l i n u x 提供邏輯卷管理功能,完全向后兼容原 來的l v m 工具集。它是l i n u x 環(huán)境下對存儲設(shè)備進(jìn)行管理的種機(jī)制,l v m 2 是建立在硬盤和分區(qū)之上的一個邏輯層,來提高磁盤分區(qū)管理的靈活性。通過 l v m 2 系統(tǒng)管理員可以輕松管理大量物理設(shè)備,如:將若干個磁盤分區(qū)組合為一 個整體的卷組( v o l u m eg r o u p ) ,形成一個存儲池。管理員可以在卷組上隨意創(chuàng) 建邏輯卷組( l o g i c a lv o l u m e s ) ,并進(jìn)一步在邏輯卷組上創(chuàng)建文件系統(tǒng)。管理員 通過l v m 2 可以方便的調(diào)整存儲卷組的大小,并且可以對磁盤存儲按照組的方 式進(jìn)行命名、管理和分配,例如按照使用用途進(jìn)行定義:“d e v e l o p m e n t ”和“s a l e s ”, 而不是使用物理磁盤名“s d a ”和“s d b ”。而且,當(dāng)系統(tǒng)添加了新的磁盤,管理員不 必將磁盤的文件移動到新的磁盤上,而是直接擴(kuò)展文件系統(tǒng)跨越磁盤即可,以 充分利用新的存儲空間。 邏輯卷管理器本質(zhì)上是一個虛擬設(shè)備驅(qū)動【l 】,是在內(nèi)核中塊設(shè)備和主機(jī)系統(tǒng) 中實際物理設(shè)備之間添加的一個新的抽象層次。它可以將若干磁盤( 物理卷, p h y s i c a lv o l u m e ) 組合起來形成一個存儲池或者卷組。l v m 2 可以每次從卷組中 劃分出不同大小的邏輯卷創(chuàng)建新的邏輯設(shè)備。底層的原始的磁盤不再由內(nèi)核直 接控制,而由l v m 2 層來控制。相對于上層應(yīng)用來說卷組替代了磁盤塊成為數(shù) 據(jù)存儲的基本單元。l v m 2 管理著所有物理卷的物理盤區(qū),維護(hù)著邏輯盤區(qū)和物 理盤區(qū)之間的映射。l v m 2 邏輯設(shè)備向上層應(yīng)用提供了和物理磁盤相同的功能, 如文件系統(tǒng)的創(chuàng)建和數(shù)據(jù)的訪問等。但l v m 2 邏輯設(shè)備不受物理約束的限制, 邏輯卷不必是連續(xù)的空間,它可以跨越許多物理卷,并且可以在任何時候任意 的調(diào)整大小。相比物理磁盤來說,更易于磁盤空間的管理。 正因為l v m 2 邏輯卷從用戶態(tài)上層應(yīng)用來看就相當(dāng)于一個普通的塊設(shè)備, 對其讀寫操作和普通塊設(shè)備的讀寫操作相同。另一方面,從物理設(shè)備底層來看, l v m 2 獨立于并且管理著底層的物理設(shè)備,從上層屏蔽了不同物理設(shè)備之間的差 1 0 第三章l v m 2 和n b d 簡介 異。因而在l v m 2 層上考慮數(shù)據(jù)的遠(yuǎn)程復(fù)制問題,可以不需要單獨考慮每一種 具體的物理設(shè)備,在很大程度上簡化了遠(yuǎn)程復(fù)制因物理設(shè)備之間的差異而產(chǎn)生 的難度。 3 1 1l v m 2 基本術(shù)語 物理存儲介質(zhì)( t h ep h y s i c a lm e d i a ) 這里指系統(tǒng)的存儲設(shè)備:硬盤,如:d e v h d a l 、d e v s d a 等等,是存儲系統(tǒng) 最低層的存儲單元。 物理卷( p h y s i c a lv o l u m e ) 物理卷就是指硬盤分區(qū)或邏輯上與磁盤分區(qū)具有同樣功能的設(shè)備( 如 r a i d ) ,是l v m 2 的基本存儲邏輯塊,但和基本的物理存儲介質(zhì)( 如分區(qū)、磁 盤等) 比較,卻包含有與l v m 2 相關(guān)的管理參數(shù)。 卷組( v o l u m eg r o u p ) l v m 2 卷組類似于非l v m 2 系統(tǒng)中的物理硬盤,其由物理卷組成。可以在 卷組上創(chuàng)建一個或多個“l(fā) v m 2 分區(qū)( 邏輯卷) ,l v m 2 卷組由一個或多個物理 卷組成。 邏輯卷( l o g i c a lv o l u m e ) l v m 2 的邏輯卷類似于非l v m 2 系統(tǒng)中的硬盤分區(qū),在邏輯卷之上可以建 立文件系統(tǒng)( 比如i l o m e 或者u s r 等) 。 p e ( p h y s i c a le x t e n t ) 每一個物理卷被劃分為稱為p e ( p h y s i c a le x t e n t s ) 的基本單元,具有唯一 編號的p e 是可以被l v m 2 尋址的最小單元。p e 的大小是可配置的,默認(rèn)為4 m b 。 l e ( l o g i c a le x t e n t ) 邏輯卷也被劃分為被稱為l e ( l o g i c a le x t e n t s ) 的可被尋址的基本單位。在 同一個卷組中,l e 的大小和p e 是相同的,并且一一對應(yīng)。 具體如圖3 1 所示: 筇二章l v m 2 和n b d 簡介 牢壓芒呷 j ? 平 毫西! 工0 西真! e o :e o :童i 叵:3 陶3 1l v m 2 組織結(jié)構(gòu)圖 3 12l v m 2 的內(nèi)部組織 其實每個p v 部被分成了相同太小的p e ,在每個v g 巾,所有的p v 的p e 的大小都是一樣的。存每個p v 中,所有的p e 都有自己的唯一編號。一個p e 足l v m 2 在物理存儲上的尋址的最小單位。 在用戶創(chuàng)建l v 時,l v m 2 將自動從存儲池中找到一些p e 分配給l v ,對應(yīng) 的每個l v 被分成了一些l e ,l e 與該v g 的每個p e 的大小是一致的。每個l e 都被映射到某個p v 上的某個確定的p e 。每個l v 上的所有的l e 也有自己的唯 編號,這樣用戶不需要考慮具體的物理位置,只需給出邏輯的位置l v m 2 就 會通過映射得到物理的位置來進(jìn)行真正的i 0 操作。 l v m 2 足獨立于物理存儲設(shè)備的對于文件系統(tǒng)或者數(shù)據(jù)庫來說,數(shù)據(jù)存放 的具體物理位置是透明的,印l v m 2 把卷和物理存儲設(shè)備隔離開來。l v m 2 主 要有以下優(yōu)點: l 動態(tài)數(shù)據(jù)遷移 l v m 2 支持?jǐn)?shù)據(jù)的動態(tài)轉(zhuǎn)移比如用戶對存儲在某個l v 上的h o m e 目錄在 讀寫時,數(shù)據(jù)完全有可能存儲存另個物理設(shè)備上。 孑基一 第三章l v m 2 和n b d 簡介 2 動態(tài)擴(kuò)展 對一個正在使用的l v ,用戶可以動態(tài)的擴(kuò)展l v 的大小,不需要停止任何 應(yīng)用,就能獲得充足的額外空間。 3 提供訪問性能 l v m 2 支持s t r i p p i n g 等功能,可以把卷分布到多個物理磁盤上,通過并行訪 問提高性能。 4 支持s n a p s h o t 功能 利用l v m 2 的s n a p s h o t 功能,可以進(jìn)行數(shù)據(jù)的熱備份,即可以獲得卷在某 一個時刻一致的數(shù)據(jù)備份而無需停止使用該卷的應(yīng)用程序。 5 磁盤位置無關(guān)性 由于磁盤的i d 與系統(tǒng)啟動時識別磁盤的順序有關(guān),如果有新的磁盤加入或 者有磁盤被卸下,則可能改變其他磁盤的i d 。而磁盤的設(shè)備名稱由磁盤i d 決定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 預(yù)防早戀班會課件圖片
- 項目功能介紹課件
- 消防安全常識培訓(xùn)
- 2025年汽車功率轉(zhuǎn)換器項目發(fā)展計劃
- 2025年防沉劑項目合作計劃書
- 2025年攪墨棒項目合作計劃書
- 五年級數(shù)學(xué)上冊期末測試卷提高卷(一)蘇教版
- 捕魚活動策劃方案
- 2025年中心靜脈導(dǎo)管項目合作計劃書
- 常州賓館冰蓄冷空調(diào)系統(tǒng)設(shè)計
- 腦室腹腔分流術(shù)護(hù)理
- 2025年重慶出版集團(tuán)招聘筆試沖刺題2025
- 明星考試題及答案
- 小學(xué)生暑假安全教育主題班會教案
- 2025年高等數(shù)學(xué)基礎(chǔ)考試試卷及答案
- GB/T 12718-2009礦用高強(qiáng)度圓環(huán)鏈
- GB 2811-1989安全帽
- 國家基本公共衛(wèi)生服務(wù)項目規(guī)范(第三版)培訓(xùn)-教學(xué)課件
- 資產(chǎn)評估收費管理辦法(2023)2914
- DFMEA編制作業(yè)指導(dǎo)書新版
- “揚(yáng)子石化杯”第36屆中國化學(xué)奧林匹克(初賽)選拔賽暨2022年江蘇賽區(qū)復(fù)賽試題及答案
評論
0/150
提交評論