分布式數(shù)據(jù)庫系統(tǒng)_第1頁
分布式數(shù)據(jù)庫系統(tǒng)_第2頁
分布式數(shù)據(jù)庫系統(tǒng)_第3頁
分布式數(shù)據(jù)庫系統(tǒng)_第4頁
分布式數(shù)據(jù)庫系統(tǒng)_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、分布式數(shù)據(jù)庫系統(tǒng)第1頁,共53頁,2022年,5月20日,10點11分,星期一本章內(nèi)容分布式數(shù)據(jù)庫系統(tǒng)概述分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)分布式查詢處理客戶/服務(wù)器結(jié)構(gòu)的分布式系統(tǒng)第2頁,共53頁,2022年,5月20日,10點11分,星期一9.1 分布式數(shù)據(jù)庫系統(tǒng)概述9.1.1 集中式系統(tǒng)和分布式系統(tǒng)集中式數(shù)據(jù)庫管理系統(tǒng)的缺點:通信開銷大;系統(tǒng)的堅固性差;性能差;可擴充性差;設(shè)計、管理困難。分散式系統(tǒng):將數(shù)據(jù)庫分成多個,建立在多臺計算機上,數(shù)據(jù)庫的管理、應(yīng)用程序的研制都是分開并相互獨立的,之間不存在數(shù)據(jù)通行聯(lián)系。分布式數(shù)據(jù)庫系統(tǒng)的特點:數(shù)據(jù)的分布性;統(tǒng)一性;透明性。統(tǒng)一性(兩個方面:數(shù)據(jù)在邏輯上的

2、統(tǒng)一性和數(shù)據(jù)在管理上的統(tǒng)一性)分布式數(shù)據(jù)庫與集中式數(shù)據(jù)庫相比的優(yōu)點:堅固性好;可擴充性好;可改善性能;自治性好。 第3頁,共53頁,2022年,5月20日,10點11分,星期一9.1 分布式數(shù)據(jù)庫系統(tǒng)概述與集中式數(shù)據(jù)庫相比,分布式DB具有:數(shù)據(jù)分布式的特點。與分散式數(shù)據(jù)庫相比,分布式DB具有:邏輯整體性的特點。第4頁,共53頁,2022年,5月20日,10點11分,星期一背景 數(shù)據(jù)庫系統(tǒng)+計算機網(wǎng)絡(luò)9.1.2 分布式數(shù)據(jù)庫系統(tǒng)的定義DB1DB1DB1計算機1計算機2計算機3通訊網(wǎng)絡(luò)T1T2T3T1T2T3T1T2T3第5頁,共53頁,2022年,5月20日,10點11分,星期一9.1.2 分布

3、式數(shù)據(jù)庫系統(tǒng)的定義一個分布式系統(tǒng)由通信網(wǎng)絡(luò)聯(lián)接起來的結(jié)點的集合。每個結(jié)點都是擁有集中式數(shù)據(jù)庫的計算機系統(tǒng)。分布式數(shù)據(jù)庫的特點:數(shù)據(jù)庫中的數(shù)據(jù)不是存儲在同一場地,而是分布存儲在多個場地。第6頁,共53頁,2022年,5月20日,10點11分,星期一9.1.2 分布式數(shù)據(jù)庫系統(tǒng)的定義分布性:數(shù)據(jù)存儲在不同場地上。與集中式數(shù)據(jù)庫不同。邏輯整體性:數(shù)據(jù)邏輯上是相互聯(lián)系的一個整體。與分散在計算機網(wǎng)絡(luò)不同站點上的一組沒有相互聯(lián)系的本地數(shù)據(jù)庫區(qū)別開來。第7頁,共53頁,2022年,5月20日,10點11分,星期一9.1.2 分布式數(shù)據(jù)庫系統(tǒng)的定義物理上是分布的,邏輯上是統(tǒng)一的一組數(shù)據(jù)庫的集合要素計算機網(wǎng)絡(luò)數(shù)

4、據(jù)庫系統(tǒng)第8頁,共53頁,2022年,5月20日,10點11分,星期一DB1DB1DB1計算機1計算機1計算機1通訊網(wǎng)絡(luò)北京重慶上海銀行系統(tǒng)訪問本地銀行數(shù)據(jù):局部應(yīng)用通兌業(yè)務(wù)、轉(zhuǎn)賬業(yè)務(wù):全局應(yīng)用第9頁,共53頁,2022年,5月20日,10點11分,星期一9.1.2 分布式數(shù)據(jù)庫系統(tǒng)的定義全局應(yīng)用:指涉及到兩個或兩個以上場地中數(shù)據(jù)庫的應(yīng)用。網(wǎng)絡(luò)的每個站點具有獨立處理能力,可以執(zhí)行局部應(yīng)用,同時也能通過網(wǎng)絡(luò)執(zhí)行全局應(yīng)用。分布式數(shù)據(jù)庫是由一組數(shù)據(jù)庫組成,這些數(shù)據(jù)庫分布在計算機網(wǎng)絡(luò)的不同站點上,邏輯上是屬于同一個系統(tǒng)的。第10頁,共53頁,2022年,5月20日,10點11分,星期一9.1.2 分布

5、式數(shù)據(jù)庫系統(tǒng)的定義分布式數(shù)據(jù)庫包含兩個重要組成部分:分布式數(shù)據(jù)庫和分布式數(shù)據(jù)庫管理系統(tǒng)。分布式數(shù)據(jù)庫是計算機網(wǎng)絡(luò)環(huán)境中各場地上數(shù)據(jù)庫的邏輯集合。分布式數(shù)據(jù)庫管理系統(tǒng)是分布式數(shù)據(jù)庫系統(tǒng)中的一組軟件,它復(fù)雜管理分布環(huán)境下邏輯集成數(shù)據(jù)的存取、一致性、有效性和完備性。第11頁,共53頁,2022年,5月20日,10點11分,星期一9.1.3 分布式數(shù)據(jù)庫系統(tǒng)的透明性位置透明性用戶或應(yīng)用程序不必了解它所使用的數(shù)據(jù)的存儲位置。舉例:銀行的借貸業(yè)務(wù):要判斷的情況有5種。復(fù)制透明性 有些數(shù)據(jù)并不存在一個場地,可能重復(fù)存放在不同的場地。本地數(shù)據(jù)庫中也包含了外地數(shù)據(jù)庫中的數(shù)據(jù)。 一個分布式系統(tǒng)有了這兩種透明性后,

6、用戶看到的系統(tǒng)就如同一個集中式系統(tǒng)。第12頁,共53頁,2022年,5月20日,10點11分,星期一9.1.4 分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點具有靈活的體系結(jié)構(gòu)數(shù)據(jù)庫的使用單位組織上、地理上是分布的適應(yīng)分布式管理和控制機構(gòu)。經(jīng)濟性能優(yōu)越經(jīng)濟上和組織上的理由系統(tǒng)的可靠性高,可用性好。局部應(yīng)用的響應(yīng)速度快??蓴U展性好,易于集成現(xiàn)有系統(tǒng)。既有數(shù)據(jù)庫互連,歷史繼承;數(shù)據(jù)資源共享系統(tǒng)規(guī)模逐步擴展增加結(jié)點,不影響現(xiàn)有系統(tǒng)運行第13頁,共53頁,2022年,5月20日,10點11分,星期一9.1.4 分布式數(shù)據(jù)庫系統(tǒng)的優(yōu)缺點缺點:系統(tǒng)開銷大,主要花在通信部分。復(fù)雜的存取結(jié)構(gòu)在集中式系統(tǒng)中是有效存取數(shù)據(jù)的重要基數(shù),

7、但在分布式系統(tǒng)中不一定有效。數(shù)據(jù)的安全和行保密性較難處理。第14頁,共53頁,2022年,5月20日,10點11分,星期一9.1.5 分布式數(shù)據(jù)庫系統(tǒng)的分類同構(gòu)同質(zhì)數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,并運行同一型號的DBMS同構(gòu)異質(zhì)數(shù)據(jù)庫每個場地都用同一類型的數(shù)據(jù)模型,但運行不同型號的DBMS異構(gòu)數(shù)據(jù)庫場地上的數(shù)據(jù)庫系統(tǒng)不盡相同DBMS不同數(shù)據(jù)模型不同第15頁,共53頁,2022年,5月20日,10點11分,星期一練習(xí):1、與集中式DB相比,分布式DB具有()特點,與分散式DB相比,又具有()特點。2、區(qū)別系統(tǒng)是分散式還是分布式就是判定系統(tǒng)是否支持().3、在分布式DB中,用戶看到的系統(tǒng)如同

8、一個集中式DBS,這是因為分布式系統(tǒng)具有()和()特點。4、如果各個場地都采用同類型數(shù)據(jù)模型,但DBMS不同型號,這種系統(tǒng)屬于()型DBMS.1、數(shù)據(jù)分布性,邏輯整體性2、全局應(yīng)用 3、位置透明性 ,復(fù)制透明性4、同構(gòu)異質(zhì)型DDBS.第16頁,共53頁,2022年,5月20日,10點11分,星期一9.2 分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)分布式數(shù)據(jù)存儲(1)數(shù)據(jù)分配數(shù)據(jù)分配是指數(shù)據(jù)在計算機網(wǎng)絡(luò)各場地上的分配策略。集中式:所有數(shù)據(jù)均安排在同一個場地上。分割式:所有數(shù)據(jù)只有一份,分布被安置在若干個場地。全復(fù)制式:數(shù)據(jù)在每個場地重復(fù)存儲?;旌鲜剑簲?shù)據(jù)庫分成若干可相交的子集,每一子集安置在一個或多個場地上,但

9、是每一場地未必保存全部數(shù)據(jù)。第17頁,共53頁,2022年,5月20日,10點11分,星期一分布式數(shù)據(jù)存儲(2)數(shù)據(jù)分片:分布式數(shù)據(jù)庫中的數(shù)據(jù)可以被分割和復(fù)制在物理場地的各個物理數(shù)據(jù)庫中。優(yōu)點將關(guān)系分片,有利于按用戶需求組織數(shù)據(jù)的分布。如產(chǎn)品(內(nèi)銷產(chǎn)品,出口產(chǎn)品)。分片方式水平分片垂直分片導(dǎo)出分片混合分片第18頁,共53頁,2022年,5月20日,10點11分,星期一分布式數(shù)據(jù)存儲第19頁,共53頁,2022年,5月20日,10點11分,星期一分布式數(shù)據(jù)存儲1)水平分片將關(guān)系r按行分為若干子集r1,r2,rn,每個子集ri稱為一個水平片段。一個水平片段可以看成是關(guān)系上的一個選擇。ri =P(i

10、)(r)如M_S=sex=M(S)關(guān)系的重構(gòu)可以通過并運算來實現(xiàn)。r= r1 r2rn第20頁,共53頁,2022年,5月20日,10點11分,星期一分布式數(shù)據(jù)存儲(2)垂直分片將關(guān)系r按列分為若干屬性子集r1,r2,rn,每個子集ri稱為一個垂直片段。一個垂直片段可以看成是關(guān)系上的一個投影。ri =Ri(r)其中Ri是r的一個屬性子集。 如P_S = SNO,SNAME(S)關(guān)系的重構(gòu)可以通過連接運算來實現(xiàn)。r= r1 r2 rn要求所有垂直分片的片段都包括關(guān)系的鍵。第21頁,共53頁,2022年,5月20日,10點11分,星期一分布式數(shù)據(jù)存儲(3)混合分片關(guān)系按某種方式分片后,得到的片段再

11、按另一種方式繼續(xù)分片。如SC(S#,C#,G,DNO)按學(xué)生系別分片,再對每個片段按成績(及格,不及格)分片。第22頁,共53頁,2022年,5月20日,10點11分,星期一分布式數(shù)據(jù)存儲定義各種分片時必須遵守下面三個條件:1)完備性條件:必須把全局關(guān)系的所有數(shù)據(jù)映射到各個片段中,絕不允許發(fā)生屬于全局關(guān)系的某個數(shù)據(jù)不屬于任何一個片段。2)重構(gòu)條件:劃分所采用的方法必須確保能夠由各個分段重建全局關(guān)系。3)不相交條件:要求一個全局關(guān)系被劃分后得到的各個數(shù)據(jù)片段互相不重疊。目的是為了在數(shù)據(jù)分片時容易控制數(shù)據(jù)的復(fù)制。第23頁,共53頁,2022年,5月20日,10點11分,星期一9.2.2 分布式數(shù)據(jù)

12、庫系統(tǒng)的體系結(jié)構(gòu)全局外模式全局應(yīng)用的用戶視圖。全局概念模式定義D-DBS中數(shù)據(jù)的整體邏輯結(jié)構(gòu),數(shù)據(jù)如同沒有分布一樣。分片模式每一個關(guān)系可以分為若干互不相交的部分,每一部分稱為一個片段。分配(分布)模式定義片段的存放地點。第24頁,共53頁,2022年,5月20日,10點11分,星期一用戶視圖用戶視圖全局視圖分片視圖分配視圖局部概念視圖局部概念視圖局部內(nèi)視圖局部內(nèi)視圖局部DB局部DB分布式集中式分片視圖分片視圖分配視圖分配視圖局部概念視圖局部內(nèi)視圖局部DB第25頁,共53頁,2022年,5月20日,10點11分,星期一舉例:RR1R2R3R4R11R21R12R22R23R33R43S1S2S3

13、邏輯片段物理映像一個全局關(guān)系的片段所對應(yīng)的存儲片段組成兩個物理映像可以相同。第26頁,共53頁,2022年,5月20日,10點11分,星期一9.2.3 分布透明性分布(網(wǎng)絡(luò))透明性分片透明性(全局視圖和分片視圖之間)用戶或應(yīng)用程序只對全局關(guān)系進行操作而不必考慮關(guān)系的分片。如果分片模式改變了,通過調(diào)整全局模式與分片模式之間的映象關(guān)系來保持全局模式不變。位置透明性(分片視圖和分配視圖之間)用戶或應(yīng)用程序不必了解片段的存儲位置。局部數(shù)據(jù)模型透明性(分配視圖和局部概念視圖之間)用戶或應(yīng)用程序不必了解局部場地上使用的是哪種數(shù)據(jù)模型。第27頁,共53頁,2022年,5月20日,10點11分,星期一RR1R

14、2R3R4R11R21R12R22R23R33R43S1S2S3例子9.4第28頁,共53頁,2022年,5月20日,10點11分,星期一9.2.4 分布式數(shù)據(jù)庫管理系統(tǒng)的功能及組成1、DDBMS的主要功能:接收用戶請求;訪問網(wǎng)絡(luò)數(shù)據(jù)字典;如果目標數(shù)據(jù)存儲于系統(tǒng)的多個計算機上,就必須進行分布式處理;通信接口功能;在一個異構(gòu)型分布式處理環(huán)境中,還需要提供數(shù)據(jù)和進程移植的支持。2、DDBMS的組成:查詢處理子系統(tǒng)、完整性子系統(tǒng)、調(diào)度子系統(tǒng)和可靠性子系統(tǒng)。第29頁,共53頁,2022年,5月20日,10點11分,星期一9.2.5 分布式數(shù)據(jù)庫系統(tǒng)中存在的問題1、不同場地的通信速度,與局部DBS的存儲

15、部件的存取速度相比,是非常慢的。2、通信系統(tǒng)有較高的存取延遲時間。3、在CPU上處理通信的代價很高。4、不同通信系統(tǒng)有不同意義的字符,數(shù)據(jù)轉(zhuǎn)換速度也不一樣,可以相差1000倍,存取延遲時間可能相差106倍。第30頁,共53頁,2022年,5月20日,10點11分,星期一9.3 分布式查詢處理分布式數(shù)據(jù)庫系統(tǒng)中由于數(shù)據(jù)分布在各個場地,因此,查詢的處理比集中式數(shù)據(jù)庫復(fù)雜。第31頁,共53頁,2022年,5月20日,10點11分,星期一9.3.1 查詢處理的傳輸代價Site-1Site-2EMPLOYEE104個記錄每個記錄100字節(jié)DEPARTMENT100個記錄每個記錄100字節(jié)檢索每個職工的姓

16、名、地址及工作部門名select ENAME,ADDRESS,DNAME from EMPLOYEE,DEPARTMENTwhere DNO=DNUMBER網(wǎng)絡(luò)傳輸速度104字節(jié)/秒第32頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理把關(guān)系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行查詢傳送時間T=(104 100 +100 35 )/104=100s32傳送時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1第33頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理把關(guān)系EMPLOYEE傳送到場地2,在場地2作聯(lián)接

17、,再把操作結(jié)構(gòu)從場地2傳到場地3:傳送時間T= (104 100 +400000 )/104=140s132第34頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作結(jié)構(gòu)從場地1傳到場地3:傳送時間T= (3500 +400000 )/104=40s132第35頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理2)在場地3有一個查詢“檢索每個部門的名字和其經(jīng)理的姓名、地址”。 select DNAME, ENAME,ADDRESS from EMPLOYEE,DEPARTMENTwhe

18、re MGRENO=ENO第36頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理把關(guān)系EMPLOYEE和DEPARTMENT分布從場地1和場地2傳到場地3,然后在場地3站進行查詢傳送時間T=(104 100 +3500 )/104=100s32傳送時間T=總傳輸延遲+總數(shù)據(jù)量/傳輸速度1第37頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理把關(guān)系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,再把操作結(jié)構(gòu)從場地2傳到場地3:傳送時間T= (104 100 +4000 )/104=100s132第38頁,共53頁,2022年,5月20日,10點11分

19、,星期一分布式查詢處理3.把關(guān)系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把操作結(jié)構(gòu)從場地1傳到場地3:傳送時間T= (3500 +4000 )/104=0.75s132第39頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理3)如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:4、把關(guān)系EMPLOYEE傳送到場地2,在場地2作聯(lián)接,此時Q1和Q2的傳輸量都是1000000,時間都是100秒。12Q1Q2第40頁,共53頁,2022年,5月20日,10點11分,星期一分布式查詢處理5.把關(guān)系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結(jié)果從場地1

20、傳到場地2,此時Q1的傳輸量為:3500+400000=403500,時間是40秒。Q2的傳輸量都是3500+4000=7500,時間是0.75秒。12第41頁,共53頁,2022年,5月20日,10點11分,星期一基于半聯(lián)接的查詢優(yōu)化策略數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,如果都以整個關(guān)系傳輸,顯然是一種冗余。不參與聯(lián)接的值或無用的值不必在網(wǎng)絡(luò)中來回傳輸。(1)、基于半聯(lián)接的查詢實例: 如果在場地2提出上述兩個查詢Q1和Q2,可以有兩種方法:把關(guān)系DEPARTMENT傳送到場地1,在場地1作聯(lián)接,再把結(jié)果從場地1傳到場地2。可以改進:1)在場地2,用投影求得關(guān)系DEPARTMENT中參與聯(lián)接操作的屬性值,把投

21、影結(jié)果傳輸?shù)綀龅?。Q1:數(shù)據(jù)傳輸量是400字節(jié)(DEPARTMENT在DNUMBER上的投影)。Q2:數(shù)據(jù)傳輸量是900字節(jié)(DEPARTMENT在MGRENO上的投影)。第42頁,共53頁,2022年,5月20日,10點11分,星期一基于半聯(lián)接的查詢優(yōu)化策略2)在場地1,執(zhí)行聯(lián)接操作,并用投影求出所需的屬性值,把結(jié)果送到場地2。Q1:數(shù)據(jù)傳輸量是340000字節(jié)。Q2:數(shù)據(jù)傳輸量是3900字節(jié)。3)在場地2,執(zhí)行聯(lián)接操作,把結(jié)果給用戶。Q1:總的數(shù)據(jù)傳輸量是340400字節(jié),傳輸時間為40秒。Q2:總的數(shù)據(jù)傳輸量是4800字節(jié),傳輸時間為0.75。顯然,本方法采用的查詢處理方法是有效的。第

22、43頁,共53頁,2022年,5月20日,10點11分,星期一(2)半聯(lián)接操作的定義半連接運算定義半連接R S=R(R S)=第44頁,共53頁,2022年,5月20日,10點11分,星期一(2)半聯(lián)接操作的定義半連接作用找出R中能夠與S中元組相連接的元組來,類似于在連接之前先做選擇和投影。R S = (R S) SR S = (S R) R半連接的非對稱性R S (S R)定義R S R(R S) A=B A=B第45頁,共53頁,2022年,5月20日,10點11分,星期一(2)半聯(lián)接操作的定義半連接在分布式數(shù)據(jù)庫中的應(yīng)用R與S位于不同場地S1,S2上,其屬性組分別為A,B,要作聯(lián)接操作。在場地2對S做投影,然后把B(S)傳輸?shù)綀龅?在場地1執(zhí)行半聯(lián)接,設(shè)結(jié)果為R,然后把結(jié)果送到場地2。 R= R S A=B在場地2執(zhí)行R與S的聯(lián)接操作,得到最后結(jié)果。R S = R S第46頁,共53頁,2022年,5月20日,10點11分,星期一ABC123456889357BCD234578864238

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論