《數(shù)據(jù)庫設(shè)計(jì)》PPT課件.ppt_第1頁
《數(shù)據(jù)庫設(shè)計(jì)》PPT課件.ppt_第2頁
《數(shù)據(jù)庫設(shè)計(jì)》PPT課件.ppt_第3頁
《數(shù)據(jù)庫設(shè)計(jì)》PPT課件.ppt_第4頁
《數(shù)據(jù)庫設(shè)計(jì)》PPT課件.ppt_第5頁
已閱讀5頁,還剩166頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2006年4月12日,1,第六章 數(shù)據(jù)庫設(shè)計(jì),2006年4月12日,2,本章主要內(nèi)容,6.1 數(shù)據(jù)庫設(shè)計(jì)概述 6.2 需求分析 6.3 概念結(jié)構(gòu)設(shè)計(jì) 6.4 邏輯結(jié)構(gòu)設(shè)計(jì) 6.5 數(shù)據(jù)庫的物理設(shè)計(jì) 6.6 數(shù)據(jù)庫的實(shí)施和維護(hù),2006年4月12日,3,6-1數(shù)據(jù)庫設(shè)計(jì)概述,什么是數(shù)據(jù)庫設(shè)計(jì)? 數(shù)據(jù)庫設(shè)計(jì)是指對于一個給定的應(yīng)用環(huán)境,構(gòu)造最優(yōu)的數(shù)據(jù)庫模式,建立數(shù)據(jù)庫及其應(yīng)用系統(tǒng),使之能夠有效地存儲數(shù)據(jù),滿足各種用戶的應(yīng)用需求(信息要求和處理要求) 在數(shù)據(jù)庫領(lǐng)域內(nèi),常常把使用數(shù)據(jù)庫的各類系統(tǒng)統(tǒng)稱為數(shù)據(jù)庫應(yīng)用系統(tǒng)。數(shù)據(jù)庫設(shè)計(jì)是信息系統(tǒng)開發(fā)和建設(shè)的重要組成部分 從事數(shù)據(jù)庫設(shè)計(jì)的專業(yè)人員應(yīng)該具備哪些知識? 數(shù)據(jù)庫的基本知識和數(shù)據(jù)庫設(shè)計(jì)技術(shù) 計(jì)算機(jī)科學(xué)的基礎(chǔ)知識和程序設(shè)計(jì)的方法和技巧 軟件工程的原理和方法 應(yīng)用領(lǐng)域的知識,2006年4月12日,4,數(shù)據(jù)庫設(shè)計(jì)有何特點(diǎn)? 數(shù)據(jù)庫建設(shè)是硬件、軟件和干件的結(jié)合 三分技術(shù),七分管理,十二分基礎(chǔ)數(shù)據(jù) 技術(shù)與管理的界面稱之為“干件” 數(shù)據(jù)庫設(shè)計(jì)應(yīng)該與應(yīng)用系統(tǒng)設(shè)計(jì)相結(jié)合 結(jié)構(gòu)(數(shù)據(jù))設(shè)計(jì):設(shè)計(jì)數(shù)據(jù)庫框架或數(shù)據(jù)庫結(jié)構(gòu) 行為(處理)設(shè)計(jì):設(shè)計(jì)應(yīng)用程序、事務(wù)處理等 結(jié)構(gòu)和行為分離的設(shè)計(jì) 傳統(tǒng)的軟件工程忽視對應(yīng)用中數(shù)據(jù)語義的分析和抽象,只要有可能就盡量推遲數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)的決策 早期的數(shù)據(jù)庫設(shè)計(jì)致力于數(shù)據(jù)模型和建模方法研究,忽視了對行為的設(shè)計(jì),2006年4月12日,5,數(shù)據(jù)庫設(shè)計(jì)有哪些方法? 手工試湊法 設(shè)計(jì)質(zhì)量與設(shè)計(jì)人員的經(jīng)驗(yàn)和水平有直接關(guān)系 缺乏科學(xué)理論和工程方法的支持,工程的質(zhì)量難以保證 數(shù)據(jù)庫運(yùn)行一段時間后常常又不同程度地發(fā)現(xiàn)各種問題,增加了維護(hù)代價 規(guī)范設(shè)計(jì)法 手工設(shè)計(jì)方法 基本思想:過程迭代和逐步求精 典型方法 新奧爾良(New Orleans)方法 將數(shù)據(jù)庫設(shè)計(jì)分為四個階段 S.B.Yao方法 將數(shù)據(jù)庫設(shè)計(jì)分為五個步驟 I.R.Palmer方法 把數(shù)據(jù)庫設(shè)計(jì)當(dāng)成一步接一步的過程 計(jì)算機(jī)輔助設(shè)計(jì) ORACLE Designer 2000 SYBASE PowerDesigner,2006年4月12日,6,數(shù)據(jù)庫設(shè)計(jì)有哪些基本步驟?,準(zhǔn)備工作: 選定參加設(shè)計(jì)的人員 1. 數(shù)據(jù)庫分析設(shè)計(jì)人員 數(shù)據(jù)庫設(shè)計(jì)的核心人員 自始至終參與數(shù)據(jù)庫設(shè)計(jì) 其水平?jīng)Q定了數(shù)據(jù)庫系統(tǒng)的質(zhì)量 2.用戶 在數(shù)據(jù)庫設(shè)計(jì)中也是舉足輕重的 主要參加需求分析和數(shù)據(jù)庫的運(yùn)行維護(hù) 用戶積極參與帶來的好處 加速數(shù)據(jù)庫設(shè)計(jì) 提高數(shù)據(jù)庫設(shè)計(jì)的質(zhì)量,3. 程序員 在系統(tǒng)實(shí)施階段參與進(jìn)來,負(fù)責(zé)編制程序 4. 操作員 在系統(tǒng)實(shí)施階段參與進(jìn)來,準(zhǔn)備軟硬件環(huán)境,2006年4月12日,7,設(shè)計(jì)概念結(jié)構(gòu),需求收集和分析,設(shè)計(jì)邏輯結(jié)構(gòu),數(shù)據(jù)模型優(yōu)化,設(shè)計(jì)物理結(jié)構(gòu),評價設(shè)計(jì),性能預(yù)測,物理實(shí)現(xiàn),試驗(yàn)性運(yùn)行,使用、維護(hù)數(shù)據(jù)庫,應(yīng)用需求 (數(shù)據(jù)、 處理),轉(zhuǎn)換規(guī)則 DBMS功能 優(yōu)化方法,應(yīng)用要求 DBMS詳 細(xì)特征,需求分析階段,概念設(shè)計(jì)階段,邏輯設(shè) 計(jì)階段,物理設(shè) 計(jì)階段,數(shù)據(jù)庫 實(shí)施階段,數(shù)據(jù)庫運(yùn)行、維 護(hù)階段,數(shù)據(jù)庫設(shè)計(jì)步驟,需求分析階段 準(zhǔn)確了解與分析用戶需求(包括數(shù)據(jù)與處理) 是整個設(shè)計(jì)過程的基礎(chǔ),是最困難、最耗費(fèi)時間的一步,概念結(jié)構(gòu)設(shè)計(jì)階段 是整個數(shù)據(jù)庫設(shè)計(jì)的關(guān)鍵 通過對用戶需求進(jìn)行綜合、歸納與抽象,形成一個獨(dú)立于具體DBMS的概念模型,邏輯結(jié)構(gòu)設(shè)計(jì)階段 將概念結(jié)構(gòu)轉(zhuǎn)換為某個DBMS所支持的數(shù)據(jù)模型 對其進(jìn)行優(yōu)化,數(shù)據(jù)庫物理設(shè)計(jì)階段 為邏輯數(shù)據(jù)模型選取一個最適合應(yīng)用環(huán)境的物理結(jié)構(gòu)(包括存儲結(jié)構(gòu)和存取方法),數(shù)據(jù)庫實(shí)施階段 運(yùn)用DBMS提供的數(shù)據(jù)語言、工具及宿主語言,根據(jù)邏輯設(shè)計(jì)和物理設(shè)計(jì)的結(jié)果 建立數(shù)據(jù)庫 編制與調(diào)試應(yīng)用程序 組織數(shù)據(jù)入庫 并進(jìn)行試運(yùn)行,數(shù)據(jù)庫運(yùn)行和維護(hù)階段 數(shù)據(jù)庫應(yīng)用系統(tǒng)經(jīng)過試運(yùn)行后即可投入正式運(yùn)行。 在數(shù)據(jù)庫系統(tǒng)運(yùn)行過程中必須不斷地對其進(jìn)行評價、調(diào)整與修改。,2006年4月12日,8,軟件工程 人們認(rèn)為,應(yīng)該用科學(xué)知識、工程方面的紀(jì)律指導(dǎo)軟件開發(fā)的過程,以提高軟件質(zhì)量和開發(fā)效率,降低開發(fā)成本 。 軟件生存期 從軟件的規(guī)劃、研制、實(shí)現(xiàn)、投入運(yùn)行后的維護(hù),直到它被新的軟件所取代而停止使用的整個期間。 數(shù)據(jù)庫工程 數(shù)據(jù)庫系統(tǒng)生存期 數(shù)據(jù)庫應(yīng)用系統(tǒng)從開始規(guī)劃、設(shè)計(jì)、實(shí)現(xiàn)、維護(hù)到最后被新的系統(tǒng)取代而停止使用的整個期間。 數(shù)據(jù)庫設(shè)計(jì)的輸入輸出,與其它軟件設(shè)計(jì)步驟進(jìn)行對比,2006年4月12日,9,軟件生存期,數(shù)據(jù)庫生存期,2006年4月12日,10,數(shù)據(jù)庫設(shè)計(jì)的輸入輸出,1、規(guī)劃階段的三個步驟: 系統(tǒng)調(diào)查 對企業(yè)組織作全面的調(diào)查,畫出組織層次圖,以了解企業(yè)的組織結(jié)構(gòu) 可行性分析 從技術(shù)、經(jīng)濟(jì)、效益、法律等族方面對建立數(shù)據(jù)庫的可行性進(jìn)行分析;寫出可行性分析報告;組織專家進(jìn)行討論其可行性 確定數(shù)據(jù)庫系統(tǒng)的總目標(biāo)和制定項(xiàng)目開發(fā)計(jì)劃,2、需求分析工作 分析用戶活動產(chǎn)生,產(chǎn)生業(yè)務(wù)流程圖 確定系統(tǒng)范圍,產(chǎn)生系統(tǒng)范圍圖 分析用戶活動涉及的數(shù)據(jù),產(chǎn)生數(shù)據(jù)流圖 分析系統(tǒng)數(shù)據(jù),產(chǎn)生數(shù)據(jù)字典 還有全系統(tǒng)中的數(shù)據(jù)項(xiàng)和數(shù)據(jù)存儲的描述,3、概念設(shè)計(jì) 為什么需要概念設(shè)計(jì)? 概念設(shè)計(jì)的主要步驟: 進(jìn)行數(shù)據(jù)抽象,設(shè)計(jì)局部概念模式 將局部概念模式綜合成全局概念模式 評審,2006年4月12日,11,2006年4月12日,12,4、邏輯設(shè)計(jì)步驟,2006年4月12日,13,5、 物理設(shè)計(jì) 什么是數(shù)據(jù)庫的物理結(jié)構(gòu)? 物理設(shè)計(jì)的步驟 存儲記錄結(jié)構(gòu)設(shè)計(jì) 確定數(shù)據(jù)存放位置 存取方法的設(shè)計(jì) 完整性和安全性考慮 程序設(shè)計(jì),2006年4月12日,14,6、 數(shù)據(jù)庫的實(shí)現(xiàn) 實(shí)現(xiàn)數(shù)據(jù)庫應(yīng)做的主要工作 用DDL定義數(shù)據(jù)庫結(jié)構(gòu); 組織數(shù)據(jù)入庫; 對數(shù)據(jù)量不大的小型系統(tǒng)(人工)主要工作: 篩選數(shù)據(jù);轉(zhuǎn)換數(shù)據(jù)格式;輸入數(shù)據(jù);校驗(yàn)數(shù)據(jù)。 大中型系統(tǒng)(自動)主要工作: 篩選數(shù)據(jù);輸入數(shù)據(jù);校驗(yàn)數(shù)據(jù);轉(zhuǎn)換數(shù)據(jù);綜合數(shù)據(jù)。 編制與調(diào)試應(yīng)用程序; 數(shù)據(jù)庫試運(yùn)行。 功能測試 性能測試(時空代價),2006年4月12日,15,7、數(shù)據(jù)庫的運(yùn)行與維護(hù)工作 數(shù)據(jù)庫的轉(zhuǎn)儲和恢復(fù) 數(shù)據(jù)庫安全性、完整性控制 數(shù)據(jù)庫性能的監(jiān)督、分析和改進(jìn) 數(shù)據(jù)庫的重組織和重構(gòu)造,2006年4月12日,16,設(shè)計(jì)特點(diǎn),在設(shè)計(jì)過程中把數(shù)據(jù)庫的設(shè)計(jì)和對數(shù)據(jù)庫中數(shù)據(jù)處理的設(shè)計(jì)緊密結(jié)合起來 將這兩個方面的需求分析、抽象、設(shè)計(jì)、實(shí)現(xiàn)在各個階段同時進(jìn)行,相互參照,相互補(bǔ)充,以完善兩方面的設(shè)計(jì),2006年4月12日,17,Creat Load,Main( ) if then end,概念結(jié)構(gòu)設(shè)計(jì),邏輯結(jié)構(gòu)設(shè)計(jì),物理設(shè)計(jì),2006年4月12日,18,6-2需求分析,需求分析的任務(wù)是什么? 需求分析的方法有哪些? 調(diào)查用戶需求的步驟有哪些? 常用的調(diào)查的方法有哪些? 什么是數(shù)據(jù)字典?,2006年4月12日,19,需求分析就是分析用戶的需要與要求 需求分析是設(shè)計(jì)數(shù)據(jù)庫的起點(diǎn) 需求分析的結(jié)果是否準(zhǔn)確地反映了用戶的實(shí)際要求,將直接影響到后面各個階段的設(shè)計(jì),并影響到設(shè)計(jì)結(jié)果是否合理和實(shí)用,2006年4月12日,20,需求分析的任務(wù),通過詳細(xì)調(diào)查現(xiàn)實(shí)世界要處理的對象(組織、部門、企業(yè)等),充分了解原系統(tǒng)(手工系統(tǒng)或計(jì)算機(jī)系統(tǒng))工作概況,明確用戶的各種需求 在此基礎(chǔ)上確定新系統(tǒng)的功能。新系統(tǒng)必須充分考慮今后可能的擴(kuò)充和改變,不能僅僅按當(dāng)前應(yīng)用需求來設(shè)計(jì)數(shù)據(jù)庫,2006年4月12日,21,需求分析的重點(diǎn),需求分析的重點(diǎn) 調(diào)查、收集與分析用戶在數(shù)據(jù)管理中的信息要求、處理要求、安全性與完整性要求。 信息要求 用戶需要從數(shù)據(jù)庫中獲得信息的內(nèi)容與性質(zhì) 由用戶的信息要求可以導(dǎo)出數(shù)據(jù)要求,即在數(shù)據(jù)庫中需要存儲哪些數(shù)據(jù) 處理要求 對處理功能的要求 對處理的響應(yīng)時間的要求 對處理方式的要求(批處理 / 聯(lián)機(jī)處理) 新系統(tǒng)的功能必須能夠滿足用戶的信息要求、處理要求、安全性與完整性要求。,2006年4月12日,22,需求分析的難點(diǎn),確定用戶最終需求的難點(diǎn) 用戶缺少計(jì)算機(jī)知識,開始時無法確定計(jì)算機(jī)究竟能為自己做什么,不能做什么,因此無法一下子準(zhǔn)確地表達(dá)自己的需求,他們所提出的需求往往不斷地變化。 設(shè)計(jì)人員缺少用戶的專業(yè)知識,不易理解用戶的真正需求,甚至誤解用戶的需求。 新的硬件、軟件技術(shù)的出現(xiàn)也會使用戶需求發(fā)生變化。 解決方法 設(shè)計(jì)人員必須采用有效的方法,與用戶不斷深入地進(jìn)行交流,才能逐步得以確定用戶的實(shí)際需求,2006年4月12日,23,需求分析的方法,調(diào)查清楚用戶的實(shí)際需求并進(jìn)行初步分析 與用戶達(dá)成共識 進(jìn)一步分析與表達(dá)這些需求,2006年4月12日,24,調(diào)查與初步分析用戶需求的步驟, 調(diào)查組織機(jī)構(gòu)情況 組織部門的組成情況 各部門的職責(zé)等 調(diào)查各部門的業(yè)務(wù)活動情況。調(diào)查重點(diǎn)之一。 各個部門輸入和使用什么數(shù)據(jù) 如何加工處理這些數(shù)據(jù) 輸出什么信息 輸出到什么部門 輸出結(jié)果的格式是什么 在熟悉業(yè)務(wù)活動的基礎(chǔ)上,協(xié)助用戶明確對新系統(tǒng)的各種要求。調(diào)查重點(diǎn)之二。 信息要求 處理要求 完全性與完整性要求 對前面調(diào)查的結(jié)果進(jìn)行初步分析 確定新系統(tǒng)的邊界 確定哪些功能由計(jì)算機(jī)完成或?qū)頊?zhǔn)備讓計(jì)算機(jī)完成 確定哪些活動由人工完成 由計(jì)算機(jī)完成的功能就是新系統(tǒng)應(yīng)該實(shí)現(xiàn)的功能。,2006年4月12日,25,有關(guān)常用調(diào)查方法,做需求調(diào)查時,往往需要同時采用多種方法 無論使用何種調(diào)查方法,都必須有用戶的積極參與和配合 設(shè)計(jì)人員應(yīng)該和用戶取得共同的語言,幫助不熟悉計(jì)算機(jī)的用戶建立數(shù)據(jù)庫環(huán)境下的共同概念,并對設(shè)計(jì)工作的最后結(jié)果共同承擔(dān)責(zé)任,2006年4月12日,26,常用調(diào)查方法有:,跟班作業(yè) 通過親身參加業(yè)務(wù)工作了解業(yè)務(wù)活動的情況 能比較準(zhǔn)確地理解用戶的需求,但比較耗時 開調(diào)查會 通過與用戶座談來了解業(yè)務(wù)活動情況及用戶需求 請專人介紹 詢問 對某些調(diào)查中的問題,可以找專人詢問 設(shè)計(jì)調(diào)查表請用戶填寫 如果調(diào)查表設(shè)計(jì)合理,則很有效,且易于為用戶接受 查閱記錄 查閱與原系統(tǒng)有關(guān)的數(shù)據(jù)記錄,2006年4月12日,27,進(jìn)一步分析和表達(dá)用戶需求,分析和表達(dá)用戶的需求的常用方法 自頂向下的結(jié)構(gòu)化分析方法(Structured Analysis,簡稱SA方法) SA方法從最上層的系統(tǒng)組織機(jī)構(gòu)入手,采用逐層分解的方式分析系統(tǒng),并用數(shù)據(jù)流圖和數(shù)據(jù)字典描述系統(tǒng)。,2006年4月12日,28,1首先把任何一個系統(tǒng)都抽象為: 2分解處理功能和數(shù)據(jù) (1)分解處理功能 將處理功能的具體內(nèi)容分解為若干子功能,再將每個子功能繼續(xù)分解,直到把系統(tǒng)的工作過程表達(dá)清楚為止。 (2)分解數(shù)據(jù) 在處理功能逐步分解的同時,其所用的數(shù)據(jù)也逐級分解,形成若干層次的數(shù)據(jù)流圖 數(shù)據(jù)流圖表達(dá)了數(shù)據(jù)和處理過程的關(guān)系 (3)表達(dá)方法 處理過程:用判定表或判定樹來描述 數(shù)據(jù):用數(shù)據(jù)字典來描述 3將分析結(jié)果再次提交給用戶,征得用戶的認(rèn)可,2006年4月12日,29,2006年4月12日,30,需求分析小結(jié),實(shí)例:假設(shè)我們要開發(fā)一個學(xué)校管理系統(tǒng)。 1經(jīng)過可行性分析和初步需求調(diào)查,抽象出該系統(tǒng)最高層數(shù)據(jù)流圖,該系統(tǒng)由教師管理子系統(tǒng)、學(xué)生管理子系統(tǒng)、后勤管理子系統(tǒng)組成,每個子系統(tǒng)分別配備一個開發(fā)小組。 2進(jìn)一步細(xì)化各個子系統(tǒng)。 其中學(xué)生管理子系統(tǒng)開發(fā)小組通過進(jìn)行進(jìn)一步的需求調(diào)查,明確了該子系統(tǒng)的主要功能是進(jìn)行學(xué)籍管理和課程管理,包括學(xué)生報到、入學(xué)、畢業(yè)的管理,學(xué)生上課情況的管理。通過詳細(xì)的信息流程分析和數(shù)據(jù)收集后,他們生成了該子系統(tǒng)的數(shù)據(jù)流圖。,2006年4月12日,31,數(shù)據(jù)字典,什么是數(shù)據(jù)字典? 數(shù)據(jù)字典有何用途? 數(shù)據(jù)字典中有哪些內(nèi)容?,2006年4月12日,32,數(shù)據(jù)字典的用途,數(shù)據(jù)字典是各類數(shù)據(jù)描述的集合 數(shù)據(jù)字典是進(jìn)行詳細(xì)的數(shù)據(jù)收集和數(shù)據(jù)分析所獲得的主要結(jié)果 數(shù)據(jù)字典在數(shù)據(jù)庫設(shè)計(jì)中占有很重要的地位,2006年4月12日,33,數(shù)據(jù)字典的內(nèi)容,數(shù)據(jù)字典的內(nèi)容 數(shù)據(jù)項(xiàng) 數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)流 數(shù)據(jù)存儲 處理過程 數(shù)據(jù)項(xiàng)是數(shù)據(jù)的最小組成單位 若干個數(shù)據(jù)項(xiàng)可以組成一個數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)字典通過對數(shù)據(jù)項(xiàng)和數(shù)據(jù)結(jié)構(gòu)的定義來描述數(shù)據(jù)流、數(shù)據(jù)存儲的邏輯內(nèi)容。,2006年4月12日,34, 數(shù)據(jù)項(xiàng),數(shù)據(jù)項(xiàng)是不可再分的數(shù)據(jù)單位 對數(shù)據(jù)項(xiàng)的描述 數(shù)據(jù)項(xiàng)描述數(shù)據(jù)項(xiàng)名,數(shù)據(jù)項(xiàng)含義說明, 別名,數(shù)據(jù)類型,長度,取值范圍, 取值含義,與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系 取值范圍、與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系定義了數(shù)據(jù)的完整性約束條件,2006年4月12日,35, 數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)結(jié)構(gòu)反映了數(shù)據(jù)之間的組合關(guān)系。 一個數(shù)據(jù)結(jié)構(gòu)可以由若干個數(shù)據(jù)項(xiàng)組成,也可以由若干個數(shù)據(jù)結(jié)構(gòu)組成,或由若干個數(shù)據(jù)項(xiàng)和數(shù)據(jù)結(jié)構(gòu)混合組成。 對數(shù)據(jù)結(jié)構(gòu)的描述 數(shù)據(jù)結(jié)構(gòu)描述數(shù)據(jù)結(jié)構(gòu)名,含義說明, 組成:數(shù)據(jù)項(xiàng)或數(shù)據(jù)結(jié)構(gòu),2006年4月12日,36, 數(shù)據(jù)流,數(shù)據(jù)流是數(shù)據(jù)結(jié)構(gòu)在系統(tǒng)內(nèi)傳輸?shù)穆窂健?對數(shù)據(jù)流的描述 數(shù)據(jù)流描述數(shù)據(jù)流名,說明,數(shù)據(jù)流來源, 數(shù)據(jù)流去向,組成:數(shù)據(jù)結(jié)構(gòu), 平均流量,高峰期流量 數(shù)據(jù)流來源是說明該數(shù)據(jù)流來自哪個過程 數(shù)據(jù)流去向是說明該數(shù)據(jù)流將到哪個過程去 平均流量是指在單位時間(每天、每周、每月等)里的傳輸次數(shù) 高峰期流量則是指在高峰時期的數(shù)據(jù)流量,2006年4月12日,37, 數(shù)據(jù)存儲,數(shù)據(jù)存儲是數(shù)據(jù)結(jié)構(gòu)停留或保存的地方,也是數(shù)據(jù)流的來源和去向之一。 對數(shù)據(jù)存儲的描述 數(shù)據(jù)存儲描述數(shù)據(jù)存儲名,說明,編號, 流入的數(shù)據(jù)流 ,流出的數(shù)據(jù)流 , 組成:數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)量,存取方式 流入的數(shù)據(jù)流:指出數(shù)據(jù)來源 流出的數(shù)據(jù)流:指出數(shù)據(jù)去向 數(shù)據(jù)量:每次存取多少數(shù)據(jù),每天(或每小時、每周等)存取幾次等信息 存取方法:批處理 / 聯(lián)機(jī)處理;檢索 / 更新;順序檢索 / 隨機(jī)檢索,2006年4月12日,38, 處理過程,處理過程的具體處理邏輯一般用判定表或判定樹來描述。數(shù)據(jù)字典中只需要描述處理過程的說明性信息 處理過程說明性信息的描述 處理過程描述處理過程名,說明, 輸入:數(shù)據(jù)流,輸出:數(shù)據(jù)流, 處理:簡要說明 簡要說明:主要說明該處理過程的功能及處理要求 功能:該處理過程用來做什么 處理要求:處理頻度要求(如單位時間里處理多少事務(wù),多少數(shù)據(jù)量);響應(yīng)時間要求等 處理要求是后面物理設(shè)計(jì)的輸入及性能評價的標(biāo)準(zhǔn),2006年4月12日,39,例:學(xué)生學(xué)籍管理子系統(tǒng)的數(shù)據(jù)字典。,數(shù)據(jù)項(xiàng),以“學(xué)號”為例: 數(shù)據(jù)項(xiàng): 學(xué)號 含義說明:唯一標(biāo)識每個學(xué)生 別名: 學(xué)生編號 類型: 字符型 長度: 8 取值范圍:00000000至99999999 取值含義:前兩位標(biāo)別該學(xué)生所在年級, 后六位按順序編號 與其他數(shù)據(jù)項(xiàng)的邏輯關(guān)系:,2006年4月12日,40,數(shù)據(jù)結(jié)構(gòu) 以“學(xué)生”為例,“學(xué)生”是該系統(tǒng)中的一個核心數(shù)據(jù)結(jié)構(gòu): 數(shù)據(jù)結(jié)構(gòu): 學(xué)生 含義說明: 是學(xué)籍管理子系統(tǒng)的主體數(shù)據(jù)結(jié) 構(gòu),定義了一個學(xué)生的有關(guān)信息 組成: 學(xué)號,姓名,性別,年齡, 所在系,年級,2006年4月12日,41,數(shù)據(jù)流“體檢結(jié)果”可如下描述:,數(shù)據(jù)流: 體檢結(jié)果 說明: 學(xué)生參加體格檢查的最終結(jié)果 數(shù)據(jù)流來源:體檢 數(shù)據(jù)流去向:批準(zhǔn) 組成: 平均流量: 高峰期流量:,2006年4月12日,42,數(shù)據(jù)存儲“學(xué)生登記表”可如下描述:,數(shù)據(jù)存儲: 學(xué)生登記表 說明: 記錄學(xué)生的基本情況 流入數(shù)據(jù)流: 流出數(shù)據(jù)流: 組成: 數(shù)據(jù)量: 每年3000張 存取方式: 隨機(jī)存取,2006年4月12日,43,處理過程“分配宿舍”可如下描述:,處理過程:分配宿舍 說明: 為所有新生分配學(xué)生宿舍 輸入: 學(xué)生,宿舍, 輸出: 宿舍安排 處理: 在新生報到后,為所有新生分配學(xué) 生宿舍。要求同一間宿舍只能安排 同一性別的學(xué)生,同一個學(xué)生只能 安排在一個宿舍中。每個學(xué)生的居 住面積不小于3平方米。安排新生 宿舍其處理時間應(yīng)不超過15分鐘。,2006年4月12日,44,6.3 概念結(jié)構(gòu)設(shè)計(jì),6.3.1 概念結(jié)構(gòu)設(shè)計(jì)概述 6.3.2 概念結(jié)構(gòu)設(shè)計(jì)的方法與步驟 6.3.3 數(shù)據(jù)抽象與局部視圖設(shè)計(jì) 6.3.4 視圖的集成,2006年4月12日,45,6.3.1 概念結(jié)構(gòu)設(shè)計(jì)概述,什么是概念結(jié)構(gòu)設(shè)計(jì) 需求分析階段描述的用戶應(yīng)用需求是現(xiàn)實(shí)世界的具體需求 將需求分析得到的用戶需求抽象為信息結(jié)構(gòu)即概念模型的過程就是概念結(jié)構(gòu)設(shè)計(jì) 概念結(jié)構(gòu)是各種數(shù)據(jù)模型的共同基礎(chǔ),它比數(shù)據(jù)模型更獨(dú)立于機(jī)器、更抽象,從而更加穩(wěn)定。 概念結(jié)構(gòu)設(shè)計(jì)是整個數(shù)據(jù)庫設(shè)計(jì)的關(guān)鍵,2006年4月12日,46,概念結(jié)構(gòu)設(shè)計(jì)的特點(diǎn),(1)能真實(shí)、充分地反映現(xiàn)實(shí)世界,包括事物和事物之間的聯(lián)系,能滿足用戶對數(shù)據(jù)的處理要求。是對現(xiàn)實(shí)世界的一個真實(shí)模型。 (2)易于理解,從而可以用它和不熟悉計(jì)算機(jī)的用戶交換意見,用戶的積極參與是數(shù)據(jù)庫的設(shè)計(jì)成功的關(guān)鍵。 (3)易于更改,當(dāng)應(yīng)用環(huán)境和應(yīng)用要求改變時,容易對概念模型修改和擴(kuò)充。 (4)易于向關(guān)系、網(wǎng)狀、層次等各種數(shù)據(jù)模型轉(zhuǎn)換。,2006年4月12日,47,什么是ER模型 ER模型的歷史 ER模型的基本元素 實(shí)體 聯(lián)系 屬性 例子,實(shí)體,聯(lián)系,屬性,ER模型圖例,描述概念模型的工具 E-R模型,2006年4月12日,48,屬性的分類,基本屬性和復(fù)合屬性(可否再分) 單值屬性和多值屬性(對一個實(shí)體對象是否只能取一個值) 多值屬性的處理 將原來的多值屬性用幾個新的單值屬性來表示。 將原來的多值屬性用一個新的實(shí)體類型表示 導(dǎo)出屬性 空值,零件編碼,2006年4月12日,49,聯(lián)系的設(shè)計(jì)之一,聯(lián)系集 聯(lián)系集是n(n2)個實(shí)體集上的數(shù)學(xué)關(guān)系,這些實(shí)體集不必互異。如果E1,E2,En為n個實(shí)體集,那么聯(lián)系集R是(e1,e2,en)|e1E1 ,e2E2,enEn的一個子集,而(e1,e2,en)是一個聯(lián)系。 聯(lián)系的元數(shù) 一個聯(lián)系涉及到的實(shí)體集個數(shù) 聯(lián)系的連通詞 聯(lián)系涉及到的實(shí)體集之間實(shí)體對應(yīng)的方式 實(shí)體的基數(shù) 有兩個實(shí)體集E1和E2,E1中每個實(shí)體與E2中有聯(lián)系實(shí)體的數(shù)目的最小值min和最大值max,稱為E1的基數(shù),用(min,max)形式表示,2006年4月12日,50,6.3.2 概念結(jié)構(gòu)設(shè)計(jì)的方法與步驟,設(shè)計(jì)概念結(jié)構(gòu)的四類方法 自頂向下 首先定義全局概念結(jié)構(gòu)的框架,然后逐步細(xì)化 自底向上 首先定義各局部應(yīng)用的概念結(jié)構(gòu),然后將它們集成起來,得到全局概念結(jié)構(gòu) 逐步擴(kuò)張 首先定義最重要的核心概念結(jié)構(gòu),然后向外擴(kuò)充,以滾雪球的方式逐步生成其他概念結(jié)構(gòu),直至總體概念結(jié)構(gòu) 混合策略 將自頂向下和自底向上相結(jié)合,用自頂向下策略設(shè)計(jì)一個全局概念結(jié)構(gòu)的框架,以它為骨架集成由自底向上策略中設(shè)計(jì)的各局部概念結(jié)構(gòu)。,2006年4月12日,51,概念結(jié)構(gòu)設(shè)計(jì)的方法與步驟(續(xù)),自頂向下策略,2006年4月12日,52,概念結(jié)構(gòu)設(shè)計(jì)的方法與步驟(續(xù)),自底向上策略,2006年4月12日,53,概念結(jié)構(gòu)設(shè)計(jì)的方法與步驟(續(xù)),逐步擴(kuò)張,2006年4月12日,54,概念結(jié)構(gòu)設(shè)計(jì)的常用策略 自頂向下地進(jìn)行需求分析 自底向上地設(shè)計(jì)概念結(jié)構(gòu) 自底向上設(shè)計(jì)概念結(jié)構(gòu)的步驟 第1步:抽象數(shù)據(jù)并設(shè)計(jì)局部視圖 第2步:集成局部視圖,得到全局概念結(jié)構(gòu),2006年4月12日,55,6.3.3 數(shù)據(jù)抽象與局部視圖設(shè)計(jì),數(shù)據(jù)抽象 局部視圖設(shè)計(jì),2006年4月12日,56,一、數(shù)據(jù)抽象,概念結(jié)構(gòu)是對現(xiàn)實(shí)世界的一種抽象 從實(shí)際的人、物、事和概念中抽取所關(guān)心的共同特性,忽略非本質(zhì)的細(xì)節(jié) 把這些特性用各種概念精確地加以描述 這些概念組成了某種模型,2006年4月12日,57,三種常用抽象,1. 分類(Classification) 定義某一類概念作為現(xiàn)實(shí)世界中一組對象的類型 這些對象具有某些共同的特性和行為 它抽象了對象值和型之間的“is member of”的語義 在E-R模型中,實(shí)體型就是這種抽象 例:P216圖6.10 2. 聚集(Aggregation) 定義某一類型的組成成分 它抽象了對象內(nèi)部類型和成分之間“is part of”的語義 在E-R模型中若干屬性的聚集組成了實(shí)體型,就是這種抽象 例:P217圖6.11,圖6.12 3. 概括(Generalization) 定義類型之間的一種子集聯(lián)系 它抽象了類型之間的“is subset of”的語義 概括有一個很重要的性質(zhì):繼承性。子類繼承超類上定義的所有抽象。 例:P217圖6.13,2006年4月12日,58,注:原E-R模型不具有概括,本書對E-R模型作了擴(kuò)充,允許定義超類實(shí)體型和子類實(shí)體型。 用雙豎邊的矩形框表示子類, 用直線加小圓圈表示超類-子類的聯(lián)系 數(shù)據(jù)抽象的用途 對需求分析階段收集到的數(shù)據(jù)進(jìn)行分類、組織(聚集),形成 實(shí)體 實(shí)體的屬性,標(biāo)識實(shí)體的碼 確定實(shí)體之間的聯(lián)系類型(1:1,1:n,m:n),2006年4月12日,59,二、局部視圖設(shè)計(jì),設(shè)計(jì)分E-R圖的步驟: 選擇局部應(yīng)用 逐一設(shè)計(jì)分E-R圖,2006年4月12日,60, 選擇局部應(yīng)用,需求分析階段,已用多層數(shù)據(jù)流圖和數(shù)據(jù)字典描述了整個系統(tǒng)。 設(shè)計(jì)分E-R圖首先需要根據(jù)系統(tǒng)的具體情況,在多層的數(shù)據(jù)流圖中選擇一個適當(dāng)層次的數(shù)據(jù)流圖,讓這組圖中每一部分對應(yīng)一個局部應(yīng)用,然后以這一層次的數(shù)據(jù)流圖為出發(fā)點(diǎn),設(shè)計(jì)分E-R圖。 通常以中層數(shù)據(jù)流圖作為設(shè)計(jì)分E-R圖的依據(jù)。原因: 高層數(shù)據(jù)流圖只能反映系統(tǒng)的概貌 中層數(shù)據(jù)流圖能較好地反映系統(tǒng)中各局部應(yīng)用的子系統(tǒng)組成 低層數(shù)據(jù)流圖過細(xì) 例:由于學(xué)籍管理、課程管理等都不太復(fù)雜,因此可以它們?nèi)胧衷O(shè)計(jì)學(xué)生管理子系統(tǒng)的分E-R圖。如果局部應(yīng)用比較復(fù)雜,則可以從更下層的數(shù)據(jù)流圖入手。,2006年4月12日,61, 逐一設(shè)計(jì)分E-R圖,任務(wù) 標(biāo)定局部應(yīng)用中的實(shí)體、屬性、碼,實(shí)體間的聯(lián)系 將各局部應(yīng)用涉及的數(shù)據(jù)分別從數(shù)據(jù)字典中抽取出來,參照數(shù)據(jù)流圖,標(biāo)定各局部應(yīng)用中的實(shí)體、實(shí)體的屬性、標(biāo)識實(shí)體的碼,確定實(shí)體之間的聯(lián)系及其類型(1:1,1:n,m:n) 注意區(qū)分實(shí)體和屬性 實(shí)體與屬性是相對而言的。同一事物,在一種應(yīng)用環(huán)境中作為“屬性”,在另一種應(yīng)用環(huán)境中就必須作為“實(shí)體”。 例:學(xué)校中的系,在某種應(yīng)用環(huán)境中,它只是作為“學(xué)生”實(shí)體的一個屬性,表明一個學(xué)生屬于哪個系;而在另一種環(huán)境中,由于需要考慮一個系的系主任、教師人數(shù)、學(xué)生人數(shù)、辦公地點(diǎn)等,這時它就需要作為實(shí)體了。,2006年4月12日,62,區(qū)分實(shí)體和屬性一般原則 屬性不能再具有需要描述的性質(zhì)。即屬性必須是不可分的數(shù)據(jù)項(xiàng),不能再由另一些屬性組成。 屬性不能與其他實(shí)體具有聯(lián)系。聯(lián)系只發(fā)生在實(shí)體之間。 符合上述兩條特性的事物一般作為屬性對待。 為了簡化E-R圖的處置,現(xiàn)實(shí)世界中的事物凡能夠作為屬性對待的,應(yīng)盡量作為屬性。舉例: 例1:“學(xué)生”由學(xué)號、姓名等屬性進(jìn)一步描述,根據(jù)準(zhǔn)則,“學(xué)生”只能作為實(shí)體,不能作為屬性。 例2:職稱通常作為教師實(shí)體的屬性,但在涉及住房分配時,由于分房與職稱有關(guān),也就是說職稱與住房實(shí)體之間有聯(lián)系,根據(jù)準(zhǔn)則,這時把職稱作為實(shí)體來處理會更合適些。 例3:銷售管理子系統(tǒng)ER設(shè)計(jì)實(shí)例,2006年4月12日,63,6.3.4 視圖的集成,各個局部視圖即分E-R圖建立好后,還需要對它們進(jìn)行合并,集成為一個整體的數(shù)據(jù)概念結(jié)構(gòu)即總E-R圖。 視圖集成的兩種方式 一次集成(P224圖6.25(a)) 一次集成多個分E-R圖 通常用于局部視圖比較簡單時 逐步累積式(P224圖6.25(b)) 首先集成兩個局部視圖(通常是比較關(guān)鍵的兩個局部視圖) 以后每次將一個新的局部視圖集成進(jìn)來 集成局部E-R圖的步驟 1. 合并 2. 修改與重構(gòu),2006年4月12日,64,視圖的集成,2006年4月12日,65,ER模型的操作 包括實(shí)體類型、聯(lián)系類型和屬性的分裂、合并、增刪等等,2006年4月12日,66,設(shè)計(jì)局部ER模式,2006年4月12日,67,局部模式,現(xiàn)有的教學(xué) 管理系統(tǒng),初步分析系統(tǒng)的對象,根據(jù)服務(wù)種類分析教師子模塊,局部ER圖,2006年4月12日,68,其他局部模式,現(xiàn)有的教學(xué) 管理系統(tǒng),初步分析系統(tǒng)的對象,根據(jù)服務(wù)種類分析學(xué)生子模塊,局部ER圖,2006年4月12日,69,其他局部模式,現(xiàn)有的教學(xué) 管理系統(tǒng),初步分析系統(tǒng)的對象,根據(jù)服務(wù)種類分析課程子模塊,局部ER圖,2006年4月12日,70,設(shè)計(jì)全局 ER模式,2006年4月12日,71,全局ER模式的優(yōu)化,實(shí)體類型的合并 1:1聯(lián)系的兩個實(shí)體類型 具有相同鍵的實(shí)體類型 冗余屬性的消除 冗余聯(lián)系的消除:利用規(guī)范化理論中函數(shù)依賴的概念消除冗余聯(lián)系,2006年4月12日,72,例子:三個局部ER圖合并成一個ER圖,2006年4月12日,73,沖突的種類,1、屬性沖突 屬性域沖突:屬性值的類型、取值范圍或取值集合不同。 例1, 由于學(xué)號是數(shù)字,因此某些部門(即局部應(yīng)用)將學(xué)號定義為整數(shù)形式,而由于學(xué)號不用參與運(yùn)算,因此另一些部門(即局部應(yīng)用)將學(xué)號定義為字符型形式。 例2, 某些部門(即局部應(yīng)用)以出生日期形式表示學(xué)生的年齡,而另一些部門(即局部應(yīng)用)用整數(shù)形式表示學(xué)生的年齡。 屬性取值單位沖突。 例:學(xué)生的身高,有的以米為單位,有的以厘米為單位,有的以尺為單位。 2、命名沖突 同名異義:不同意義的對象在不同的局部應(yīng)用中具有相同的名字 例,局部應(yīng)用A中將教室稱為房間, 局部應(yīng)用B中將學(xué)生宿舍稱為房間 異名同義(一義多名):同一意義的對象在不同的局部應(yīng)用中具有不同的名字 例,有的部門把教科書稱為課本, 有的部門則把教科書稱為教材 命名沖突可能發(fā)生在屬性級、實(shí)體級、聯(lián)系級上。其中屬性的命名沖突更為常見。 3、結(jié)構(gòu)沖突,2006年4月12日,74,3類結(jié)構(gòu)沖突,1、同一對象在不同應(yīng)用中具有不同的抽象 例,“課程”在某一局部應(yīng)用中被當(dāng)作實(shí)體,在另一局部應(yīng)用中則被當(dāng)作屬性 解決方法:通常是把屬性變換為實(shí)體或把實(shí)體變換為屬性,使同一對象具有相同的抽象。變換時要遵循兩個準(zhǔn)則。 2、同一實(shí)體在不同局部視圖中所包含的屬性不完全相同,或者屬性的排列次序不完全相同。 產(chǎn)生原因:不同的局部應(yīng)用關(guān)心的是該實(shí)體的不同側(cè)面。 解決方法:使該實(shí)體的屬性取各分E-R圖中屬性的并集,再適當(dāng)設(shè)計(jì)屬性的次序。 3、實(shí)體之間的聯(lián)系在不同局部視圖中呈現(xiàn)不同的類型 例1, 實(shí)體E1與E2在局部應(yīng)用A中是多對多聯(lián)系,而在局部應(yīng)用B中是一對多聯(lián)系 例2, 在局部應(yīng)用X中E1與E2發(fā)生聯(lián)系,而在局部應(yīng)用Y中E1、E2、E3三者之間有聯(lián)系。 解決方法:根據(jù)應(yīng)用語義對實(shí)體聯(lián)系的類型進(jìn)行綜合或調(diào)整。,2006年4月12日,75,2006年4月12日,76,二、修改與重構(gòu),基本任務(wù) 消除不必要的冗余,設(shè)計(jì)生成基本E-R圖,2006年4月12日,77,1冗余,冗余從何而來? 冗余的數(shù)據(jù)是指可由基本數(shù)據(jù)導(dǎo)出的數(shù)據(jù), 冗余的聯(lián)系是指可由其他聯(lián)系導(dǎo)出的聯(lián)系。 冗余數(shù)據(jù)和冗余聯(lián)系容易破壞數(shù)據(jù)庫的完整性,給數(shù)據(jù)庫維護(hù)增加困難并不是所有的冗余數(shù)據(jù)與冗余聯(lián)系都必須加以消除,有時為了提高某些應(yīng)用的效率,不得不以冗余信息作為代價。 設(shè)計(jì)數(shù)據(jù)庫概念結(jié)構(gòu)時,哪些冗余信息必須消除,哪些冗余信息允許存在,需要根據(jù)用戶的整體需求來確定。消除不必要的冗余后的初步E-R圖稱為基本E-R圖。,2006年4月12日,78,2消除冗余的方法,分析方法 以數(shù)據(jù)字典和數(shù)據(jù)流圖為依據(jù),根據(jù)數(shù)據(jù)字典中關(guān)于數(shù)據(jù)項(xiàng)之間邏輯關(guān)系的說明來消除冗余。 例,教師工資單中包括該教師的基本工資、各種補(bǔ)貼、應(yīng)扣除的房租水電費(fèi)以及實(shí)發(fā)工資。 由于實(shí)發(fā)工資可以由前面各項(xiàng)推算出來,因此可以去掉,在需要查詢實(shí)發(fā)工資時根據(jù)基本工資、各種補(bǔ)貼、應(yīng)扣除的房租水電費(fèi)數(shù)據(jù)臨時生成。 如果是為了提高效率,人為地保留了一些冗余數(shù)據(jù),則應(yīng)把數(shù)據(jù)字典中數(shù)據(jù)關(guān)聯(lián)的說明作為完整性約束條件。 一種更好的方法是把冗余數(shù)據(jù)定義在視圖中,2006年4月12日,79,消除冗余的方法,規(guī)范化理論 函數(shù)依賴的概念提供了消除冗余聯(lián)系的形式化工具 方法 1. 確定分E-R圖實(shí)體之間的數(shù)據(jù)依賴FL 。實(shí)體之間一對一、一對多、多對多的聯(lián)系可以用實(shí)體碼之間的函數(shù)依賴來表示。 例: 班級和學(xué)生之間一對多的聯(lián)系: 學(xué)號班級號 學(xué)生和課程之間多對多的聯(lián)系: (學(xué)號,課程號) 成績 2. 求FL的最小覆蓋GL ,差集為 D = FL-GL。 逐一考察D中的函數(shù)依賴,確定是否是冗余的聯(lián)系,若是,就把它去掉。,2006年4月12日,80,冗余數(shù)據(jù)和冗余聯(lián)系: (1) 學(xué)生實(shí)體中的年齡屬性可以由出生日期推算出來,屬于冗余數(shù)據(jù),應(yīng)該去掉。這樣不僅可以節(jié)省存儲空間,而且當(dāng)某個學(xué)生的出生日期有誤,進(jìn)行修改后,無須相應(yīng)修改年齡,減少了產(chǎn)生數(shù)據(jù)不一致的機(jī)會。 學(xué)生:學(xué)號,姓名,出生日期,所在系, 年級,平均成績 (2) 教室實(shí)體與班級實(shí)體的上課聯(lián)系可以由教室與課程之間的開設(shè)聯(lián)系、課程與學(xué)生之間的選修聯(lián)系、學(xué)生與班級之間的組成聯(lián)系三者推導(dǎo)出來,因此屬于冗余聯(lián)系,可以消去。 (3) 學(xué)生實(shí)體中的平均成績可以從選修聯(lián)系中的成績屬性中推算出來 由于應(yīng)用中需要經(jīng)常查詢某個學(xué)生的平均成績,每次都進(jìn)行這種計(jì)算效率就會太低,因此為提高效率,保留該冗余數(shù)據(jù) 但定義一個觸發(fā)器來保證學(xué)生的平均成績等于該學(xué)生各科成績的平均值。 任何一科成績修改后,或該學(xué)生學(xué)了新的科目并有成績后,就觸發(fā)該觸發(fā)器去修改該學(xué)生的平均成績屬性值。,2006年4月12日,81,三、驗(yàn)證整體概念結(jié)構(gòu),視圖集成后形成一個整體的數(shù)據(jù)庫概念結(jié)構(gòu),對該整體概念結(jié)構(gòu)還必須進(jìn)行進(jìn)一步驗(yàn)證,確保它能夠滿足下列條件: 整體概念結(jié)構(gòu)內(nèi)部必須具有一致性,不存在互相矛盾的表達(dá)。 整體概念結(jié)構(gòu)能準(zhǔn)確地反映原來的每個視圖結(jié)構(gòu),包括屬性、實(shí)體及實(shí)體間的聯(lián)系。 整體概念結(jié)構(gòu)能滿足需要分析階段所確定的所有要求。 整體概念結(jié)構(gòu)最終還應(yīng)該提交給用戶,征求用戶和有關(guān)人員的意見,進(jìn)行評審、修改和優(yōu)化,然后把它確定下來,作為數(shù)據(jù)庫的概念結(jié)構(gòu),作為進(jìn)一步設(shè)計(jì)數(shù)據(jù)庫的依據(jù)。,2006年4月12日,82,數(shù)據(jù)庫設(shè)計(jì),數(shù)據(jù)庫的設(shè)計(jì)過程 需求分析 概念結(jié)構(gòu)設(shè)計(jì) 邏輯結(jié)構(gòu)設(shè)計(jì) 物理數(shù)據(jù)庫設(shè)計(jì) 實(shí)施 運(yùn)行維護(hù) 設(shè)計(jì)過程中往往還會有許多反復(fù)。,2006年4月12日,83,概念結(jié)構(gòu)設(shè)計(jì)小結(jié),概念結(jié)構(gòu)設(shè)計(jì)的步驟 抽象數(shù)據(jù)并設(shè)計(jì)局部視圖 集成局部視圖,得到全局概念結(jié)構(gòu) 驗(yàn)證整體概念結(jié)構(gòu),2006年4月12日,84,概念結(jié)構(gòu)設(shè)計(jì)小結(jié),數(shù)據(jù)抽象 分類 聚集 概括,2006年4月12日,85,概念結(jié)構(gòu)設(shè)計(jì)小結(jié),設(shè)計(jì)局部視圖 選擇局部應(yīng)用 逐一設(shè)計(jì)分E-R圖 標(biāo)定局部應(yīng)用中的實(shí)體、屬性、碼,實(shí)體間的聯(lián)系 用E-R圖描述出來,2006年4月12日,86,概念結(jié)構(gòu)設(shè)計(jì)小結(jié),集成局部視圖 1.合并分E-R圖,生成初步E-R圖 消除沖突 屬性沖突 命名沖突 結(jié)構(gòu)沖突 2. 修改與重構(gòu) 消除不必要的冗余,設(shè)計(jì)生成基本E-R圖 分析方法 規(guī)范化理論,2006年4月12日,87,6.4 邏輯結(jié)構(gòu)設(shè)計(jì),邏輯結(jié)構(gòu)設(shè)計(jì)的任務(wù) 概念結(jié)構(gòu)是各種數(shù)據(jù)模型的共同基礎(chǔ)。為了能夠用某一DBMS實(shí)現(xiàn)用戶需求,還必須將概念結(jié)構(gòu)進(jìn)一步轉(zhuǎn)化為相應(yīng)的數(shù)據(jù)模型,這正是數(shù)據(jù)庫邏輯結(jié)構(gòu)設(shè)計(jì)所要完成的任務(wù)。 邏輯結(jié)構(gòu)設(shè)計(jì)的步驟 將概念結(jié)構(gòu)轉(zhuǎn)化為一般的關(guān)系、網(wǎng)狀、層次模型 將轉(zhuǎn)化來的關(guān)系、網(wǎng)狀、層次模型向特定DBMS支持下的數(shù)據(jù)模型轉(zhuǎn)換 對數(shù)據(jù)模型進(jìn)行優(yōu)化,2006年4月12日,88,2006年4月12日,89,6.4.1 E-R圖向關(guān)系模型的轉(zhuǎn)換,轉(zhuǎn)換內(nèi)容 轉(zhuǎn)換原則,2006年4月12日,90,E-R圖向關(guān)系模型的轉(zhuǎn)換內(nèi)容,E-R圖由實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系三個要素組成 關(guān)系模型的邏輯結(jié)構(gòu)是一組關(guān)系模式的集合 將E-R圖轉(zhuǎn)換為關(guān)系模型:將實(shí)體、實(shí)體的屬性和實(shí)體之間的聯(lián)系轉(zhuǎn)化為關(guān)系模式。,2006年4月12日,91,E-R圖向關(guān)系模型的轉(zhuǎn)換原則1,一個實(shí)體型轉(zhuǎn)換為一個關(guān)系模式。 關(guān)系的屬性:實(shí)體型的屬性 關(guān)系的碼:實(shí)體型的碼 例,學(xué)生實(shí)體可以轉(zhuǎn)換為如下關(guān)系模式: 學(xué)生(學(xué)號,姓名,出生日期,所在系,年級,平均成績) 性別、宿舍、班級、檔案材料、教師、課程、教室、教科書都分別轉(zhuǎn)換為一個關(guān)系模式。,2006年4月12日,92,E-R圖向關(guān)系模型的轉(zhuǎn)換原則2,一個m:n聯(lián)系轉(zhuǎn)換為一個關(guān)系模式。 關(guān)系的屬性:與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性 關(guān)系的碼:各實(shí)體碼的組合 例,“選修”聯(lián)系是一個m:n聯(lián)系,可以將它轉(zhuǎn)換為如下關(guān)系模式,其中學(xué)號與課程號為關(guān)系的組合碼: 選修(學(xué)號,課程號,成績),2006年4月12日,93,E-R圖向關(guān)系模型的轉(zhuǎn)換原則3,一個1:n聯(lián)系可以轉(zhuǎn)換為一個獨(dú)立的關(guān)系模式,也可以與n端對應(yīng)的關(guān)系模式合并。 1) 轉(zhuǎn)換為一個獨(dú)立的關(guān)系模式 關(guān)系的屬性:與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性 關(guān)系的碼:n端實(shí)體的碼 2) 與n端對應(yīng)的關(guān)系模式合并 合并后關(guān)系的屬性:在n端關(guān)系中加入1端關(guān)系的碼和聯(lián)系本身的屬性 合并后關(guān)系的碼:不變 可以減少系統(tǒng)中的關(guān)系個數(shù),一般情況下更傾向于采用這種方法,2006年4月12日,94,E-R圖向關(guān)系模型的轉(zhuǎn)換原則4, 一個1:1聯(lián)系可以轉(zhuǎn)換為一個獨(dú)立的關(guān)系模式,也可以與任意一端對應(yīng)的關(guān)系模式合并。 1) 轉(zhuǎn)換為一個獨(dú)立的關(guān)系模式 關(guān)系的屬性:與該聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性 關(guān)系的候選碼:每個實(shí)體的碼均是該關(guān)系的候選碼 2) 與某一端對應(yīng)的關(guān)系模式合并 合并后關(guān)系的屬性:加入對應(yīng)關(guān)系的碼和聯(lián)系本身的屬性 合并后關(guān)系的碼:不變,2006年4月12日,95,例,“管理”聯(lián)系為1:1聯(lián)系,可以有三種轉(zhuǎn)換方法: (1)轉(zhuǎn)換為一個獨(dú)立的關(guān)系模式: 管理(職工號,班級號) 或 管理(職工號,班級號) (2)“管理”聯(lián)系與班級關(guān)系模式合并,則只需在班級關(guān)系中加入教師關(guān)系的碼,即職工號: 班級:(班級號,學(xué)生人數(shù),職工號) (3)“管理”聯(lián)系與教師關(guān)系模式合并,則只需在教師關(guān)系中加入班級關(guān)系的碼,即班級號: 教師:(職工號,姓名,性別,職稱,班級號, 是否為優(yōu)秀班主任),2006年4月12日,96,注意: 從理論上講,1:1聯(lián)系可以與任意一端對應(yīng)的關(guān)系模式合并。 但在一些情況下,與不同的關(guān)系模式合并效率會大不一樣。因此究竟應(yīng)該與哪端的關(guān)系模式合并需要依應(yīng)用的具體情況而定。 由于連接操作是最費(fèi)時的操作,所以一般應(yīng)以盡量減少連接操作為目標(biāo)。 例如,如果經(jīng)常要查詢某個班級的班主任姓名,則將管理聯(lián)系與教師關(guān)系合并更好些。,2006年4月12日,97,E-R圖向關(guān)系模型的轉(zhuǎn)換原則5, 三個或三個以上實(shí)體間的一個多元聯(lián)系轉(zhuǎn)換為一個關(guān)系模式。 關(guān)系的屬性:與該多元聯(lián)系相連的各實(shí)體的碼以及聯(lián)系本身的屬性 關(guān)系的碼:各實(shí)體碼的組合 例,“講授”聯(lián)系是一個三元聯(lián)系,可以將它轉(zhuǎn)換為如下關(guān)系模式,其中課程號、職工號和書號為關(guān)系的組合碼: 講授(課程號,職工號,書號),2006年4月12日,98,E-R圖向關(guān)系模型的轉(zhuǎn)換原則6, 同一實(shí)體集的實(shí)體間的聯(lián)系,即自聯(lián)系,也可按上述1:1、1:n和m:n三種情況分別處理。 例,如果教師實(shí)體集內(nèi)部存在領(lǐng)導(dǎo)與被領(lǐng)導(dǎo)的1:n自聯(lián)系,我們可以將該聯(lián)系與教師實(shí)體合并,這時主碼職工號將多次出現(xiàn),但作用不同,可用不同的屬性名加以區(qū)分: 教師:職工號,姓名,性別,職稱,系主任,2006年4月12日,99,E-R圖向關(guān)系模型的轉(zhuǎn)換原則7, 具有相同碼的關(guān)系模式可合并。 目的:減少系統(tǒng)中的關(guān)系個數(shù)。 合并方法:將其中一個關(guān)系模式的全部屬性加入到另一個關(guān)系模式中,然后去掉其中的同義屬性(可能同名也可能不同名),并適當(dāng)調(diào)整屬性的次序。 例,“性別”關(guān)系模式: 性別(學(xué)號,性別) 與學(xué)生關(guān)系模式: 學(xué)生(學(xué)號,姓名,出生日期,所在系,年級, 班級號,平均成績) 都以學(xué)號為碼,可以將它們合并為一個關(guān)系模式: 學(xué)生(學(xué)號,姓名,性別,出生日期,所在系, 年級,班級號,平均成績),2006年4月12日,100,實(shí)例 按照上述七條原則,學(xué)生管理子系統(tǒng)中的18個實(shí)體和聯(lián)系可以轉(zhuǎn)換為下列關(guān)系模型: 學(xué)生(學(xué)號,姓名,性別,出生日期,所在系, 年級,班級號,平均成績,檔案號) 宿舍樓(宿舍樓號,性別) 住宿(學(xué)號,宿舍編號) 宿舍(宿舍編號,宿舍樓號,地址,性別,人數(shù)) 班級(班級號,學(xué)生人數(shù)) 教師(職工號,姓名,性別,職稱,班級號, 是否為優(yōu)秀班主任) 指導(dǎo)(職工號,學(xué)號) 課程(課程號,課程名,學(xué)分,教室號) 選修(學(xué)號,課程號,成績) 教科書(書號,書名,價錢) 教室(教室編號,地址,容量) 講授(課程號,教師號,書號) 檔案材料(檔案號,) 。 。,2006年4月12日,101,E-R圖向關(guān)系模型的轉(zhuǎn)換(續(xù)),該關(guān)系模型由12個關(guān)系模式組成。 其中: 學(xué)生關(guān)系模式包含了“擁有”聯(lián)系、“組成”聯(lián)系、“歸檔”聯(lián)系所對應(yīng)的關(guān)系模式 教師關(guān)系模式包含了“管理”聯(lián)系所對應(yīng)的關(guān)系模式; 宿舍關(guān)系模式包含了“住宿”聯(lián)系所對應(yīng)的關(guān)系模式; 課程關(guān)系模式包含了“開設(shè)”聯(lián)系所對應(yīng)的關(guān)系模式。,2006年4月12日,102,ER圖轉(zhuǎn)換成關(guān)系模式集的規(guī)則,將每個實(shí)體類型轉(zhuǎn)換成一個關(guān)系模式,實(shí)體的屬性即為關(guān)系模式的屬性,實(shí)體標(biāo)識符即為關(guān)系模式的鍵 二元聯(lián)系類型的轉(zhuǎn)換 若實(shí)體間聯(lián)系是1:1,可以在兩個實(shí)體類型轉(zhuǎn)換成的兩個關(guān)系模式中任意一個關(guān)系模式的屬性中加入另一個關(guān)系模式的鍵和聯(lián)系類型的屬性。 若實(shí)體間聯(lián)系是1:N,則在N端實(shí)體類型轉(zhuǎn)換成的關(guān)系模式中加入1端實(shí)體類型的鍵和聯(lián)系類型的屬性。 若實(shí)體間聯(lián)系是M:N,則將聯(lián)系類型也轉(zhuǎn)換成關(guān)系模式,其屬性為兩端實(shí)體類型的鍵加上聯(lián)系類型的屬性,而鍵為兩端實(shí)體鍵的組合 一元聯(lián)系類型的轉(zhuǎn)換:同二元聯(lián)系 三元聯(lián)系類型的轉(zhuǎn)換 總是將三元聯(lián)系類型轉(zhuǎn)換成關(guān)系模式,其屬性為三端實(shí)體類型的鍵加上聯(lián)系類型的屬性,而鍵為三端實(shí)體鍵的組合。,2006年4月12日,103,ER模型到關(guān)系模型的轉(zhuǎn)換實(shí)例,2006年4月12日,104,ER模型到關(guān)系模型的轉(zhuǎn)換實(shí)例,零件,零件號,零件名,規(guī)格,數(shù)量,組成,M,N,M,N,P,零件(零件號,零件名,規(guī)格) 組成(零件號,子零件號,數(shù)量),倉庫(倉庫號,倉庫名,地址) 商店(商店號,商店名) 商品(商品號,商品名) 進(jìn)貨(商店號,商品名,倉庫號,日期,數(shù)量),2006年4月12日,105,采用ER方法的邏輯設(shè)計(jì)步驟,2006年4月12日,106,例1 庫存銷售信息管理系統(tǒng)的ER模型及轉(zhuǎn)換,庫存系統(tǒng)ER圖,車間(車間號,車間名,主任名) 產(chǎn)品(產(chǎn)品號,產(chǎn)品名,單價) 倉位(倉位號,地址,主任名) 客戶(客戶號,客戶名,聯(lián)系人,電話, 地址,稅號,賬號) 銷售員(銷售員號,姓名,性別,學(xué)歷,業(yè)績),實(shí)體,入庫(入庫單號,入庫量,入庫日期,經(jīng)手人, 車間號,倉位號,產(chǎn)品名) 出庫(出庫單號,出庫量,出庫日期,經(jīng)手人, 客戶號,產(chǎn)品名,倉位號) 訂單(訂單號,數(shù)量,折扣,總價,訂單日期, 產(chǎn)品號,客戶號,銷售員號) 存儲(倉位號,產(chǎn)品號,核對日期,核對員,存儲量),聯(lián)系,2006年4月12日,107,例2:公司車隊(duì)信息系統(tǒng)的ER模型,2006年4月12日,108,1、 弱實(shí)體,什么是弱實(shí)體 弱實(shí)體的表示方法 包含弱實(shí)體的ER圖轉(zhuǎn)換成關(guān)系模式,ER模型的擴(kuò)充,2006年4月12日,109,2 子類實(shí)體與超類實(shí)體,什么是子類和超類 子類和超類的性質(zhì) 子類與超類之間具有繼承性,但子類本身還能包含比超類更多的屬性。 子類和超類有相同的標(biāo)識符,人員,教師,本科生,學(xué)生,研究生,學(xué)校人事系統(tǒng)中實(shí)體之間的聯(lián)系,人員(身份證號,姓名,年齡,性別) 教師(身份證號,教師編號,職稱) 學(xué)生(身份證號,學(xué)號,系別,專業(yè)) 本科生(身份證號,入學(xué)年份) 研究生(身份證號,研究方向,導(dǎo)師姓名),對應(yīng)的關(guān)系模式,2006年4月12日,110,6.4.2 向特定DBMS規(guī)定的模型進(jìn)行轉(zhuǎn)換,一般的數(shù)據(jù)模型還需要向特定DBMS規(guī)定的模型進(jìn)行轉(zhuǎn)換。 轉(zhuǎn)換的主要依據(jù)是所選用的DBMS的功能及限制。沒有通用規(guī)則。 對于關(guān)系模型來說,這種轉(zhuǎn)換通常都比較簡單。,2006年4月12日,111,6.4.3 數(shù)據(jù)模型的優(yōu)化,數(shù)據(jù)庫邏輯設(shè)計(jì)的結(jié)果不是唯一的。 得到初步數(shù)據(jù)模型后,還應(yīng)該適當(dāng)?shù)匦薷?、調(diào)整數(shù)據(jù)模型的結(jié)構(gòu),以進(jìn)一步提高數(shù)據(jù)庫應(yīng)用系統(tǒng)的性能,這就是數(shù)據(jù)模型的優(yōu)化。 關(guān)系數(shù)據(jù)模型的優(yōu)化通常以規(guī)范化理論為指導(dǎo)。,2006年4月12日,112,優(yōu)化數(shù)據(jù)模型的方法, 確定數(shù)據(jù)依賴 按需求分析階段所得到的語義,分別寫出每個關(guān)系模式內(nèi)部各屬性之間的數(shù)據(jù)依賴以及不同關(guān)系模式屬性之間數(shù)據(jù)依賴。 例,課程關(guān)系模式內(nèi)部存在 下列數(shù)據(jù)依賴: 課程號課程名 課程號學(xué)分 課程號教室號 選修關(guān)系模式中存在 下列數(shù)據(jù)依賴: (學(xué)號,課程號)成績,學(xué)生關(guān)系模式中存在 下列數(shù)據(jù)依賴: 學(xué)號姓名 學(xué)號性別 學(xué)號出生日期 學(xué)號所在系 學(xué)號年級 學(xué)號班級號 學(xué)號平均成績 學(xué)號檔案號,學(xué)生關(guān)系模式的學(xué)號與選修關(guān)系 模式的學(xué)號之間存在數(shù)據(jù)依賴: 學(xué)生.學(xué)號選修.學(xué)號,2006年4月12日,113,數(shù)據(jù)模型的優(yōu)化(續(xù)), 對于各個關(guān)系模式之間的數(shù)據(jù)依賴進(jìn)行極小化處理,消除冗余的聯(lián)系。 按照數(shù)據(jù)依賴的理論對關(guān)系模式逐一進(jìn)行分析,考查是否存在部分函數(shù)依賴、傳遞函數(shù)依賴、多值依賴等,確定各關(guān)系模式分別屬于第幾范式。 例如經(jīng)過分析可知,課程關(guān)系模式屬于BC范式。 按照需求分析階段得到的各種應(yīng)用對數(shù)據(jù)處理的要求,分析對于這樣的應(yīng)用環(huán)境這些模式是否合適,確定是否要對它們進(jìn)行合并或分解。,2006年4月12日,114,數(shù)據(jù)模型的優(yōu)化(續(xù)),并不是規(guī)范化程度越高的關(guān)系就越優(yōu)。 當(dāng)一個應(yīng)用的查詢中經(jīng)常涉及到兩個或多個關(guān)系模式的屬性時,系統(tǒng)必須經(jīng)常地進(jìn)行聯(lián)接運(yùn)算,而聯(lián)系運(yùn)算的代價是相當(dāng)高的,可以說關(guān)系模型低效的主要原因就是做聯(lián)接運(yùn)算引起的,因此在這種情況下,第二范式甚至第一范式也許是最好的。 非BCNF的關(guān)系模式雖然從理論上分析會存在不同程度的更新異常,但如果在實(shí)際應(yīng)用中對此關(guān)系模式只是查詢,并不執(zhí)行更新操作,則就不會產(chǎn)生實(shí)際影響。 對于一個具體應(yīng)用來說,到底規(guī)范化進(jìn)行到什么程度,需要權(quán)衡響應(yīng)時間和潛在問題兩者的利弊才能決定。一般說來,第三范式就足夠了。,2006年4月12日,115,例:在關(guān)系模式 學(xué)生成績單(學(xué)號,英語,數(shù)學(xué),語文,平均成績) 中存在下列函數(shù)依賴: 學(xué)號英語 學(xué)號數(shù)學(xué) 學(xué)號語文 學(xué)號平均成績 (英語, 數(shù)學(xué), 語文)平均成績 顯然有: 學(xué)號(英語,數(shù)學(xué),語文) 因此該關(guān)系模式中存在傳遞函數(shù)信賴,是2NF關(guān)系。 雖然平均成績可以由其他屬性推算出來,但如果應(yīng)用中需要經(jīng)常查詢學(xué)生的平均成績,為提高效率,我們?nèi)匀豢杀A粼撊哂鄶?shù)據(jù),對關(guān)系模式不再做進(jìn)一步分解。,2006年4月12日,116,數(shù)據(jù)模型的優(yōu)化(續(xù)), 按照需求分析階段得到的各種應(yīng)用對數(shù)據(jù)處理的要求,對關(guān)系模式進(jìn)行必要的分解或合并,以提高數(shù)據(jù)操作的效率和存儲空間的利用率 常用分解方法 水平分解 垂直分解,2006年4月12日,117,什么是水平分解? 把(基本)關(guān)系的元組分為若干子集合,定義每個子集合為一個子關(guān)系,以提高系統(tǒng)的效率。 水平分解的適用范圍 1. 滿足“80/20原則”的應(yīng)用 80/20原則:一個大關(guān)系中,經(jīng)常被使用的數(shù)據(jù)只是關(guān)系的一部分,約20% 把經(jīng)常使用的數(shù)據(jù)分解出來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論