




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、本文概述了 SQL Server 2005 Beta 2 中“商務智能”平臺的增強功能。本文并非實施指南,而是為讀者提供了關于“商務智能”平臺增強功能的信息。一、簡介 Microsoft SQL Server 2005 是一個完整的商務智能 (BI) 平臺,其中為用戶提供了可用于構建典型和創(chuàng)新的分析應用程序所需的各種特性、工具和功能。本文簡要介紹了您在構建分析應用程序時將要用到的一些工具,并著重介紹了一些新增功能,這些新增功能使復雜 BI 系統(tǒng)的構建和管理比以往更加輕松。下表概述了商務智能系統(tǒng)的組件,以及與之相應的 Microsoft SQL Server 2000 和 SQL Server
2、2005 組件。組件SQL Server 2000SQL Server 2005提取、轉換和加載數(shù)據(jù)轉換服務 (DTS)數(shù)據(jù)轉換服務 (DTS)關系數(shù)據(jù)倉庫SQL Server 2000 關系數(shù)據(jù)庫SQL Server 2005 關系數(shù)據(jù)庫多維數(shù)據(jù)庫SQL 2000 Analysis ServicesSQL 2005 Analysis Services數(shù)據(jù)挖掘SQL 2000 Analysis ServicesSQL 2005 Analysis Services托管報告SQL 2000 Reporting ServicesSQL 2005 Reporting Services特殊查詢和分析Of
3、fice(Excel、Office Web Components、Data Analyzer、Sharepoint Portal)Office(Excel、Office Web Components、Data Analyzer、Sharepoint Portal)數(shù)據(jù)庫開發(fā)工具SQL 2000 企業(yè)管理器、分析管理器、查詢分析器以及各種其他工具SQL 2005 Business Intelligence Development Studio (新增?。?shù)據(jù)庫管理工具企業(yè)管理器、分析管理器SQL 2005 Management Studio(新增?。㏒QL Server 2005 新增了兩個組件
4、:SQL Server Management Studio 和 SQL Server Business Intelligence Development Studio。其他主要的 BI 組件DTS、Analysis Services OLAP、Analysis Services Data Mining 和 Reporting Services在 SQL Server 2005 中得到了改進,與以前有很大的不同。SQL Server 2005 關系數(shù)據(jù)庫包含一些重要的新增功能。雖然 Microsoft Office 查詢和門戶工具并沒有包含在 SQL Server 中,但當前的發(fā)行版本力爭在 S
5、QL Server 2005 之前實現(xiàn)這一功能。Office 工具的 BI 功能將在 Office 產品發(fā)行周期內將得到逐步實現(xiàn)。SQL Server 2005 Business Intelligence 工具集提供了一種端到端的 BI 應用程序集成:設計:Business Intelligence Development Studio 是第一款專門為商務智能系統(tǒng)開發(fā)人員設計的集成開發(fā)環(huán)境。Business Intelligence Development Studio 構建于 Visual Studio 2005 技術之上,它為 BI 系統(tǒng)開發(fā)人員提供了一個豐富、完整的專業(yè)開發(fā)平臺。調試、源
6、代碼控制以及腳本和代碼的開發(fā)均可用于所有的 BI 應用程序組件。合成:“數(shù)據(jù)轉換服務”已被重新編寫,現(xiàn)在的 DTS 可以高速執(zhí)行超大數(shù)據(jù)量的復雜數(shù)據(jù)集成、轉換和合成。Business Intelligence Development Studio 使程序包的構建和調試變得更加生動有趣。DTS、Analysis Services 和 Reporting Services 共同提供了一個源自異類源的無縫數(shù)據(jù)視圖。存儲:在 SQL Server 2005 中,關系數(shù)據(jù)庫和多維數(shù)據(jù)庫之間的界限變得更加模糊。您可以將數(shù)據(jù)庫存儲在關系數(shù)據(jù)庫、多維數(shù)據(jù)庫中,或使用新增的“主動緩存”功能,充分利用兩種數(shù)據(jù)庫各
7、自的優(yōu)點。分析:一直以來,Microsoft 的數(shù)據(jù)挖掘都十分簡單易用?,F(xiàn)在結合了其他的重要新算法(包括關聯(lián)規(guī)則、時間序列、回歸樹、序列群集、神經(jīng)網(wǎng)絡和貝葉斯算法),使得這一功能更加完美。而在 Analysis Services 多維數(shù)據(jù)集中也添加了一些重要的新增功能:關鍵績效指標框架、MDX 腳本,以及其他的內置高級業(yè)務分析方法。Reporting Services 報告提交和管理框架使得復雜的分析方法更易于向最廣泛的潛在受眾分發(fā)。交付:Reporting Services 將 Microsoft Business Intelligence 平臺的用戶群體延伸至那些需要使用分析功能的商務用戶
8、。Reporting Services 是一種企業(yè)托管報告環(huán)境,通過 web 服務進行嵌入和管理。您可以用大量的交互和打印選項,以各種不同的格式,個性化設置和提交報告。通過將報告以數(shù)據(jù)源的形式分發(fā)至下游商務智能,復雜分析可以覆蓋更廣泛的受眾。Microsoft 及其合作伙伴的特殊查詢和分析工具將繼續(xù)承擔在 Analysis Services 和關系數(shù)據(jù)庫中訪問數(shù)據(jù)的常用工具角色。管理:SQL Server Management Studio 集成了對 SQL Server 2005 所有組件的管理。Business Intelligence 從業(yè)者都將得益于 Microsoft 服務器“能力”
9、擴展這一用戶盼望已久的功能增強,即從關系引擎(伸縮性、可靠性、可用性、可編程性等)擴展為全套的 BI 平臺組件。SQL Server 2005 Business Intelligence 組件的主要目標是支持在各種規(guī)模的企業(yè)中開發(fā)和使用商務智能,并使其能夠供所有員工使用,不僅包括管理層和分析師,還包括操作人員和外部委托人。就此目標而言,SQL Server 2005 具有完整、集成、易用的特點,它以 web 服務的形式發(fā)布數(shù)據(jù),而且僅通過日常硬件便可提供極佳的性能,另外它還包含許多新增功能,您可以使用這些新增功能開發(fā)創(chuàng)新的分析應用程序。 二、SQL Server2005 Beta 2 入門在安
10、裝 SQL Server 2005 時,第一點要注意的就是它的集成安裝體驗。您不再需要為某些功能(如 Analysis Services)而分別運行安裝程序。如果某個功能(如 Reporting Services)不可安裝,則說明您的計算機不滿足該功能的安裝要求。您可以查看說明文件以獲得有關功能必要條件的完整討論。在大多數(shù)配置得當?shù)臋C器上,安裝過程中應接受所有默認設置,安裝所有的主要功能:SQL Server 關系數(shù)據(jù)庫引擎DTSAnalysis ServicesReporting ServicesSQL Server Management Studio(數(shù)據(jù)庫管理工具集)Business I
11、ntelligence Development Studio(BI 應用程序開發(fā)工具集)Reporting Services要求在機器上安裝并妥善配置IIS。由于Reporting Services 是2005 Business Intelligence功能組的一個重要組成部分,我們強烈建議您花費一定的時間執(zhí)行這些配置和安裝步驟。熟悉Analysis Services的客戶可能會因缺少Analysis Services元數(shù)據(jù)倉庫而感到迷惑。在SQL Server 2000中,Analysis Services倉庫被作為Access數(shù)據(jù)庫發(fā)行。Analysis Services 2005不包含元
12、數(shù)據(jù)倉庫。相反,Analysis Services數(shù)據(jù)庫元數(shù)據(jù)信息被存儲為XML文件格式,由 Analysis Services 進行管理。如果需要,還可以將這些 XML 文件放置在源代碼控制之下。我們建議您使用Business Intelligence Development Studio 進行開發(fā),同時使用SQL Server Management Studio來操作和維護BI數(shù)據(jù)庫對象。雖然您能夠在 SQL Server Management Studio中設置DTS包以及Analysis Services多維數(shù)據(jù)集和數(shù)據(jù)挖掘模型,但Business Intelligence Devel
13、opment Studio卻為設計和調試BI應用程序提供了更好的體驗。對于Beta 2而言,建議您從掌握新的應用程序入手,因為與升級現(xiàn)有DTS包或 Analysis Services數(shù)據(jù)庫相比,這樣可以學到更多東西。如果您已有一個可用的包或數(shù)據(jù)庫,您會發(fā)現(xiàn)“重新創(chuàng)建”現(xiàn)有的包或數(shù)據(jù)會十分有用。在您熟悉了這些新增工具、功能和概念之后,便可試著升級現(xiàn)有對象。許多客戶都借助SQL Server工具,使用熟悉的來自一個或多個源系統(tǒng)的商務智能結構來開發(fā)新的系統(tǒng),使用DTS填充維度關系型數(shù)據(jù)倉庫,然后再用數(shù)據(jù)倉庫來填充 Analysis Services數(shù)據(jù)庫。但是SQL Server 2005提供了許多
14、選項,通過消除或淡化不同的組件使其背離了這種一般化設計。三、關系型數(shù)據(jù)倉庫SQL Server 2005關系數(shù)據(jù)庫引擎包含一些對數(shù)據(jù)倉庫樣式應用程序設計和維護大有幫助的功能。這些功能包括:對于超大型的表而言,表分區(qū)可提高數(shù)據(jù)的加載速度,并簡化維護過程輕松創(chuàng)建報告服務器Transact-SQL方面的改進包括新增的數(shù)據(jù)類型和新增的分析功能聯(lián)機索引操作細化備份/還原操作快速初始化文件報告服務器要想將關系操作報告從事務處理數(shù)據(jù)庫中分離出來,經(jīng)常采用的一項技術便是維護一臺報告服務器。報告服務器對事務處理數(shù)據(jù)庫映像的維護一般都有一定的時間延遲,通常截止到前一天。報告服務器多用于報告功能和數(shù)據(jù)倉庫提取。 M
15、icrosoft SQL Server 2005新增了兩項功能,使報告服務器的創(chuàng)建和維護過程變得更加簡單。SQL Server報告服務器的延遲時間與以前相比大大縮短。同時,報告服務器被設計為充當事務處理系統(tǒng)的備選系統(tǒng)。要創(chuàng)建報告服務器,先要創(chuàng)建一個數(shù)據(jù)庫鏡像,這是SQL Server 2005的新增功能,它為系統(tǒng)的高可用性提供了一個緊急備用系統(tǒng)。更多信息,請閱讀聯(lián)機叢書的“數(shù)據(jù)庫鏡像概念”主題。數(shù)據(jù)庫鏡像不能夠直接查詢,這時第二個新增功能就能派上用場了。 在鏡像上創(chuàng)建一個數(shù)據(jù)庫視圖。數(shù)據(jù)庫視圖是數(shù)據(jù)庫在某個時點的只讀副本。數(shù)據(jù)庫視圖并非數(shù)據(jù)庫的完整副本;極為節(jié)省空間。多個數(shù)據(jù)庫視圖還是可以同時
16、共存,雖然維護數(shù)據(jù)庫視圖會對數(shù)據(jù)庫視圖所基于的事務處理數(shù)據(jù)庫產生一定的影響。更多信息,請閱讀聯(lián)機叢書的“了解數(shù)據(jù)庫視圖”主題。通過在數(shù)據(jù)庫鏡像上創(chuàng)建數(shù)據(jù)庫視圖,您可輕松為系統(tǒng)的高可用性創(chuàng)建備用服務器,此服務器還可用作報告服務器,起著雙重作用。表分區(qū) 分區(qū)表和分區(qū)索引將數(shù)據(jù)分割到多個水平單元中,以便于將行組映射到單獨的分區(qū)中。而對數(shù)據(jù)執(zhí)行操作(如查詢)時,又可以將整個表或索引作為一個整體來執(zhí)行。分區(qū)可以: 改善數(shù)據(jù)表和索引的可管理性改善多CPU機器上的查詢性能在關系型數(shù)據(jù)倉庫中,事實數(shù)據(jù)表比較適合應用表分區(qū),而按日期范圍分區(qū)又是最常見的分區(qū)策略。 正如聯(lián)機從書的“創(chuàng)建分區(qū)表和索引”主題中所描述的
17、,定義分區(qū)表可分為三個步驟:創(chuàng)建一個分區(qū)函數(shù),指定使用此函數(shù)的表如何分區(qū)創(chuàng)建一個分區(qū)方案,指定應用此分區(qū)函數(shù)的分區(qū)在文件組上的位置使用此分區(qū)方案創(chuàng)建一個表或索引多個表可以使用同一個分區(qū)方案。本文討論了事實數(shù)據(jù)表的“范圍”分區(qū),但其目的并非是針對表分區(qū)的完整討論或教程。有興趣的讀者請參閱SQL Server聯(lián)機叢書。最常用的分區(qū)方案是按日期范圍(如年、季、月或甚至天)對事實數(shù)據(jù)表進行分區(qū)。在大多數(shù)情況下,對大型事實數(shù)據(jù)表進行日期分區(qū)可以提供良好的可管理性收益。為了改善查詢性能,應盡量使用相同的分區(qū)方案對時間維度表進行分區(qū)。分區(qū)表和未分區(qū)表的行為方式相同針對表的查詢能夠得到正確解析針對表的直接插入
18、、更新和刪除會被自動解析到適當?shù)姆謪^(qū)使用數(shù)據(jù)表分區(qū)可實現(xiàn)快速加載數(shù)據(jù)許多數(shù)據(jù)倉庫應用程序都力求在越來越小的加載窗口中加載越來越多的數(shù)據(jù)量。典型的流程是這樣的,先從幾個源系統(tǒng)中提取數(shù)據(jù)開始,接下來便是在這些系統(tǒng)間清理、轉換、合成和合理化數(shù)據(jù)。數(shù)據(jù)管理應用程序被限制為在加載窗口中完成整個提取、轉換和加載流程。通常系統(tǒng)的業(yè)務用戶都強烈要求將數(shù)據(jù)倉庫查詢時的不可用時間降至最低。在設計時,數(shù)據(jù)管理應用程序的“寫入”步驟(即將新數(shù)據(jù)插入到現(xiàn)有數(shù)據(jù)倉庫的步驟)必須在短時間內完成,且要最小化對用戶造成的影響。為了非??焖俚丶虞d數(shù)據(jù),數(shù)據(jù)庫恢復模型必須為“批量記錄”恢復模式或“簡單”恢復模式,而數(shù)據(jù)表必須為空,
19、或是包含數(shù)據(jù)但不包含索引。如果滿足這些條件,不作記錄的加載便成為可能。在SQL Server 2000中,分區(qū)表出現(xiàn)以前,這些條件通常只在初始歷史數(shù)據(jù)倉庫加載中才能滿足。一些具有大型數(shù)據(jù)倉庫的客戶已通過在分散的物理表上搭建UNION ALL視圖,構建了一個準分區(qū)結構;這些數(shù)據(jù)表都使用不記錄技術填充每個加載周期。這一方法并不盡如人意,而SQL Server 2005分區(qū)表則提供了更為優(yōu)秀的功能。在 SQL Server 2005中,您不能直接在分區(qū)中執(zhí)行不記錄加載。但是,卻可以將數(shù)據(jù)加載到將調用偽分區(qū)的單獨表中。在特定條件下,您可以用執(zhí)行速度極快的元數(shù)據(jù)操作將偽分區(qū)切換到分區(qū)表中。此技術可滿足我
20、們的兩個要求:最小化整體加載時間:在不作記錄的情況下執(zhí)行偽分區(qū)加載最小化對最終用戶的影響,并確保數(shù)據(jù)倉庫的完整性:偽分區(qū)可以在用戶查詢數(shù)據(jù)倉庫時被加載。在執(zhí)行分區(qū)切換之前,數(shù)據(jù)管理應用程序會等到所有事實數(shù)據(jù)表全部加載完畢為止。分區(qū)切換的執(zhí)行速度非???,反應時間通常不到一秒。 此外,偽分區(qū)還可作為單獨的表進行備份,從而改善系統(tǒng)的可管理性。使用表分區(qū)快速刪除數(shù)據(jù)許多數(shù)據(jù)倉庫在數(shù)據(jù)倉庫中保留了一個詳細活動數(shù)據(jù)的滑動窗口。例如,事實數(shù)據(jù)表可能包含三年、五年或十年的數(shù)據(jù)。每到一個時間周期,便從數(shù)據(jù)表中刪除最舊的數(shù)據(jù)。持續(xù)刪除數(shù)據(jù)的主要原因在于要提高查詢性能并最小化存儲成本。SQL Server 2005
21、分區(qū)使大型分區(qū)事實數(shù)據(jù)表中舊數(shù)據(jù)的刪除倍加輕松。如上所述,簡單地創(chuàng)建一個空白偽分區(qū),然后將其切換到分區(qū)表中。分區(qū)表在其曾植入分區(qū)的地方有一個空白分區(qū);偽分區(qū)在其曾為空白的地方包含數(shù)據(jù)。用戶可以根據(jù)需要對偽分區(qū)進行適當?shù)膫浞?、截斷或刪除。或者,您還可以選擇重新定義分區(qū)函數(shù),將所有空白分區(qū)合并到一個分區(qū)中。Transact-SQL方面的改進新的數(shù)據(jù)類型 SQL Server 2005 中有一些很重要的新類型,這些類型對數(shù)據(jù)倉庫大有裨益:Varchar(max)、nvarchar(max)和varbinary(max)支持2GB的數(shù)據(jù),對于text、ntext和 image數(shù)據(jù)類型非常有用。這些擴展
22、的字符類型可能對在數(shù)據(jù)倉庫中保存擴展的元數(shù)據(jù)和其他說明性信息非常有用。新的分析功能許多新分析功能都提供了Transact-SQL中的基本分析功能。這些功能在那些允許用戶查詢關系數(shù)據(jù)庫,而不是通過Analysis Services排他查詢數(shù)據(jù)的數(shù)據(jù)倉庫中非常有用。另外,在數(shù)據(jù)中轉過程中,這些復雜的計算常被用來開發(fā)有價值的數(shù)據(jù)屬性。ROW_NUMBER返回結果集的連續(xù)行號。RANK:返回行在結果集中的等級。在通常情況下,RANK 值與有序數(shù)據(jù)集上的 ROW_NUMBER值相同。但對于那些彼此之間有關聯(lián)的行來說,則是所有具有相同排序值的行都有相同的等級。而下一個等級則又與ROW_NUMBER值相同。
23、換句話說,如果在第一個位置存在雙向關聯(lián),那么行1和行2的RANK就都為 1,而行3的 RANK 則為 3。不存在RANK為2的行。DENSE_RANK:返回行在結果集中的等級。DENSE_RANK 函數(shù)與RANK相似,只是去除了RANK函數(shù)所留下的空隙。在上面的示例中,行1和行2的RANK為1,而行 3的RANK 則為2。NTILE:將有序集分成指定數(shù)量、大小近似相等的組在SQL Server 2005 Beta2中還不能使用這些函數(shù)。PIVOT和UNPIVOT操作符PIVOT操作符可以按查詢中的中斷值旋轉結果集,從而使您可以生成交叉數(shù)據(jù)報告。例如,如果表中在兩個不同的行中包含"Ac
24、tuals"和"Budgets"數(shù)據(jù),則使用PIVOT操作符將可以生成帶有Actuals和Budgets列的交叉數(shù)據(jù)報告。與之相似,UNPIVOT操作符可以將一行拆分為若干行。在此示例中,帶有Actuals 和Budgets列的行集可以被轉換為包含這些值的多個行。在以前的SQL Server版本中,用戶能夠編寫復雜的Transact-SQL SELECT語句來旋轉數(shù)據(jù)。PIVOT和UNPIVOT操作符則為數(shù)據(jù)旋轉提供了更為簡單的機制。遞歸查詢在許多方案中“遞歸查詢”都是非常有用的。SQL Server 2005中的新增功能令遞歸查詢成為可能,雖然此項功能還不是十分
25、簡單易用。遞歸查詢是針對自聯(lián)接表的查詢。自聯(lián)接表的兩個常見示例有保存員工及其經(jīng)理信息的數(shù)據(jù)表和保存材料清單的數(shù)據(jù)表。在AdventureWorks數(shù)據(jù)庫的Employee表中對自聯(lián)接數(shù)據(jù)表進行了說明。查詢自聯(lián)接表的直接關系通常十分簡單,如查詢直接向經(jīng)理報告的員工數(shù)量。但是,如果要回答“經(jīng)理的組織中有多少名員工?”這樣一個問題卻十分困難。SQL Server 2005中的關系數(shù)據(jù)庫功能解決了這一問題,這一功能被稱為“遞歸通用表表達式”?!案戒洝敝邪粋€遞歸查詢的示例,該示例回答了以上定義的問題。聯(lián)機叢書的"WITH <common_table_expression>&qu
26、ot;主題中包含更多的相關信息。四、提取、轉換和加載 (ETL)數(shù)據(jù)轉換服務(DTS) 對于SQL Server 2005而言,是一項全新的技術。DTS是SQL Server 2000中很受歡迎的一項功能,但DTS 2005已被重新設計成企業(yè)ETL平臺。DTS 為構建企業(yè)級ETL 應用程序提供了大量必需的功能,以及非常高的擴展性能。DTS是完全可編程的、嵌入式的、可擴展的所有這些特性都使它成為理想的ETL平臺。下表總結了DTS 2005的這些功能。有關ETL系統(tǒng)開發(fā)DTS適用性更加完整的討論,請參閱SQL Server聯(lián)機叢書。包開發(fā)SQL Server 2005的DTS功能企業(yè) ETL 開發(fā)
27、 ETL 平臺使用Business Intelligence Development Studio圖形用戶界面設計數(shù)據(jù)管理應用程序的DTS包。DTS包的設計、開發(fā)和調試均在Business Intelligence Development Studio中完成,您只需從工具欄拖動任務、為其設置屬性并將任務與優(yōu)先約束相連接便可完成這一切。 使用SQL Server Management Studio向導開發(fā)執(zhí)行常規(guī)任務(如“復制數(shù)據(jù)庫”)的簡單DTS包。 軟件供應商將在其產品中嵌入DTS功能,構建按需生成自定義包的向導。 將控制流從數(shù)據(jù)流中分離出來。大多數(shù)的DTS包都包含多個控制流任務,以及循環(huán)任
28、務或順序任務,這些任務都被放置在控制流窗格中??刂迫蝿眨ü艿廊蝿眨┦前墓ぷ鲃恿Γ鼡碛凶约旱脑O計表面,可用于布置數(shù)據(jù)流??刂屏骱蛿?shù)據(jù)流的分離使得程序更加容易讀取。 包變量是經(jīng)過定義且可見的。變量是受限制的,如受包、循環(huán)或任務的限制。 復雜的ETLM系統(tǒng)可以通過構建包網(wǎng)絡實現(xiàn),其中包含一個調用其他包的包。子包可以很好地重新使用邏輯、變量和上下文。DTS 2005與DTS 2000相比,對嵌套數(shù)據(jù)包的需求有所減少。 包配置框架是可擴展的系統(tǒng),可用于自定義包在不同環(huán)境中的運行方式。 DTS程序以XML格式存儲在文件系統(tǒng)或SQL Server中。DTS XML文件可受源代碼管理。 DTS 2000包
29、遷移向導可以幫助您將包遷移至DTS 2005,它還可以在出現(xiàn)升級問題的地方提供警告。 DTS 2000運行時包含在SQL Server 2005中,在不升級DTS 2000包的情況下,仍可運行。 包的操作和結果會以多種形式被記錄下來,分發(fā)給廣泛的提供程序。 事件處理程序邏輯只需定義一次,便可多次使用。 與WMI的集成表明包可以對外部事件(例如文件復制的完成)作出響應,或拋出可供其他進程使用的WMI事件。 包可重啟性與事務控制和故障檢查點一起,可以幫助管理員管理復雜的包,移動大量數(shù)據(jù)。 控制流SQL Server 2005的DTS功能企業(yè) ETL 開發(fā) ETL 平臺優(yōu)先約束:您可以設計一個包,以
30、在任務成功、失敗或完成時將控制傳遞給這些不同的任務。 循環(huán)任務包括 For、ForEach和Sequence循環(huán)。包開發(fā)人員可以在數(shù)據(jù)的所有(或一組)表上、目錄中的文件上或是Analysis Services多維數(shù)據(jù)集分區(qū)上輕松執(zhí)行一組操作。 Analysis Services集成是無縫的,它與自動執(zhí)行Analysis Services DDL的控制任務一起處理Analysis Services對象,或執(zhí)行數(shù)據(jù)挖掘查詢。正如下面所討論的,DTS管理還集成了Analysis Services。VB.NET腳本可與“腳本任務”一起使用。被稱為“ActiveX腳本任務”的第二個腳本任務主要用于向后兼
31、容DTS 2000。通信任務包括:消息隊列發(fā)送郵件其他控制流任務包括:大容量插入執(zhí)行包執(zhí)行進程執(zhí)行 SQL文件系統(tǒng)FTP 其他任務可以使用 DTS 對象模型輕松開發(fā)。 數(shù)據(jù)流 SQL Server 2005 的DTS功能企業(yè) ETL開發(fā)ETL 平臺在數(shù)據(jù)流管道中存在多個源、轉換和目的。只有在轉換完成時,數(shù)據(jù)才能被讀取、合并和操作,然后才能寫入。中轉表所需的多次寫入被削弱或消除;轉換性能得到極大提高。 “DTS 管道”任務使用來自多個異類數(shù)據(jù)源和本機的數(shù)據(jù)??蓴U展的“數(shù)據(jù)源”體系結構支持來自平面文件、OLEDB源(包括DB2和Oracle)和原始文件的數(shù)據(jù)。其他源,包括使用特殊結構化數(shù)據(jù)的源都在
32、計劃之內。 其他數(shù)據(jù)源可以由Microsoft及其合作伙伴輕松開發(fā)。 來自多個源的數(shù)據(jù)可以與聯(lián)接、查找和聯(lián)合操作符相聯(lián)接。這些操作都在內存中執(zhí)行,不需要對數(shù)據(jù)庫或文件執(zhí)行寫入操作。 數(shù)據(jù)流可以使用條件分離和多播轉換。類似編譯器的DTS引擎確定了可以平行操作哪些數(shù)據(jù)流。 大量基于行的數(shù)據(jù)轉換都是由字符映射、復制映射、數(shù)據(jù)轉換和派生列轉換所提供的。這些操作符更像是向導,而非轉換,它們提供了用戶所需的大部分數(shù)據(jù)轉換。 有些數(shù)據(jù)轉換任務需要對多個行中的數(shù)據(jù)進行比較。排序和聚合轉換可以在數(shù)據(jù)流中以極高的性能執(zhí)行這些操作,其性能遠非數(shù)據(jù)庫聚合可及。 有些數(shù)據(jù)轉換任務需要復雜邏輯,例如模糊匹配、模糊分組、時
33、間維度生成以及旋轉或反旋轉。其他常見任務(例如維度鍵管理)則需要多個步驟。特殊技術和向導使這些復雜技術可供所有用戶使用。 轉換后的數(shù)據(jù)可以寫入異類目標,其中包括SQL Server表、OLEDB數(shù)據(jù)庫表、平面文件以及原始文件。 轉換后的數(shù)據(jù)可以與Microsoft BI解決方案的其他組件集成,其中包括 Analysis Services數(shù)據(jù)庫和數(shù)據(jù)挖掘模型。 由轉換步驟所導致的錯誤流可以以多種方式進行管理: 進程內轉換可以“修復”數(shù)據(jù)并重新提交主要流錯誤流可以被記錄到表或文件中,以備脫機研究和重新提交。 其他轉換和目的可以由Microsoft及其合作伙伴輕松開發(fā)。 開發(fā)和調試 SQL Serv
34、er 2005 的 DTS 功能企業(yè) ETL 開發(fā) ETL 平臺包開發(fā)商可以在每個控制流任務中定義控制流斷點。在調試過程中,斷點可以定義在某些任務執(zhí)行點之前、之后,或定義在這些任務執(zhí)行點。 包開發(fā)商可以為數(shù)據(jù)流中的每個轉換附加一個數(shù)據(jù)查看器。在調試過程中,數(shù)據(jù)查看器會顯示在該點的轉換后數(shù)據(jù)流內容。 Business Intelligence Development Studio寄宿在Visual Studio中。腳本及其他編程任務可以充分利用該企業(yè)開發(fā)環(huán)境的優(yōu)點。 包開發(fā)可以幫助用戶將所有包組件(包括自定義腳本和可執(zhí)行程序)捆綁在一起,以用于發(fā)行測試、生產或其他客戶系統(tǒng)。 可供DTS 2000
35、開發(fā)人員使用的DTS 2005 DTS 2000用戶已經(jīng)開發(fā)出了一套執(zhí)行復雜操作的技巧。這些技巧,尤其是編寫自修改包,在DTS 2005中不再有用武之地。在DTS 2005中要使用變量和配置基礎結構來編寫動態(tài)包、不要再試圖編寫自修改包。配置良好的變量和配置基礎結構還可以減少創(chuàng)建復雜子包系統(tǒng)的需求。如果設計完善,單一包便可滿足多種需求;例如,單一包可以在多種不同配置中重復使用,以用來在維度數(shù)據(jù)倉庫中加載許多維度表。在DTS 2000中,一個復雜的DTS包網(wǎng)絡可能包括50-100個包;而在DTS 2005中,一個復雜的網(wǎng)絡可能只包含 10 個包。五、Analysis ServicesSQL Ser
36、ver 2000 Analysis Services由兩個主要的互補功能組成:聯(lián)機分析處理 (OLAP) 和數(shù)據(jù)挖掘。這兩個組件在Analysis Services 2005中仍然存在,并且是分析應用程序的基石。Analysis Services 2005 OLAP中的功能改進主要可以歸納為兩類改進:啟用了一些新的分析應用程序,而達到此目的做法便是添加全新的功能,或是使復雜功能的構建變得更加簡單。增強了分析應用程序的企業(yè)適應性新增功能或改進功能統(tǒng)一維度模型合并了關系數(shù)據(jù)模型和OLAP數(shù)據(jù)模型的最佳特征。后文將對統(tǒng)一維度模型進行更為詳細的討論。主動緩存使您可以用極低的成本操作低延遲時間的應用程序
37、。后文將對主動緩存進行更為詳細的討論。關鍵績效指標 (KPI) 框架為定義公司度量提供了一個基于服務器的簡單機制。KPI由值、目標、當前狀態(tài)和趨勢表達式組成,并通過諸如量尺和停車燈之類的簡單圖形顯示出來。翻譯為用戶提供了一個簡單的集中管理機制,使他們可以用自己喜歡的語言來存儲和顯示分析數(shù)據(jù)。一個分析數(shù)據(jù)庫可以用多種語言來顯示。MDX 腳本是用于定義“計算成員”、“命名集”和“單元計算”的新機制?!癕DX 腳本”的語法得到了簡化和改進;“MDX 腳本”可以分步調試?!癕DX 腳本”計算可以緩存和保留,這可以提供優(yōu)良的查詢性能,即使面對復雜計算也沒有問題?!癕DX 腳本”計算可以維護實時的動態(tài)計算
38、行為。 后文將對“MDX 腳本”進行更為詳細的討論。Analysis Services存儲過程允許您使用公共語言運行時編程語言(如 C+、VB或C)創(chuàng)建外部例程。存儲過程擴展了Analysis Services 2000用戶定義函數(shù)(UDF)所提供的功能。后文將對Analysis Services存儲過程進行更為詳細的討論。數(shù)據(jù)寫回增強使其性能較以前有了十倍的增長。分析應用程序可以將數(shù)據(jù)寫回到聚合單元中,然后再有選擇地執(zhí)行聚合數(shù)據(jù)到其底層葉數(shù)據(jù)的分配工作。內置的業(yè)務規(guī)則、工具和向導使艱難的設計變得簡單:半累積度量值時間智能帳戶智能財務聚合貨幣轉換時間維度生成數(shù)據(jù)源視圖提供了一種機制,既可以簡化
39、,又可以擴展分析應用程序底層的關系數(shù)據(jù)庫。后文將對“數(shù)據(jù)源視圖”進行更為詳細的討論。Analysis Services的數(shù)據(jù)定義語言是XML。Analysis Services元數(shù)據(jù)知識庫已經(jīng)沒有了,取而代之的是由Analysis Services服務器所存儲和管理的XML文件。Web 服務:XML for Analysis (XML/A)是基于標準的本機協(xié)議,其作用是與Analysis Services服務器進行通信。啟用了新型的應用程序,而且開發(fā)這些應用程序還十分簡單,這些應用程序將分析與操作實時集成在一起。將XML/A作為本機協(xié)議,便可以把Analysis Services客戶端配置為具
40、有零覆蓋范圍,且每臺服務器都自動成為一種web服務。具有小覆蓋范圍的Win32層可用于向后兼容與Analysis Services 2000一起使用的,用于OLAP、ADOMD和ADOMD.Net的OLE DB工具。許多客戶和開發(fā)人員將繼續(xù)使用ADOMD.Net對象模型來構建Analysis Services自定義應用程序。計算被集中在服務器端,與Analysis Services 2000不同,Analysis Services 2005在服務器端執(zhí)行所有計算,這樣做的優(yōu)點十分顯著:客戶端的占用空間為零;消除了客戶端緩存。復雜計算的查詢性能得到極大提高。實現(xiàn)這些改進的代價是使對最簡單查詢的查
41、詢性能有輕微的降低,因為這些查詢在 Analysis Services 2000中是在客戶端緩存中被解析的。開發(fā)和管理工具(Business Intelligence Development Studio和SQL Server Management Studio)是用于商務智能應用程序的第一款完整的開發(fā)環(huán)境。這些新工具可以幫助您捕獲和建模所有數(shù)據(jù),加快應用程序的開發(fā)速度。Analysis Services 2005對其權限模型作了改進。不同的角色和權限包括:服務器管理員數(shù)據(jù)庫管理員處理對象查看對象結構(由對象授予)改變對象結構Analysis Services 2005包含150多項安全性設計
42、更改。在安全模型方面的改進包括:Analysis Services具有多條安全防線,屬于“默認安全設置”。管理權限得到更為細致的劃分;不同數(shù)據(jù)庫對象的權限得以分離,執(zhí)行設計更改的權限與處理權限也得到了分離??梢詫Ρ镜囟嗑S數(shù)據(jù)集進行加密。Analysis Services在運行時其權限級別為可能的最低級別??梢詫蛻舳?服務器端通信進行加密和簽名,以避免出現(xiàn)數(shù)據(jù)包竊聽、欺詐、篡改和拒絕的情況。加密操作在服務器端強制執(zhí)行,服務器可以拒絕不使用加密的客戶端。Analysis Services 2005服務器可以使用工具生成可監(jiān)控的服務器跟蹤事件,所用工具的示例有SQL Server事件探查器,此工具
43、在SQL Server關系數(shù)據(jù)庫中長期以來一直可用。審核應用程序的訪問和使用審核應用程序和服務器事件以提高服務器的可管理性。審核應用程序錯誤,與“Microsoft支持”合作,以便更快地解決問題。得到改進的計算性能來源于以下幾項功能:服務器計算緩存在多個用戶間共享查詢優(yōu)化器會用可以提高性能的等價語句“重寫”查詢。 得到改進的NonEmpty性能非重復計數(shù)度量值得到改進Analysis Services 2005對中間層體系結構有著廣泛的支持。用低空間占用率的對象模型交付可伸縮的中間層可擴展到支持成千上萬名并行用戶。其在廣泛區(qū)域網(wǎng)絡中的部署性能雖未有過正式的測評,但肯定要優(yōu)于SQL Server
44、 2000。Analysis Services 2005支持無限大的維度。因為維度不需要再在內存中緩存。Analysis Services 2005支持在標準管理工具集中平行處理分區(qū)。SQL Server Management Studio將被用來管理所有的SQL Server數(shù)據(jù)庫。它可以使用Analysis Services對關系數(shù)據(jù)庫提供集成的管理,其集成工具可用于:服務器控制臺管理(取代了企業(yè)管理器和分析管理器)查詢分析(SQL和MDX)來自關系引擎和Analysis Services的分析事件“飛行記錄儀”和“捕獲重放”功能可以自動捕獲服務器事件,這可以有效地幫助您(或 Micros
45、oft Services)診斷問題。一種新的對象模型,分析管理對象 (AMO),取代了DSO。DSO的作用是向后兼容,真正起作用的是AMO,它提供了豐富的新功能,尤其是它可以用管理工具和開發(fā)工具通過腳本來創(chuàng)建對象和修改對象,令人印象深刻。構建分析數(shù)據(jù)庫的途徑主要有兩個: 完全自定義:從源開始,通常是從一個關系型源開始,定義維度、多維數(shù)據(jù)集、關鍵績效指標、計算和數(shù)據(jù)挖掘模型。此途徑對那些業(yè)已具備數(shù)據(jù)倉庫或主題集市的客戶來說十分適合。在多維數(shù)據(jù)集向導的第一個屏幕中,此選項的標簽為“使用現(xiàn)有數(shù)據(jù)庫/數(shù)據(jù)倉庫”??勺远x的模板:從模板開始,定義和生成一個完整的應用程序,包括關系數(shù)據(jù)庫、DTS包和Ana
46、lysis Services OLAP數(shù)據(jù)庫。設計和生成這些組件的目的是使這些組件無縫合作,共同組成一個完整的應用程序。此途徑對于那些從模板開始安裝完整商務智能解決方案的客戶來說十分適合。在多維數(shù)據(jù)集向導的第一個屏幕中,此選項的標簽為“在不具備數(shù)據(jù)源的前提下設計商務智能模型”。不管采用哪種方法,基本的系統(tǒng)設計都假設使用當前熟悉的、來自一個或多個源的商務智能結構來填充維度關系型數(shù)據(jù)倉庫,然后再用數(shù)據(jù)倉庫來填充Analysis Services數(shù)據(jù)庫。但是SQL Server 2005提供了許多選項,通過消除或淡化不同的組件使其背離了這種常規(guī)設計。在下面“統(tǒng)一維度”模型中討論了一些其他的備選系統(tǒng)。
47、從現(xiàn)有的源數(shù)據(jù)庫創(chuàng)建自定義數(shù)據(jù)庫創(chuàng)建Analysis Services數(shù)據(jù)庫的第一種方法最為SQL Server 2000的用戶所熟悉。即從任意結構的源數(shù)據(jù)庫開始著手創(chuàng)建數(shù)據(jù)庫:按事實數(shù)據(jù)表和維度表構建一個維度數(shù)據(jù)庫 任何其他的數(shù)據(jù)庫結構,包括標準化的事務系統(tǒng)SQL Server 2005中可從標準化數(shù)據(jù)庫尋源的能力是對Analysis Services 2000的一大突破,在Analysis Services 2000中,執(zhí)行此操作需要一個維度結構,此結構或是星型的、或是雪花型的、或是拉伸型的。此功能使您可以輕松地開發(fā)具有極低延遲時間的商務智能應用程序。通過直接在事務數(shù)據(jù)庫內構建Analys
48、is Services數(shù)據(jù)庫,而不需要先構建正式的數(shù)據(jù)倉庫,可以用較低的成本,輕松有效地滿足許多用戶的要求。如果您需要僅對數(shù)據(jù)執(zhí)行最低的數(shù)據(jù)轉換、清理和集成便投入使用,則可考慮使用一個Analysis Services數(shù)據(jù)庫來補充或替換現(xiàn)有的關系報告。您可以充分利用Analysis Services的功能和交互性,更好地管理事務系統(tǒng)中的負載。雖然可以直接從事務系統(tǒng)構建和維護Analysis Services數(shù)據(jù)庫,但只有先構建關系型數(shù)據(jù)倉庫才能最好地滿足許多企業(yè)分析的要求。復雜的數(shù)據(jù)集成和數(shù)據(jù)更改管理問題可以通過典型的數(shù)據(jù)倉庫體系結構得到最好的解決,其中Analysis Services數(shù)據(jù)庫
49、充當著查詢和分析引擎的角色。數(shù)據(jù)源和數(shù)據(jù)源視圖構建分析應用程序的第一步就是在Business Intelligence Development Studio 中創(chuàng)建一個新的Analysis Services項目。創(chuàng)建了空項目之后,應當創(chuàng)建一個“數(shù)據(jù)源”并將其與源數(shù)據(jù)庫建立連接,此源數(shù)據(jù)庫可以是任何受支持的關系數(shù)據(jù)庫管理系統(tǒng)中的數(shù)據(jù)庫。對于Beta 2版本,建議您將SQL Server 2000或SQL Server 2005關系數(shù)據(jù)庫作為源?!皵?shù)據(jù)源”負責為源數(shù)據(jù)連接存儲信息?!皵?shù)據(jù)源視圖”中包含著源數(shù)據(jù)庫表相關子集的信息。此信息不只局限于源數(shù)據(jù)庫中表的物理結構;您還可以添加諸如關系、表和列的
50、友好名稱、計算列和命名查詢之類的信息。“數(shù)據(jù)源視圖”可以在BI項目和DTS項目之間共享。“數(shù)據(jù)源視圖”很有用處,尤其是在以下幾種情況中:源數(shù)據(jù)庫包含成千上萬個表,但其中只有相對少數(shù)的表在BI應用程序中真正有用。Analysis Services數(shù)據(jù)庫使用來自多個源的數(shù)據(jù),這些源有多重數(shù)據(jù)庫、服務器、平面文件或RDBMS。BI系統(tǒng)開發(fā)人員不具有源數(shù)據(jù)庫中的系統(tǒng)管理權限,且不允許創(chuàng)建物理視圖或修改源數(shù)據(jù)庫。BI系統(tǒng)開發(fā)人員需要以“脫機”模式工作,必須斷開與源數(shù)據(jù)庫的連接。設計和開發(fā)任務針對“數(shù)據(jù)源視圖”發(fā)生,而“數(shù)據(jù)源視圖”已從源數(shù)據(jù)中分離出來。您為“數(shù)據(jù)源視圖”設置良好名稱和關系所作的投資將換來
51、分析應用程序的輕松開發(fā)。創(chuàng)建維度和多維數(shù)據(jù)集創(chuàng)建了“數(shù)據(jù)源視圖”之后,便可以右擊“解決方案資源管理器”窗格中的“多維數(shù)據(jù)集”圖標,選擇“新建多維數(shù)據(jù)集”,創(chuàng)建一個多維數(shù)據(jù)集。您可以啟用IntelliCube檢測和建議。如果您選擇使用IntelliCube,則必須決定是否構建一個已為報告經(jīng)過旋轉優(yōu)化的多維數(shù)據(jù)集。IntelliCube技術會對“數(shù)據(jù)源視圖”中的數(shù)據(jù)庫和數(shù)據(jù)基數(shù)關系進行檢查,并按事實數(shù)據(jù)表、維度表或用于解析多對多關系的維度-事實橋接表來智能呈現(xiàn)表特征。對于Beta2版本來說,選擇是為旋轉還是為報告優(yōu)化多維數(shù)據(jù)集和維度存在一些微小的差別。唯一的差別就是IntelliCube是否會嘗試
52、在維度屬性之間創(chuàng)建層次關系。由于層次易于創(chuàng)建,也易于毀壞,因此無須擔心會花費太多時間和精力。建議您在此“多維數(shù)據(jù)集向導”的初始屏幕后立即點擊“完成”按鈕。這樣會一次定義好所需的Analysis Services數(shù)據(jù)庫、維度、層次、屬性和多維數(shù)據(jù)集。您可以對此設計進行編輯,但通常情況下,仔細一點兒走完向導,并在過程中作出一些明智的選擇會更加有效。實施完“多維數(shù)據(jù)集向導”之后,您可能會發(fā)現(xiàn)您更喜歡用“維度向導”來逐一地創(chuàng)建復雜的維度,要啟動“維度向導”,只需在“解決方案資源管理器”窗格中右擊“維度”即可。仔細定義完大型維度(例如“產品”、“客戶”和“時間”)后,啟動“多維數(shù)據(jù)集向導”,并確保在適當
53、的位置包括這些預定義的維度。構建和部署到此為止,前面執(zhí)行的這些步驟已在您的開發(fā)機器上以XML文件輕松創(chuàng)建了維度和多維數(shù)據(jù)集定義和結構。Business Intelligence Development Studio和“配置管理器”使您可以對目標服務器上的項目構建和部署過程進行管理。默認情況下,“部署”目標服務器就是您的本地服務器。您可以創(chuàng)建適合其他環(huán)境部署的備選配置。項目的主要屬性,如目標服務器的名稱和數(shù)據(jù)源連接字符串等,可能會因配置而不同。要在開發(fā)循環(huán)過程中預覽和測試多維數(shù)據(jù)集和維度,請從Business Intelligence Development Studio的菜單中選擇“部署”,在
54、指定的目標服務器上構建和部署項目,或者,單擊F5,或選擇“調試”(位于Business Intelligence Development Studio主菜單中)。這樣會啟動幾個調試和瀏覽工具中的一個,具體啟動哪個,要取決于您所執(zhí)行的操作以及您選擇“部署”的時間。根據(jù)此上下文,“部署”過程會啟動多維數(shù)據(jù)集瀏覽器、MDX腳本調試器或KPI瀏覽器。您可能想在定義完系統(tǒng)的維度、度量值和多維數(shù)據(jù)集后查看一下系統(tǒng)原型。請使用相對較少的數(shù)據(jù)針對開發(fā)數(shù)據(jù)庫進行處理,以驗證數(shù)據(jù)和結構的行為是否與預期的行為相一致。作為原型的一部分,您可能想設計一些更為復雜的“Analysis Services數(shù)據(jù)庫”、“關鍵績效
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學生生活小達人課件
- 尊重生命班會課件
- 26 必修2 素養(yǎng)加強課4 基因在染色體上位置的判斷與探究
- 05 必修1 第一單元 第5講 細胞器之間的分工合作
- pbl教學課件模板
- 2025年長沙市中考數(shù)學試卷真題(含標準答案)
- 部門承包經(jīng)營品牌建設與維護合同
- 大數(shù)據(jù)產業(yè)園廠房場地租賃合同樣本
- 成都市環(huán)城生態(tài)區(qū)農用地租賃合作開發(fā)合同
- 茶葉市場推廣與茶園使用權租賃合同
- 中心靜脈壓的試題及答案
- 2025年會計知識競賽題庫(共134題附答案)
- 2024北京朝陽區(qū)高二(下)期末英語試題和答案
- 初中數(shù)學新課程標準(2024版)
- 電信通信設備的應急維修
- 源頭治超培訓
- 出院病人終末消毒流程
- 2024年08月海南省財金集團有限公司招考實習見習生筆試歷年參考題庫附帶答案詳解
- star法則培訓課件
- 北師大版4四年級下冊數(shù)學期末復習試卷(5套)
- 【MOOC】邏輯學導論-西北大學 中國大學慕課MOOC答案
評論
0/150
提交評論