當前位置:首頁 » 數據倉庫 » 聯邦式資料庫系統講解
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

聯邦式資料庫系統講解

發布時間: 2022-09-04 21:18:17

資料庫中的集群和F5

分布式資料庫系統分布式資料庫系統有兩種:一種是物理上分布的,但邏輯上卻是集中的。這種分布式資料庫只適宜用途比較單一的、不大的單位或部門。另一種分布式資料庫系統在物理上和邏輯上都是分布的,也就是所謂聯邦式分布資料庫系統。由於組成聯邦的各個子資料庫系統是相對「自治」的,這種系統可以容納多種不同用途的、差異較大的資料庫,比較適宜於大范圍內資料庫的集成。
----- ----
分布式資料庫系統(DDBS)包含分布式資料庫管理系統(DDBMS)和分布式資料庫(DDB)。在分布式資料庫系統中,一個應用程序可以對資料庫進行透明操作,資料庫中的數據分別在不同的局部資料庫中存儲、由不同的 DBMS進行管理、在不同的機器上運行、由不同的操作系統支持、被不同的通信網路連接在一起。
一個分布式資料庫在邏輯上是一個統一的整體,在物理上則是分別存儲在不同的物理節點上。一個應用程序通過網路的連接可以訪問分布在不同地理位置的資料庫。它的分布性表現在資料庫中的數據不是存儲在同一場地。 更確切地講,不存儲在同一計算機的存儲設備上。 這就是與集中式資料庫的區別。從用戶的角度看,一個分布式資料庫系統在邏輯上和集中式資料庫系統一樣,用戶可以在任何一個場地執行全局應用。就好那些數據是存儲在同一台計算機上,有單個資料庫管理系統(DBMS)管理一樣,用戶並沒有什麼感覺不一樣。
分布式資料庫系統是在集中式資料庫系統的基礎上發展起來的,是計算機技術和網路技術結合的產物。分布式資料庫系統適合於單位分散的部門,允許各個部門將其常用的數據存儲在本地,實施就地存放本地使用,從而提高響應速度,降低通信費用。分布式資料庫系統與集中式資料庫系統相比具有可擴展性,通過增加適當的數據冗餘,提高系統的可靠性。在集中式資料庫中,盡量減少冗餘度是系統目標之一.其原因是,冗餘數據浪費存儲空間,而且容易造成各副本之間的不一致性.而為了保證數據的一致性,系統要付出一定的維護代價.減少冗餘度的目標是用數據共享來達到的。而在分布式資料庫中卻希望增加冗餘數據,在不同的場地存儲同一數據的多個副本,其原因是:①.提高系統的可靠性、可用性當某一場地出現故障時,系統可以對另一場地上的相同副本進行操作,不會因一處故障而造成整個系統的癱瘓。②.提高系統性能系統可以根據距離選擇離用戶最近的數據副本進行操作,減少通信代價,改善整個系統的性能。
分布式資料庫具有以下幾個特點:
(1)、數據獨立性與位置透明性。數據獨立性是資料庫方法追求的主要目標之一,分布透明性指用戶不必關心數據的邏輯分區,不必關心數據物理位置分布的細節,也不必關心重復副本(冗餘數據)的一致性問題,同時也不必關心局部場地上資料庫支持哪種數據模型.分布透明性的優點是很明顯的.有了分布透明性,用戶的應用程序書寫起來就如同數據沒有分布一樣.當數據從一個場地移到另一個場地時不必改寫應用程序.當增加某些數據的重復副本時也不必改寫應用程序.數據分布的信息由系統存儲在數據字典中.用戶對非本地數據的訪問請求由系統根據數據字典予以解釋、轉換、傳送.
(2)、集中和節點自治相結合。資料庫是用戶共享的資源.在集中式資料庫中,為了保證資料庫的安全性和完整性,對共享資料庫的控制是集中的,並設有DBA負責監督和維護系統的正常運行.在分布式資料庫中,數據的共享有兩個層次:一是局部共享,即在局部資料庫中存儲局部場地上各用戶的共享數據.這些數據是本場地用戶常用的.二是全局共享,即在分布式資料庫的各個場地也存儲可供網中其它場地的用戶共享的數據,支持系統中的全局應用.因此,相應的控制結構也具有兩個層次:集中和自治.分布式資料庫系統常常採用集中和自治相結合的控制結構,各局部的DBMS可以獨立地管理局部資料庫,具有自治的功能.同時,系統又設有集中控制機制,協調各局部DBMS的工作,執行全局應用。當然,不同的系統集中和自治的程度不盡相同.有些系統高度自治,連全局應用事務的協調也由局部DBMS、局部DBA共同承擔而不要集中控制,不設全局DBA,有些系統則集中控製程度較高,場地自治功能較弱。
(3)、支持全局資料庫的一致性和和可恢復性。分布式資料庫中各局部資料庫應滿足集中式資料庫的一致性、可串列性和可恢復性。除此以外還應保證資料庫的全局一致性、並行操作的可串列性和系統的全局可恢復性。這是因為全局應用要涉及兩個以上結點的數據.因此在分布式資料庫系統中一個業務可能由不同場地上的 多個操作組成.例如, 銀行轉帳業務包括兩個結點上的更新操作。這樣,當其中某一個結點出現故障操作失敗後如何使全局業務滾回呢?如何使另一個結點撤銷已執行的操作(若操作已完成或完成一部分)或者不必再執行業務的其它操作(若操作尚沒執行)?這些技術要比集中式資料庫復雜和困難得多,分布式資料庫系統必須解決這些問題.
(4)、復制透明性。用戶不用關心資料庫在網路中各個節點的復制情況,被復制的數據的更新都由系統自動完成。在分布式資料庫系統中,可以把一個場地的數據復制到其他場地存放,應用程序可以使用復制到本地的數據在本地完成分布式操作,避免通過網路傳輸數據,提高了系統的運行和查詢效率。但是對於復制數據的更新操作,就要涉及到對所有復制數據的更新。
(5)、易於擴展性。在大多數網路環境中,單個資料庫伺服器最終會不滿足使用。如果伺服器軟體支持透明的水平擴展,那麼就可以增加多個伺服器來進一步分布數據和分擔處理任務。
分布式資料庫的優點:
(1)具有靈活的體系結構 。
(2)適應分布式的管理和控制機構。
(3)經濟性能優越 。
(4)系統的可靠性高、可用性好 。
(5)局部應用的響應速度快。
(6)可擴展性好,易於集成現有系統。
分布式資料庫的缺點:
(1)系統開銷大,主要花在通信部分。
(2)復雜的存取結構,原來在集中式系統中有效存取數據的技術,在分成式系統中都不再適用。
(3)數據的安全生和保密性較難處理。
分布式資料庫系統的目標
分布式資料庫系統的目標,也就是研製分布式資料庫系統的目的、動機,主要包括技術和組織兩方面的目標.
1.適應部門分布的組織結構,降低費用。
使用資料庫的單位在組織上常常是分布的(如分為部門、科室、車間等等),在地理上也是分布的.分布式資料庫系統的結構符合部門分布的組織結構,允許各個部門對自己常用的數據存儲在本地,在本地錄入、查詢、維護,實行局部控制.由於計算機資源靠近用戶,因而可以降低通信代價,提高響應速度,使這些部門使用資料庫更方便更經濟。
2.提高系統的可靠性和可用性。
改善系統的可靠性和可用性是分布式資料庫的主要目標.將數據分布於多個場地,並增加適當的冗餘度可以提供更好的可靠性.一些可靠性要求較高的系統,這一點尤其重要.因為一個地出了故障不會引起整個系統崩潰.因為故障場地的用戶可以通過其它場地進入系統.而其它場地的用戶可以由系統自動選擇存取路徑,避開故障場地,利用其它數據副本執行操作,不影響業務的正常運行.
3.充分利用資料庫資源,提高現有集中式資料庫的利用率
當在一個大企業或大部門中已建成了若干個資料庫之後,為了利用相互的資源,為了開發全局應用,就要研製分布式資料庫系統.這種情況可稱為自底向上的建立分布式系統.這種方法雖然也要對各現存的局部資料庫系統做某些改動、重構,但比起把這些資料庫集中起來重建一個集中式資料庫,則無論從經濟上還是從組織上考慮,分布式資料庫均是較好的選擇.
4.逐步擴展處理能力和系統規模
當一個單位規模擴大要增加新的部門(如銀行系統增加新的分行,工廠增加新的科室、車間)時,分布式資料庫系統的結構為擴展系統的處理能力提供了較好的途徑:在分布式資料庫系統中增加一個新的結點.這樣做比在集中式系統中擴大系統規模要方便、靈活、經濟得多。
在集中式系統中為了擴大規模常用的方法有兩種:一種是在開始設計時留有較大的餘地.這容易造成浪費,而且由於預測困難,設計結果仍可能不適應情況的變化.另一種方法是系統升級,這會影響現有應用的正常運行.並且當升級涉及不兼容的硬體或系統軟體有了重大修改而要相應地修改已開發的應用軟體時,升級的代價就十分昂貴而常常使得升級的方法不可行.分布式資料庫系統能方便地把一個新的結點納入系統,不影響現有系統的結構和系統的正常運行,提供了逐漸擴展系統能力的較好途徑,有時甚至是唯一的途徑。
①資料庫系統與應用 趙致格編著 清華大學出版社p. 260
②資料庫原理及應用 張晉連 編著 電子工業出版社P.13

② 簡述什麼是資料庫系統,及資料庫系統的組成

資料庫系統是為適應數據處理的需要而發展起來的一種較為理想的數據處理系統,也是一個為實際可運行的存儲、維護和應用系統提供數據的軟體系統,是存儲介質 、處理對象和管理系統的集合體。

資料庫系統一般由4個部分組成:資料庫,由資料庫管理系統統一管理,數據的插入、修改和檢索均要通過資料庫管理系統進行;硬體,構成計算機系統的各種物理設備;軟體,包括操作系統、資料庫管理系統及應用程序;數據管理員,負責創建、監控和維護整個資料庫,使數據能被有效使用。

(2)聯邦式資料庫系統講解擴展閱讀:

對資料庫系統的基本要求:

1、能夠保證數據的獨立性。數據和程序相互獨立有利於加快軟體開發速度,節省開發費用。

2、能夠確保系統運行可靠,出現故障時能迅速排除;能夠保護數據不受非受權者訪問或破壞;能夠防止錯誤數據的產生,一旦產生也能及時發現。

3、有重新組織數據的能力,能改變數據的存儲結構或數據存儲位置,以適應用戶操作特性的變化,改善由於頻繁插入、刪除操作造成的數據組織零亂和時空性能變壞的狀況。

4、能夠充分描述數據間的內在聯系。

③ 簡述分布式資料庫系統,集中式資料庫系統和聯邦資料庫系統之間的異同點

分布式資料庫系統通常使用較小的計算機系統,每台計算機可單獨放在一個地方,每台計算機中都有DBMS的一份完整拷貝副本,並具有自己局部的資料庫,位於不同地點的許多計算機通過網路互相連接,共同組成一個完整的、全局的大型資料庫。 這種組織資料庫的方法克服了物理中心資料庫組織的弱點。首先,降低了數據傳送代價,因為大多數的對資料庫的訪問操作都是針對局部資料庫的,而不是對其他位置的資料庫訪問;其次,系統的可靠性提高了很多,因為當網路出現故障時,仍然允許對局部資料庫的操作,而且一個位置的故障不影響其他位置的處理工作,只有當訪問出現故障位置的數據時,在某種程度上才受影響;第三,便於系統的擴充,增加一個新的局部資料庫,或在某個位置擴充一台適當的小型計算機,都很容易實現。然而有些功能要付出更高的代價。例如,為了調配在幾個位置上的活動,事務管理的性能比在中心資料庫時花費更高,而且甚至抵消許多其他的優點。

④ 什麼是聯邦式資料庫系統

數據聯邦(Federation)是目前比較成熟的企業數據集成方法之一。下面通過IBM聯邦資料庫技術來認識數據聯邦是如何集成企業數據的。IBM 在聯邦技術上進行了大量投資,使之在整個數據管理產品系列中取得市場領先能力。現在,聯邦技術能夠統一地訪問任何信息存儲中以任何格式(結構化的和非結構化的)表示的任何數字信息。現在,通過各種 IBM 產品 — 包括 DB2® UDB(和 DB2 Relational Connect)、DB2 DataJoiner® 和 IBM Enterprise Information Portal(EIP),還有最新發布的 Information Integrator — 可以使用這些聯邦技術。

⑤ 簡述分布式資料庫的模式結構

分布式資料庫系統是在集中式資料庫系統的基礎上發展來的。是資料庫技術與網路技術結合的產物。什麼是分布式資料庫: 分布式資料庫系統是在集中式資料庫系統的基礎上發展來的。是資料庫技術與網路技術結合的產物。分布式資料庫系統有兩種:一種是物理上分布的,但邏輯上卻是集中的。這種分布式資料庫只適宜用途比較單一的、不大的單位或部門。另一種分布式資料庫系統在物理上和邏輯上都是分布的,也就是所謂聯邦式分布資料庫系統。由於組成聯邦的各個子資料庫系統是相對「自治」的,這種系統可以容納多種不同用途的、差異較大的資料庫,比較適宜於大范圍內資料庫的集成。分布式資料庫系統(DDBS)包含分布式資料庫管理系統(DDBMS)和分布式資料庫(DDB)。在分布式資料庫系統中,一個應用程序可以對資料庫進行透明操作,資料庫中的數據分別在不同的局部資料庫中存儲、由不同的DBMS進行管理、在不同的機器上運行、由不同的操作系統支持、被不同的通信網路連接在一起。一個分布式資料庫在邏輯上是一個統一的整體:即在用戶面前為單個邏輯資料庫,在物理上則是分別存儲在不同的物理節點上。一個應用程序通過網路的連接可以訪問分布在不同地理位置的資料庫。它的分布性表現在資料庫中的數據不是存儲在同一場地。更確切地講,不存儲在同一計算機的存儲設備上。 這就是與集中式資料庫的區別。從用戶的角度看,一個分布式資料庫系統在邏輯上和集中式資料庫系統一樣,用戶可以在任何一個場地執行全局應用。就好那些數據是存儲在同一台計算機上,有單個資料庫管理系統(DBMS)管理一樣,用戶並沒有什麼感覺不一樣。分布式資料庫中每一個資料庫伺服器合作地維護全局資料庫的一致性。分布式資料庫系統是一個客戶/伺服器體系結構。

⑥ 數據集成中的多資料庫系統和聯邦資料庫有什麼關系聯邦資料庫是不是多資料庫系統的一種

http://ke..com/view/4111079.htm看這里就有答案了

⑦ 什麼是資料庫系統的體系結構

資料庫系統

體系結構
是指資料庫系統的整個
體系
的結構。資料庫系統的體系結構從不同的角度可有不同的劃分方式。從
資料庫管理系統
的角度可分為三層,從外到內依次為
外模式
、模式和內模式。
模式是所有
資料庫用戶
的公共
數據視圖
,是資料庫中全部數據的
邏輯結構

特徵
的描述。模式(schema)又可細分為
概念模式
(conceptual
schema)和
邏輯
模式(109ical
schema)。
希望對你有幫助。

⑧ DB2 聯邦資料庫功能

裡面若是sql語句的話,直接
db2 CREATE SERVER TESTDB TYPE DB2/UDB VERSION '10.5.0' WRAPPER "DRDA" AUTHID "db2inst2" PASSWORD "db2inst2" OPTIONS(ADD NODE 'TESTDB', PASSWORD 'Y')
不要帶雙引號,以及最後的分號。

⑨ 在數據集成中,聯邦資料庫和中間件方法有什麼區別

數據集成是把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而為企業提供全面的數據共享。在企業數據集成領域,已經有了很多成熟的框架可以利用。目前通常採用聯邦式、基於中間件模型和數據倉庫等方法來構造集成的系統,這些技術在不同的著重點和應用上解決數據共享和為企業提供決策支持。

⑩ 數據聯邦的數據聯邦

在大型現代企業中,組織中的各部門使用不同資料庫管理系統來存儲和搜索其重要數據,這幾乎是不可避免的。競爭、不斷發展的技術、合並、收購、地域分布以及擴展中不可避免的分散等因素都會造成這種多樣性。但只有將這些系統中的信息組合起來,企業才會認識到這些系統所包含數據的整體價值。
例如,在金融行業,合並幾乎是很常見的事。新創建的實體沿襲了原有機構的數據存儲。許多這樣的存儲都是關系資料庫管理系統,但這些系統常常來自不同的廠商;例如,一家公司可能主要用 Sybase,而另一家公司用 Informix® IDS。他們可能都有一個或多個文檔管理系統(譬如,Documentum 或 IBM Content Manager)用於存儲文本文檔(譬如,貸款副本等)。每種系統可能都有一些應用程序來計算重要信息(例如,某個特定客戶的貸款風險)或挖掘有關客戶購買模式的信息。
在企業合並之後,他們需要能夠從兩套存儲中訪問所有客戶信息,使用現有的和新的應用程序來分析他們新的資產組合,通常情況下,還要通過一個公共介面來使用兩個機構中經過組合的資源。雖然不同公司可能用完全不同的標識鍵來標識他們的客戶,但在合並後他們需要能夠標識他們公共的客戶,合並這些客戶的帳戶。在這些情況下,聯邦技術通過提供異構數據的統一介面有效地解決這一問題。
本文主要討論高級的資料庫聯邦技術,它們是通過代號為「Garlic」的技術來實現的,這種技術代表了 IBM 軟體的下一代信息聯邦增強功能。這些增強功能將使客戶機能夠訪問和集成數據,能夠專門計算各種關系型和非關系型數據源。隨著時間的推移,Garlic 技術將會不斷融入 IBM 所有提供聯邦技術軟體產品之中。客戶可以放心,不但他們對現有產品的投資會受到保護,而且以後無論選擇哪種產品,他們都將能夠利用這里所描述的高級技術。這組聯邦技術會繼續得到增強,我們的客戶在所有這些產品上的投資會繼續產生實際的商業價值。
IBM 的聯邦資料庫系統為組合來自多個數據源的信息提供了功能強大的工具。IBM 的聯邦資料庫技術構建在早期產品 DB2 DataJoiner [3] 的最佳技術之上,並且在可擴展性和性能方面,通過應用 Garlic 研究項目 [2] 的一些位於前沿的特性而得到了增強,這些技術在該行業是獨一無二的。DB2 DataJoiner 引入了虛擬資料庫的概念,這個虛擬資料庫是通過聯邦多個異構數據源而創建的。DB2 DataJoiner 的用戶可以隨意查詢存儲在聯邦系統中任意位置的數據,而不必擔心數據的位置、實際數據源系統的 SQL 語言種類或者存儲的能力。相反,對於聯邦資料庫中的任何數據,用戶可以按照 DB2 的方式來進行操作。Garlic 項目展現了拓展這一思想來構建聯邦體資料庫系統的可行性,該系統可以有效地使用各種不同的、可能是非關系型數據源的查詢能力。在這些系統中(如當今的 DB2),中間件查詢處理器促進了優化執行方案,並彌補了各數據源可能缺乏的功能。
在本文中,我們描述 IBM 聯邦技術的主要特徵:透明性、異構性、高級功能、底層聯邦數據源的自治、可擴展性、開放性和優化的性能。然後,我們回過頭來向您展示 IBM 的資料庫聯邦技術是如何工作的。我們演示了在各種情形下如何使用聯邦技術,並推斷將來的一些發展趨勢。