當前位置:首頁 » 數據倉庫 » 存儲陣列資料庫
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

存儲陣列資料庫

發布時間: 2022-06-30 04:39:22

A. 什麼是資料庫

資料庫是一種存儲技術。最簡單和通俗地理解就是,我們把需要存儲的內容做成一張張二維表格,資料庫負責把這些表存放到計算機的磁碟上,並提供增、刪、改、查詢等各種手段來維護和管理這它們。最傳統的關系型資料庫就是這樣的。數據量小的一台計算機就可以搞定,當數據量越來越大,就需要專用的存儲介質(比如存儲陣列)來放,到後來要讀和寫的人越來越多,就需要多台計算機搭配存儲陣列一起來工作,其中一台負責寫,多台讀。數據量再大就需要分布式架構,多台讀、多台寫。現在在關系型資料庫之外,還有NoSQL、NewSQL等資料庫出來,它們提供更自由的保存數據的方式,能儲存更多數據。

B. 檔案電子化資料庫存儲適合用磁碟陣列哪個級別


硬碟陣列(RAID)技術詳解
對於硬碟的歷史發展來說,還有各種硬碟的附加技術,如硬碟數據保護技術和防震技術,以及降噪技術,它們也隨著硬碟的發展而不斷更新,但一般而言,不同硬碟廠商都有自己的一套硬碟保護技術,如昆騰的數據保護系統DPS、震動保護系統SPS;邁拓的數據保護系統MaxSafe、震動保護系統ShockBlock;西部數據公司的數據保護系統Data SafeGuide(數據衛士)等等。這些保護技術都是在原有技術的基礎上推出第二代、第三代……等技術。

此外硬碟的數據緩存也隨著硬碟的不斷發展而不斷增大,早期IDE硬碟的數據緩存只有128KB甚至更小,而那時2MB的數據的只能在高端的SCSI硬碟上看到。當然隨著存儲技術及高速存儲器價格的降低,IDE硬碟的數據緩存增加到了256KB,而接下來就是512KB了,目前主流的IDE硬碟數據緩存則為2MB或8M。

接下來,讓我們一起關注RAID(磁碟陣列)。

RAID的英文全稱為:Rendant Array of Independent Disks。翻譯成中文即為獨立磁碟冗餘陣列,或簡稱磁碟陣列。由美國加州大學在1987年開發成功。

RAID的初衷主要是為大型伺服器提供高端的存儲功能和冗餘的數據安全。 我們可以這樣來理解,RAID是一種把多塊獨立的硬碟(物理硬碟)按不同方式組合起來形成一個硬碟組(邏輯硬碟),從而提供比單個硬碟更高的存儲性能和提供數據冗餘的技術。組成磁碟陣列的不同方式成為RAID級別(RAID Levels)。在用戶看起來,組成的磁碟組就像是一個硬碟,用戶可以對它進行分區,格式化等等。總之,對磁碟陣列的操作與單個硬碟一模一樣。不同的是,磁碟陣列的存儲性能要比單個硬碟高很多,而且在很多RAID模式中都有較為完備的相互校檢/恢復的措施,甚至是直接相互的鏡象備份,從而大大提高了RAID系統的容錯度,提高了系統的穩定冗餘性,這也是Rendant一詞的由來。

不過,所有的RAID系統最大的優點則是「熱交換」能力:用戶可以取出一個存在缺陷的驅動器,並插入一個新的予以更換。對大多數類型的RAID來說,可以利用鏡像或奇偶信息來從剩餘的驅動器重建數據不必中斷伺服器或系統,就可以自動重建某個出現故障的磁碟上的數據。這一點,對伺服器用戶以及其他高要求的用戶是至關重要的。

數據冗餘的功能指的是:在用戶數據一旦發生損壞後,利用冗餘信息可以使損壞數據得以恢復,從而保障了用戶數據的安全性。

RAID以前一直是SCSI領域獨有的產品,因為它當時的技術與成本也限制了其在低端市場的發展。今天,隨著RAID技術的不斷成熟與廠商的不斷努力,我們已經能夠享受到相對成本低廉的多的IDE-RAID系統,雖然穩定與可靠性還不能與SCSI-RAID相比,但它相對於單個硬碟的性能優勢對廣大玩家是一個不小的誘惑。隨著相關設備的擁有成本和使用成本不斷下降,這項技術也已獲得一般電腦用戶的青睞。

RAID技術是一種工業標准,下面我們就一起來對各主要RAID級別做一個大致的了解。

RAID 0

RAID 0又稱為Stripe或Striping,中譯為集帶工作方式。它代表了所有RAID級別中最高的存儲性能。RAID 0提高存儲性能的原理是把連續的數據分散到多個磁碟上存取。系統傳輸來的數據,經過RAID控制器通常是平均分配到幾個磁碟中,而這一切對於系統來說是完全不用干預的,每個磁碟執行屬於它自己的那部分數據請求。這樣,系統有數據請求就可以被多個磁碟並行的執行。這種數據上的並行操作可以充分利用匯流排的帶寬,顯著提高磁碟整體存取性能。我們可以這樣簡單的認為:N個硬碟是一個容量為N個硬碟容量之和的「大」硬碟。RAID0的主要工作目的是獲得更大的「單個」磁碟容量。另一方面就是多個硬碟同時讀取,從而獲得更高的存取速度。例如一個由兩個硬碟組成的Raid系統中,系統向兩個磁碟組成的邏輯硬碟(RADI 0 磁碟組)發出的I/O數據請求被轉化為2項操作,其中的每一項操作都對應於一塊物理硬碟。通過建立RAID 0,原先順序的數據請求被分散到所有的兩塊硬碟中同時執行。從理論上講,兩塊硬碟的並行操作使同一時間內磁碟讀寫速度提升了2倍。雖然由於匯流排帶寬等多種因素的影響,實際的提升速率肯定會低於理論值。但是,大量數據並行傳輸與串列傳輸比較,提速效果還是非常明顯的。

RAID 0最大的缺點是不提供數據冗餘,其安全性大大降低,構成陣列的任何一塊硬碟的損壞都將帶來災難性的數據損失。

RAID 0具有的特點,使其不適用於關鍵任務環境,但是,它卻非常適合於特別適用於對性能要求較高的視頻生產和編輯或圖像編輯領域。對個人用戶,RAID 0也是提高硬碟存儲性能的絕佳選擇。

RAID 1

RAID 1又稱為Mirror或Mirroring,中譯為鏡像方式。這種工作方式的出現完全是為了數據安全考慮的,因為在整個鏡像的過程中,只有一半的磁碟容量是有效的,因為另一半用來存放同這一半完全一樣的數據,也就是數據的冗餘了。同RAID0相比,它是另一個極端。RAID0首要考慮的是磁碟的速度和容量,忽略安全;而RAID1首要考慮的是數據的安全性,容量可以減半、速度可以不變。它的宗旨是最大限度的保證用戶數據的可用性和可修復性。

RAID 1的操作方式是把用戶寫入硬碟的數據百分之百地自動復制到另外一個硬碟上。當讀取數據時,系統先從RAID 0的源盤讀取數據,如果讀取數據成功,則系統不去管備份盤上的數據;如果讀取源盤數據失敗,則系統自動轉而讀取備份盤上的數據,不會造成用戶工作任務的中斷。當然,我們應當及時地更換損壞的硬碟並利用備份數據重新建立Mirror,避免備份盤在發生損壞時,造成不可挽回的數據損失。 由於對存儲的數據進行百分之百的備份,在所有RAID級別中,RAID 1提供最高的數據安全保障。同樣,由於數據的百分之百備份,備份數據佔了總存儲空間的一半,因而,Mirror的磁碟空間利用率低,存儲成本高。

Mirror雖不能提高存儲性能,但由於其具有的高數據安全性,使其尤其適用於存放重要數據,如伺服器和資料庫存儲等領域。

RAID 0+1

正如其名字一樣RAID 0+1是RAID 0和RAID 1的組合形式,也稱為RAID 10。它的出現就是為了達到既高速又安全目的, RAID10也可以簡單的理解成兩個分別由多個磁碟組成的 RAID0陣列再進行鏡像;其實反過來理解也沒有錯。

以四個磁碟組成的RAID 0+1為例,RAID 0+1是存儲性能和數據安全兼顧的方案。它在提供與RAID 1一樣的數據安全保障的同時,也提供了與RAID 0近似的存儲性能。

由於RAID 0+1也通過數據的100%備份提供數據安全保障,因此RAID 0+1的磁碟空間利用率與RAID 1相同,存儲成本高。

構建RAID 0+1陣列的成本投入大,數據空間利用率低。不是種經濟高效的磁碟陣列解決方案。但特別適用於既有大量數據需要存取,同時又對數據安全性要求嚴格的領域,如銀行、金融、商業超市、政府各種檔案管理等。

RAID 3

RAID 3 採用的是一種較為簡單的校驗實現方式。將數據做XOR 運算,產生Parity Data後,在將數據和Parity Data以並行存取模式寫入一個專門的存放所有校驗數據的磁碟中,而在剩餘的磁碟中創建帶區集分散數據的讀寫操作。因此具備並行存取模式的優點和缺點。RAID 3所存在的最大一個不足同時也是導致RAID 3很少被人們採用的原因就是校驗盤很容易成為整個系統的瓶頸。我們已經知道RAID 3會把數據的寫入操作分散到多個磁碟上進行,然而不管是向哪一個數據盤寫入數據,都需要同時重寫校驗盤中的相關信息。因此,對於那些經常需要執行大量寫入操作的應用來說,校驗盤的負載將會很大,無法滿足程序的運行速度,從而導致整個RAID系統性能的下降。RAID 3的並行存取模式,需要RAID 控制器特別功能的支持,才能達到磁碟驅動器同步控制,而且上述寫入性能的優點,以目前的Caching 技術,都可以將其取而代之,因此一般認為RAID 3的應用,將逐漸淡出市場。

RAID 4

RAID 4 是採取獨立存取模式,它的每一筆傳輸[Strip]資料較長,而且可以執行Overlapped I/O,因此其讀取的性能很好。但是由於使用單一專屬的Parity Disk 來存放Parity Data,因此每次寫操作都需要訪問奇偶盤,就會造成系統很大的瓶頸。RAID 4在商業應用中很少使用.

RAID 5

RAID 5 是一種存儲性能、數據安全和存儲成本兼顧的存儲解決方案。

RAID 5也是目前應用最廣泛的RAID技術。各塊獨立硬碟進行條帶化分割,相同的條帶區進行奇偶校驗(異或運算),校驗數據平均分布在每塊硬碟上。以n塊硬碟構建的RAID 5陣列可以有n-1塊硬碟的容量,存儲空間利用率非常高。RAID 5不對存儲的數據進行備份,而是把數據和相對應的奇偶校驗信息存儲到組成RAID5的各個磁碟上,並且奇偶校驗信息和相對應的數據分別存儲於不同的磁碟上。當RAID5的任何一塊硬碟上的數據丟失,均可以通過校驗數據推算出來它和RAI D 3最大的區別在於校驗數據是否平均分布到各塊硬碟上。RAID 5具有數據安全、讀寫速度快,空間利用率高等優點,應用非常廣泛,但不足之處是如果1塊硬碟出現故障以後,整個系統的性能將大大降低。RAID 5可以為系統提供數據安全保障,但保障程度要比Mirror低而磁碟空間利用率要比Mirror高。RAID 5具有和RAID 0相近似的數據讀取速度,只是多了一個奇偶校驗信息,寫入數據的速度比對單個磁碟進行寫入操作稍慢。同時由於多個數據對應一個奇偶校驗信息,RAID 5的磁碟空間利用率要比RAID 1高,存儲成本相對較低。

RAID 5模式適合多人多任務的存取頻繁,數據量不是很大的環境,例如企業檔案伺服器、WEB 伺服器、在線交易系統、電子商務等等。

RAID 6

RAID 6 與RAID 5相比,增加了第二個獨立的奇偶校驗信息塊。兩個獨立的奇偶系統使用不同的演算法,數據的可靠性非常高。即使兩塊磁碟同時失效,也不會影響數據的使用。但需要分配給奇偶校驗信息更大的磁碟空間,相對於RAID 5有更大的「寫損失」。RAID 6 的寫性能非常差,較差的性能和復雜的實施使得RAID 6很少使用。

C. 資料庫主機 與 磁碟陣列 是什麼關系

一個是計算的核心,一個是存儲的核心。
就好比是電腦和移動硬碟的關系一樣。

一般資料庫主機就是一台伺服器,可以是x86架構的PC伺服器,也可以是solaris或者aix那樣的小型機。一般這種伺服器都是配磁碟存儲的,可能是幾百GB的容量。
當資料庫需要存儲海量的數據,如上百TB級別的數據,伺服器自帶的磁碟容量就不夠了,需要進行擴充。這樣磁碟陣列就出場了。磁碟陣列可以將幾塊、幾十塊,乃至上百塊磁碟組合起來,容量十分的巨大(價格也不菲),將所有的數據都存儲在磁碟陣列中,通過光纖連接到資料庫主機。提高了存儲容量。

D. 資料庫伺服器和存儲三者的區別與聯系

資料庫是應用軟體,跑在操作系統之上的。
伺服器是硬體,就是計算機。
存儲就是保存數據的地方,伺服器一般都是自帶硬碟的,就像我們買的品牌機,但是也有專用的硬碟,一般比伺服器帶的硬碟性能好,一般稱為存儲,存儲需要連接在伺服器上來使用,相當於外置硬碟(類似移動硬碟的功能)。存儲的價格比較貴。

E. 資料庫伺服器與磁碟陣列問題,急!!!!!

在盤陣開著的情況下,重啟下伺服器,開機可能會自檢,若沒有掃描磁碟,啟動後在磁碟管理里對盤陣分區做下差錯掃描。屬性-工具-差錯-開始檢查(掃描並修復)。這樣應該就可以了,但有些數據可能在上一次先關閉盤陣中丟失。。。祝你好運!

F. 怎麼實行磁碟陣列如何把資料庫和查詢數據的軟體也裝在這個伺服器上

伺服器本身也是一個存儲,能插多塊硬碟做磁碟陣列,如果數據量比較大,磁碟陣列就是說的單獨的存儲,如果只是有伺服器,你的數據和軟體肯定都是在伺服器上的

G. 請問」磁碟陣列」和」存儲系統」有什麼區別和聯系

你好,我是做存儲行業的,就我個人的理解說一下這兩個概念吧,僅供參考。
首先要明確磁碟陣列的概念,磁碟陣列是一種存儲介質,說白了它就是一個堆硬碟形成的一塊大硬碟,通過做RAID實現並行讀寫並通過數據校驗保證數據的正確性和安全性。
而存儲系統是一個大概念,一個典型的存儲系統會分為業務層、備份層、數據保護層和最終的歸檔層:
根據業務層的業務種類,決定了你所用到的存儲類型,是使用基於文件系統的NAS存儲,還是使用基於資料庫塊操作的磁碟陣列;接下來在備份層結合備份軟體,將業務數據備份到磁碟陣列或磁帶中;在數據保護層中,將用到一些數據保護技術,如數據壓縮、數據加密、重復數據刪除等等;最後數據歸檔層中,將數據歸檔到磁帶中。

H. 資料庫伺服器如何掛載磁碟陣列

一般資料庫伺服器和磁碟陣列是一塊使用的。磁碟陣列掛載到資料庫伺服器上。
資料庫伺服器是一台伺服器,跑的是數據應用程序,所以叫資料庫伺服器,一般核心數據是不會放在資料庫伺服器的本地磁碟的(出於安全和性能的考慮)。
磁碟陣列就是存儲盤櫃。支持IPSAN、FCSAN等。

I. 請問存儲陣列的定義是什麼呢謝謝!!!

磁碟陣列簡稱RAID(Rendant Arrays of Inexpensive Disks,RAID),有「價格便宜且多餘的磁碟陣列」之意。其原理是利用數組方式來作磁碟組,配合數據分散排列的設計,提升數據的安全性。磁碟陣列主要針對硬碟,在容量及速度上,無法跟上CPU及內存的發展,提出改善方法。磁碟陣列是由很多便宜、容量較小、穩定性較高、速度較慢磁碟,組合成一個大型的磁碟組,利用個別磁碟提供數據所產生的加成效果來提升整個磁碟系統的效能。同時,在儲存數據時,利用這項技術,將數據切割成許多區段,分別存放在各個硬碟上。