大型網站存儲原理_網路存儲技術的工作原理是什麼有圖解釋么

① 可否告訴我大型伺服器的硬碟的工作原理

磁碟陣列(Disk Array)原理

1.為什麼需要磁碟陣列?

如何增加磁碟的存取(access)速度,如何防止數據因磁碟的故障而失落及如何有效
的利用磁碟空間,一直是電腦專業人員和用戶的困擾;而大容量磁碟的價格非常昂貴,對
用戶形成很大的負擔。磁碟陣列技術的產生一舉解決了這些問題。

過去十幾年來,CPU的處理速度增加了五十倍有多,內存(memory)的存取速度亦大
幅增加,而數據儲存裝置--主要是磁碟(hard disk)--的存取速度只增加了三、四倍,形
成電腦系統的瓶頸,拉低了電腦系統的整體性能(through put),若不能有效的提升磁碟
的存取速度,CPU、內存及磁碟間的不平衡將使CPU及內存的改進形成浪費。

目前改進磁碟存取速度的的方式主要有兩種。一是磁碟快取控制(disk cache
controller),它將從磁碟讀取的數據存在快取內存(cache memory)中以減少磁碟存取
的次數,數據的讀寫都在快取內存中進行,大幅增加存取的速度,如要讀取的數據不在快
取內存中,或要寫數據到磁碟時,才做磁碟的存取動作。這種方式在單工環境(single-
tasking envioronment)如DOS之下,對大量數據的存取有很好的性能(量小且頻繁的存
取則不然),但在多工(multi-tasking)環境之下(因為要不停的作數據交換(swapping)
的動作)或資料庫(database)的存取(因為每一記錄都很小)就不能顯示其性能。這種方
式沒有任何安全保障。

其二是使用磁碟陣列的技術。磁碟陣列是把多個磁碟組成一個陣列,當作單一磁碟
使用,它將數據以分段(striping)的方式儲存在不同的磁碟中,存取數據時,陣列中的相
關磁碟一起動作,大幅減低數據的存取時間,同時有更佳的空間利用率。磁碟陣列所利用
的不同的技術,稱為RAID level,不同的level針對不同的系統及應用,以解決數據安全
的問題。

一般高性能的磁碟陣列都是以硬體的形式來達成,進一步的把磁碟快取控制及磁碟
陣列結合在一個控制器(RAID controler或控制卡上,針對不同的用戶解決人們對磁
盤輸出入系統的四大要求:
(1)增加存取速度,
(2)容錯(fault tolerance),即安全性
(3)有效的利用磁碟空間;
(4)盡量的平衡CPU,內存及磁碟的性能差異,提高電腦的整體工作性能。

2.磁碟陣列原理

磁碟陣列中針對不同的應用使用的不同技術,稱為RAID level,RAID是Rendent
Array of Inexpensive Disks的縮寫,而每一level代表一種技術,目前業界公認的標
準是RAID 0~RAID 5。這個level並不代表技術的高低,level 5並不高於level 3,level
1也不低過level 4,至於要選擇那一種RAID level的產品,純視用戶的操作環境
(operating environment)及應用(application)而定,與level的高低沒有必然的關系。
RAID 0及RAID 1適用於PC及PC相關的系統如小型的網路伺服器(network server)及
需要高磁碟容量與快速磁碟存取的工作站等,比較便宜;RAID 3及RAID 4適用於大型電
腦及影像、CAD/CAM等處理;RAID 5多用於OLTP,因有金融機構及大型數據處理中心的
迫切需要,故使用較多而較有名氣, RAID 2較少使用,其他如RAID 6,RAID 7,乃至RAID
10等,都是廠商各做各的,並無一致的標准,在此不作說明。介紹各個RAID level之前,
先看看形成磁碟陣列的兩個基本技術:

磁碟延伸(Disk Spanning):

譯為磁碟延伸,能確切的表示disk spanning這種技術的含義。如圖磁碟陣列控制器,
聯接了四個磁碟,這四個磁碟形成一個陣列(array),而磁碟陣列的控制器(RAID
controller)是將此四個磁碟視為單一的磁碟,如DOS環境下的C:盤。這是disk
spanning的意義,因為把小容量的磁碟延伸為大容量的單一磁碟,用戶不必規劃數據在
各磁碟的分布,而且提高了磁碟空間的使用率。並使磁碟容量幾乎可作無限的延伸;而各
個磁碟一起作取存的動作,比單一磁碟更為快捷。很明顯的,有此陣列的形成而產生
RAID的各種技術。

磁碟或數據分段(Disk Striping or Data Striping):

因為磁碟陣列是將同一陣列的多個磁碟視為單一的虛擬磁碟(virtual disk),所以其數
據是以分段(block or segment)的方式順序存放在磁碟陣列中,數據按需要分段,從第一
個磁碟開始放,放到最後一個磁碟再回到第一個磁碟放起,直到數據分布完畢。至於分段
的大小視系統而定,有的系統或以1KB最有效率,或以4KB,或以6KB,甚至是4MB或8MB
的,但除非數據小於一個扇區(sector,即521bytes),否則其分段應是512byte的倍數。
因為磁碟的讀寫是以一個扇區為單位,若數據小於512bytes,系統讀取該扇區後,還要
做組合或分組(視讀或寫而定)的動作,浪費時間。從上圖我們可以看出,數據以分段於在
不同的磁碟,整個陣列的各個磁碟可同時作讀寫,故數據分段使數據的存取有最好的效
率,理論上本來讀一個包含四個分段的數據所需要的時間約=(磁碟的access time+數據
的tranfer time)X4次,現在只要一次就可以完成。

若以N表示磁碟的數目,R表示讀取,W表示寫入,S表示可使用空間,則數據分段的性能
為:
R:N(可同時讀取所有磁碟)
W:N(可同時寫入所有磁碟)
S:N(可利用所有的磁碟,並有最佳的使用率)

Disk striping也稱為RAID 0,很多人以為RAID 0沒有甚麼,其實這是非常錯誤的觀念,
因為RAID 0使磁碟的輸出入有最高的效率。而磁碟陣列有更好效率的原因除數據分段
外,它可以同時執行多個輸出入的要求,因為陣列中的每一個磁碟都能獨立動作,分段放
在不同的磁碟,不同的磁碟可同時作讀寫,而且能在快取內存及磁碟作並行存取
(parallel access)的動作,但只有硬體的磁碟陣列才有此性能表現。

從上面兩點我們可以看出,disk spanning定義了RAID的基本形式,提供了一個便宜、
靈活、高性能的系統結構,而disk striping解決了數據的存取效率和磁碟的利用率問
題,RAID 1至RAID 5是在此基礎上提供磁碟安全的方案。

RAID 1

RAID 1是使用磁碟鏡像(disk mirroring)的技術。磁碟鏡像應用在RAID 1之前就在很
多系統中使用,它的方式是在工作磁碟(working disk)之外再加一額外的備份磁碟
(backup disk),兩個磁碟所儲存的數據完全一樣,數據寫入工作磁碟的同時亦寫入備份
磁碟。磁碟鏡像不見得就是RAID 1,如Novell Netware亦有提供磁碟鏡像的功能,但並
不表示Netware有了RAID 1的功能。一般磁碟鏡像和RAID 1有二點最大的不同:

RAID 1無工作磁碟和備份磁碟之分,多個磁碟可同時動作而有重疊(overlaping)讀取的
功能,甚至不同的鏡像磁碟可同時作寫入的動作,這是一種最佳化的方式,稱為負載平衡
(load-balance)。例如有多個用戶在同一時間要讀取數據,系統能同時驅動互相鏡像的
磁碟,同時讀取數據,以減輕系統的負載,增加I/O的性能。

RAID 1的磁碟是以磁碟延伸的方式形成陣列,而數據是以數據分段的方式作儲存,因而
在讀取時,它幾乎和RAID 0有同樣的性能。從RAID的結構就可以很清楚的看出RAID 1
和一般磁碟鏡像的不同。

下圖為RAID 1,每一筆數據都儲存兩份:
從圖可以看出:
R:N(可同時讀取所有磁碟)
W:N/2(同時寫入磁碟數)
S:N/2(利用率)

讀取數據時可用到所有的磁碟,充分發揮數據分段的優點;寫入數據時,因為有備份,所
以要寫入兩個磁碟,其效率是N/2,磁碟空間的使用率也只有全部磁碟的一半。

很多人以為RAID 1要加一個額外的磁碟,形成浪費而不看好RAID 1,事實上磁碟越來越
便宜,並不見得造成負擔,況且RAID 1有最好的容錯(fault tolerence)能力,其效率也
是除RAID 0之外最好的。

在磁碟陣列的技術上,從RAID 1到RAID 5,不停機的意思表示在工作時如發生磁碟故障,
系統能持續工作而不停頓,仍然可作磁碟的存取,正常的讀寫數據;而容錯則表示即使磁
盤故障,數據仍能保持完整,可讓系統存取到正確的數據,而SCSI的磁碟陣列更可在工
作中抽換磁碟,並可自動重建故障磁碟的數據。磁碟陣列之所以能做到容錯及不停機,
是因為它有冗餘的磁碟空間可資利用,這也就是Rendant的意義。

RAID 2

RAID 2是把數據分散為位(bit)或塊(block),加入海明碼Hamming Code,在磁碟陣列中
作間隔寫入(interleaving)到每個磁碟中,而且地址(address)都一樣,也就是在各個磁
盤中,其數據都在相同的磁軌(cylinder or track)及扇區中。RAID 2的設計是使用共
軸同步(spindle synchronize)的技術,存取數據時,整個磁碟陣列一起動作,在各作磁
盤的相同位置作平行存取,所以有最好的存取時間(accesstime),其匯流排(bus)是特別的
設計,以大帶寬(band wide)並行傳輸所存取的數據,所以有最好的傳輸時間(transfer
time)。在大型檔案的存取應用,RAID 2有最好的性能,但如果檔案太小,會將其性能拉
下來,因為磁碟的存取是以扇區為單位,而RAID 2的存取是所有磁碟平行動作,而且是作
單位元的存取,故小於一個扇區的數據量會使其性能大打折扣。RAID 2是設計給需要連
續且大量數據的電腦使用的,如大型電腦(mainframe to supercomputer)、作影像處理
或CAD/CAM的工作站(workstation)等,並不適用於一般的多用戶環境、網路伺服器
(network server),小型機或PC。

RAID 2的安全採用內存陣列(memory array)的技術,使用多個額外的磁碟作單位錯誤校
正(single-bit correction)及雙位錯誤檢測(double-bit detection);至於需要多少個
額外的磁碟,則視其所採用的方法及結構而定,例如八個數據磁碟的陣列可能需要三個
額外的磁碟,有三十二個數據磁碟的高檔陣列可能需要七個額外的磁碟。

RAID 3

RAID 3的數據儲存及存取方式都和RAID 2一樣,但在安全方面以奇偶校驗(parity
check)取代海明碼做錯誤校正及檢測,所以只需要一個額外的校檢磁碟(parity disk)。
奇偶校驗值的計算是以各個磁碟的相對應位作XOR的邏輯運算,然後將結果寫入奇偶校
驗磁碟,任何數據的修改都要做奇偶校驗計算,如圖:

如某一磁碟故障,換上新的磁碟後,整個磁碟陣列(包括奇偶校驗磁碟)需重新計算一次,
將故障磁碟的數據恢復並寫入新磁碟中;如奇偶校驗磁碟故障,則重新計算奇偶校驗值,
以達容錯的要求.

較之RAID 1及RAID 2,RAID 3有85%的磁碟空間利用率,其性能比RAID 2稍差,因為要
做奇偶校驗計算;共軸同步的平行存取在讀檔案時有很好的性能,但在寫入時較慢,需要
重新計算及修改奇偶校驗磁碟的內容。RAID 3和RAID 2有同樣的應用方式,適用大檔
案及大量數據輸出入的應用,並不適用於PC及網路伺服器。

RAID 4

RAID 4也使用一個校驗磁碟,但和RAID 3不一樣,如圖:

RAID 4是以扇區作數據分段,各磁碟相同位置的分段形成一個校驗磁碟分段(parity
block),放在校驗磁碟。這種方式可在不同的磁碟平行執行不同的讀取命今,大幅提高磁
盤陣列的讀取性能;但寫入數據時,因受限於校驗磁碟,同一時間只能作一次,啟動所有
磁碟讀取數據形成同一校驗分段的所有數據分段,與要寫入的數據做好校驗計算再寫
入。即使如此,小型檔案的寫入仍然比RAID 3要快,因其校驗計算較簡單而非作位(bit
level)的計算;但校驗磁碟形成RAID 4的瓶頸,降低了性能,因有RAID 5而使得RAID 4
較少使用。

RAID 5
RAID5避免了RAID 4的瓶頸,方法是不用校驗磁碟而將校驗數據以循環的方式放在每一
個磁碟中,如下圖:

磁碟陣列的第一個磁碟分段是校驗值,第二個磁碟至後一個磁碟再折回第一個磁碟的分
段是數據,然後第二個磁碟的分段是校驗值,從第三個磁碟再折回第二個磁碟的分段是
數據,以此類推,直到放完為止。圖中的第一個parity block是由A0,A1...,B1,B2計算
出來,第二個parity block是由B3,B4,...,C4,D0計算出來,也就是校驗值是由各磁碟
同一位置的分段的數據所計算出來。這種方式能大幅增加小檔案的存取性能,不但可同
時讀取,甚至有可能同時執行多個寫入的動作,如可寫入數據到磁碟1而其parity
block在磁碟2,同時寫入數據到磁碟4而其parity block在磁碟1,這對聯機交易處理
(OLTP,On-Line Transaction Processing)如銀行系統、金融、股市等或大型資料庫的
處理提供了最佳的解決方案(solution),因為這些應用的每一筆數據量小,磁碟輸出入
頻繁而且必須容錯。

事實上RAID 5的性能並無如此理想,因為任何數據的修改,都要把同一parityblock的
所有數據讀出來修改後,做完校驗計算再寫回去,也就是RMW cycle(Read-Modify-Write
cycle,這個cycle沒有包括校驗計算);正因為牽一而動全身,所以:
R:N(可同時讀取所有磁碟)
W:1(可同時寫入磁碟數)
S:N-1(利用率)

RAID 5的控制比較復雜,尤其是利用硬體對磁碟陣列的控制,因為這種方式的應用比其
他的RAID level要掌握更多的事情,有更多的輸出入需求,既要速度快,又要處理數據,
計算校驗值,做錯誤校正等,所以價格較高;其應用最好是OLTP,至於用於圖像處理等,
不見得有最佳的性能。

2.磁碟陣列的額外容錯功能：Spare or Standby driver

事實上容錯功能已成為磁碟陣列最受青睞的特性,為了加強容錯的功能以及使系統在磁
盤故障的情況下能迅速的重建數據,以維持系統的性能,一般的磁碟陣列系統都可使用
熱備份(hot spare or hot standby driver)的功能,所謂熱備份是在建立(configure)
磁碟陣列系統的時候,將其中一磁碟指定為後備磁碟,此一磁碟在平常並不操作,但若陣
列中某一磁碟發生故障時,磁碟陣列即以後備磁碟取代故障磁碟,並自動將故障磁碟的
數據重建(rebuild)在後備磁碟之上,因為反應快速,加上快取內存減少了磁碟的存取,
所以數據重建很快即可完成,對系統的性能影響很小。對於要求不停機的大型數據處理
中心或控制中心而言,熱備份更是一項重要的功能,因為可避免晚間或無人值守時發生
磁碟故障所引起的種種不便。

另一個額外的容錯功能是壞扇區轉移(bad sector reassignment)。壞扇區是磁碟故障
的主要原因,通常磁碟在讀寫時發生壞扇區的情況即表示此磁碟故障,不能再作讀寫,甚
至有很多系統會因為不能完成讀寫的動作而死機,但若因為某一扇區的損壞而使工作不
能完成或要更換磁碟,則使得系統性能大打折扣,而系統的維護成本也未免太高了。壞扇
區轉移是當磁碟陣列系統發現磁碟有壞扇區時,以另一空白且無故障的扇區取代該扇區,
以延長磁碟的使用壽命,減少壞磁碟的發生率以及系統的維護成本。所以壞扇區轉移功
能使磁碟陣列具有更好的容錯性,同時使整個系統有最好的成本效益比。其他如可外接
電池備援磁碟陣列的快取內存,以避免突然斷電時數據尚未寫回磁碟而損失;或在RAID
1時作寫入一致性的檢查等,雖是小技術,但亦不可忽視。

3.硬體磁碟陣列還是軟體磁碟陣列

市面上有所謂硬體磁碟陣列與軟體磁碟陣列之分,因為軟體磁碟陣列是使用一塊SCSI
卡與磁碟連接,一般用戶誤以為是硬體磁碟陣列。以上所述主要是針對硬體磁碟陣列,
其與軟體磁碟陣列有幾個最大的區別:

l 一個完整的磁碟陣列硬體與系統相接。
l 內置CPU,與主機並行運作,所有的I/O都在磁碟陣列中完成,減輕主機的工作負載,
增加系統整體性能。
l 有卓越的匯流排主控(bus mastering)及DMA(Direct Memory Access)能力,加速數據
的存取及傳輸性能。
l 與快取內存結合在一起,不但增加數據的存取及傳輸性能,更因減少對磁碟的存取
而增加磁碟的壽命。
l 能充份利用硬體的特性,反應快速。

軟體磁碟陣列是一個程序,在主機執行,透過一塊SCSI卡與磁碟相接形成陣列,它最大
的優點是便宜,因為沒有硬體成本(包括研發、生產、維護等),而SCSI卡很便宜(亦有的
軟體磁碟陣列使用指定的很貴的SCSI卡);它最大的缺點是使主機多了很多進程
(process),增加了主機的負擔,尤其是輸出入需求量大的系統。目前市面上的磁碟陣列
系統大部份是硬體磁碟陣列,軟體磁碟陣列較少。

4.磁碟陣列卡還是磁碟陣列控制器

磁碟陣列控制卡一般用於小系統，供單機使用。與主機共用電源，在關閉主機電源時存
在丟失Cache中的數據的的危險。磁碟陣列控制卡只有常用匯流排方式的介面，其驅動程
序與主機、主機所用的操作系統都有關系，有軟、硬體兼容性問題並潛在地增加了系統
的不安定因素。在更換磁碟陣列卡時要冒磁碟損壞，資料失落，隨時停機的風險。

獨立式磁碟陣列控制一般用於較大型系統,可分為兩種：
單通道磁碟陣列和多通道式磁碟陣列，單通道磁碟陣列只能接一台主機，有很大的
擴充限制。多通道磁碟陣列可接多個系統同時使用,以群集(cluster)的方式共用磁碟陣
列,這使內接式陣列控制及單接式磁碟陣列無用武之地。目前多數獨立形式的磁碟陣列
子系統，其本身與主機系統的硬體及操作環境?BR>
--
※ 來源:．廣州網易 BBS bbs.nease.net．[FROM: 202.103.153.151]
發信人: secu (secu), 信區: WinNT
標題: Re: NT下做RAID
發信站: 廣州網易 BBS (Mon Aug 24 17:59:42 1998), 轉信

【在 davychen (xiaoque) 的大作中提到: 】
: 【在 Magicboy (師傅仔) 的大作中提到: 】
: : 請問用SCSI硬碟做軟體RAID與用性能更高一些的IDE硬碟做軟體鏡象，哪個
: : 性能更好一些？
: 當然是SCSI,但用軟體鏡象不能實現雙工。因為備分的只是數據部分，引導區部分不在
: 上面。如果用IDE的話，無論RAID0,1,5,10,50都必須同時讀寫。可能很快斐捎才袒?/font>
: 道或扇區。RAID 0,1隻要求兩個硬碟，RAID 5則至少三個硬碟。

首先，IDE的性能不會比SCSI更高的。特別是在多任務的情況下。一般廣告給出的是
最大傳送速度，並不是工作速度。同一時期的IDE與SCSI盤相比，主要是產量比較大，
電路比較簡單，所以價格比SCSI低很多，但要比性能，則差遠了。

② 網路存儲技術的工作原理是什麼有圖解釋么

網路存儲技術（Network Storage Technologies）是基於數據存儲的一種通用網路術語。網路存儲結構大致分為三種：直連式存儲（DAS：Direct Attached Storage）、網路存儲設備（NAS：Network Attached Storage）和存儲網路（SAN：Storage Area Network）。
網路存儲技術
直連式存儲（DAS）：這是一種直接與主機系統相連接的存儲設備，如作為伺服器的計算機內部硬體驅動。到目前為止，DAS 仍是計算機系統中最常用的數據存儲方法。 DAS即直連方式存儲，英文全稱是Direct Attached Storage。中文翻譯成「直接附加存儲」。顧名思義，在這種方式中，存儲設備是通過電纜（通常是SCSI介面電纜）直接到伺服器的。I/O（輸入/輸入）請求直接發送到存儲設備。DAS，也可稱為SAS（Server-Attached Storage，伺服器附加存儲）。它依賴於伺服器，其本身是硬體的堆疊，不帶有任何存儲操作系統。
DAS的適用環境為：
1）伺服器在地理分布上很分散，通過SAN（存儲區域網路）或NAS（網路直接存儲）在它們之間進行互連非常困難時(商店或銀行的分支便是一個典型的例子)； 2）存儲系統必須被直接連接到應用伺服器（如Microsoft Cluster Server或某些資料庫使用的「原始分區」）上時； 3）包括許多資料庫應用和應用伺服器在內的應用，它們需要直接連接到存儲器上，群件應用和一些郵件服務也包括在內。典型DAS結構如圖所示：典型DAS結構如圖所示
對於多個伺服器或多台PC的環境，使用DAS方式設備的初始費用可能比較低，可是這種連接方式下，每台PC或伺服器單獨擁有自己的存儲磁碟，容量的再分配困難；對於整個環境下的存儲系統管理，工作煩瑣而重復，沒有集中管理解決方案。所以整體的擁有成本（TCO）較高。目前DAS基本被NAS所代替。下面是DAS與NAS的比較。 DAS與NAS的比較圖
網路存儲設備（NAS）：NAS 是一種採用直接與網路介質相連的特殊設備實現數據存儲的機制。由於這些設備都分配有 IP 地址，所以客戶機通過充當數據網關的伺服器可以對其進行存取訪問，甚至在某些情況下，不需要任何中間介質客戶機也可以直接訪問這些設備。
NAS網路存儲器
1. 最大存儲容量
最存儲大存儲容量是指NAS存儲設備所能存儲數據容量的極限，通俗的講，就是NAS設備能夠支持的最大硬碟數量乘以單個硬碟容量就是最大存儲容量。這個數值取決於NAS設備的硬體規格。不同的硬體級別，適用的范圍不同，存儲容量也就有所差別。通常，一般小型的NAS存儲設備會支持幾百GB的存儲容量，適合中小型公司作為存儲設備共享數據使用，而中高檔的NAS設備應該支持T級別的容量（1T=1000G）。
2. 處理器
同普通電腦類似，NAS產品也都具有自己的處理器（CPU）系統，來協調控制整個系統的正常運行。其採用的處理器也常常與台式機或伺服器的CPU大體相同。目前主要有以下幾類。（1）Intel系列處理器（4）AMD系列處理器（5）PA-RISC型處理器（6）PowerPC處理器（7）MIPS處理器一般針對中小型公司使用NAS產品採用AMD的處理器或Intel PIII/PIV等處理器。而大規模應用的NAS產品則使用Intel Xeon處理器、或者RISC型處理器等。但是也不能一概而論，視具體應用和廠商規劃而定。
3. 內存
NAS從結構上講就是一台精簡型的電腦，每台NAS設備都配備了一定數量的內存，而且大多用戶以後可以擴充。在NAS設備中，常見的內存類型由SDRAM（同步內存）、FLASH（快閃記憶體）等。不同的NAS產品出廠時配備的內存容量不同，一般為幾十兆到數GB（1GB=1000MB）容量不等，這取決於NAS產品的應用范圍，一般來講，應用在小規模的區域網當中的NAS，如果只是應付幾台設備的訪問，64M以下內存容量即可。如果是上百個節點以上的訪問，就得需要上G容量的內存。當然，這不是絕對的因素，NAS產品的綜合性能發揮還取決於它的處理器能力、硬碟速度及其網路實際環境等因素的制約。總之，選購NAS產品時，應該綜合考慮各個方面的性能參數。
4. 介面
NAS產品的外部介面比較簡單，由於只是通過內置網卡與外界通訊，所以一般只具有乙太網絡介面，通常是RJ45規格，而這種介面網卡一般都是100M網卡或1000M網卡。另外，也有部分NAS產品需要與SAN（存儲區域網路）產品連接提供更為強大的功能，所以也可能會有FC（Fiber Channel光纖通道）介面。
5. 預置軟體系統
預制操作系統是指NAS產品出廠時隨機帶的操作系統或者管理軟體。目前NAS產品一般帶有以下幾種系統軟體。精簡的WINDOWS2000系統這類系統只是保留了WINDOWS2000 SERVER系統核心網路中最重要的部分，能夠驅動NAS產品正常工作。我們可以把它理解為WINDOWS2000的「精簡版」。 FreeBSD嵌入式系統 FreeBSD是類UNIX系統，在網路應用方面具備極其優異的性能。 Linux嵌入式系統 Linux系統類似於UNIX操組系統，但相比之下具有界面友好、內核升級迅速等特點。常常用來作為電器等產品的嵌入式控制系統。
6. 網路管理
網路管理，是指網路管理員通過網路管理程序對網路上的資源進行集中化管理的操作，包括配置管理、性能和記賬管理、問題管理、操作管理和變化管理等。一台設備所支持的管理程度反映了該設備的可管理性及可操作性。一般的網路滿足SNMP MIB I / MIB II統計管理功能。常見的網路管理方式有以下幾種：（1）SNMP管理技術（2）RMON管理技術（3）基於WEB的網路管理 SNMP是英文「Simple Network Management Protocol」的縮寫，中文意思是「簡單網路管理協議」。SNMP首先是由Internet工程任務組織(Internet Engineering Task Force)(IETF)的研究小組為了解決Internet上的路由器管理問題而提出的。 SNMP是目前最常用的環境管理協議。SNMP被設計成與協議無關，所以它可以在IP，IPX，AppleTalk，OSI以及其他用到的傳輸協議上被使用。SNMP是一系列協議組和規范（見下表），它們提供了一種從網路上的設備中收集網路管理信息的方法。SNMP也為設備向網路管理工作站報告問題和錯誤提供了一種方法。目前，幾乎所有的網路設備生產廠家都實現了對SNMP的支持。領導潮流的SNMP是一個從網路上的設備收集管理信息的公用通信協議。設備的管理者收集這些信息並記錄在管理信息庫（MIB）中。這些信息報告設備的特性、數據吞吐量、通信超載和錯誤等。MIB有公共的格式，所以來自多個廠商的SNMP管理工具可以收集MIB信息，在管理控制台上呈現給系統管理員。通過將SNMP嵌入數據通信設備，如交換機或集線器中，就可以從一個中心站管理這些設備，並以圖形方式查看信息。目前可獲取的很多管理應用程序通常可在大多數當前使用的操作系統下運行，如Windows3.11、Windows95 、Windows NT和不同版本UNIX的等。一個被管理的設備有一個管理代理，它負責向管理站請求信息和動作，代理還可以藉助於陷阱為管理站提供站動提供的信息，因此，一些關鍵的網路設備（如集線器、路由器、交換機等）提供這一管理代理，又稱SNMP代理，以便通過SNMP管理站進行管理。
7. 網路協議
網路協議即網路中（包括互聯網）傳遞、管理信息的一些規范。如同人與人之間相互交流是需要遵循一定的規矩一樣，計算機之間的相互通信需要共同遵守一定的規則，這些規則就稱為網路協議。一台計算機只有在遵守網路協議的前提下，才能在網路上與其他計算機進行正常的通信。網路協議通常被分為幾個層次，每層完成自己單獨的功能。通信雙方只有在共同的層次間才能相互聯系。常見的協議有：TCP/IP協議、IPX/SPX協議、NetBEUI協議等。在區域網中用得的比較多的是IPX/SPX.。用戶如果訪問Internet，則必須在網路協議中添加TCP/IP協議。 TCP/IP是「transmission Control Protocol/Internet Protocol」的簡寫，中文譯名為傳輸控制協議/互聯網路協議）協議， TCP/IP（傳輸控制協議/網間協議）是一種網路通信協議，它規范了網路上的所有通信設備，尤其是一個主機與另一個主機之間的數據往來格式以及傳送方式。TCP/IP是INTERNET的基礎協議，也是一種電腦數據打包和定址的標准方法。在數據傳送中，可以形象地理解為有兩個信封，TCP和IP就像是信封，要傳遞的信息被劃分成若干段，每一段塞入一個TCP信封，並在該信封面上記錄有分段號的信息，再將TCP信封塞入IP大信封，發送上網。在接受端，一個TCP軟體包收集信封，抽出數據，按發送前的順序還原，並加以校驗，若發現差錯，TCP將會要求重發。因此，TCP/IP在INTERNET中幾乎可以無差錯地傳送數據。對普通用戶來說，並不需要了解網路協議的整個結構，僅需了解IP的地址格式，即可與世界各地進行網路通信。 IPX/SPX是基於施樂的XEROX』S Network System（XNS）協議，而SPX是基於施樂的XEROX』S SPP（Sequenced Packet Protocol：順序包協議）協議，它們都是由novell公司開發出來應用於區域網的一種高速協議。它和TCP/IP的一個顯著不同就是它不使用ip地址，而是使用網卡的物理地址即（MAC）地址。在實際使用中，它基本不需要什麼設置，裝上就可以使用了。由於其在網路普及初期發揮了巨大的作用，所以得到了很多廠商的支持，包括microsoft等，到現在很多軟體和硬體也均支持這種協議。 NetBEUI即NetBios Enhanced User Interface ，或NetBios增強用戶介面。它是NetBIOS協議的增強版本，曾被許多操作系統採用，例如Windows for Workgroup、Win 9x系列、Windows NT等。NETBEUI協議在許多情形下很有用，是WINDOWS98之前的操作系統的預設協議。總之NetBEUI協議是一種短小精悍、通信效率高的廣播型協議，安裝後不需要進行設置，特別適合於在「網路鄰居」傳送數據。所以建議除了TCP/IP協議之外，區域網的計算機最好也安上NetBEUI協議。另外還有一點要注意，如果一台只裝了TCP/IP協議的WINDOWS98機器要想加入到WINNT域，也必須安裝NetBEUI協議。
8. 網路文件協議
網路文件系統是基於網路的分布式文件系統，其文件系統樹的各節點可以存在於不同的聯網計算機甚至不同的系統平台上，可以用來提供跨平台的信息存儲與共享。當今最主要的兩大網路文件系統是Sun提出的NFS（Network File System）以及由微軟、EMC和NetApp提出的CIFS（Common Internet File System），前者主要用於各種Unix平台，後者則主要用於Windows平台，我們熟悉的「網上鄰居」的文件共享方式就是基於CIFS系統的。其他著名的網路文件系統還有Novell公司的NCP（網路控制協議）、Apple公司的AFP以及卡內基-梅隆大學的Coda等，NAS的主要功能之一便是通過各種網路文件系統提供存儲服務。
9. 網路備份軟體
目前在數據存儲領域可以完成網路數據備份管理的軟體產品主要有Legato公司的NetWorker、IBM公司的Tivoli、Veritas公司的NetBackup等。另外有些操作系統，諸如Unix的tar/cpio、Windows2000/NT的Windows Backup、Netware的Sbackup也可以作為NAS的備份軟體。
NetBackup
NetBackup是Veritas公司推出的適用於中型和大型的存儲系統的備份軟體，可以廣泛的支持各種開放平台。另外該公司還推出了適合低端的備份軟體Backup Exec。
NetWorker
NetWorker是Legato公司推出的備份軟體，它適用於大型的復雜網路環境，具有各種先進的備份技術機制，廣泛的支持各種開放系統平台。值得一提的是， NetWorker中的Cellestra技術第一個在產品上實現了Serverless Backup（無伺服器備份）的思想。
IBM Tivoli
IBM Tivoli是IBM公司推出的備份軟體，與Veritas的NetBackup和Legato的NetWorker相比，Tivoli Storage Manager更多的適用於IBM主機為主的系統平台，其強大的網路備份功能可以勝任大規模的海量存儲系統的備份需要。此外，CA公司原來的備份軟體ARCServe，在低端市場具有相當廣泛的影響力。其新一代備份產品--BrightStor，定位直指中高端市場，也具有不錯的性能。選購備份軟體時，應該根據不同的用戶需要選擇合適的產品，理想的網路備份軟體系統應該具備以下功能:
集中式管理
網路存儲備份管理系統對整個網路的數據進行管理。利用集中式管理工具的幫助，系統管理員可對全網的備份策略進行統一管理，備份伺服器可以監控所有機器的備份作業，也可以修改備份策略，並可即時瀏覽所有目錄。所有數據可以備份到同備份伺服器或應用伺服器相連的任意一台磁帶庫內。
全自動的備份
備份軟體系統應該能夠根據用戶的實際需求，定義需要備份的數據，然後以圖形界面方式根據需要設置備份時間表，備份系統將自動啟動備份作業，無需人工干預。這個自動備份作業是可自定的,包括一次備份作業、每周的某幾日、每月的第幾天等項目。設定好計劃後，備份作業就會按計劃自動進行。
資料庫備份和恢復
在許多人的觀念里，資料庫和文件還是一個概念。當然，如果你的資料庫系統是基於文件系統的，當然可以用備份文件的方法備份資料庫。但發展至今，資料庫系統已經相當復雜和龐大，再用文件的備份方式來備份資料庫已不適用。是否能夠將需要的數據從龐大的資料庫文件中抽取出來進行備份，是網路備份系統是否先進的標志之一。
在線式的索引
備份系統應為每天的備份在伺服器中建立在線式的索引，當用戶需要恢復時，只需點取在線式索引中需要恢復的文件或數據，該系統就會自動進行文件的恢復。
歸檔管理
用戶可以按項目、時間定期對所有數據進行有效的歸檔處理。提供統一的Open Tape Format 數據存儲格式從而保證所有的應用數據由一個統一的數據格式作為永久的保存，保證數據的永久可利用性。
有效的媒體管理
備份系統對每一個用於作備份的磁帶自動加入一個電子標簽，同時在軟體中提供了識別標簽的功能，如果磁帶外面的標簽脫落，只需執行這一功能，就會迅速知道該磁帶的內容。
滿足系統不斷增加的需求
備份軟體必須能支持多平台系統，當網路上連接上其它的應用伺服器時，對於網路存儲管理系統來說，只需在其上安裝支持這種伺服器的客戶端軟體即可將數據備份到磁帶庫或光碟庫中。
10. 網站瀏覽器支持
網站瀏覽器支持是指能否夠通過WEB（就是WWW，俗稱互聯網）手段對NAS產品進行管理，以及管理時使用的瀏覽器類型。絕大部分的NAS產品都支持WEB管理，這樣的好處是管理方便，用戶在任何地方只要能夠上網就可以輕松的管理NAS設備。目前NAS產品支持的常用瀏覽器有微軟的IE（Internet Explorer）瀏覽器以及網景公司的Netscape瀏覽器。
11. 網路服務
網路服務是指NAS產品在運行時系統能夠提供何種服務。典型的網路服務有DHCP、DNS、FTP、Telnet、WINS、SMTP等。
DHCP
DHCP的全名是「Dynamic Host Configuration Protocol」，即動態主機配置協議。在使用DHCP的網路里，用戶的計算機可以從DHCP伺服器那裡獲得上網的參數，幾乎不需要做任何手工的配置就可以上網。一般情況下，DHCP伺服器會盡量保持每台計算機使用同一個IP地址上網。如果計算機長時間沒有上網或配置為使用靜態地址上網，DHCP伺服器就會把這個地址分配給其他計算機。
WINS
WINS是「Windows Internet Name Service」的簡稱，中文為Windows網際命名服務，WINS伺服器主要用於NetBIOS名字（計算機名稱）服務，它處理的是NetBIOS計算機名(Computer Name)，所以也被稱為NetBIOS名字伺服器(NBNS，NetBIOS Name Server)。WINS伺服器可以登記WINS-enabled工作站(下面簡稱為「WINS工作站」)的計算機名、IP地址、DNS域名等數據，當工作站查詢名字時，它又可以將這些數據提供給工作站。
DNS
DNS，Domain Name System或者Domain Name Service（域名系統或者余名服務）。域名系統為Internet上的主機分配域名地址和IP地址。用戶使用域名地址，該系統就會自動把域名地址轉為IP地址。域名服務是運行域名系統的Internet工具。執行域名服務的伺服器稱之為DNS伺服器，通過DNS伺服器來應答域名服務的查詢。
FTP
文件傳輸協議FTP(File Transfer Protocol)是Internet傳統的服務之一。FTP使用戶能在兩個聯網的計算機之間傳輸文件，它是Internet傳遞文件最主要的方法。使用匿名(Anonymous)FTP，用戶可以免費獲取Internet豐富的資源。除此之外，FTP還提供登錄、目錄查詢、文件操作及其他會話控制功能。
SMTP
SMTP(Simple Mail Transfer Protocol)即簡單郵件傳輸協議,它是一組用於由源地址到目的地址傳送郵件的規則,由它來控制信件的中轉方式。SMTP協議屬於TCP/IP協議族,它幫助每台計算機在發送或中轉信件時找到下一個目的地。通過SMTP協議所指定的伺服器,我們就可以把E－mail寄到收信人的伺服器上了,整個過程只要幾分鍾。SMTP伺服器則是遵循SMTP協議的發送郵件伺服器，用來發送或中轉你發出的電子郵件。
Telnet
有的時候我們需要運行一些很大的程序，而自己的PC又達不到運行這個程序所必須的配置，在這種情況下，我們可以通過網路連接上一台功能強大的計算機，並且把自己的PC模擬成那台計算機的終端，進而達到在該計算機上運行程序的目的。這種利用網路遠程登錄到其他計算機上，並且以虛擬終端方式遙控程序運行的做法就是TELNET。隨著計算機硬體的發展，目前TELNET在一般網路用戶中已經不是很普遍了，但是對於網路管理員來說，它仍然是個得力助手。
12. 網路安全
網路安全是指網路系統的硬體、軟體及其系統中的數據受到保護，不受偶然的或者惡意的原因而遭到破壞、更改、泄露，系統連續可靠正常地運行，網路服務不中斷。網路安全實際上包括兩部分：網路的安全和主機系統的安全。網路安全主要通過設置防火牆來實現，也可以考慮在路由器上設置一些數據包過濾的方法防止來自Internet上的黑客的攻擊。至於系統的安全則需根據不同的操作系統來修改相關的系統文件，合理設置用戶許可權和文件屬性。 NAS產品的網路安全應具有以下四個方面的特徵：保密性：信息不泄露給非授權用戶、實體或過程，或供其利用的特性。完整性：數據未經授權不能進行改變的特性。即信息在存儲或傳輸過程中保持不被修改、不被破壞和丟失的特性。可用性：可被授權實體訪問並按需求使用的特性。即當需要時能否存取所需的信息。例如網路環境下拒絕服務、破壞網路和有關系統的正常運行等都屬於對可用性的攻擊；可控性：對信息的傳播及內容具有控制能力。
13. NAS
NAS是英文「Network Attached Storage」的縮寫, 中文意思是「網路附加存儲」。按字面簡單說就是連接在網路上, 具備資料存儲功能的裝置，因此也稱為「網路存儲器」或者「網路磁碟陣列」。從結構上講，NAS是功能單一的精簡型電腦，因此在架構上不像個人電腦那麼復雜，在外觀上就像家電產品，只需電源與簡單的控制鈕，結構圖如下： NAS是一種專業的網路文件存儲及文件備份設備，它是基於LAN（區域網）的，按照TCP/IP協議進行通信，以文件的I/O（輸入/輸出）方式進行數據傳輸。在LAN環境下，NAS已經完全可以實現異構平台之間的數據級共享，比如NT、UNIX等平台的共享。一個NAS系統包括處理器，文件服務管理模塊和多個硬碟驅動器(用於數據的存儲)。 NAS 可以應用在任何的網路環境當中。主伺服器和客戶端可以非常方便地在NAS上存取任意格式的文件，包括SMB格式（Windows）NFS格式(Unix, Linux)和CIFS（Common Internet File System）格式等等。典型的NAS的網路結構如下圖所示：存儲網路（SAN）：SAN 是指存儲設備相互連接且與一台伺服器或一個伺服器群相連的網路。其中的伺服器用作 SAN 的接入點。在有些配置中，SAN 也與網路相連。SAN 中將特殊交換機當作連接設備。它們看起來很像常規的乙太網絡交換機，是 SAN 中的連通點。SAN 使得在各自網路上實現相互通信成為可能，同時並帶來了很多有利條件。 SAN英文全稱：Storage Area Network，即存儲區域網路。它是一種通過光纖集線器、光纖路由器、光纖交換機等連接設備將磁碟陣列、磁帶等存儲設備與相關伺服器連接起來的高速專用子網。 SAN由三個基本的組件構成：介面（如SCSI、光纖通道、ESCON等）、連接設備（交換設備、網關、路由器、集線器等）和通信控制協議（如IP和SCSI等）。這三個組件再加上附加的存儲設備和獨立的SAN伺服器，就構成一個SAN系統。SAN提供一個專用的、高可靠性的基於光通道的存儲網路，SAN允許獨立地增加它們的存儲容量，也使得管理及集中控制（特別是對於全部存儲設備都集群在一起的時候）更加簡化。而且，光纖介面提供了10 km的連接長度，這使得物理上分離的遠距離存儲變得更容易.

③ 雲存儲是用什麼原理的，是怎麼來做的。硬體軟體各有什麼要求

這個具體還是要根據存儲的數據類型和數據量的大小來決定的！有很多類型的雲存儲軟體。比如：雲創存儲的Minicloud迷你雲，這是一款適合中小企業的雲存儲系統，是一個超安全的私有雲計算數據中心，採用高可靠的雲存儲技術，文件數據塊始終以雙副本方式在不同節點上存放，絕不丟失數據。

同時，迷你雲海量存儲空間支持靈活使用，既可作為應用軟體（如郵箱、視頻監控）的海量存儲空間，又可作為員工的私密存儲空間，還可以作為數據共享空間，為了確保數據安全，辦公室內部共享數據與通過互聯網共享數據採用完全隔離的兩套系統。在辦公室內部，可通過「我的電腦」直接訪問自己的私有數據空間，在辦公室外部，可通過PC Web界面和移動終端（安卓手機、iPhone以及iPad）等訪問minicloud，實現移動辦公。同時，還提供豐富多彩的應用系統，系統自帶企業郵箱、內部虛擬磁碟、網路雲盤*、FTP等應用，用戶還可按需安裝配置其它應用；可選配超強的桌面虛擬化系統：單伺服器支持100多個瘦終端流暢共享各類應用軟體和上網。

④ 大型網站是怎麼存儲數據的

一個大的機房,一台伺服器可以掛很多硬碟(大容量的),而且伺服器可以採用聯機技術,把存儲的東西存儲到不同的伺服器,但不會影響用戶的訪問.

⑤ 《大規模分布式存儲系統原理解析與架構實戰》epub下載在線閱讀，求百度網盤雲資源

《大規模分布式存儲系統》（楊傳輝）電子書網盤下載免費在線閱讀

鏈接：https://pan..com/s/1CG8nBAVixYg53OHREZc_3g

提取碼：khut

書名：大規模分布式存儲系統

作者：楊傳輝

豆瓣評分：7.8

出版社：機械工業出版社

出版年份：2013-9-1

頁數：293

內容簡介：

《大規模分布式存儲系統：原理解析與架構實戰》是分布式系統領域的經典著作，由阿里巴巴高級技術專家「阿里日照」（OceanBase核心開發人員）撰寫，陽振坤、章文嵩、楊衛華、汪源、余鋒（褚霸）、賴春波等來自阿里、新浪、網易和網路的資深技術專家聯袂推薦。理論方面，不僅講解了大規模分布式存儲系統的核心技術和基本原理，而且對谷歌、亞馬遜、微軟和阿里巴巴等國際型大互聯網公司的大規模分布式存儲系統進行了分析；實戰方面，首先通過對阿里巴巴的分布式資料庫OceanBase的實現細節的深入剖析完整地展示了大規模分布式存儲系統的架構與設計過程，然後講解了大規模分布式存儲技術在雲計算和大數據領域的實踐與應用。

《大規模分布式存儲系統：原理解析與架構實戰》內容分為四個部分：基礎篇——分布式存儲系統的基礎知識，包含單機存儲系統的知識，如數據模型、事務與並發控制、故障恢復、存儲引擎、壓縮/解壓縮等；分布式系統的數據分布、復制、一致性、容錯、可擴展性等。范型篇——介紹谷歌、亞馬遜、微軟、阿里巴巴等著名互聯網公司的大規模分布式存儲系統架構，涉及分布式文件系統、分布式鍵值系統、分布式表格系統以及分布式資料庫技術等。實踐篇——以阿里巴巴的分布式資料庫OceanBase為例，詳細介紹分布式資料庫內部實現，以及實踐過程中的經驗。專題篇——介紹分布式系統的主要應用：雲存儲和大數據，這些是近年來的熱門領域，本書介紹了雲存儲平台、技術與安全，以及大數據的概念、流式計算、實時分析等。

作者簡介：

楊傳輝，阿里巴巴高級技術專家，花名日照，OceanBase核心開發人員，對分布式系統的理論和工程實踐有深刻理解。曾在網路作為核心成員參與類MapRece系統、類Bigtable系統和網路分布式消息隊列等底層基礎設施架構工作。熱衷於分布式存儲和計算系統設計，樂於分享，有技術博客NosqlNotes。

⑥ 視頻網站為何能存儲那麼多的電影

大型的網站都是有若干個伺服器的,每個伺服器都有好幾個硬碟,所以可以存放大量的文件.
舉個例子, 維基網路公布了他們服務的配置,主資料庫伺服器一共有15台,配置為內存4GB~16GB，6塊73~146GB的硬碟和雙CPU。資料庫中除了有一個主資料庫，還有許多復制的從資料庫. 像谷歌這樣的超大型網站有幾十萬台廉價的IDE硬碟伺服器構成.

⑦ 網盤存儲原理

網盤的存儲原理其實就是網路公司將其伺服器的硬碟或硬碟陣列中的一部分容量分給注冊用戶使用，因此網盤一般來說投資都比較大，所以免費網盤一般容量比較小，目前一般為300M到10G左右；另外為了防止用戶濫用網盤還往往附加單個文件最大限制，目前一般為100M到1G左右，因此免費網盤一般只用於存儲較小的文件。
而收費網盤則具有速度快、安全性能好、容量高、允許大文件存儲等優點，適合有較高要求的用戶。
網盤存儲原理從概念上來說，雲盤應該有更多的物理性質上的備份，至少3個。網盤就看那個網站怎麼做的存儲機制了，但是大致來說都只在一處而已。也就是上傳文件的時候，雲盤應該同時在至少3處伺服器上留下了物理物理備份，而網盤不一定。空間佔用方面：都是用的網路上的伺服器的資源，與本地或者說是你上傳的個人的空間無關的。

⑧ 流媒體網站是怎樣儲存那麼多的視頻的，它的伺服器容量怎能如此之大

很簡單，小型的流媒體網站只需要一台小型伺服器+一塊或多塊硬碟就可以完全勝任，大型網站通常通過域伺服器多台伺服器協同作業就可以解決，通常一台伺服器掛載一塊1TB的硬碟大約可以存儲4000多集劇集，而目前一塊1T的企業版的硬碟價格不到1K對於一般網站主來說是可以承受的.而流媒體伺服器對其他硬體的要求並不高，比普通WEB網站的處理能力強一點就可以了。

另外，現在出現了一種新興的流媒體伺服器叫QVOD也叫快播，這種伺服器使用的是BT協議，網站主只需要從網路上下載視頻文件的種子放到伺服器就可以實現VOD視頻點播，使用這種方案，普通小網站主省去了大量的伺服器空間開支，一個擁有數萬視頻文件的網站只需要數百M的空間就可以解決，而且帶寬只需要是正常的1/100。QVOD單伺服器1000部400Kbps碼率的電影負載峰值用戶量可以達到2~3萬，是傳統點播網站的上百倍。

⑨ 大型網站如何存儲文章

即使生成靜態頁（html）之後，文章也是存在資料庫里的，修改之後，重新生成覆蓋一下就行了

大型網站存儲原理

與大型網站存儲原理相關的內容