1. 什麼是存儲
存儲就是根據不同的應用環境通過採取合理、安全、有效的方式將數據保存到某些介質上並能保證有效的訪問,總的來講可以包含兩個方面的含義:一方面它是數據臨時或長期駐留的物理媒介;另一方面,它是保證數據完整安全存放的方式或行為。存儲就是把這兩個方面結合起來,向客戶提供一套數據存放解決方案。
說到存儲介質,實際上它的范圍非常的廣,小到計算機系統中的幾百KB的ROM晶元,大到上百TB的磁碟陣列系統都可以用來保存數據,又都可以稱為存儲,可以說存儲無處不在、無處不有。
存儲按照使用的方式和存儲規模,又有移動存儲設備(比如:具有拇指大小的霹靂碟、具有名片大小的PCMCIA硬碟、具有書本大小的USB移動硬碟)和非移動存儲設備,企業中存儲數據的絕大多數設備都是非移動存儲設備。
通常計算機中的各種數據可以駐留在不同的介質上,按照存儲介質和存儲技術的不同又可分為磁碟存儲、磁帶存儲、光存儲、磁光存儲,其中磁帶是最為便宜的存儲介質、而磁碟是存取速度最快的存儲介質。
為了減少企業對存儲的整體投入,通常對不同的數據採取不同的存儲方式,因此在一個較大的存儲系統中存儲設備會分成三種角色:在線存儲、近線存儲、離線存儲,通常將不經常訪問的數據存放在離線存儲的設備上(比如:磁帶庫),將要求傳輸速度快或經常訪問的數據存放在在線存儲的設備上(比如:磁碟陣列)。
2. 目前主要三種數據存儲方式
三種存儲方式:DAS、SAN、NAS
三種存儲類型:塊存儲、文件存儲、對象存儲
塊存儲和文件存儲是我們比較熟悉的兩種主流的存儲類型,而對象存儲(Object-based Storage)是一種新的網路存儲架構,基於對象存儲技術的設備就是對象存儲設備(Object-based Storage Device)簡稱OSD。
本質是一樣的,底層都是塊存儲,只是在對外介面上表現不一致,分別應用於不同的業務場景。
分布式存儲的應用場景相對於其存儲介面,現在流行分為三種:
對象存儲: 也就是通常意義的鍵值存儲,其介面就是簡單的GET、PUT、DEL和其他擴展,如七牛、又拍、Swift、S3
塊存儲: 這種介面通常以QEMU Driver或者Kernel Mole的方式存在,這種介面需要實現Linux的Block Device的介面或者QEMU提供的Block Driver介面,如Sheepdog,AWS的EBS,青雲的雲硬碟和阿里雲的盤古系統,還有Ceph的RBD(RBD是Ceph面向塊存儲的介面)
文件存儲: 通常意義是支持POSIX介面,它跟傳統的文件系統如Ext4是一個類型的,但區別在於分布式存儲提供了並行化的能力,如Ceph的CephFS(CephFS是Ceph面向文件存儲的介面),但是有時候又會把GFS,HDFS這種非POSIX介面的類文件存儲介面歸入此類。
3. 計算機術語中的數據存儲是什麼存儲
數據存儲用硬碟或內存存儲。
ß外部存儲器就像日記本一樣,你可以在上面記錄任何內容,而且關機後信息不會丟失。ß硬碟的磁性圓盤由硬質材料製成,有很高的精密度。硬碟連同驅動器一起封閉在殼體內,在它的容量比軟盤和光碟大得多,讀寫速度比軟盤和光碟快得多。ß硬碟是由幾片硬碟片環繞一個共同的軸心組成的碟片組,兩個碟片之間僅留出安置磁頭的距離。每個碟片有兩個盤面,盤面上劃分著許多同心圓,稱為磁軌。這些同心圓周長不同,但存儲量卻相同。每個磁軌被分為很多區域,每個區域叫做一個扇區,每個扇區存儲五百十二個位元組的信息。在硬碟中,幾個碟片上相同磁軌號的集合叫做柱面,這些磁軌有一個相同的磁場旋轉方向。每個盤面對應一個磁頭,但現在的硬碟,兩個磁頭可以讀取一個碟片。所以硬碟容量由柱面數、盤面數、每磁軌的扇區數決定。硬碟容量等於柱面數乘以盤面數乘以每個磁軌的扇區數乘以512,一般以GB、TB為單位,很多硬碟廠商計算GB和TB時是十進制的,1GB是1000MB,1TB是1000GB。ß硬碟內部由磁儲存檔片組成,數量從一片到三片不等,每個碟片有一定的容量,叫做單碟容量,幾個碟片的容量之和就是硬碟總容量。ß硬碟的主軸馬達帶動碟片高速旋轉,產生浮力使磁頭飄浮在碟片上方,硬碟通過磁頭來讀取碟片上的數據,轉速越快,數據讀取的時間也就越短。轉速在很大程度上決定硬碟的速度。
硬碟的磁頭移動到盤面指定的磁軌所用的時間叫做平均尋道時間,單位為毫秒,這個時間越小越好。ß數據傳輸率是電腦從硬碟中准確找到相應數據並傳輸到內存的速率,包括內部數據傳輸率和外部數據傳輸率,是用單位時間可傳輸幾兆位元組衡量的。硬碟的介面有IDE介面和SCSI介面。ß由於硬碟是全封閉固定安裝的,所以硬碟驅動器也是固定在一起安裝在主機箱內的,從主機箱外面看不見。
4. 數據存儲是什麼意思
舉個例子:
你把電腦上的文件拷貝到你的U盤上,這就是一種數據儲蓄。
你從網線下載東西到電腦上來 也是一種數據儲存的表現
5. 在資料庫中存儲的是什麼
資料庫是「按照數據結構來組織、存儲和管理數據的倉庫」。是一個長期存儲在計算機內的、有組織的、可共享的、統一管理的大量數據的集合。
資料庫是一個按數據結構來存儲和管理數據的計算機軟體系統。資料庫的概念實際包括兩層意思:資料庫是一個實體,它是能夠合理保管數據的「倉庫」,用戶在該「倉庫」中存放要管理的事務數據,「數據」和「庫」兩個概念結合成為資料庫。
資料庫系統,是由資料庫及其管理軟體組成的系統。資料庫系統是為適應數據處理的需要而發展起來的一種較為理想的數據處理系統,也是一個為實際可運行的存儲、維護和應用系統提供數據的軟體系統,是存儲介質 、處理對象和管理系統的集合體。
6. 資料庫中存儲的是什麼
資料庫中存儲的是電子文件。
資料庫是存放數據的倉庫。它的存儲空間很大,可以存放百萬條、千萬條、上億條數據。但是資料庫並不是隨意地將數據進行存放,是有一定的規則的,否則查詢的效率會很低。當今世界是一個充滿著數據的互聯網世界,充斥著大量的數據。
即這個互聯網世界就是數據世界。數據的來源有很多,比如出行記錄、消費記錄、瀏覽的網頁、發送的消息等等。除了文本類型的數據,圖像、音樂、聲音都是數據。
(6)數據存儲是一種什麼數據擴展閱讀:
資料庫的分類
1、關系型資料庫: 經過數學理論驗證 可以保存現實生活中的各種關系數據, 資料庫中存儲數據以表為單位;
2、非關系型資料庫:通常用來解決某些特定的需求如:數據緩存,高並發訪問。 存儲數據的形式有多種,舉例:Redis資料庫:通過鍵值對的形式存儲數據;
7. 數據存儲的三類簡介
一、DAS(Direct Attached Storage)直接附加存儲,DAS這種存儲方式與我們普通的PC存儲架構一樣,外部存儲設備都是直接掛接在伺服器內部匯流排上,數據存儲設備是整個伺服器結構的一部分。
DAS存儲方式主要適用以下環境:
(1)小型網路
因為網路規模較小,數據存儲量小,且也不是很復雜,採用這種存儲方式對伺服器的影響不會很大。並且這種存儲方式也十分經濟,適合擁有小型網路的企業用戶。
(2)地理位置分散的網路
雖然企業總體網路規模較大,但在地理分布上很分散,通過SAN或NAS在它們之間進行互聯非常困難,此時各分支機構的伺服器也可採用DAS存儲方式,這樣可以降低成本。
(3)特殊應用伺服器
在一些特殊應用伺服器上,如微軟的集群伺服器或某些資料庫使用的原始分區,均要求存儲設備直接連接到應用伺服器。
(4)提高DAS存儲性能
在伺服器與存儲的各種連接方式中,DAS曾被認為是一種低效率的結構,而且也不方便進行數據保護。直連存儲無法共享,因此經常出現的情況是某台伺服器的存儲空間不足,而其他一些伺服器卻有大量的存儲空間處於閑置狀態卻無法利用。如果存儲不能共享,也就談不上容量分配與使用需求之間的平衡。
DAS結構下的數據保護流程相對復雜,如果做網路備份,那麼每台伺服器都必須單獨進行備份,而且所有的數據流都要通過網路傳輸。如果不做網路備份,那麼就要為每台伺服器都配一套備份軟體和磁帶設備,所以說備份流程的復雜度會大大增加。
想要擁有高可用性的DAS存儲,就要首先能夠降低解決方案的成本,例如:LSI的12Gb/s SAS,在它有DAS直聯存儲,通過DAS能夠很好的為大型數據中心提供支持。對於大型的數據中心、雲計算、存儲和大數據,所有這一切都對DAS存儲性能提出了更高的要求,雲和企業數據中心數據的爆炸性增長也推動了市場對於可支持更高速數據訪問的高性能存儲介面的需求,因而LSI 12Gb/s SAS正好是能夠滿足這種性能增長的要求,它可以提供更高的IOPS和更高的吞吐能力,12Gb/s SAS提高了更高的寫入的性能,並且提高了RAID的整個綜合性能。
與直連存儲架構相比,共享式的存儲架構,比如SAN(storage-area network)或者NAS(network-attached storage)都可以較好的解決以上問題。於是乎我們看到DAS被淘汰的進程越來越快了。可是到2012年為止,DAS仍然是伺服器與存儲連接的一種常用的模式。事實上,DAS不但沒有被淘汰,近幾年似乎還有回潮的趨勢。 二、NAS(Network Attached Storage)數據存儲方式
NAS(網路附加存儲)方式則全面改進了以前低效的DAS存儲方式。它採用獨立於伺服器,單獨為網路數據存儲而開發的一種文件伺服器來連接所存儲設備,自形成一個網路。這樣數據存儲就不再是伺服器的附屬,而是作為獨立網路節點而存在於網路之中,可由所有的網路用戶共享。
NAS的優點:
(1)真正的即插即用
NAS是獨立的存儲節點存在於網路之中,與用戶的操作系統平台無關,真正的即插即用。
(2)存儲部署簡單
NAS不依賴通用的操作系統,而是採用一個面向用戶設計的,專門用於數據存儲的簡化操作系統,內置了與網路連接所需要的協議,因此使整個系統的管理和設置較為簡單。
(3)存儲設備位置非常靈活
(4)管理容易且成本低
NAS數據存儲方式是基於現有的企業Ethernet而設計的,按照TCP/IP協議進行通信,以文件的I/O方式進行數據傳輸。
NAS的缺點:
(1)存儲性能較低(2)可靠度不高 三、SAN(Storage Area Network)存儲方式
1991年,IBM公司在S/390伺服器中推出了ESCON(Enterprise System Connection)技術。它是基於光纖介質,最大傳輸速率達17MB/s的伺服器訪問存儲器的一種連接方式。在此基礎上,進一步推出了功能更強的ESCON Director(FC SWitch),構建了一套最原始的SAN系統。
SAN存儲方式創造了存儲的網路化。存儲網路化順應了計算機伺服器體系結構網路化的趨勢。SAN的支撐技術是光纖通道(FC Fiber Channel)技術。它是ANSI為網路和通道I/O介面建立的一個標准集成。FC技術支持HIPPI、IPI、SCSI、IP、ATM等多種高級協議,其最大特性是將網路和設備的通信協議與傳輸物理介質隔離開,這樣多種協議可在同一個物理連接上同時傳送。
SAN的硬體基礎設施是光纖通道,用光纖通道構建的SAN由以下三個部分組成:
(1)存儲和備份設備:包括磁帶、磁碟和光碟庫等。
(2)光纖通道網路連接部件:包括主機匯流排適配卡、驅動程序、光纜、集線器、交換機、光纖通道和SCSI間的橋接器
(3)應用和管理軟體:包括備份軟體、存儲資源管理軟體和存儲設備管理軟體。
SAN的優勢:
(1)網路部署容易;
(2)高速存儲性能。因為SAN採用了光纖通道技術,所以它具有更高的存儲帶寬,存儲性能明顯提高。SAn的光纖通道使用全雙工串列通信原理傳輸數據,傳輸速率高達1062.5Mb/s。
(3)良好的擴展能力。由於SAN採用了網路結構,擴展能力更強。光纖介面提供了10公里的連接距離,這使得實現物理上分離,不在本地機房的存儲變得非常容易。 DAS、NAS和SAN三種存儲方式比較
存儲應用最大的特點是沒有標準的體系結構,這三種存儲方式共存,互相補充,已經很好滿足企業信息化應用。
從連接方式上對比,DAS採用了存儲設備直接連接應用伺服器,具有一定的靈活性和限制性;NAS通過網路(TCP/IP,ATM,FDDI)技術連接存儲設備和應用伺服器,存儲設備位置靈活,隨著萬兆網的出現,傳輸速率有了很大的提高;SAN則是通過光纖通道(Fibre Channel)技術連接存儲設備和應用伺服器,具有很好的傳輸速率和擴展性能。三種存儲方式各有優勢,相互共存,佔到了磁碟存儲市場的70%以上。SAN和NAS產品的價格仍然遠遠高於DAS.許多用戶出於價格因素考慮選擇了低效率的直連存儲而不是高效率的共享存儲。
客觀的說,SAN和NAS系統已經可以利用類似自動精簡配置(thin provisioning)這樣的技術來彌補早期存儲分配不靈活的短板。然而,之前它們消耗了太多的時間來解決存儲分配的問題,以至於給DAS留有足夠的時間在數據中心領域站穩腳跟。此外,SAN和NAS依然問題多多,至今無法解決。
8. 數據存儲形式有哪幾種
數據存儲是數據流在加工過程中產生的臨時文件或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。數據存儲要命名,這種命名要反映信息特徵的組成含義。數據流反映了系統中流動的數據,表現出動態數據的特徵;數據存儲反映系統中靜止的數據,表現出靜態數據的特徵。
常用的存儲介質為磁碟和磁帶。數據存儲組織方式因存儲介質而異。在磁帶上數據僅按順序文件方式存取;在磁碟上則可按使用要求採用順序存取或直接存取方式。數據存儲方式與數據文件組織密切相關,其關鍵在於建立記錄的邏輯與物理順序間對應關系,確定存儲地址,以提高數據存取速度。
9. 什麼是分布式數據存儲
什麼是分布式存儲
分布式存儲是一種數據存儲技術,它通過網路使用企業中每台機器上的磁碟空間,這些分散的存儲資源構成了虛擬存儲設備,數據分布存儲在企業的各個角落。
分布式存儲系統,可在多個獨立設備上分發數據。傳統的網路存儲系統使用集中存儲伺服器來存儲所有數據。存儲伺服器成為系統性能的瓶頸,也是可靠性和安全性的焦點,無法滿足大規模存儲應用的需求。分布式網路存儲系統採用可擴展的系統結構,使用多個存儲伺服器共享存儲負載,利用位置伺服器定位存儲信息,不僅提高了系統的可靠性,可用性和訪問效率,而且易於擴展。