① 如何安裝FastDFS
Google了一下,流行的開源分布式文件系統有很多,介紹如下:
mogileFS:Key-Value型元文件系統,不支持FUSE,應用程序訪問它時需要API,主要用在web領域處理海量小圖片,效率相比mooseFS高很多。
fastDFS:國人在mogileFS的基礎上進行改進的key-value型文件系統,同樣不支持FUSE,提供比mogileFS更好的性能。
mooseFS:支持FUSE,相對比較輕量級,對master伺服器有單點依賴,用perl編寫,性能相對較差,國內用的人比較多
glusterFS:支持FUSE,比mooseFS龐大
ceph:支持FUSE,客戶端已經進入了linux-2.6.34內核,也就是說可以像ext3/rasierFS一樣,選擇ceph為文件系統。徹底的分布式,沒有單點依賴,用C編寫,性能較好。基於不成熟的btrfs,其本身也非常不成熟。
lustre:Oracle公司的企業級產品,非常龐大,對內核和ext3深度依賴
NFS:老牌網路文件系統,具體不了解,反正NFS最近幾年沒發展,肯定不能用。
鑒於fastDFS是國人開發,也有國內的一些大公司在使用,so…
普通的文件架構其實一兩年內也是沒有問題的,但有句話叫未雨綢繆,於是決定折騰折騰。
② fastdfs能存儲什麼東西
FastDFS是一個開源的輕量級分布式文件系統,它對文件進行管理,功能包括:文件存儲、文件同步、文件訪問(文件上傳、文件下載)等,解決了大容量存儲和負載均衡的問題。特別適合以文件為載體的在線服務,如相冊網站、視頻網站等等。
③ linux下常用的分布式文件系統有哪些
常見的分布式文件系統有,GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS等。各自適用於不同的領域。它們都不是系統級的分布式文件系統,而是應用級的分布式文件存儲服務。
GFS(Google File System)
--------------------------------------
Google公司為了滿足本公司需求而開發的基於Linux的專有分布式文件系統。。盡管Google公布了該系統的一些技術細節,但Google並沒有將該系統的軟體部分作為開源軟體發布。
下面分布式文件系統都是類 GFS的產品。
HDFS
--------------------------------------
Hadoop 實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。 Hadoop是Apache Lucene創始人Doug Cutting開發的使用廣泛的文本搜索庫。它起源於Apache Nutch,後者是一個開源的網路搜索引擎,本身也是Luene項目的一部分。Aapche Hadoop架構是MapRece演算法的一種開源應用,是Google開創其帝國的重要基石。
Ceph
---------------------------------------
是加州大學聖克魯茲分校的Sage weil攻讀博士時開發的分布式文件系統。並使用Ceph完成了他的論文。
說 ceph 性能最高,C++編寫的代碼,支持Fuse,並且沒有單點故障依賴, 於是下載安裝, 由於 ceph 使用 btrfs 文件系統, 而btrfs 文件系統需要 Linux 2.6.34 以上的內核才支持。
可是ceph太不成熟了,它基於的btrfs本身就不成熟,它的官方網站上也明確指出不要把ceph用在生產環境中。
Lustre
---------------------------------------
Lustre是一個大規模的、安全可靠的,具備高可用性的集群文件系統,它是由SUN公司開發和維護的。
該項目主要的目的就是開發下一代的集群文件系統,可以支持超過10000個節點,數以PB的數據量存儲系統。
目前Lustre已經運用在一些領域,例如HP SFS產品等。
④ linux下常用的分布式文件系統有哪些
Lustre是HP,Intel,Cluster File System公司聯合美國能源部開發的Linux集群並行文件系統,名稱來源於Linux和Clusters。同時Lustre也是一個遵循GPL許可協議的開源軟體,Lustre也被稱為平行分布式文件系統,常用於大型計算機集群和超級電腦中。
Lustre的主要組建包括:元數據伺服器(Metadataservers, MDSs)、對象存儲伺服器(objectstorage servers, OSSs)和客戶端。其中MDSs提供元數據服務,MGS管理伺服器提供Lustre文件系統配置信息,OSS對象存儲伺服器expose塊設備提供數據。
Lustre文件系統針對大文件讀寫進行了優化,能夠提高性能的IO能力;在源數據獨立存儲、服務和網路失效的快速恢復、基於意圖的分布式鎖管理和系統可快速配置方面優異。
分布式存儲的關鍵技術主要包括:全局名字空間、緩存一致性、安全性、可用性和可擴展性。從數據形態來劃分,主要有:結構化數據、非機構化數據和半結構化數據。
Linux是一套免費使用和自由傳播的類Unix操作系統,是一個基於POSIX和UNIX的多用戶、多任務、支持多線程和多CPU的操作系統。它能運行主要的UNIX工具軟體、應用程序和網路協議。它支持32位和64位硬體。Linux繼承了Unix以網路為核心的設計思想,是一個性能穩定的多用戶網路操作系統。
Linux操作系統誕生於1991 年10 月5 日(這是第一次正式向外公布時間)。Linux存在著許多不同的Linux版本,但它們都使用了Linux內核。Linux可安裝在各種計算機硬體設備中,比如手機、平板電腦、路由器、視頻游戲控制台、台式計算機、大型機和超級計算機。
⑤ ceph這款雲存儲技術怎麼樣
雲存儲系統具有良好的可擴展性、容錯性,以及內部實現對用戶透明等特性,這一切都離不開分布式文件系統的支撐。現有的雲存儲分布式文件系統包括GFS、HDFS、Lustre、FastDFS、PVFS、GPFS、PFS、Ceph和TFS等。
⑥ 文件Fastcompre是什麼
首先簡單了解一下基礎概念,FastDFS是一個開源的輕量級分布式文件系統,由跟蹤伺服器(tracker server)、存儲伺服器(storage server)和客戶端(client)三個部分組成,主要解決了海量數據存儲問題,特別適合以中小文件(建議范圍:4KB < file_size <500MB)為載體的在線服務。FastDFS的系統結構圖如下:
如上圖,FastDFS的兩個核心概念分別是:
Tracker(跟蹤器)
Storage(存儲節點)
Tracker主要做調度工作,相當於mvc中的controller的角色,在訪問上起負載均衡的作用。跟蹤器和存儲節點都可以由一台或多台伺服器構成,跟蹤器和存儲節點中的伺服器均可以隨時增加或下線而不會影響線上服務,其中跟蹤器中的所有伺服器都是對等的,可以根據伺服器的壓力情況隨時增加或減少。Tracker負責管理所有的Storage和group,每個storage在啟動後會連接Tracker,告知自己所屬的group等信息,並保持周期性的心跳,tracker根據storage的心跳信息,建立group==>[storage server list]的映射表,Tracker需要管理的元信息很少,會全部存儲在內存中;另外tracker上的元信息都是由storage匯報的信息生成的,本身不需要持久化任何數據,這樣使得tracker非常容易擴展,直接增加tracker機器即可擴展為tracker cluster來服務,cluster里每個tracker之間是完全對等的,所有的tracker都接受stroage的心跳信息,生成元數據信息來提供讀寫服務。
Storage採用了分卷[Volume](或分組[group])的組織方式,存儲系統由一個或多個組組成,組與組之間的文件是相互獨立的,所有組的文件容量累加就是整個存儲系統中的文件容量。一個卷[Volume](組[group])可以由一台或多台存儲伺服器組成,一個組中的存儲伺服器中的文件都是相同的,組中的多台存儲伺服器起到了冗餘備份和負載均衡的作用,數據互為備份,存儲空間以group內容量最小的storage為准,所以建議group內的多個storage盡量配置相同,以免造成存儲空間的浪費。更多原理性的內容可以參考這篇blog,介紹的很詳細:分布式文件系統FastDFS設計原理
接下來就具體看一下FastDFS的整個下載安裝過程~
⑦ 基於linux 平台的主要分布式文件系統有哪些
常見的分布式文件系統有,GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS等。各自適用於不同的領域。它們都不是系統級的分布式文件系統,而是應用級的分布式文件存儲服務。
GFS(Google File System)
--------------------------------------
Google公司為了滿足本公司需求而開發的基於Linux的專有分布式文件系統。。盡管Google公布了該系統的一些技術細節,但Google並沒有將該系統的軟體部分作為開源軟體發布。
下面分布式文件系統都是類 GFS的產品。
HDFS
--------------------------------------
Hadoop 實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。
Hadoop是Apache Lucene創始人Doug Cutting開發的使用廣泛的文本搜索庫。它起源於Apache
Nutch,後者是一個開源的網路搜索引擎,本身也是Luene項目的一部分。Aapche
Hadoop架構是MapRece演算法的一種開源應用,是Google開創其帝國的重要基石。
Ceph
---------------------------------------
是加州大學聖克魯茲分校的Sage weil攻讀博士時開發的分布式文件系統。並使用Ceph完成了他的論文。
說 ceph 性能最高,C++編寫的代碼,支持Fuse,並且沒有單點故障依賴, 於是下載安裝, 由於 ceph 使用 btrfs 文件系統, 而btrfs 文件系統需要 Linux 2.6.34 以上的內核才支持。
可是ceph太不成熟了,它基於的btrfs本身就不成熟,它的官方網站上也明確指出不要把ceph用在生產環境中。
Lustre
---------------------------------------
Lustre是一個大規模的、安全可靠的,具備高可用性的集群文件系統,它是由SUN公司開發和維護的。
該項目主要的目的就是開發下一代的集群文件系統,可以支持超過10000個節點,數以PB的數據量存儲系統。
目前Lustre已經運用在一些領域,例如HP SFS產品等。
⑧ fastdfs對特大文件支持得如何
回復 2# happy_fish100 我這里的虛擬機鏡像不是塊設備,也是以普通文件的方式存在於文件系統上。 只不過文件都比較大,幾十G到幾百G不等,因為fastdfs是不分片的,不知道Fastdfs對特大的文件支持得如何?
⑨ 雲存儲怎麼更好實現容錯
雲存儲系統具有良好的可擴展性、容錯性,以及內部實現對用戶透明等特性,這一切都離不開分布式文件系統的支撐。現有的雲存儲分布式文件系統包括GFS、HDFS、Lustre、FastDFS、PVFS、GPFS、PFS、Ceph和TFS等。它們的許多設計理念類似,同時也各有特色。下面對現有的分布式文件系統進行詳細介紹。
1 Google File System (GFS)
GFS是一個可擴展的分布式文件系統,其主要用於處理大的分布式數據密集型應用。GFS的一大特色就是其運行於大量普通的廉價硬體上,通過GFS文件系統提供容錯功能,並給大量用戶提供可處理海量數據的高性能服務。和傳統標准相比,GFS文件規模巨大,其主要用來處理大文件。此外,GFS大多通過直接追加新數據來改變文件,而非覆蓋現有數據,一旦數據寫入完成,文件就僅支持讀操作。
2 Lustre文件系統
Lustre文件系統是一種典型的基於對象存儲技術 的分布式文件系統, 目前,該文件系統已經廣泛用於國外許多高性能計算機構,如美國能源部、Sandia國家實驗室、Pacific Northwest國家實驗室等。Top500機器中有多台均採用的是Lustre文件系統。
Lustre文件系統的大文件性能良好 ,其通過基於對象的數據存儲格式,將同一數據文件分為若干個對象分別存儲於不同的對象存儲設備。大文件I/O操作被分配到不同的對象存儲設備上並行實施,從而實現很大的聚合帶寬。此外,由於Lustre融合了傳統分布式文件系統的特色和傳統共享存儲文件系統的設計理念,因此其具有更加有效的數據管理機制、全局數據共享、基於對象存儲、存儲智能化,以及可快速部署等一系列優點。盡管如此,由於Lustre採用分布式存儲結構將元數據和數據文件分開存儲,訪問數據之前需要先訪問元數據伺服器,這一過程增加了網路開銷,從而使得Lustre的小文件I/O操作性能較差。
3 FastDFS文件系統
FastDFS是一個輕量級分布式文件系統,其體系架構如圖3所示,整個文件系統由客戶端(Cli—ent)、跟蹤器(Tracker)和存儲節點(Storage)三部分組成。系統服務端有Tracker和Storage兩個角色,Tracker用來負責作業的調度和負載均衡,Storage則用於存儲文件,並負責管理文件。為支持大容量的數據存儲,Storage採用分卷或分組的數據組織方式;存儲系統可由一個或多個卷組成,一個卷可以由一台或多台存儲伺服器構建。同一個卷下的多台存儲伺服器中的數據文件都是相同的,卷與卷之間的文件則相互獨立,通過這種數據組織方式,可以很好地實現數據冗餘備份以及系統負載均衡的目的。
圖 FastDFS文件系統體系結構示意圖
4 Parallel Virtual File System (PVFS)
由Clemson大學設計並成功開發的PVFS是一種構建在Linux操作系統之上的開源並行虛擬文件系統。PVFS基於傳統的C/S架構進行設計,整個文件系統由管理結點、計算結點和I/0結點三大部分組成,管理結點負責處理文件的元數據,計算節點用來執行各種計算任務,I/0結點則主要負責數據文件的存儲和讀寫,並負責給計算結點提供所需的數據。在整個集群系統范圍內,PVFS使用一致的全局命名空間,另外,PVFS應用對象存儲的概念,將數據文件條塊化為多個對象並分別存儲到多個存儲結點上。由於在網路通信方面,PVFS只支持TCP網路通信協議,這使得其靈活性不足;此外,由於PVFS應用對象存儲的概念進行數據文件的存儲,其在處理小文件時性能也不太理想。
5 General Parallel File System (GPFS)
GPFS的前身是Tiger Shark多媒體文件系統,其是IBM專為Linux集群系統設計的並行共享文件系統。在系統結構上,GPFS主要借鑒了IBM Linux集群系統中的虛擬共享磁碟技術,計算節點可以通過使用交換網路來同時並行訪問系統中多個磁碟中的數據,並依賴這一訪問方式來實現較高的I/O帶寬。GPFS的主要特點包括:通過循環的方式將大文件存儲在不同的磁碟上,同時通過合並操作來處理小文件的讀寫,使用動態選舉的元數據結點來管理元數據;此外,GPFS還具有基於日誌的失效節點的自動恢復策略以及集中式的數據鎖機制。
6 Parallel File System (PFS)
Sun公司的PFS分布式文件系統可以很好地支持高性能和可擴展的I/O操作,其主要設計思想是將文件分布在多個磁碟和伺服器上,並將存放文件的多個設備邏輯上看成一個虛擬磁碟來統一管理。很顯然,PFS可以同時跨越多個存儲系統,可以將整個PFS中的所有存儲設備都看成是這個虛擬磁碟的一部分;當有多個節點同時訪問同一文件時,PFS可以並行地為這些節點提供訪問服務。PFS分布式文件系統構建於Solaris操作系統之上,主要包括宿主節點、計算節點、I/O從屬節點和I/O主機節點。宿主節點是PFS提供給其它系統的人口,只有成功登錄到宿主節點的用戶才是合法的,才可以訪問PFS內部的數據文件。計算節點主要用來管理PFS系統的通信和內存資源。L/O主機節點則主要負責文件系統的目錄管理和存儲塊管理,同時為存儲數據文件提供讀寫服務。I/O從屬節點僅用來處理磁碟的讀寫操作和空白塊的分配工作。
7 Ceph雲存儲文件系統
Ceph是Califomia大學Santa Cruz分校的Sage Weil設計的一種雲存儲分布式文件系統。Ceph雲存儲文件系統的主要目標是設計基於POSIX的無節點故障分布式文件系統,並且數據文件具有容錯和無縫復制功能。Ceph文件系統具有三大特點,首先,其使用多個元數據伺服器來構建系統的命名空間,這顯著強化了元數據伺服器的並發訪問功能;其次,在元數據伺服器上,Ceph文件系統採用了動態的子樹劃分技術,並支持元數據伺服器的負載遷移,可以很好地實現元數據的負載均衡;最後,Ceph文件系統提供基於對象存儲設備的對象文件系統,並將數據文件作為一個存儲對象來對待,這有效地提高了數據文件的讀寫效率。
8 Taobao File System (TFS)
Taobao file system (TFS)是由淘寶開發的雲存儲文件系統,其主要面向海量非結構化數據存儲問題提供服務。TFS部署在普通的Linux集群上,為淘寶網提供高可靠、高並發的大量小文件數據存儲服務。TFS採用扁平化的數據組織結構將文件名映射到文件的物理地址,簡化了文件訪問流程,一定程度上優化了系統讀寫性能。
一個TFS集群由兩個NameServer節點和多個DataServer節點組成,TFS的服務程序都是作為一個用戶級的程序運行在普通Linux機器上。TFS將眾多的小文件合並成大文件,並稱這個大文件為Block,Block存儲在DataServer上,每個Block在TFS系統內均擁有唯一的Id號。NameServer負責維護block與DataServer之間的映射關系。NameServer採用HA結構,即雙機互為熱備份,來實現容災功能,兩台NameServer同時運行,其中一台為主節點,另外一台作為備用節點。當主NameServer節點出現故障後,迅速將備份NameServer切換為主節點並對外提供服務。
⑩ 各位使用的分布式文件存儲,有哪些產品使用體驗更好一些
我覺得XSKY星辰天合的XGFS文件存儲軟體不錯,這個軟體只需要三個全快閃記憶體元數據高可用節點,就可以高效保存和處理 100 億文件規模的數據。可以靈活擴展,滿足公司不斷增長的業務對性能和容量的需求。