如果數據量不是很大(G級別以下),文件不是特別零碎,可以直接存在硬碟上。
但是如果數據量已經/可能超過T級別,或者文件小且零碎,建議還是放在HDFS等分布式文件系統上。
我存儲爬蟲的html以及圖片數據,是通過HDFS的MapFile格式存儲的。MapFile是個已排序的鍵值對文件格式,我的鍵採用的是url的hash+採集時間,值就是文件內容。並且封裝了原生的MapFile.Reader實現了讀取和一定程度的緩存(目前只用了LRU)。
在HDFS提倡一次寫入,多次讀取的前提下,文件的更新只能是通過失效舊,使用新的策略。即把舊的元數據標記為失效,插入新的元數據,並把更新的文件寫入HDFS。讀取是通過新的元數據定位到文件。同時,要定期的清除已失效的文件,即把未失效的元數據讀出來,將對應的文件寫到新的MapFile,刪除舊的MapFile,即可實現物理刪除。
當然還可以使用HBase。HBase是面向列的,二進制存儲的,可橫向拓展的NoSQL。可以把不大於64M的數據作為單元格數據直接寫進去。但是有一定的學習成本,而且對集群的硬體要求比較
2. IBM x3650 伺服器添加硬碟怎樣做
ibm x3650伺服器使用8k,8k-l陣列卡,在已有陣列配置的情況下,如果確定要添加的硬碟沒有數據或配置信息,可以直接插入,在卡的核心界面配置陣列即可。
如果要添加的硬碟有數據或配置信息,或者不確定,請嚴格按以下操作說明來添加,以防止現有的陣列崩潰,數據丟失。
在安裝新硬碟之前,要按照下面的方法對其進行初始化:
1、關閉伺服器的電源;
2、拔掉伺服器上所有現有的硬碟;
3、插入這個新的硬碟;
4、啟動伺服器;
5、在加電自檢過程中,在看到Adaptec SAS RAID BIOS檢測並提示如下信息時按Ctrl-A:
Press <Ctrl><A> for IBM ServeRAID
Configuration Utility!
Booting the Controller Kernel....../
6、在IBM ServeRAID Configuration Utility Options選項窗口中,選擇"Array Configuration Utility";
7、在Main Menu主菜單中,選擇"Initialize Drives"並按Enter;
8、按空格鍵來選擇需要被初始化的硬碟,這些硬碟將會從左邊的窗口移動到右邊的窗口中,然後按Enter;
9、當出現警告提示時按Y;
10、預計每塊硬碟需要用5-10秒來進行初始化,當所有的硬碟都初始化完成後,Main Menu主菜單將會顯示出來;
11、按Escape退出IBM ServeRAID Configuration Utility界面;
系統重新啟動;
12、在加電自檢的開始,當看到IBM Logo標志顯示時,關閉伺服器;
13、重新安裝上以前移走的硬碟;
14、那個新的硬碟可以隨後安裝或以後再安裝;
15、啟動伺服器;
16、在顯示Adaptec SAS RAID BIOS的界面時,將會看到下列信息:
New devices detected at the following SAS Phys: (listing
of reinserted devices)
17、按Enter回車接受當前的陣列配置。
說明:
當一塊硬碟作為陣列的一部分後,每塊硬碟都要被寫上陣列配置信息的元數據。如果一塊帶有元數據的硬碟被安裝到一個現有的陣列中,這個現有的陣列上的元數據就會被破壞並且這個陣列將會變得無法被系統使用。
在把一塊硬碟插入到一個現有的陣列之前,一定要確認通過上述的初始化的步驟把所有的以前存在的元數據都要從這塊硬碟上清除掉。
3. 伺服器中的高速緩存檔,元數據盤,系統盤什麼意思
二樓說的很專業我來說個簡單的:raid0就是把多個(最少2個)硬碟合並成1個邏輯盤使用,數據讀寫時對各硬碟同時操作,不同硬碟寫入不同數據,速度快。raid1就是同時對2個硬碟讀寫(同樣的數據)。強調數據的安全性。比較浪費。raid5也是把多個(最少3個)硬碟合並成1個邏輯盤使用,數據讀寫時會建立奇偶校驗信息,並且奇偶校驗信息和相對應的數據分別存儲於不同的磁碟上。當RAID5的一個磁碟數據發生損壞後,利用剩下的數據和相應的奇偶校驗信息去恢復被損壞的數據。相當於raid0和raid1的綜合。raid10就是raid1+raid0,比較適合速度要求高,又要完全容錯,當然¥也很多的時候。最少需要4塊硬碟(注意:做raid10時要先作RAID1,再把數個RAID1做成RAID0,這樣比先做raid0,再做raid1有更高的可靠性)
4. 移動硬碟有的可以正常使用,有的電腦提示此卷不包含可識別的文件系統
這種情況最可能的原因是硬碟上分區元數據佔用的空間有不穩定的扇區,讀出來了就正常,沒讀出來就raw分區,建議盡快備份數據,然後用htne之類的軟體對盤做全盤壞扇區掃描,注意下smart的05和c5項,如果c5有較大計數就不要再存放重要數據文件。
5. 磁碟元數據測試0x32如何修復
你好,這個問題基本是與windows 10 系統的自動修復有關的,一般就是開機報錯,自動修復失敗的問題。
遇到這種情況,如果自己不會操作的話,就去專業的修理電腦的店裡解決,讓專業的工作人員來修復,這是比較保險的做法,或者可以咨詢windows客服,在他的幫助下解決。盡量不要自己操作,以防對數據造成損害。
6. 磁碟的NTF和FAT格式有什麼區別啊,用哪個好
NTFS(New Technology File System)是Microsoft Windows NT的標准文件系統,它也同時應用於Windows 2000/XP/2003。它與舊的FAT文件系統的主要區別是NTFS支持元數據(metadata),並且可以利用先進的數據結構提供更好的性能、穩定性和磁碟的利用率。NTFS有三個版本:在NT 3.51和NT 4中的1.2版,Windows 2000中的3.0版和Windows XP中的3.1版。這些版本有時被提及為4.0版、5.0版和5.1版。更新的版本添加了額外的特性,比如Windows 2000引入了配額。在兼容性方面,Windows的95/98/98SE和Me版都不能識別NTFS文件系統。另外NTFS支持文件加密管理功能,可為用戶提供更高層次的安全保證。
fat
我們以前用的DOS、Windows 95都使用FAT16文件系統,現在常用的Windows 98/2000/XP等系統均支持FAT16文件系統。但是它最大隻可以管理大到2GB的分區。隨著大容量硬碟的出現,從Windows 98開始,FAT32開始流行。它是FAT16的增強版本,可以支持大到2TB(2048GB)的分區。
FAT(File Allocation Table)是「文件分配表」的意思。對我們來說,它的意義在於對硬碟分區的管理。
FAT16:我們以前用的DOS、Windows 95都使用FAT16文件系統,現在常用的Win 98/2000/XP等系統均支持FAT16文件系統。它最大可以管理大到2GB的分區,但每個分區最多隻能有65525個簇(簇是磁碟空間的配置單位)。隨著硬碟或分區容量的增大,每個簇所佔的空間將越來越大,從而導致硬碟空間的浪費。
FAT32:隨著大容量硬碟的出現,從Windows 98開始,FAT32開始流行。它是FAT16的增強版本,可以支持大到2TB(2048G的分區。FAT32使用的簇比FAT16小,從而有效地節約了硬碟空間。
上面是網上查的資料,總的來說ntfs比較安全,而fat比較適合管理,比如在dos下格式化等,所以如果是計算機新手,還是建議用fat,就這樣
http://www.51jiang.cn
7. 硬碟的幾個分區為什麼會有不同的格式,比如說:NTFS/FAT32/RAW,它們有什麼意義,有什麼不同
●FAT32與NTFS的區別
在推出FAT32文件系統之前,通常PC機使用的文件系統是FAT16。像基於MS-DOS,Win 95等系統都採用了FAT16文件系統。在Win 9X下,FAT16支持的分區最大為2GB。我們知道計算機將信息保存在硬碟上稱為「簇」的區域內。使用的簇越小,保存信息的效率就越高。在FAT16的情況下,分區越大簇就相應的要增大,存儲效率就越低,勢必造成存儲空間的浪費。並且隨著計算機硬體和應用的不斷提高,FAT16文件系統已不能很好地適應系統的要求。在這種情況下,推出了增強的文件系統FAT32。同FAT16相比,FAT32主要具有以下特點:
1. 同FAT16相比FAT32最大的優點是可以支持的磁碟大小達到2TB(2047GB),但是不能支持小於512MB的分區。基於FAT32的Win 2000可以支持分區最大為32GB;而基於 FAT16的Win 2000支持的分區最大為4GB。
2. 由於採用了更小的簇,FAT32文件系統可以更有效率地保存信息。如兩個分區大小都為2GB,一個分區採用了FAT16文件系統,另一個分區採用了 FAT32文件系統。採用FAT16的分區的簇大小為32KB,而FAT32分區的簇只有4KB的大小。這樣FAT32就比FAT16的存儲效率要高很多,通常情況下可以提高15%。
3. FAT32文件系統可以重新定位根目錄和使用FAT的備份副本。另外FAT32分區的啟動記錄被包含在一個含有關鍵數據的結構中,減少了計算機系統崩潰的可能性。
●NTFS文件系統
NTFS文件系統是一個基於安全性的文件系統,是Windows NT所採用的獨特的文件系統結構,它是建立在保護文件和目錄數據基礎上,同時照顧節省存儲資源、減少磁碟佔用量的一種先進的文件系統。使用非常廣泛的 Windows NT 4.0採用的就是NTFS 4.0文件系統,相信它所帶來的強大的系統安全性一定給廣大用戶留下了深刻的印象。Win 2000採用了更新版本的NTFS文件系統??NTFS 5.0,它的推出使得用戶不但可以像Win 9X那樣方便快捷地操作和管理計算機,同時也可享受到NTFS所帶來的系統安全性。
●NTFS 5.0的特點主要體現在以下幾個方面:
1. NTFS可以支持的分區(如果採用動態磁碟則稱為卷)大小可以達到2TB。而Win 2000中的FAT32支持分區的大小最大為32GB。
2. NTFS是一個可恢復的文件系統。在NTFS分區上用戶很少需要運行磁碟修復程序。NTFS通過使用標準的事物處理日誌和恢復技術來保證分區的一致性。發生系統失敗事件時,NTFS使用日誌文件和檢查點信息自動恢復文件系統的一致性。
3. NTFS支持對分區、文件夾和文件的壓縮。任何基於Windows的應用程序對NTFS分區上的壓縮文件進行讀寫時不需要事先由其他程序進行解壓縮,當對文件進行讀取時,文件將自動進行解壓縮;文件關閉或保存時會自動對文件進行壓縮。
4. NTFS採用了更小的簇,可以更有效率地管理磁碟空間。在Win 2000的FAT32文件系統的情況下,分區大小在2GB~8GB時簇的大小為4KB;分區大小在8GB~16GB時簇的大小為8KB;分區大小在 16GB~32GB時,簇的大小則達到了16KB。而Win 2000的NTFS文件系統,當分區的大小在2GB以下時,簇的大小都比相應的FAT32簇小;當分區的大小在2GB以上時(2GB~2TB),簇的大小都為4KB。相比之下,NTFS可以比FAT32更有效地管理磁碟空間,最大限度地避免了磁碟空間的浪費。
5. 在NTFS分區上,可以為共享資源、文件夾以及文件設置訪問許可許可權。許可的設置包括兩方面的內容:一是允許哪些組或用戶對文件夾、文件和共享資源進行訪問;二是獲得訪問許可的組或用戶可以進行什麼級別的訪問。訪問許可許可權的設置不但適用於本地計算機的用戶,同樣也應用於通過網路的共享文件夾對文件進行訪問的網路用戶。與FAT32文件系統下對文件夾或文件進行訪問相比,安全性要高得多。另外,在採用NTFS格式的Win 2000中,應用審核策略可以對文件夾、文件以及活動目錄對象進行審核,審核結果記錄在安全日誌中,通過安全日誌就可以查看哪些組或用戶對文件夾、文件或活動目錄對象進行了什麼級別的操作,從而發現系統可能面臨的非法訪問,通過採取相應的措施,將這種安全隱患減到最低。這些在FAT32文件系統下,是不能實現的。
6. 在Win 2000的NTFS文件系統下可以進行磁碟配額管理。磁碟配額就是管理員可以為用戶所能使用的磁碟空間進行配額限制,每一用戶只能使用最大配額范圍內的磁碟空間。設置磁碟配額後,可以對每一個用戶的磁碟使用情況進行跟蹤和控制,通過監測可以標識出超過配額報警閾值和配額限制的用戶,從而採取相應的措施。磁碟配額管理功能的提供,使得管理員可以方便合理地為用戶分配存儲資源,避免由於磁碟空間使用的失控可能造成的系統崩潰,提高了系統的安全性。
7. NTFS使用一個「變更」日誌來跟蹤記錄文件所發生的變更。
●小提示(選取FAT32和NTFS的建議)
在系統的安全性方面,NTFS文件系統具有很多FAT32文件系統所不具備的特點,而且基於NTFS的Win 2000運行要快於基於FAT32的Win 2000;而在與Win 9X的兼容性方面,FAT32優於NTFS。所以在決定Win 2000中採用什麼樣的文件系統時應從以下幾點出發:
1. 計算機是單一的Win 2000系統,還是採用多啟動的Win 2000系統;
2. 本地安裝的磁碟的個數和容量;
3. 是否有安全性方面的考慮等。
基於以上的考慮,如果要在Win 2000中使用大於32GB的分區的話,那麼只能選擇NTFS格式。如果計算機作為單機使用,不需要考慮安全性方面的問題,更多地注重與Win 9X的兼容性,那麼FAT32是最好的選擇。如果計算機作為網路工作站或更多的追求系統的安全性,而且可以在單一的Win 2000模式下運行,強烈建議所有的分區都採用NTFS格式;如果要兼容以前的應用,需要安裝Win 9X或其它的操作系統,建議做成多啟動系統,這就需要兩個以上的分區,一個分區採用NTFS格式,另外的分區採用FAT32格式,同時為了獲得最快的運行速度建議將Win 2000的系統文件放置在NTFS分區上,其它的個人文件則放置在FAT32分區中。
●建議你用NTFS,現在比較流行
什麼是RAW格式文件?
其實RAW格式並不是什麼新鮮事,不少人對於這一格式,並不很了解。那麼和一般的JPEG格式的文件相比RAW格式的文件有什麼優點呢?
RAW是數碼相機原始數據的一種格式,相當於傳統相機的菲林底片。因此,它的色彩和層次的寬容度是相當廣闊的,RAW最大的好處是保存了最原始的CCD數據,把更多的自由放在用戶手裡。 記錄了最原始最真實的信息,不做修飾和更改,為後期製作留下了廣闊的可操作性。
而通常非RAW格式即使是最完整的TIF格式,也是經過了數碼相機自身處理的,這個處理實際上也是個軟體處理的過程,會有很明顯的生產商的興趣取向(或者說對圖像、色彩的理解),常說的索尼色彩艷麗、富士綠等就是對某種色彩特別處理的結果。
至於是RAW格式對後期有好處還是其它格式對後期有好處,這不是能夠一概而論的事,在ps高手眼裡,什麼格式可能不會有太大區別,只要原始的圖片精度夠基本上問題就不大了。所以這個我認為是要看個人能力及喜好的。
RAW是文件格式..不是系統格式
8. 移動硬碟分區esp和msr分區有什麼用
MSR分區即 Microsoft 保留 (MSR) 分區。是每個 GUID 分區表 (GPI) 磁碟都要求的分區。 系統組件可以將 MSR 分區的部分分配到新的分區以供它們使用。例如,將基本 GPT 磁碟轉換為動態磁碟後,系統分配的 MSR 分區將被用作「邏輯磁碟管理器」(LDM) 元數據分區。 MSR 分區的大小會因 GPT 磁碟的大小不同而發生變化。對於小於 16 GB 的磁碟,MSR 分區為 32 MB。對於大於 16 GB 的磁碟,MSR 分區為 128 MB。MSR 分區在「磁碟管理」中不可見,用戶也無法在 MSR 分區上存儲或刪除數據。
9. NTFS元數據文件是什麼
xp文件格式主要有兩種:NTFS,FAT32
-- NTFS格式細解
1、什麼是NTFS-新(N)技術(T)文件(F)系統(S)?
想要了解NTFS,我們首先應該認識一下FAT。FAT(File Allocation Table)是「文件分配表」的意思。對我們來說,它的意義在於對硬碟分區的管理。FAT16、FAT32、NTFS是目前最常見的三種文件系統。
FAT16:我們以前用的DOS、Windows 95都使用FAT16文件系統,現在常用的Windows 98/2000/XP等系統均支持FAT16文件系統。它最大可以管理大到2GB的分區,但每個分區最多隻能有65525個簇(簇是磁碟空間的配置單位)。隨著硬碟或分區容量的增大,每個簇所佔的空間將越來越大,從而導致硬碟空間的浪費。
FAT32:隨著大容量硬碟的出現,從Windows 98開始,FAT32開始流行。它是FAT16的增強版本,可以支持大到2TB(2048G的分區。FAT32使用的簇比FAT16小,從而有效地節約了硬碟空間。
NTFS:微軟Windows NT內核的系列操作系統支持的、一個特別為網路和磁碟配額、文件加密等管理安全特性設計的磁碟格式。隨著以NT為內核的Windows 2000/XP的普及,很多個人用戶開始用到了NTFS。NTFS也是以簇為單位來存儲數據文件,但NTFS中簇的大小並不依賴於磁碟或分區的大小。簇尺寸的縮小不但降低了磁碟空間的浪費,還減少了產生磁碟碎片的可能。NTFS支持文件加密管理功能,可為用戶提供更高層次的安全保證。
2、什麼系統可以支持NTFS文件系統?
只有Windows NT/2000/XP才能識別NTFS系統,Windows 9x/Me以及DOS等操作系統都不能支持、識別NTFS格式的磁碟。由於DOS系統不支持NTFS系統,所以最好不要將C:盤製作為NTFS系統,這樣在系統崩潰後便於在DOS系統下修復。
NTFS與操作系統支持情況如下:
FAT16 windows 95/98/me/nt/2000/xp unix,linux,dos
FAT32 windows 95/98/me/2000/xp
NTFS windows nt/2000/xp
3、我們需要NTFS嗎?
Windows 2000/XP在文件系統上是向下兼容的,它可以很好地支持FAT16/FAT32和NTFS,其中NTFS是Windows NT/2000/XP專用格式,它能更充分有效地利用磁碟空間、支持文件級壓縮、具備更好的文件安全性。如果你只安裝Windows 2000/XP,建議選擇NTFS文件系統。如果多重引導系統,則系統盤(C盤)必須為FAT16或FAT32,否則不支持多重引導。當然,其他分區的文件系統可以為NTFS。