1. Oracle大型資料庫系統的前言
風,緊,
夜,深沉,
劍,已出鞘,
影,飄然前行!
本書的立意和內容
在伺服器領域,IBM p系列伺服器與AIX操作系統毫無疑問是UNIX伺服器領域中的佼佼者,它代表著UNIX深刻的技術內涵和廣泛的用戶基礎。同樣地,Oracle是資料庫領域事實上的市場領導者,眾多IT應用系統採用了Oracle構架,運行Oracle資料庫作為其數據支撐節點。目前Oracle用戶已經可以升級其資料庫到Oracle Database 11g Release 2版本。
實踐上,運行在AIX上的Oracle資料庫系統是諸多大中型系統的典型配置方式——用戶得益於IBM AIX的堅固支撐,受惠於Oracle的可用性保證!
但凡事都有兩面性,AIX是一套復雜的UNIX系統,Oracle則是一種「最難」的資料庫。對於任何用戶而言,了解、熟悉、運用、掌握兩者的平台特徵和工程技術手段,需要進行大量的學習、培訓、實踐以及長時間的磨練!廣大資料庫用戶需要一種快捷的學習路徑以及可參考資料來幫助他們構建、運行、維護乃至優化自己的系統!
本書的立意即在於此!本書以AIX UNIX平台為主線,以其他UNIX系統為參照,描述了資料庫系統Oracle 10g、Oracle 11g的構架方法,說明了該資料庫在AIX平台常用的諸多管理方面,提供了在AIX上實施Oracle集群的環境要素說明和實施方法,分析了伺服器綜合容災的工程手段和技術方法,綜合了在AIX系統上優化Oracle運行環境的諸多做法和要點。最後,本書還以AIX上Sybase ASE資料庫系統為對比,論述了Oracle在AIX上的獨到特徵。
基於上述出發點,本書力爭面向工程實踐,並面向用戶的實際需求展開論述。因此,本書並未刻意在學術上進行高、精、尖的探索,而是力爭將復雜的事情簡單化,把各技術要點以最簡單的形式和大家能了解的方法擺在用戶面前!
本書的讀者群體
本書的目標讀者是那些在UNIX上進行資料庫開發、維護、管理、優化任務和高可用設置的工程技術人員,以及從事於這個尖端行業的人群。
從技術角度看,本書所涉及的內容全部是生產實踐中必要的過程和階段。因此,本書並沒有試圖去描繪一些新鮮熱辣的炒作概念或遙不可及的無用內容,而是作為一種可以放在手邊的技術專著面向大眾,服務於系統用戶95%的日常工作需求。正因如此,本書注重細節描述和過程說明,讀者無須擁有非常深厚的專業技術基礎。
當然,學習的熱情和探索的精神是必不可少的!
本書的內容安排
本書共分為五篇,按照資料庫項目實施中工作內容的不同方向進行了分組,各篇的內容分述如下。
第一篇 構架篇
本篇側重在於系統的構架,以及構架中的相關要素和重點。 第1章 了解伺服器運行環境
本章力圖使讀者站到一個足夠高的層次和高度來看待伺服器技術框架。站得高,則看得必遠!
第2章 管理和維護伺服器設備和服務
Oracle運行在AIX上,Oracle將使用AIX資源、調用AIX服務,受AIX的運行狀態影響。
第3章 管理伺服器存儲
資料庫伺服器的一個典型特徵就是大量使用磁碟空間來存儲資料庫數據。Oracle需要AIX提供的存儲介質來存儲數據。
第4章 構建Oracle環境
Oracle的環境構架相對復雜。用戶需要掌握Oracle系統構架的具體工程細節,並獲得動手能力。
第二篇 管理篇
本篇結合了AIX系統的諸多特點,綜合論述了Oracle在AIX上管理的具體方法和實踐行為規范。 第5章 在AIX中Oracle資料庫管理
日常管理是一個管理員工作的大部分內容。本章描述了常用的管理內容和做法。
第6章 使用ASM跳過AIX卷空間管理
ASM是Oracle提出的存儲管理最新的實施方法。Oracle推薦使用ASM來進行磁碟空間的管理。
第7章 管理AIX下Oracle的空間使用
空間管理是系統管理的重點。Oracle需要各種不同的空間要素,需要管理和維護。
第三篇 災備篇
本篇站在伺服器的層面,綜合講述了在AIX運行Oracle系統所需進行的備份管理工作,以及災難恢復實施方法。 第8章 設計和實施AIX系統備份
伺服器系統的備份工作必須能夠兼顧操作系統、應用系統、資料庫數據備份的各方面。AIX是備份中重要的一環。
第9章 設計Oracle系統備份
Oracle作為資料庫系統,其備份方法和恢復手段與操作系統備份截然不同。按照規范的方法進行備份對恢復有著不言而喻的意義。
續表
第三篇 災備篇
本篇站在伺服器的層面,綜合講述了在AIX運行Oracle系統所需進行的備份管理工作,以及災難恢復實施方法。 第10章 實施Oracle系統備份
工程上實施資料庫備份的方法是百花齊放的。這里討論了若干種具體實施方法和手段。
第11章 恢復崩潰的系統
防患於未然!好的備份系統是經過恢復測試的系統。讓我們看看如何用備份進行系統恢復的!
第四篇 集群篇
在AIX平台上RAC集群是一種廣泛使用的結構。本篇即針對集群展開討論。 第12章 構建AIX下的Oracle集群環境
集群是實現Oracle系統網格與高可用的主要技術手段,尤其在AIX承擔的關鍵業務系統中。
第13章 在AIX中管理Oracle集群環境
集群的管理有其自身特色,包括集群件管理、集群服務的管理。
第五篇 優化篇
好的系統需要進行預先的優化結構設計,並在系統運行中進行漸近的再優化。本篇以項目周期為階段,描述了系統優化的各個過程和方面。 第14章 在AIX上綜合設置Oracle環境
系統在構建時,要綜合考慮可用性和性能之間的關系,並設置和優化系統。
第15章 AIX上Oracle系統的運行優化
在系統運行過程中,應用性能會隨時變化,性能的檢查和優化也需隨時進行。動態地、漸進式地分析與調整也就十分必要。
第六篇 擴展篇
通過與Sybase ASE的對比來了解什麼是Oracle。 第16章 AIX上Oracle與Sybase的比較
Sybase ASE與Oracle同為可在AIX上運行的資料庫系統。兩種產品中各有特點、各有優勢、同樣優秀。
本書從構思到最終完成,歷時兩年時間,其間更改數十稿。單獨講述UNIX不難,單獨講述Oracle不難,但把二者結合起來,站在整個系統的高度來說明問題,卻讓本書作者難以著手——千頭萬緒,該寫的內容太多!
致謝
本書內容來源於實踐,用戶即是最佳的實踐來源。感謝山東海化集團王鳳鳴先生、中國電信青海公司陳宇峰先生、福建公司陳亮先生等人的鼎力支持。本書中若干技術觀點和實踐總結來源於作者為該單位提供資料庫顧問服務的工作現場。感謝他們和作者在工作與技術領域上的不斷探討,這促進了本書內容的不斷完善!
在本書編寫過程中,很多復雜的、結構性的實驗在北京時代朝陽資料庫技術中心Trail實驗室完成。北京時代朝陽資料庫技術中心是一家有著17年企業歷史的資料庫專業技術機構,精於資料庫產品與服務。這里有多樣化的UNIX平台、各種集群構架、不同容災環境等,這為本書所涉及的各項結構性實踐提供了可能。感謝Trail實驗室各位同事的配合。另外,考慮到本書在部分章節上存在一定難度,為保證本書的可讀性,作者也請Trail實驗室中參加Oracle職業/就業課程的若干學員試讀了本書,感謝他們提出的諸多意見!
感謝本書策劃編輯胡辛征先生的熱心鼓勵和積極推動,感謝文字編輯江立女士的細心編審和中肯點評。沒有他們的細致工作和鼓勵,本書不能順利出版。
最後,感謝博文視點以知識傳播的方式對中國IT產業的支持——以其廣博文字選題,以其超然視點出版!
祝博文視點從成功走向輝煌!
本書作者:文平
2009-09-20於北京
目錄第一篇構架篇
第1章了解伺服器運行環境
1.1 AIX:一種成熟的UNIX
1.1.1 AIX系統構成要素
1.1.2登錄AIX系統
1.1.3 RS6000伺服器結構
1.1.4 AIx系統管理界面
1.1.5 AIX中使用的Shell
1.1.6 AJx存儲組織結構
1.1.7 AJx換頁空間(交換區)
1.1.8 AIX文件系統結構
1.1.9 AJx對象數據管理
1.1.10 AIX當前進程運行
1.1.11 AIX用戶訪問過程
1.1.12 AIX各種服務提供
1.1.13 AIX網路通信設置
1.1.14 AIX中的常用操作
1.2 Oracle與AIx系統
1.2.1 Oracle與AIX的角色
1.2.2 Oracle系統典型特徵
1.2.3系統全局區SGA
1.2.4程序全局區PGA
1.2.5 Oracle後台進程
1.2.6 Oracle資料庫物理結構
1.2.7資料庫數據存放
1.2.8資料庫的用戶訪問
第2章管理和維護伺服器設備和服務
2.1管理AIX中的設備
2.1.1 AIX使用設備類型
2.1.2 AIX的設備分層管理
2.1.3 ODM對象資料庫
2.1.4設備的狀態特徵查看
2.1.5設備的配置和檢測
2.1.6設備屬性信息查看
2.1.7創建主機硬體配置檔案
2.2管理AIX中的服務
2.2.1系統資源控制器的啟動
2.2.2系統資源的啟動和關閉
2.2.3系統資源的刷新
2.2.4通常啟動的資源
2.3 AIX系統錯誤處理
2.4 AIX系統硬體診斷
2.5 AIX系統日誌查看
第3章管理伺服器存儲
3.1 AIX存儲基本框架
3.2 AIX的存儲概念要素
3.2.1物理卷和卷組
3.2.2邏輯卷和邏輯分區
3.2.3AIX日誌文件系統
3.2.4文件系統掛載和目錄樹
3.3系統存儲結構的管理
3.3.1系統中的卷組定義信息
3.3.2增加、刪除和設置卷組
3.3.3卷組中物理磁碟的改變
3.3.4卷組重組提高磁碟性能
3.3.5卷組的活動狀態管理
3.3.6卷組的導入導出管理
3.3.7邏輯卷的創建和維護
3.3.8通過鏡像保護邏輯卷
3.3.9通過條帶優化邏輯卷
3.3.10物理卷的設置和管理
第4章構建Oracle環境
第二篇管理篇
第5章在AIX中Oracle資料庫管理
第6章使用ASM跳過AIX卷空間管理
第7章管理AIX下Oracle的空間使用
第三篇災備篇
第8章設計和實施AIX系統備份
第9章設計Oracle系統備份
第10章實施Oracle系統備份
第11章恢復崩潰的系統
第四篇集群篇
第12章構建AIX下的Oracle集群環境
第13章在AIX中管理Oracle集群環境
第五篇優化篇
第14章在AIX上綜合設置Oracle環境
第15章AIX上Oracle系統的運行優化
第六篇擴展篇
第16章AIX上Oracle與Sybase的比較
2. 支持大型資料庫的伺服器需要什麼配置
選擇資料庫伺服器的原則:
1、高性能原則:保證所選購的伺服器,不僅能夠滿足運營系統的運行和業務處理的需要,而且能夠滿足一定時期業務量的增長。一般可以根據經驗公式計算出所需的伺服器TpmC值(Tpmc是衡量計算機系統的事務處理能力的程序)。
後比較各伺服器廠商和TPC組織公布的TpmC值,選擇相應的機型。同時,用伺服器的市場價/報價除去計算出來的TpmC值得出單位TpmC值的價格,進而選擇高性能價格比的伺服器。
2、可靠性原則:可靠性原則是所有選擇設備和系統中首要考慮的,尤其是在大型的、有大量處理要求的、需要長期運行的系統上。考慮伺服器系統的可靠性,不僅要考慮伺服器單個節點的可靠性或穩定性,而且要考慮伺服器與相關輔助系統之間連接的整體可靠性。
(2)大資料庫存儲系統擴展閱讀:
優點:
1、編程量減少
資料庫伺服器提供了用於數據操縱的標准介面API(Application Programming Interface,應用程序編程接 口)。
2、資料庫安全高
資料庫伺服器提供監控性能、並發控制等工具。由DBA(Database Administrator,資料庫管理員)統一負 責授權訪問資料庫及網路管理。
3、數據可靠性管理
資料庫伺服器提供統一的資料庫備份/恢復、啟動/停止資料庫的管理工具。
4、計算機資源利用充分
資料庫伺服器把數據管理及處理工作從客戶機上分離出來,使網路中各計算機資源能靈活分配、各盡其用。
3. 你身邊的資料庫系統有哪些請列舉3到5個
1、MySQL
MySQL是一個快速的、多線程、多用戶和健壯的SQL資料庫伺服器。MySQL伺服器支持關鍵任務、重負載生產系統的使用,也可以將它嵌入到一個大配置(mass- deployed)的軟體中去。
2、SQL Server
SQL Server 提供了眾多的Web和電子商務功能,如對XML和Internet標準的豐富支持,通過Web對數據進行輕松安全的訪問,具有強大的、靈活的、基於Web的和安全的應用程序管理等。
3、Oracle
Oracle產品系列齊全,幾乎囊括所有應用領域,大型,完善,安全,可以支持多個實例同時運行,功能強。能在所有主流平台上運行。完全支持所有的工業標准。採用完全開放策略。可以使客戶選擇最適合的解決方案。對開發商全力支持。
(3)大資料庫存儲系統擴展閱讀:
資料庫的發展現狀:
在資料庫的發展歷史上,資料庫先後經歷了層次資料庫、網狀資料庫和關系資料庫等各個階段的發展,資料庫技術在各個方面的快速的發展。
特別是關系型資料庫已經成為目前資料庫產品中最重要的一員,80年代以來, 幾乎所有的資料庫廠商新出的資料庫產品都支持關系型資料庫,即使一些非關系資料庫產品也幾乎都有支持關系資料庫的介面。這主要是傳統的關系型資料庫可以比較好的解決管理和存儲關系型數據的問題。
隨著雲計算的發展和大數據時代的到來,關系型資料庫越來越無法滿足需要,這主要是由於越來越多的半關系型和非關系型數據需要用資料庫進行存儲管理,以此同時,分布式技術等新技術的出現也對資料庫的技術提出了新的要求,於是越來越多的非關系型資料庫就開始出現;
這類資料庫與傳統的關系型資料庫在設計和數據結構有了很大的不同, 它們更強調資料庫數據的高並發讀寫和存儲大數據,這類資料庫一般被稱為NoSQL(Not only SQL)資料庫。 而傳統的關系型資料庫在一些傳統領域依然保持了強大的生命力。
4. 簡述資料庫、資料庫管理系統和資料庫系統的概念
資料庫、資料庫管理系統和資料庫系統的概念分別回答:
1、資料庫:
資料庫(Database)是按照數據結構來組織、存儲和管理數據的倉庫。
資料庫有很多種類型,從最簡單的存儲有各種數據的表格到能夠進行海量數據存儲的大型資料庫系統都在各個方面得到了廣泛的應用。
2、資料庫管理系統:
資料庫管理系統(Database Management System)是一種操縱和管理資料庫的大型軟體,用於建立、使用和維護資料庫,簡稱DBMS。
資料庫管理系統對資料庫進行統一的管理和控制,以保證資料庫的安全性和完整性。
3、資料庫系統:
資料庫系統DBS(Data Base System,簡稱DBS)通常由軟體、資料庫和數據管理員組成。
資料庫系統是為了適應數據處理的需要而發展起來的一種較為理想的數據處理系統,也是一個為了實際可運行的存儲、維護和應用系統提供數據的軟體系統,是存儲介質 、處理對象和管理系統的集合體。
5. 什麼是資料庫系統
資料庫系統(database systems),是由資料庫及其管理軟體組成的系統。它是為適應數據處理的需要而發展起來的一種較為理想的數據處理系統,也是一個實際可運行的存儲、維護和應用系統提供數據的軟體系統,是存儲介質 、處理對象和管理系統的集合體。
定義編輯
資料庫系統DBS(Data Base System,簡稱DBS)通常由軟體、資料庫和數據管理員組成。其軟體主要包括操作系統、各種宿主語言、實用程序以及資料庫管理系統。資料庫由資料庫管理系統統一管理,數據的插入、修改和檢索均要通過資料庫管理系統進行。數據管理員負責創建、監控和維護整個資料庫,使數據能被任何有權使用的人有效使用。資料庫管理員一般是由業務水平較高、資歷較深的人員擔任。
資料庫系統
資料庫系統的個體含義是指一個具體的資料庫管理系統軟體和用它建立起來的資料庫;它的學科含義是指研究、開發、建立、維護和應用資料庫系統所涉及的理論、方法、技術所構成的學科。在這一含義下,資料庫系統是軟體研究領域的一個重要分支,常稱為資料庫領域。
資料庫系統是為適應數據處理的需要而發展起來的一種較為理想的數據處理的核心機構。計算機的高速處理能力和大容量存儲器提供了實現數據管理自動化的條件。
資料庫研究跨越於計算機應用、系統軟體和理論三個領域,其中應用促進新系統的研製開發,新系統帶來新的理論研究,而理論研究又對前兩個領域起著指導作用。資料庫系統的出現是計算機應用的一個里程牌,它使得計算機應用從以科學計算為主轉向以數據處理為主,並從而使計算機得以在各行各業乃至家庭普遍使用。在它之前的文件系統雖然也能處理持久數據,但是文件系統不提供對任意部分數據的快速訪問,而這對數據量不斷增大的應用來說是至關重要的。為了實現對任意部分數據的快速訪問,就要研究許多優化技術。這些優化技術往往很復雜,是普通用戶難以實現的,所以就由系統軟體(資料庫管理系統)來完成,而提供給用戶的是簡單易用的資料庫語言。由於對資料庫的操作都由資料庫管理系統完成,所以資料庫就可以獨立於具體的應用程序而存在,從而資料庫又可以為多個用戶所共享。因此,數據的獨立性和共享性是資料庫系統的重要特徵。數據共享節省了大量人力物力,為資料庫系統的廣泛應用奠定了基礎。資料庫系統的出現使得普通用戶能夠方便地將日常數據存入計算機並在需要的時候快速訪問它們,從而使計算機走出科研機構進入各行各業、進入家庭。
資料庫系統有大小之分,大型資料庫系統有SQL Server、Oracle、DB2等,中小型資料庫系統有Foxpro、Access。
構成
資料庫系統一般由4個部分組成:
(1)資料庫(database,DB)是指長期存儲在計算機內的,有組織,可共享的數據的集合。資料庫中的數據按一定的數學模型組織、描述和存儲,具有較小的冗餘,較高的數據獨立性和易擴展性,並可為各種用戶共享。
(2)硬體:構成計算機系統的各種物理設備,包括存儲所需的外部設備。硬體的配置應滿足整個資料庫系統的需要。
(3)軟體:包括操作系統、資料庫管理系統及應用程序。資料庫管理系統(database management system,DBMS)是資料庫系統的核心軟體,是在操作系統的支持下工作,解決如何科學地組織和存儲數據,如何高效獲取和維護數據的系統軟體。其主要功能包括:數據定義功能、數據操縱功能、資料庫的運行管理和資料庫的建立與維護。
(4)人員:主要有4類。第一類為系統分析員和資料庫設計人員:系統分析員負責應用系統的需求分析和規范說明,他們和用戶及資料庫管理員一起確定系統的硬體配置,並參與資料庫系統的概要設計。資料庫設計人員負責資料庫中數據的確定、資料庫各級模式的設計。第二類為應用程序員,負責編寫使用資料庫的應用程序。這些應用程序可對數據進行檢索、建立、刪除或修改。第三類為最終用戶,他們利用系統的介面或查詢語言訪問資料庫。第四類用戶是資料庫管理員(data base administrator,DBA),負責資料庫的總體信息控制。DBA的具體職責包括:具體資料庫中的信息內容和結構,決定資料庫的存儲結構和存取策略,定義資料庫的安全性要求和完整性約束條件,監控資料庫的使用和運行,負責資料庫的性能改進、資料庫的重組和重構,以提高系統的性能。
特點
數據的結構化,數據的共享性好,數據的獨立性好,數據存儲粒度小,數據管理系統,為用戶提供了友好的介面。
資料庫系統的核心和基礎,是數據模型,現有的資料庫系統均是基於某種數據模型的。
資料庫系統
資料庫系統的核心是資料庫管理系統。
資料庫系統一般由資料庫、資料庫管理系統(DBMS)、應用系統、資料庫管理員和用戶構成。DBMS是資料庫系統的基礎和核心。
基本要求
對資料庫系統的基本要求是: ①能夠保證數據的獨立性。數據和程序相互獨立有利於加快軟體開發速度,節省開發費用。 ②冗餘數據少,數據共享程度高。 ③系統的用戶介面簡單,用戶容易掌握,使用方便。 ④能夠確保系統運行可靠,出現故障時能迅速排除;能夠保護數據不受非受權者訪問或破壞;能夠防止錯誤數據的產生,一旦產生也能及時發現。 ⑤有重新組織數據的能力,能改變數據的存儲結構或數據存儲位置,以適應用戶操作特性的變化,改善由於頻繁插入、刪除操作造成的數據組織零亂和時空性能變壞的狀況。 ⑥具有可修改性和可擴充性。 ⑦能夠充分描述數據間的內在聯系。
6. 怎樣建立一個大型資料庫
建立一個資料庫當你想建立一個表時,你必須按照以下的步驟先建立一個資料庫:在SQL Enterprise Manager中,選擇你的資料庫的名字。從Manage菜單中選擇Databases選項。管理資料庫的窗口就出現了。在工具條上點擊新建資料庫的按鈕,就會出現新建資料庫的對話框(如圖3.5所示)。注意</B>現在版本的SQL Server(version 6.5)最多能有32,767個資料庫。每個資料庫的最小容量是1MB,最大容量是ITB。在SQL Enterprise Manager對話框中的新建資料庫對話框。 填寫你的資料庫所要使用的名字(不能有空格)。 然後,填寫你要建立的資料庫所在的資料庫設備(例如,他就是你在前面一步建立的資料庫設備)。 這個新建資料庫的對話框會以圖形的方式顯示所有資料庫設備的已經使用和沒有使用的空間。 當你建立一個資料庫時,你可以選擇去建立事務日誌。為了建立事務日誌,你需要指定一個log device(日誌資料庫設備)。在新建資料庫對話框中,打開標有LogDevice的下拉式框,然後選擇一個資料庫設備和用於日誌的空間大小。注意</B>每個資料庫都有它自己的事務處理日誌,它記錄了對資料庫每一個請求(modify,insert,delete)。日誌文件是對資料庫的內部處理過程的一種監視。它允許你對資料庫執行updates, inserts, deletes等操作。所以在需要的時候,你也可以取消這些操作的結果。在系統沒有正確地關閉,而只是停機或重新啟動時,這些事務處理的日誌是很有用的-在重新啟動時,SQL Server會根據事務處理日誌來恢復數據。注意</B>當你把事務處理日誌向一個mp 資料庫傾倒時,你的事務處理日誌會被截短。你也可以強制地使你的事務日誌縮短。如果你想知道有關事務日誌的更多的信息,請查詢SQL 在線幫助文件,用關鍵字transaction log查找。6當你完成在新建資料庫的對話框中的這些問題的回答,點擊Create Now 按鈕。你的資料庫就會在Databases文件夾下顯示出來。
7. 資料庫管理系統有哪些
資料庫管理系統軟體(DBMS)有哪些呢?目前互聯網上常見的資料庫管理軟體有SYBASE、DB2、ORACLE、MySQL、ACCESS、VisualFoxpro、MSSQLServer、Informix、PostgreSQL這幾種。
資料庫管理系統軟體的種類有很多,常見的也很多,但是針對不同人群的不同需求,常用的資料庫管理系統軟體也那麼三五種:ORACLE、MySQL、ACCESS、MSSQLServer這些是不同領域常用的資料庫管理系統軟體,下面我們來介紹一下這些軟體各自的優勢何在。
8. 目前大型資料庫應用系統採用什麼體系結構
從資料庫最終用戶角度看,資料庫系統的結構分為單用戶結構、主從式結構、分布式結構、客戶/伺服器、瀏覽器/應用伺服器/資料庫伺服器多層結構。這是資料庫外部體系結構。
物理存儲結構、邏輯存儲結構、內存結構和實例進程結構。這是內部體系結構
9. 大數據採集與存儲的基本步驟有哪些
數據抽取
針對大數據分析平台需要採集的各類數據,分別有針對性地研製適配介面。對於已有的信息系統,研發對應的介面模塊與各信息系統對接,不能實現數據共享介面的系統通過ETL工具進行數據採集,支持多種類型資料庫,按照相應規范對數據進行清洗轉換,從而實現數據的統一存儲管理。
數據預處理
為使大數據分析平台能更方便對數據進行處理,同時為了使得數據的存儲機制擴展性、容錯性更好,需要把數據按照相應關聯性進行組合,並將數據轉化為文本格式,作為文件存儲下來。
數據存儲
除了Hadoop中已廣泛應用於數據存儲的HDFS,常用的還有分布式、面向列的開源資料庫Hbase,HBase是一種key/value系統,部署在HDFS上,與Hadoop一樣,HBase的目標主要是依賴橫向擴展,通過不斷的增加廉價的商用伺服器,增加計算和存儲能力。
關於大數據採集與存儲的基本步驟有哪些,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。
10. 具有大數據量存儲管理能力並與ORACLE資料庫高度兼容發國產數據系統是
達夢資料庫系統達夢資料庫管理系統是達夢公司推出的具有完全自主知識產權的高性能資料庫管理系統,簡稱DM。達夢資料庫管理系統的最新版本是7.0版本,簡稱DM7。DM7採取全新的體系架構,在保證大型通用的基礎上,針對可靠性、高性能、海量數據處理和安全性做了大量的研發和改進工作,極大提升了達夢資料庫產品的性能、可靠性、可擴大性,能同時統籌OLTP和OLAP要求,從根本上提升了DM7產品的品質。 查看更多答案>>