⑴ 元資料庫是什麼與資料庫有何區別
元數據(Meta Date),主要記錄數據倉庫中模型的定義、各層級間的映射關系、監控數據倉庫的數據狀態及ETL的任務運行狀態。一般會通過元數據資料庫(Metadata Repository)來統一地存儲和管理元數據,其主要目的是使數據倉庫的設計、部署、操作和管理能達成協同和一致。
元數據是數據倉庫管理系統的重要組成部分,元數據管理是企業級數據倉庫中的關鍵組件,貫穿數據倉庫構建的整個過程,直接影響著數據倉庫的構建、使用和維護。
- 構建數據倉庫的主要步驟之一是ETL。這時元數據將發揮重要的作用,它定義了源數據系統到數據倉庫的映射、數據轉換的規則、數據倉庫的邏輯結構、數據更新的規則、數據導入歷史記錄以及裝載周期等相關內容。數據抽取和轉換的專家以及數據倉庫管理員正是通過元數據高效地構建數據倉庫。
- 用戶在使用數據倉庫時,通過元數據訪問數據,明確數據項的含義以及定製報表。
- 數據倉庫的規模及其復雜性離不開正確的元數據管理,包括增加或移除外部數據源,改變數據清洗方法,控制出錯的查詢以及安排備份等。
元數據可分為技術元數據和業務元數據。技術元數據為開發和管理數據倉庫的IT 人員使用,它描述了與數據倉庫開發、管理和維護相關的數據,包括數據源信息、數據轉換描述、數據倉庫模型、數據清洗與更新規則、數據映射和訪問許可權等。而業務元數據為管理層和業務分析人員服務,從業務角度描述數據,包括商務術語、數據倉庫中有什麼數據、數據的位置和數據的可用性等,幫助業務人員更好地理解數據倉庫中哪些數據是可用的以及如何使用。
由上可見,元數據不僅定義了數據倉庫中數據的模式、來源、抽取和轉換規則等,而且是整個數據倉庫系統運行的基礎,元數據把數據倉庫系統中各個鬆散的組件聯系起來,組成了一個有機的整體。
派可數據,用心創造數據價值 讓數據分析更簡單
⑵ 資料庫元數據的介紹
按照傳統的定義,元數據(Metadata)是關於數據的數據。在數據倉庫系統中,元數據可以幫助數據倉庫管理員和數據倉庫的開發人員非常方便地找到他們所關心的數據;元數據是描述數據倉庫內數據的結構和建立方法的數據,可將其按用途的不同分為兩類:技術元數據(Technical Metadata)和業務元數據(Business Metadata)。
⑶ 元資料庫
幫你找了,希望幫到你:
何為目錄資料庫?
目錄(Catalog)是以完整的出版單元(如一種圖書、一種期刊)為單位,按照一定次序編排的對文獻信息進行描述和報道的工具,也稱書目。目錄對文獻的描述比較簡單,每條記錄的欄位主要包括:文獻題名、責任者、出版事項、分類號、主題詞等。一種出版物經過如此描述後形成一條記錄,將所有的記錄組織起來就形成了目錄。
何為元資料庫?
什麼是元數據?
元數據(Meta Date),關於數據的數據或者叫做用來描述數據的數據或者叫做信息的信息。
這些定義都很是抽象,我們可以把元數據簡單的理解成,最小的數據單位。元數據可以為數據說明其元素或屬性(名稱、大小、數據類型、等),或其結構(長度、欄位、數據列),或其相關數據(位於何處、如何聯系、擁有者)。
舉幾個簡單的例子:
使用過數碼相機的同學都應該知道,每張數碼照片都會存在一個EXIF信息。它就是一種用來描述數碼圖片的元數據。根據EXIF標准,這些元數據包括:Image Description(圖像描述、來源. 指生成圖像的工具 )、Artist(作者)、Make( 生產者)、Model (型號)、….、等等。
生活中我們填寫的《個人信息登記表》,包括姓名、性別、民族、政治面貌、一寸照片、學歷、職稱等等這些就是鎖定kent.zhu這個人的元數據。
通常情況下元數據可以分為以下三類:固有性元數據、管理性元數據、描述性元數據。
固有性元數據;與事物構成有關的元數據。
管理性元數據;與事物處理方式有關的元數據。
描述性元數據;與事物本質有關的元數據。
當然,並不是說所數據總能清晰的劃分在以上3類中。比如:一張由kent拍攝的大小為20K的JPG格式的印著一隻小狗的聖誕卡照片。
它的固有性元數據包括:20K、JPG;管理性元數據:kent拍攝、聖誕卡;描述性元數據:狗、小狗、聖誕、照片、聖誕節、…
但是,聖誕卡則可以放在以上任何一個分類中。與事物構成有關(說明這個東東是什麼)、與事物處理方式有關(說明這個東東的用途是什麼)、與事物本質有關(可以直接用來描述這個東東)。
元數據之於信息架構的意義
元數據是一種很有效的方法,用以確保網站上各種形式的內容確實都能被查找到。比如我們常常為搜索很久之前看到的一張美女圖片犯愁,而如果一個圖片網站如果信息架構足夠好,我們就能憑借我們回憶到的元數據(關於武藤蘭的?2000年拍攝的?)清晰的找到。
元數據之於信息架構就像是房子的磚瓦,它可以根據需要擺放成不同的信息檢索系統。元數據是所有組織系統的基礎,從搜索到電子商務網站上的導航系統都強烈的依賴於元數據。
前面提到,元數據實際上是為產品的可查找性(Findability)服務的。而用戶在查找信息的時候不會按照機器思維去找(不會輸入該照片的ID),而是直接輸入關於信息的描述性信息如:「小狗 聖誕卡」。也就意味著在創建關於描述性元數據的時候要盡量的提取出任官關於這個對象所講述的故事,這些才是人們能記住的和習慣搜索的細節。
我們會發現,機械生成的元數據常常是不靠譜的,如在UCH系統下發布日誌的時候系統會自動根據標題進行機械分析生成的一些元數據。
而充分利用手工元數據(handcrafted metadate)是提高可查找性的一個好方法。最常見的例子就是我們見到的Tag。Tag就是一種用戶自創的元數據,其特點是無層次結構、自定義。比如這張Flickr照片下的手工元數據就為在Flickr上查找提供了更多的方便。
本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/zyh_flywithme/archive/2010/10/22/5958461.aspx
⑷ 資料庫分為哪幾類
資料庫按照使用和歸類不同,它的分類也是不同的,我基本歸納了如下幾類:
一,按國際上通用的分類方法,資料庫分為以下三大類:
1、參考資料庫(Reference databases),是能指引用戶到另一信息源獲取原文或其他細節的資料庫;
2、源資料庫(Source databases),指能直接提供所需原始資料或具體數據的資料庫。;
3、混合型資料庫(Mixed databases),能同時存貯多種類型數據的資料庫。
二,按數據結構來分類,有三種:
1、層次式資料庫
2、網路式資料庫
3、關系式資料庫
三,常用資料庫分類:
1,IBM 的DB2。
2,Oracle。
3,Informix。
4,Sybase。
5,sql Server。
6,PostgreSQL。
7,mySQL。
⑸ 元資料庫是什麼與資料庫有何區別
樓主您好!
元數據的英文名稱是「Metadata",它是「關於數據的數據」在地理空間信息中用於描述地理數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵,它是實現地理空間信息共享的核心標准之一。目前,國際上對空間元數據標准內容進行研究的組織主要有三個,分別是歐洲標准化委員會(CEN/TC287)、美國聯邦地理數據委員會(FGDC)和國際標准化組織地理信息/地球信息技術委員會(ISO/TC211)。空間元數據標准內容分兩個層次。第一層是目錄信息,主要用於對數據集信息進行宏觀描述,它適合在數字地球的國家級空間信息交換中心或區域以及全球范圍內管理和查詢空間信息時使用。第二層是詳細信息,用來詳細或全面描述地理空間信息的空間元數據標准內容,是數據集生產者在提供空間數據集時必須要提供的信息。
元數據主要有下列幾個方面的作用:
(1)用來組織和管理空間信息,並挖掘空間信息資源,這正是數字地球的特點和優點所在。通過它可以在廣域網或網際網路上准確地識別、定位和訪問空間信息。
(2)幫助數據使用者查詢所需空間信息。比如,它可以按照不同的地理區間、指定的語言以及具體的時間段來查找空間信息資源。
(3)組織和維護一個機構對數據的投資。
(4)用來建立空間信息的數據目錄和數據交換中心。通過數據目錄和數據交換中心等提供的空間元數據內容,用戶可以共享空間信息、維護數據結果,以及對它們進行優化等。
(5)提供數據轉換方面的信息。使用戶在獲取空間信息的同時便可以得到空間元數據信息。通過空間元數據,人們可以接受並理解空間信息,與自己的空間信息集成在一起,進行不同方面的科學分析和決策。描述空間信息的元數據標准體系內容按照部分、復合元素和數據元素來組織,它們是依次包含關系,前者包含後者,即:後者依次組成前者。具體分為8個基本內容部分和4個引用部分,由12個部分組成,其中標准化內容包括標識信息、數據質量信息、數據集繼承信息、空間數據表示信息、空間參照系信息、實體和屬性信息、發行信息以及空間元數據參考信息等內容,另外還有4個部分是標准化部分中必須引用的信息,它們為引用信息、時間范圍信息、聯系信息及地址信息。元數據標准內容體系是通過元數據網路管理系統來實現的,該系統主要由許可權驗證功能(伺服器端驗證)、輸入和合法性校驗功能(客戶端校驗)、查詢功能(伺服器端查詢)與返回和顯示功能(伺服器端格式化查詢結果並返回,客戶端顯示)等組成。利用空間元數據網路管理系統作為空間交換站的共享軟體可基本上實現空間信息的網路共享。
轉自: http://..com/question/61835466.html
⑹ 資料庫元數據的分類
技術元數據是存儲關於數據倉庫系統技術細節的數據,是用於開發和管理數據倉庫使用的數據,它主要包括以下信息:數據倉庫結構的描述,包括倉庫模式、視圖、維、層次結構和導出數據的定義,以及數據集市的位置和內容;業務系統、數據倉庫和數據集市的體系結構和模式;匯總用的演算法,包括度量和維定義演算法,數據粒度、主題領域、聚集、匯總、預定義的查詢與報告;;由操作環境到數據倉庫環境的映射,包括源數據和它們的內容、數據分割、數據提取、清理、轉換規則和數據刷新規則、安全(用戶授權和存取控制)。 業務元數據從業務角度描述了數據倉庫中的數據,它提供了介於使用者和實際系統之間的語義層,使得不懂計算機技術的業務人員也能夠讀懂數據倉庫中的數據。業務元數據主要包括以下信息:使用者的業務術語所表達的數據模型、對象名和屬性名;訪問數據的原則和數據的來源;系統所提供的分析方法以及公式和報表的信息;具體包括以下信息: ;企業概念模型:這是業務元數據所應提供的重要的信息,它表示企業數據模型的高層信息、整個企業的業務概念和相互關系。以這個企業模型為基礎,不懂資料庫技術和SQL 語句的業務人員對數據倉庫中的數據也能做到心中有數。 ;多維數據模型:這是企業概念模型的重要組成部分,它告訴業務分析人員在數據集市當中有哪些維、維的類別、數據立方體以及數據集市中的聚合規則。這里的數據立方體表示某主題領域業務事實表和維表的多維組織形式。 ;業務概念模型和物理數據之間的依賴:以上提到的業務元數據只是表示出了數據的業務視圖,這些業務視圖與實際的數據倉庫或資料庫、多維資料庫中的表、欄位、維、層次等之間的對應關系也應該在元數據知識庫中有所體現。
⑺ 資料庫分為哪幾類
常用資料庫
1. IBM 的DB2
作為關系資料庫領域的開拓者和領航人,IBM在1997年完成了System R系統的原型,1980年開始提供集成的資料庫伺服器—— System/38,隨後是SQL/DSforVSE和VM,其初始版本與SystemR研究原型密切相關。DB2 forMVSV1 在1983年推出。該版本的目標是提供這一新方案所承諾的簡單性,數據不相關性和用戶生產率。1988年DB2 for MVS 提供了強大的在線事務處理(OLTP)支持,1989 年和1993 年分別以遠程工作單元和分布式工作單元實現了分布式資料庫支持。最近推出的DB2 Universal Database 6.1則是通用資料庫的典範,是第一個具備網上功能的多媒體關系資料庫管理系統,支持包括Linux在內的一系列平台。
2. Oracle
Oracle 前身叫SDL,由Larry Ellison 和另兩個編程人員在1977創辦,他們開發了自己的拳頭產品,在市場上大量銷售,1979 年,Oracle公司引入了第一個商用SQL 關系資料庫管理系統。Oracle公司是最早開發關系資料庫的廠商之一,其產品支持最廣泛的操作系統平台。目前Oracle關系資料庫產品的市場佔有率名列前茅。
3. Informix
Informix在1980年成立,目的是為Unix等開放操作系統提供專業的關系型資料庫產品。公司的名稱Informix便是取自Information 和Unix的結合。Informix第一個真正支持SQL語言的關系資料庫產品是Informix SE(StandardEngine)。InformixSE是在當時的微機Unix環境下主要的資料庫產品。它也是第一個被移植到Linux上的商業資料庫產品。
4. Sybase
Sybase公司成立於1984年,公司名稱「Sybase」取自「system」和 「database」 相結合的含義。Sybase公司的創始人之一Bob Epstein 是Ingres 大學版(與System/R同時期的關系資料庫模型產品)的主要設計人員。公司的第一個關系資料庫產品是1987年5月推出的Sybase SQLServer1.0。Sybase首先提出Client/Server 資料庫體系結構的思想,並率先在Sybase SQLServer 中實現。
5. SQL Server
1987 年,微軟和 IBM合作開發完成OS/2,IBM 在其銷售的OS/2 ExtendedEdition 系統中綁定了OS/2Database Manager,而微軟產品線中尚缺少資料庫產品。為此,微軟將目光投向Sybase,同Sybase 簽訂了合作協議,使用Sybase的技術開發基於OS/2平台的關系型資料庫。1989年,微軟發布了SQL Server 1.0 版。
6. PostgreSQL
PostgreSQL 是一種特性非常齊全的自由軟體的對象——關系性資料庫管理系統(ORDBMS),它的很多特性是當今許多商業資料庫的前身。PostgreSQL最早開始於BSD的Ingres項目。PostgreSQL 的特性覆蓋了SQL-2/SQL-92和SQL-3。首先,它包括了可以說是目前世界上最豐富的數據類型的支持;其次,目前PostgreSQL 是唯一支持事務、子查詢、多版本並行控制系統、數據完整性檢查等特性的唯一的一種自由軟體的資料庫管理系統.
7.mySQL
mySQL是一個小型關系型資料庫管理系統,開發者為瑞典MySQL AB公司。在2008年1月16號被Sun公司收購。目前MySQL被廣泛地應用在Internet上的中小型網站中。由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網站為了降低網站總體擁有成本而選擇了MySQL作為網站資料庫。MySQL的官方網站的網址是: www.mysql.com
⑻ 元資料庫
元數據是「關於數據的數據」,存在於電子信息環境中,用於描述資源的屬性,呈現其關系,支持資源發現、管理與有效利用(徐筱紅,2006),是對所採集到的數據的說明。一般來說,它有兩方面的用途:首先,元數據能提供基於用戶的信息,如記錄數據項的業務描述信息的元數據能幫助用戶使用數據;其次,元數據能支持系統對數據的管理和維護,如關於數據項存儲方法的元數據能支持系統以最有效的方式訪問數據。具體來說,在塔里木河流域生態環境動態監測及輔助決策支持系統綜合資料庫系統中,元數據機制主要支持以下幾類系統管理功能:①描述哪些數據在綜合資料庫中;②定義要進入資料庫中的數據和從資料庫中產生的數據;③記錄並檢測系統數據一致性的要求和執行情況;④衡量數據質量。
(一)元數據分級與特徵
1.元數據分級
基本元數據:提供地理數據源基本文檔所需要的最少的元數據元素集。
完全元數據:提供完整的地理數據源(單獨的數據集、數據集系列、各種地理要素)文檔所需要的必選的和可選的元數據元素集。它完整地定義全部元數據,以便標識、評價、摘錄、使用和管理地理信息。
2.元數據特徵
(1)名稱:賦給元數據實體或元素的標記。
(2)標識碼:計算機中使用的定義每個元數據實體和元素的唯一代碼。代碼結構為:XXXXXX
前2位為元數據子集,2位數字碼;中間2位為元數據實體/獨立元素,2位數字碼;後2位為元數據實體包含的元素,2位數字碼。
(3)定義:對元數據實體和元素的說明。
(4)性質:說明元數據實體或元素是否總是出現,或有時出現的描述符。描述符分別為:M-必選;C-一定條件下必選;O-可選。
(5)條件:說明何種條件下元數據子集、實體或元素是必選的。如果對所說明的條件成立,那麼該子集、實體或元素就是必選的。
(6)最大出現次數:指定元數據實體或元素在實際使用時,可能重復出現的最大次數。只出現一次的表示為「1」,重復出現的表示為「N」。
(7)數據類型:表示元數據元素的一組不同的值,例如,「文本」、「整型」、「短語」、「坐標串」、「實型」和「日期」。
(8)值域:指定每個元數據元素的取值范圍。「任意長文本」表示所述內容不受限制,實型數和基於代碼的整型數等只能使用一個限定的(閉合的)值域內的值。
(二)元資料庫主要內容
塔里木河流域生態環境動態監測系統的元數據包括數字影像圖、數字柵格圖、數字高程模型、數字線劃圖等。大部分數據都有相應的國家或行業元數據標准規范,有國家或行業標準的按照標准規范採集;沒有規范的,按照元數據的分級特徵進行定義。主要包括有關數據源、數據分層、成果歸屬、空間參照系、數據質量(包含數據精度和數據評價)、數據更新、圖幅接邊等方面的信息(周騁等,2006)。其主要內容描述如下:
(1)標識信息:是唯一標識數據集的元數據信息。包括數據集名稱、發布時間、版本、語種、摘要、現狀、空間范圍(地理范圍、時間范圍)、表示方式、空間解析度、信息類別。
(2)數據質量信息:是數據集質量的總體評價。包括數據集內容完整性說明、數據集在概念、值域、格式和拓撲關系等方面的一致性程度、位置精度(空間位置絕對精度和相對精度)、時間精度(表示時間的精確程度、現勢性、有效性)、屬性精度(數據集屬性分類正確性、屬性值的精度和正確性)、數據質量保證措施。
(3)數據字典信息:包含數據集應用、數據源及生產數據集時所用工藝方法等信息。
(4)空間參照系信息:數據集使用的空間參照系統的說明。包括基於地理標識的空間參照系統、基於坐標的空間參照系統。
(5)內容信息:描述數據集的主要內容。包括主要要素類型名稱及相應的屬性名稱、影像數據集內容概述(波長、波段、灰階等級、合成處理方式)、柵格數據集內容概述(格網尺寸、格網尺寸單位、格網行列數、格網起始點坐標)。
(6)元數據參考信息:包括元數據發布或更新的時間,以及建立元數據單位的聯系信息。
以上6類由兩個公共數據類型聯系,公共數據類型包括:
(1)覆蓋范圍信息:數據集的空間范圍(經緯度坐標、地理標識符)、時間范圍(起始時間、終止時間)、垂向范圍(最小垂向坐標值、最大垂向坐標值、計量單位)。
(2)負責單位聯系信息:與數據集有關的單位標識(負責單位名稱、聯系人、職責)和聯系信息(電話、傳真、通信地址、郵政編碼、電子信箱地址、網址)。
(三)元數據入庫
元數據信息是一個純文本文件,在生產時採集了多項數據,它是與圖形數據、屬性數據緊密聯系在一起的,按照每幅圖一個文本文件存儲。為了實現資料庫系統中元數據與數據體的集成化管理,以及元數據與數據體的一體化相互檢索查詢,需將元數據信息空間化。採取的技術方法就是將元數據文件與圖幅結合表聯系起來,將每一幅圖形的區域作為一個目標對象,所採集的多項元數據信息作為其屬性項,構成一個以圖幅結合表為基礎的矢量格式元數據集。同圖形數據坐標系統一樣,元數據採用地理坐標系統,整個流域則以Coverage格式整體存儲,數據處理完成後全部導入到Oracle9i資料庫中。
⑼ 什麼是元資料庫
元數據的英文名稱是「Metadata",它是「關於數據的數據」在地理空間信息中用於描述地理數據集的內容、質量、表示方式、空間參考、管理方式以及數據集的其他特徵,它是實現地理空間信息共享的核心標准之一。目前,國際上對空間元數據標准內容進行研究的組織主要有三個,分別是歐洲標准化委員會(CEN/TC287)、美國聯邦地理數據委員會(FGDC)和國際標准化組織地理信息/地球信息技術委員會(ISO/TC211)。空間元數據標准內容分兩個層次。第一層是目錄信息,主要用於對數據集信息進行宏觀描述,它適合在數字地球的國家級空間信息交換中心或區域以及全球范圍內管理和查詢空間信息時使用。第二層是詳細信息,用來詳細或全面描述地理空間信息的空間元數據標准內容,是數據集生產者在提供空間數據集時必須要提供的信息。
元數據主要有下列幾個方面的作用:
(1)用來組織和管理空間信息,並挖掘空間信息資源,這正是數字地球的特點和優點所在。通過它可以在廣域網或網際網路上准確地識別、定位和訪問空間信息。
(2)幫助數據使用者查詢所需空間信息。比如,它可以按照不同的地理區間、指定的語言以及具體的時間段來查找空間信息資源。
(3)組織和維護一個機構對數據的投資。
(4)用來建立空間信息的數據目錄和數據交換中心。通過數據目錄和數據交換中心等提供的空間元數據內容,用戶可以共享空間信息、維護數據結果,以及對它們進行優化等。
(5)提供數據轉換方面的信息。使用戶在獲取空間信息的同時便可以得到空間元數據信息。通過空間元數據,人們可以接受並理解空間信息,與自己的空間信息集成在一起,進行不同方面的科學分析和決策。描述空間信息的元數據標准體系內容按照部分、復合元素和數據元素來組織,它們是依次包含關系,前者包含後者,即:後者依次組成前者。具體分為8個基本內容部分和4個引用部分,由12個部分組成,其中標准化內容包括標識信息、數據質量信息、數據集繼承信息、空間數據表示信息、空間參照系信息、實體和屬性信息、發行信息以及空間元數據參考信息等內容,另外還有4個部分是標准化部分中必須引用的信息,它們為引用信息、時間范圍信息、聯系信息及地址信息。元數據標准內容體系是通過元數據網路管理系統來實現的,該系統主要由許可權驗證功能(伺服器端驗證)、輸入和合法性校驗功能(客戶端校驗)、查詢功能(伺服器端查詢)與返回和顯示功能(伺服器端格式化查詢結果並返回,客戶端顯示)等組成。利用空間元數據網路管理系統作為空間交換站的共享軟體可基本上實現空間信息的網路共享。