當前位置:首頁 » 數據倉庫 » 書目資料庫的分類目錄
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

書目資料庫的分類目錄

發布時間: 2022-08-05 02:40:31

① 圖書館里書籍編號是怎麼排列的

中國圖書館分類法,簡稱《中圖法》,現為第五版。包括馬列主義、毛澤東思想,哲學,社會科學,自然科學,綜合性圖書五大部類,22個基本大類。

具體如下:

A、馬克思主義、列寧主義、毛澤東思想、鄧小平理論。

B、哲學、宗教。

C、社會科學總論。

D、政治、法律。

E、軍事。

F、經濟。

G、文化、科學、教育、體育。

H、語言、文字。

I、文學。

J、藝術。

K、歷史、地理。

N、自然科學總論。

O、數理科學和化學。

P、天文學、地球科學。

Q、生物科學。

R、醫葯、衛生。

S、農業科學。

T、工業技術。

U、交通運輸。

V、航空、航天。

X、環境科學、勞動保護科學(安全科學)。

Z、綜合性圖書。

編制背景:

中華人民共和國建立後,中國圖書館和情報界又編制了幾十部文獻分類法,其中比較著名的有東北圖書館編的《圖書分類法》(1949);山東圖書館編的《圖書分類新法》(1951);《中國人民大學圖書館圖書分類法》(1953);《中小型圖書館圖書分類表草案》(1957);

《中國科學院圖書館圖書分類法》(1958);武漢大學圖書館學系編的《武漢大學圖書分類法》(1959);《大型圖書館圖書分類法草案》(1960年出版,1963年改名為《中國圖書館圖書分類法草案》);《中國圖書館圖書分類法》(1975)等。

文獻整理:

文獻整理包括文獻的分類、主題標引等內容。文獻分類不僅為編制分類目錄和文獻排架提供依據,也便於圖書館統計、新書宣傳、參考咨詢等。文獻主題標引是根據文獻內容所討論的主題范圍,以主題詞來揭示和組織文獻的。

文獻分類和主題標引是揭示文獻內容的重要手段,文獻著錄則是全面地、詳盡地揭示文獻形式特徵和內容特徵的主要手段,它便於讀者依據該文獻的各種特徵確認某種文獻,獲得所需文獻的線索。

圖書館員把各種款目有序地組織成圖書館目錄(見目錄組織法)以揭示圖書館館藏。圖書館目錄是檢索文獻的工具,也是打開圖書館這個知識寶庫的鑰匙。

圖書館基本秩序:

嚴禁在圖書館內吸煙。

保持室內整潔,禁止將食物及飲料帶入館內;請勿隨意搬拽閱覽桌椅。

保持室內安靜:入館請將呼機和手機關機或調為靜音狀態;在館內請輕聲交談,以免影響他人閱讀。

尊重管理人員,做個文明讀者。

愛護書刊資料及一切公共財物,請勿塗抹、撕毀、私藏書刊。

開發信息資源:

圖書館收藏著大量的文獻信息資源,積極地開發,廣泛地利用這些文獻資源是圖書館的重要職能之一,它也是圖書館承擔各種職能的基礎。由於當今社會文獻的生產數量大、增長快;社會文獻的類型復雜、形式多樣; 文獻的時效性強;

文獻的傳播速度加快;文獻的內容交叉重復;文獻所用語種在擴大,質量下降等特點,使人們普遍感到利用起來十分不容易。圖書館通過對文獻信息資源進行加工整理、科學分析綜合指引,形成有秩序、有規律、源源不斷的信息流,進行更加廣泛的交流與傳遞,使讀者更好地利用它們。

圖書館的文獻資源開發包括下面幾項內容:

第一,對到館的文獻進行驗收、登記、分類、編目、加工,最後調配到各借閱室,以便科學排架,合理的流通;

第二,對館外文獻信息資源進行搜索、過濾,成為虛擬館藏,形成更加寬廣、快捷的信息通道;

第三,通過最現代化的手段——計算機網路操作技術使館藏文獻走向數字化。

以上內容參考網路-中國圖書館圖書分類法

② 信息搜索定義

1
信息檢索(information retrieval):是指將信息接一定的方式組織和貯存起來,並根據信息用戶的需要找出有關信息的過程。所以,它的全稱又叫信息存貯與檢索(information storage and retrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過程的後半部分,即根據課題的需要,主要藉助於檢索工具,從信息集合中找出所需信息的過程,相當於人們所說的信息查尋(information search)。信息檢索的過程往往需要一個評價反饋途徑,多次比較匹配,以獲得最終的檢索結果。

2
當你拿到一本書就會在封底或版權頁看到由「ISBN」(國際標准書
號)和10位數字為標志組成的字樣,其格式為:ISBN7-5004-1693-
8/I·200,它的含義是:ISBN組號-出版者號-書名號-校驗號/圖書
分類號·種次號。組號代表一個地區或地理區域、國家或集團的編號,
中國的編號是「7」;出版者號代表出版社的編號;書名號是出版社出
版的一種特定出版物的名稱;校驗號校驗ISBN編號是否合法。中國加入
ISBN系統之後制定了相應的國家標准-中國標准書號,並於1987年1月
實施。
如此繁復的代號和數字組合有什麼作用呢?其一,幫你了解圖書的
出版規模。ISBN由十位數字組成,其中校驗號恆定為一位數,組號可取
1-5位數。如果一個國家或地區的組號是五位數,其中出版者號與書名
號位數之和就是四位數,通過排列組合,這個國家或地區的出版量最多
只是一萬種;而組號如果是一位數,那麼其中出版號與書名號位數之和
就是八位數,其出版量將高達一億種,組號的位數越大出版量越小,組
號的位數越小出版量越大。我國的組號是〃7〃,可見其出版量之大。
其二,幫你了解出版者。首先,可以了解出版者的出版規模和目前
的圖書出版數量。ISBN的出版者號與書名號的位數之和恆等於八。目前
,我國出版者可取代碼2至5位數,如果出版者號是三位,書名號就是五
位數,則出版量就是十萬種,出版者號的位數越小,書名號的位數越大
,出版量也越多,反之出版量越少。例如:商務印書館1996年7月出版
的《現代漢語詞典》修訂第三版,中國標准書號為ISBN7-100-01777
-7/H.519。「100」是商務印書館的代碼,「01777」是書名號,表示
商務可出版10萬種圖書,至1996年7月已出版了1778種(出版者所出版
的第一種圖書書名號從0計算)。另外,可以了解出版者是綜合性的還
是專業性的。ISBN的書名號與種次號分別代表的是可以出版多少種圖書
,已經出版了多少種和某一類目出版了多少種。例如,人民文學出版社
的《當今十大奇案》,中國標准書號是ISBN7-02-000420-2/I·421
其書名號與種次號相等,說明人民文學出版社是專業性的出版社,它以
出版文學類的圖書為主。
其三,方便了圖書館工作人員。由於ISBN具有世界唯一性,所以通
過ISBN檢索的准確性要高於通過書名檢索的准確性。書名有重名現象,
比如茅盾有長篇小說《虹》,而英國的勞倫斯也有長篇小說《虹》。通
過ISBN檢索具有唯一性,檢索的速度也要高於通過書名檢索的速度。書
名少則幾個字,多則十幾個字,而ISBN只有十個阿拉伯數字,一般的工
作人員都能夠錄入且速度要比錄入書名的速度快得多。
總之,中國標准書號的最大特點是將國際標准書號(ISBN)和全國
統一書號中的分類號和種次號的成份結合起來,結構簡單層次性強,便
於計算機處理和檢索,給出版、發行、訂購、統計、分編等提供很大的
方便,是讀者進入圖書館查閱圖書的一個重要檢索點。

3
計 算 機 檢 索 系 統 的 構 成

計算機檢索系統由計算機硬體、軟體、資料庫和通訊網路構成。
一、計算機硬體
計算機硬體是系統採用的各種硬設備的總稱,主要包括具有一定性能的主計算機、外圍設備以及與數據處理或數據傳送有關的其他設備。

二、軟體
軟體由系統維護軟體與檢索軟體構成。系統維護軟體,如資料庫管理程序、詞表管理程序等,其作用是保障檢索系統的高效運轉。檢索軟體是用戶與系統的界面,用戶通過檢索軟體進行檢索,檢索軟體功能的強弱直接影響著檢索效果。檢索軟體可以分為指令式、菜單式和智能介面等。

三、資料庫
根據ISO/DIS 5127標准,數據定義為:「至少由一種文檔組成,並能滿足某一特定目的或某一特定數據處理系統需要的一種數據集合。」通俗地說,資料庫就是在計算機存儲設備上按一定方式存儲的相互關聯的數據集合。
按國際上通用的分類方法,資料庫可以劃分為以下類型:

1. 參考資料庫
參考資料庫(Reference databases)是指引用戶到另一信息源以獲得原文或其他細節的一類資料庫。它包括書目資料庫(Bibliographic databases)和指南資料庫(Referral database或Directory database)兩種。
書目資料庫是指存儲某個領域的二次文獻(如文摘、題錄、目錄等書目數據)的一類資料庫,有時又稱為二次文獻資料庫,或簡稱為文獻資料庫。如中國機械工程文摘資料庫,屬於此類型資料庫。
指南資料庫也稱指示性資料庫,是指存儲關於某些機構、人物、出版物、項目、程序、活動等對象的簡要描述,指引用戶從其他有關信息源獲取更詳細的信息的一類資料庫。如產品目錄、機構名錄、研發項目、基金項目等資料庫均屬於此類型。

2. 源資料庫
源資料庫(Source databases)是指能直接提供原始資料或具體數據的資料庫,用戶不必再查閱其他信息源。它可以分為:
(1)數值資料庫這是一種專門提供以數值方式表示的數據的源資料庫,如統計資料庫、財務資料庫等。
(2)文本-數值資料庫這是一種能同時提供文本信息和數值數據的源資料庫,如企業信息資料庫、產品資料庫等。
(3)全文資料庫這是一種存儲文獻全文或其中主要部分的源資料庫,如法律法規全文庫、期刊全文庫等。
(4)術語資料庫這是一種專門存儲名詞術語信息、詞語信息以及術語工作和語言規范工作成果的源資料庫,如名詞術語信息庫、各種電子化辭書等。
(5)圖像資料庫這是一種用來存儲各種圖像或圖形信息及有關文字說明資料的源資料庫,主要應用於建築、設計、廣告、產品、圖片或照片等資料類型的計算機存儲與檢索。
除上述幾種類型的資料庫外,還有能同時存儲多種不同類型數據的資料庫,即混合型資料庫。另外,按其載體不同又可分成磁媒體資料庫、光碟資料庫和多媒體資料庫等。

四、通訊網路
由於現代通信技術的發展,公共數據傳輸技術為信息的傳遞提供了保障,信息檢索逐漸發展成為網路檢索,通過數據傳輸網將各個計算機連接起來。每個計算機成為網路中的一個節點,每個節點可含一個或多個資料庫,網路上的每個節點和其終端只要有授權均可對網路中的資料庫進行訪問,實現資源共享。隨著空間技術的發展,信息檢索已進入了信息傳遞-衛星通訊-計算機技術三位一體的新階段。

4
《中國圖書館分類法》有22大類:A 馬克思主義、列寧主義、毛澤東思想、鄧小平理論,B 哲學、宗教,C 社會科學總論,D 政治、法律,E 軍事,F 經濟,G 文化、科學、教育、體育,H 語言、文字,I 文學,J 藝術,K 歷史、地理,N 自然科學總論,O 數理科學和化學,P 天文學、地球科學,Q 生物科學,R 醫葯、衛生,S 農業科學,T 工業技術,U 交通運輸,V 航空、航天,X 環境科學、安全科學,Z 綜合性圖書。
詳細類目可查閱圖書館主頁《中國圖書館分類法》。

體育有:G 文化、科學、教育、體育

5
1.是否支持全文檢索
2.檢索結果如何排序,相關性,時間等,是否全面
3.檢索功能是否全面,如布爾邏輯檢索、關鍵詞檢索、位置檢索、截詞檢索、限制檢索等等
4.查詢速度如何,維護更新如何
5.界面是否簡單易用,易用性是否強
建議你找本關於《信息檢索》的書來看看,我說的特別簡單,手頭沒有書,你要是想具體看看,還得看書。人大出版社的那本信息檢索不錯。

6
根據文獻的有關信息查找相應的館藏目錄或聯合目錄,找到收藏單位,再索取或復制原文。如果本單點陣圖書館沒有收藏所需文獻,用戶可以通過館際互借或文獻傳遞服務獲取。

7
學術性圖書館當然以國家圖書館最權威,各高校圖書館都收藏有相應的學術資源,可通過中國高校文獻保障系統(Calis)來查重要高校的館藏和信息服務情況。

③ 請問資料庫有哪些種類呢

資料庫共有3種類型,為關系資料庫、非關系型資料庫和鍵值資料庫。

1、關系資料庫

MySQL、MariaDB(MySQL的代替品,英文維基網路從MySQL轉向MariaDB)、Percona Server(MySQL的代替品·)、PostgreSQL、Microsoft Access、Microsoft SQL Server、Google Fusion Tables、FileMaker、Oracle資料庫、Sybase、dBASE、Clipper、FoxPro、foshub。

幾乎所有的資料庫管理系統都配備了一個開放式資料庫連接(ODBC)驅動程序,令各個資料庫之間得以互相集成。

2、非關系型資料庫(NoSQL)

BigTable(Google)、Cassandra、MongoDB、CouchDB。

3、鍵值(key-value)資料庫

Apache Cassandra(為Facebook所使用):高度可擴展、Dynamo、LevelDB(Google)。

(3)書目資料庫的分類目錄擴展閱讀:

資料庫模型:對象模型、層次模型(輕量級數據訪問協議)、網狀模型(大型數據儲存)、關系模型、面向對象模型、半結構化模型、平面模型(表格模型,一般在形式上是一個二維數組。如表格模型數據Excel)。

資料庫的架構可以大致區分為三個概括層次:內層、概念層和外層。

④ 資料庫的類型

ASP資料庫類型DBFDBCMDBExcelSQLServer

資料庫是在計算機存儲設備上按一定方式,合理組織並存儲的相互有關聯的數據的集合,是計算機技術和信息檢索技術相結合的產物,是電子信息資源的主體,是信息檢索系統的核心部分之一。按所提供的信息內容,資料庫主要可分為參考資料庫和源資料庫。

1.參考資料庫

主要存儲一系列描述性信息內容,指引用戶到另一信息源以獲得完整的原始信息的一類資料庫,主要包括書目資料庫和指南資料庫。

(1)書目資料庫 存儲描述如目錄、題錄、文摘等書目線索的資料庫,又稱二次文獻信息資料庫。如各種圖書館目錄資料庫、題錄資料庫和文摘資料庫等屬於此類,它的作用是為用戶指出了獲取原始信息的線索。

圖書館目錄資料庫,又稱機讀目錄,其數據內容詳細,除描述標題、作者、出版項等書目信息外,還提供用戶索取原始信息的館藏信息。題錄、文摘資料庫描述的數據內容與印刷型的題錄、文摘相似,它提供了論文信息或專利信息等確定的信息來源,供用戶檢索。

(2)指南資料庫 存儲描述關於機構、人物、產品、活動等對象的資料庫。與其它資料庫相比,指南資料庫為用戶提供的不僅僅是有關信息,還包括各種類型的實體,多採用名稱進行檢索。如存儲生產與經營活動信息的機構名錄資料庫、存儲人物信息的人物傳記資料庫、存儲產品或商品信息的產品指南資料庫、存儲基金信息的基金資料庫等屬於此類,它的作用指引用戶從其它有關信息源獲取更詳細的信息。

2.源資料庫

主要存儲全文、數值、結構式等信息,能直接提供原始信息或具體數據,用戶不必再轉查其它信息源的資料庫。它主要包括全文資料庫和數值資料庫。

(1)全文資料庫 存儲原始信息全文或主要部分的一種源資料庫。如期刊全文資料庫、專利全文資料庫、網路全書全文資料庫,用戶使用某一詞彙或短語,便可直接檢索出含有該詞彙或短語的原始信息的全文。

(2)數值資料庫 存儲以數值表示信息為主的一種源資料庫,和它類似的有文本-數值資料庫。與書目資料庫比較,數值資料庫是對信息進行深加工的產物,可以直接提供所需的數據信息。如各種統計資料庫、科學技術資料庫等。數值資料庫除了一般的檢索功能外,還具有準確數據運算功能、數據分析功能、圖形處理功能及對檢索輸出的數據進行排序和重新組織等方面的功能。

4.2.2 資料庫結構

1.書目資料庫的結構

書目資料庫是以文檔形式組織一系列數據,這些數據被稱為記錄,一個記錄又包含若干欄位。

(1)記錄與欄位 記錄是作為一個單位來處理有關數據的集合,是組成文檔的基本數據單位。記錄中所包含的若干欄位,則是組成記錄的基本數據單位。在書目資料庫中,一個記錄相當於一條題錄或文摘,因此,一個記錄通常由標題欄位、作者欄位、來源欄位、文摘欄位、主題詞欄位、分類號欄位、語種欄位等組成。在有些欄位中,又包含多個子欄位,子欄位是欄位的下級數據單位。如,主題詞欄位含有多個主題詞。按照欄位所代表記錄的性質不同,欄位通常分為基本欄位和輔助欄位兩類。常見的欄位名稱及代碼見表4-1。

表4-1 欄位名稱及代碼

基本欄位
輔助欄位

欄位名稱
欄位代碼
欄位名稱
欄位代碼

標 題
TI
記錄號
DN

文 摘
AB
作 者
AU

敘 詞
DE
作者單位
CS

標識詞
ID
期刊名稱
JN

出版年
PY

出版國
CO

語 種
LA

(2)文檔 按一定結構組織的相關記錄的集合。文檔是書目資料庫數據組織的基本形式,文檔的組織方式與檢索系統的硬體和軟體功能密切相關。在書目資料庫中,文檔結構主要分為順排文檔和倒排文檔。

1)順排文檔 記錄按順序存放,記錄之間的邏輯順序與物理順序是一致的,相當於印刷型工具中文摘的排列順序,是一種線形文檔。順排文檔是構成資料庫的主體部分,但其主題詞等特徵的標識呈無序狀態,直接檢索時,必須以完整的記錄作為檢索單元,從頭至尾查詢,檢索時間長,實用性較差。

2)倒排文檔 將順排文檔中各個記錄中含有主題性質的欄位(如主題詞欄位、標題欄位、敘詞欄位等)和非主題性質欄位(如作者欄位、機構欄位、來源欄位等)分別提取出來,按某種順序重新組織得到的一種文檔。具有主題性質的倒排檔,稱基本索引檔,非主題性質的倒排檔,稱輔助索引檔。

綜上所述,順排檔和倒排檔的主要區別是:順排檔以完整的記錄為處理和檢索單元,是主文檔,倒排檔以記錄中的欄位為處理和檢索單元,是索引文檔。計算機進行檢索時,先進入倒排檔查找有關信息的存取號,然後再進入順排檔按存取號查找記錄。

2.全文資料庫的結構

一般的全文資料庫結構與書目資料庫相似,全文資料庫的一個記錄就是一個全文文本,記錄分成若干欄位。其主文檔是以順排形式組織的文本文檔,倒排檔是對應於記錄可檢欄位的索引文檔。

3.數值資料庫的結構

數值資料庫的結構要綜合考慮資料庫的內容及檢索目的,即,在內容上,數值資料庫的主要內容是數值信息,但不排除含有必要的說明性的文本信息,在檢索上,便於單項檢索和綜合檢索,還能對數值進行准確數據運算、數據分析、圖形處理及對檢索輸出的數據進行排序和重新組織。數值資料庫的數據結構可以是單元式,也可以是表冊形式。前者是對原始數據的模擬,後者則是對統計表格的機讀模擬。數值資料庫通常有多種文檔,如順排擋、倒排擋、索引文檔等。順排擋是由數值數據組成,為主文檔,另有相應的索引文檔,為便於存取,索引文檔採用基本直接存取結構的組織形式。倒排擋也有相應的索引文檔,索引文檔採取分級組織形式。數值資料庫的文檔結構,使所有文檔都可以用於檢索,所有數據都可用來運算,構成了數值資料庫的特點。

4.指南資料庫的結構

指南資料庫的結構兼有書目資料庫、全文資料庫和數值資料庫的特點,有順排檔、倒排檔、索引文檔和數據字典。一般而言,對涉及主題領域較多,內容綜合性較強的大型指南資料庫,順排擋(主文檔)可採用多子文檔的結構,對單一主題領域和內容較專的,則採用單一主文檔和不定長、多欄位的記錄格式為宜。

⑤ 主要的檢索途徑有哪幾種類型

計算機檢索系統的構成
計算機檢索系統由計算機硬體、軟體、資料庫和通訊網路構成。
一、計算機硬體
計算機硬體是系統採用的各種硬設備的總稱,主要包括具有一定性能的主計算機、外圍設備以及與數據處理或數據傳送有關的其他設備。
二、軟體軟體由系統維護軟體與檢索軟體構成。系統維護軟體,如資料庫管理程序、詞表管理程序等,其作用是保障檢索系統的高效運轉。檢索軟體是用戶與系統的界面,用戶通過檢索軟體進行檢索,檢索軟體功能的強弱直接影響著檢索效果。檢索軟體可以分為指令式、菜單式和智能介面等。
三、資料庫根據ISO/DIS 5127標准,數據定義為:「至少由一種文檔組成,並能滿足某一特定目的或某一特定數據處理系統需要的一種數據集合。」通俗地說,資料庫就是在計算機存儲設備上按一定方式存儲的相互關聯的數據集合。
按國際上通用的分類方法,資料庫可以劃分為以下類型:
1. 參考資料庫
參考資料庫(Reference databases)是指引用戶到另一信息源以獲得原文或其他細節的一類資料庫。它包括書目資料庫(Bibliographic databases)和指南資料庫(Referral database或Directory database)兩種。
書目資料庫是指存儲某個領域的二次文獻(如文摘、題錄、目錄等書目數據)的一類資料庫,有時又稱為二次文獻資料庫,或簡稱為文獻資料庫。如中國機械工程文摘資料庫,屬於此類型資料庫。
指南資料庫也稱指示性資料庫,是指存儲關於某些機構、人物、出版物、項目、程序、活動等對象的簡要描述,指引用戶從其他有關信息源獲取更詳細的信息的一類資料庫。如產品目錄、機構名錄、研發項目、基金項目等資料庫均屬於此類型。
2. 源資料庫
源資料庫(Source databases)是指能直接提供原始資料或具體數據的資料庫,用戶不必再查閱其他信息源。它可以分為:
(1)數值資料庫這是一種專門提供以數值方式表示的數據的源資料庫,如統計資料庫、財務資料庫等。
(2)文本-數值資料庫這是一種能同時提供文本信息和數值數據的源資料庫,如企業信息資料庫、產品資料庫等。
(3)全文資料庫這是一種存儲文獻全文或其中主要部分的源資料庫,如法律法規全文庫、期刊全文庫等。
(4)術語資料庫這是一種專門存儲名詞術語信息、詞語信息以及術語工作和語言規范工作成果的源資料庫,如名詞術語信息庫、各種電子化辭書等。
(5)圖像資料庫這是一種用來存儲各種圖像或圖形信息及有關文字說明資料的源資料庫,主要應用於建築、設計、廣告、產品、圖片或照片等資料類型的計算機存儲與檢索。
除上述幾種類型的資料庫外,還有能同時存儲多種不同類型數據的資料庫,即混合型資料庫。另外,按其載體不同又可分成磁媒體資料庫、光碟資料庫和多媒體資料庫等。
四、通訊網路
由於現代通信技術的發展,公共數據傳輸技術為信息的傳遞提供了保障,信息檢索逐漸發展成為網路檢索,通過數據傳輸網將各個計算機連接起來。每個計算機成為網路中的一個節點,每個節點可含一個或多個資料庫,網路上的每個節點和其終端只要有授權均可對網路中的資料庫進行訪問,實現資源共享。隨著空間技術的發展,信息檢索已進入了信息傳遞-衛星通訊-計算機技術三位一體的新階段。

⑥ 什麼是目錄資料庫

何為目錄資料庫?

目錄(Catalog)是以完整的出版單元(如一種圖書、一種期刊)為單位,按照一定次序編排的對文獻信息進行描述和報道的工具,也稱書目。目錄對文獻的描述比較簡單,每條記錄的欄位主要包括:文獻題名、責任者、出版事項、分類號、主題詞等。一種出版物經過如此描述後形成一條記錄,將所有的記錄組織起來就形成了目錄。

何為元資料庫?

什麼是元數據?
元數據(Meta Date),關於數據的數據或者叫做用來描述數據的數據或者叫做信息的信息。
這些定義都很是抽象,我們可以把元數據簡單的理解成,最小的數據單位。元數據可以為數據說明其元素或屬性(名稱、大小、數據類型、等),或其結構(長度、欄位、數據列),或其相關數據(位於何處、如何聯系、擁有者)。

舉幾個簡單的例子:
使用過數碼相機的同學都應該知道,每張數碼照片都會存在一個EXIF信息。它就是一種用來描述數碼圖片的元數據。根據EXIF標准,這些元數據包括:Image Description(圖像描述、來源. 指生成圖像的工具 )、Artist(作者)、Make( 生產者)、Model (型號)、….、等等。
生活中我們填寫的《個人信息登記表》,包括姓名、性別、民族、政治面貌、一寸照片、學歷、職稱等等這些就是鎖定kent.zhu這個人的元數據。

通常情況下元數據可以分為以下三類:固有性元數據、管理性元數據、描述性元數據。
固有性元數據;與事物構成有關的元數據。
管理性元數據;與事物處理方式有關的元數據。
描述性元數據;與事物本質有關的元數據。
當然,並不是說所數據總能清晰的劃分在以上3類中。比如:一張由kent拍攝的大小為20K的JPG格式的印著一隻小狗的聖誕卡照片。
它的固有性元數據包括:20K、JPG;管理性元數據:kent拍攝、聖誕卡;描述性元數據:狗、小狗、聖誕、照片、聖誕節、…
但是,聖誕卡則可以放在以上任何一個分類中。與事物構成有關(說明這個東東是什麼)、與事物處理方式有關(說明這個東東的用途是什麼)、與事物本質有關(可以直接用來描述這個東東)。

元數據之於信息架構的意義
元數據是一種很有效的方法,用以確保網站上各種形式的內容確實都能被查找到。比如我們常常為搜索很久之前看到的一張美女圖片犯愁,而如果一個圖片網站如果信息架構足夠好,我們就能憑借我們回憶到的元數據(關於武藤蘭的?2000年拍攝的?)清晰的找到。
元數據之於信息架構就像是房子的磚瓦,它可以根據需要擺放成不同的信息檢索系統。元數據是所有組織系統的基礎,從搜索到電子商務網站上的導航系統都強烈的依賴於元數據。
前面提到,元數據實際上是為產品的可查找性(Findability)服務的。而用戶在查找信息的時候不會按照機器思維去找(不會輸入該照片的ID),而是直接輸入關於信息的描述性信息如:「小狗 聖誕卡」。也就意味著在創建關於描述性元數據的時候要盡量的提取出任官關於這個對象所講述的故事,這些才是人們能記住的和習慣搜索的細節。

我們會發現,機械生成的元數據常常是不靠譜的,如在UCH系統下發布日誌的時候系統會自動根據標題進行機械分析生成的一些元數據。
而充分利用手工元數據(handcrafted metadate)是提高可查找性的一個好方法。最常見的例子就是我們見到的Tag。Tag就是一種用戶自創的元數據,其特點是無層次結構、自定義。比如這張Flickr照片下的手工元數據就為在Flickr上查找提供了更多的方便。

⑦ 文獻信息源主要有哪幾種類型

根據文獻的媒體形式不同,文獻可分為以下十類:

1.圖書

圖書是人類用來記錄一切成就的主要載體,也是人類交流感情、獲得知識、傳承經驗的重要媒介,對人類文明的發展貢獻至鉅。圖書具有品種多、數量大、范圍廣的特點,一般給人們以系統、完整、連續的知識和信息。

2.期刊

從廣義上來講,期刊的分類可以分為非正式期刊和正式期刊兩種。非正式期刊是指通過行政部門審核領取「內部報刊准印證」作為行業內部交流的期刊,一般只限行業內交流不公開發行,但也是合法期刊的一種,一般正式期刊都經歷過非正式期刊過程。正式期 刊由國家新聞出版署與國家科委在商定的數額內審批,並編入「國 內統一刊號」,辦刊申請比較嚴格,要有一定的辦刊實力,正式期刊 有獨立的辦刊方針。期刊具有出版周期短、報道速度快、數量大、信息內容新等特點,是很重要的信息源。

文獻的基本類型和特點有哪些?

3.報紙

報紙指以刊載新聞和新聞評論為主,通常散頁印刷,不裝訂、沒有封面的紙質出版物。現代報紙每日出版一次,稱為日刊;或者每周出版一次,稱為周刊。報紙的特點是報道及時,受眾面廣,具有群眾性和通俗性。

4.會議文獻

會議文獻可分為會前、會中和會後三種。

(1 )會前文獻包括徵文啟事、會議通知書、會議日程表、預印本和會前論文摘要等。

(2)會議期間的會議文獻有開幕詞、講話或報告、討論記錄、會議決議和閉幕詞等。

(3)會後文獻有會議錄、匯編、論文集、報告、學術討論會報告、會議專刊等。其中,會議記錄是會後將論文、報告及討論記錄整理匯編而公開出版或發表的文獻。會議文獻的特點是專業性強,並且能較全面、迅速地反映某一技術領域或學科發展水平、動態和趨勢。

5.科技報告

科技報告是指記錄某一科研項目調查、實驗、研究的成果或進展情況的報告,又稱研究報告、報告文獻。它出現於20世紀初,第二次世界大戰後迅速發展,成為科技文獻中的一大門類。每份報告自成一冊,通常載有主持單位、報告撰寫者、密級、報告號、研究項目號和合同號等。按內容可分為報告書、論文、通報、札記、技術譯文、備忘錄、特種出版物。科技報告具有單獨成冊、出版日期不定、內容專深、報道迅速、多為保密、控制發行等特點。

⑧ 談談你對資料庫的了解

按國際上通用的分類方法,資料庫分為以下三大類:
1.參考資料庫(Reference databases),是能指引用戶到另一信息源獲取原文或其他細節的資料庫,包括書目資料庫(Bibliographic databases)如題錄庫、文摘索引庫、圖書館機讀目錄庫,和指南資料庫(Referral databases或Directory databases),如企業名錄庫、產品資料庫等;
2.源資料庫(Source databases),指能直接提供所需原始資料或具體數據的資料庫。包括數值資料庫(Numeric databases)、全文資料庫(Full text databases)、術語資料庫(Terminological databases)和圖像資料庫(Graphic databases)。具體的如新聞消息全文庫、法律法規全文庫、商情全文庫、期刊論文資料庫、財務資料庫、科技報告資料庫、各種統計資料庫、含有圖片或照片的產品目錄庫、資料庫等;
3.混合型資料庫(Mixed databases),能同時存貯多種類型數據的資料庫。

規模

易觀國際近期發布《IT產品和服務-2007年第1季度中國資料庫軟體市場數據監測》,考察了中國資料庫管理軟體市場。數據顯示,中國商業資料庫市場2007年第1季度整體規模達到5.43億人民幣,比去年同期增長15%,與上季度環比增長1.53%。

從廠商競爭格局來看,國際軟體巨頭占據市場的絕大多數份額。Oracle、IBM、Microsoft和Sybase牢牢占據國內資料庫軟體市場前四位,擁有93.8%的市場份額。國產資料庫的市場份額在本季度繼續提升,正在抓住國家提倡自主創新的機遇,以「有自主知識產權」的產品為契機,滿足部委和地方政府的信息整合平台需求

應用

隨著信息時代的發展,資料庫也相應產生了一些新的應用領域。主要表現在下面6個方面。

1.多媒體資料庫

這類資料庫主要存儲與多媒體相關的數據,如聲音、圖像和視頻等數據。多媒體數據最大的特點是數據連續,而且數據量比較大,存儲需要的空間較大。

2.移動資料庫

該類資料庫是在移動計算機系統上發展起來的,如筆記本電腦、掌上計算機等。該資料庫最大的特點是通過無線數字通信網路傳輸的。移動資料庫可以隨時隨地地獲取和訪問數據,為一些商務應用和一些緊急情況帶來了很大的便利。

3.空間資料庫

這類資料庫目前發展比較迅速。它主要包括地理信息資料庫(又稱為地理信息系統,即GIS)和計算機輔助設計(CAD)資料庫。其中地理信息資料庫一般存儲與地圖相關的信息數據;計算機輔助設計資料庫一般存儲設計信息的空間資料庫,如機械、集成電路以及電子設備設計圖等。

4.信息檢索系統

信息檢索就是根據用戶輸入的信息,從資料庫中查找相關的文檔或信息,並把查找的信息反饋給用戶。信息檢索領域和資料庫是同步發展的,它是一種典型的聯機文檔管理系統或者聯機圖書目錄。

5.分布式信息檢索

這類資料庫是隨著Internet的發展而產生的資料庫。它一般用於網際網路及遠距離計算機網路系統中。特別是隨著電子商務的發展,這類資料庫發展更加迅猛。許多網路用戶(如個人、公司或企業等)在自己的計算機中存儲信息,同時希望通過網路使用發送電子郵件、文件傳輸、遠程登錄方式和別人共享這些信息。分布式信息檢索滿足了這一要求。

6.專家決策系統

專家決策系統也是資料庫應用的一部分。由於越來越多的數據可以聯機獲取,特別是企業通過這些數據可以對企業的發展作出更好的決策,以使企業更好地運行。由於人工智慧的發展,使得專家決策系統的應用更加廣泛。

⑨ 計算機信息檢索系統由幾個部分組成

一個完整的信息檢索系統,通常由信息源、信息組織管理、系統功能、用戶介面和系統支持技術等幾個有機部分組成。

計算機信息檢索系統:是利用計算機和一定的通信設備查找所需信息的檢索方式,檢索的系統就是人的設計操作和計算機自動化處理相結合的系統。

計算機信息檢索系統的保密性是通過對信息條目的存取控制機構來實現的。對於以文件系統為基礎的信息檢索系統,存取控制一般只能在文件一級,即通過在打開文件時核對口令來控制非授權的用戶檢索信息。

對於以資料庫技術為基礎的檢索系統,存取控制可以在文件、記錄,甚至在信息條目中某信息項一級,既可以通過核對口令方式,也可以採取調用用戶編寫的編碼、解碼子程序的方式阻止非授權的用戶調用保密的信息。

(9)書目資料庫的分類目錄擴展閱讀

常用的檢索技術主要有以下六種:

1. 布爾邏輯檢索

利用布爾邏輯算符進行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術。常用的布爾邏輯算符有三種,分別是邏輯或「OR」、邏輯與「AND」和邏輯非「NOT」。

2. 截詞檢索

截詞檢索是計算機檢索系統中應用非常普遍的一種技術。由於西文的構詞特性,在檢索中經常會遇到名詞的單復數形式不一致;同一個意思的詞,英美拼法不一致;詞干加上不同性質的前綴和後綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索。

3. 位置檢索位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語言進行檢索,詞與詞之間的邏輯關系用位置算符組配,對檢索詞之間的相對位置進行限制。這是一種可以不依賴主題詞表而直接使用自由詞進行檢索的技術方法。

4. 欄位限定檢索

欄位限定檢索是指限定檢索詞在資料庫記錄中的一個或幾個欄位范圍內查找的一種檢索方法。在檢索系統中,資料庫設置的可供檢索的欄位通常有兩種:表達文獻主題內容特徵的基本欄位和表達文獻外部特徵的輔助欄位。

5. 加權檢索

加權檢索是某些檢索系統中提供的一種定量檢索技術。

加權檢索同布爾檢索、截詞檢索等一樣,也是文獻檢索的一個基本檢索手段,但與它們不同的是,加權檢索的側重點不在於判定檢索詞或字元串是不是在資料庫中存在、與別的檢索詞或字元串是什麼關系,而是在於判定檢索詞或字元串在滿足檢索邏輯後對文獻命中與否的影響程度。

6. 聚類檢索

聚類是把沒有分類的事物,在不知道應分幾類的情況下,根據事物彼此不同的內在屬性,將屬性相似的信息劃分到同一類下面。