当前位置:首页 » 数据仓库 » 书目数据库的分类目录
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

书目数据库的分类目录

发布时间: 2022-08-05 02:40:31

① 图书馆里书籍编号是怎么排列的

中国图书馆分类法,简称《中图法》,现为第五版。包括马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,22个基本大类。

具体如下:

A、马克思主义、列宁主义、毛泽东思想、邓小平理论。

B、哲学、宗教。

C、社会科学总论。

D、政治、法律。

E、军事。

F、经济。

G、文化、科学、教育、体育。

H、语言、文字。

I、文学。

J、艺术。

K、历史、地理。

N、自然科学总论。

O、数理科学和化学。

P、天文学、地球科学。

Q、生物科学。

R、医药、卫生。

S、农业科学。

T、工业技术。

U、交通运输。

V、航空、航天。

X、环境科学、劳动保护科学(安全科学)。

Z、综合性图书。

编制背景:

中华人民共和国建立后,中国图书馆和情报界又编制了几十部文献分类法,其中比较着名的有东北图书馆编的《图书分类法》(1949);山东图书馆编的《图书分类新法》(1951);《中国人民大学图书馆图书分类法》(1953);《中小型图书馆图书分类表草案》(1957);

《中国科学院图书馆图书分类法》(1958);武汉大学图书馆学系编的《武汉大学图书分类法》(1959);《大型图书馆图书分类法草案》(1960年出版,1963年改名为《中国图书馆图书分类法草案》);《中国图书馆图书分类法》(1975)等。

文献整理:

文献整理包括文献的分类、主题标引等内容。文献分类不仅为编制分类目录和文献排架提供依据,也便于图书馆统计、新书宣传、参考咨询等。文献主题标引是根据文献内容所讨论的主题范围,以主题词来揭示和组织文献的。

文献分类和主题标引是揭示文献内容的重要手段,文献着录则是全面地、详尽地揭示文献形式特征和内容特征的主要手段,它便于读者依据该文献的各种特征确认某种文献,获得所需文献的线索。

图书馆员把各种款目有序地组织成图书馆目录(见目录组织法)以揭示图书馆馆藏。图书馆目录是检索文献的工具,也是打开图书馆这个知识宝库的钥匙。

图书馆基本秩序:

严禁在图书馆内吸烟。

保持室内整洁,禁止将食物及饮料带入馆内;请勿随意搬拽阅览桌椅。

保持室内安静:入馆请将呼机和手机关机或调为静音状态;在馆内请轻声交谈,以免影响他人阅读。

尊重管理人员,做个文明读者。

爱护书刊资料及一切公共财物,请勿涂抹、撕毁、私藏书刊。

开发信息资源:

图书馆收藏着大量的文献信息资源,积极地开发,广泛地利用这些文献资源是图书馆的重要职能之一,它也是图书馆承担各种职能的基础。由于当今社会文献的生产数量大、增长快;社会文献的类型复杂、形式多样; 文献的时效性强;

文献的传播速度加快;文献的内容交叉重复;文献所用语种在扩大,质量下降等特点,使人们普遍感到利用起来十分不容易。图书馆通过对文献信息资源进行加工整理、科学分析综合指引,形成有秩序、有规律、源源不断的信息流,进行更加广泛的交流与传递,使读者更好地利用它们。

图书馆的文献资源开发包括下面几项内容:

第一,对到馆的文献进行验收、登记、分类、编目、加工,最后调配到各借阅室,以便科学排架,合理的流通;

第二,对馆外文献信息资源进行搜索、过滤,成为虚拟馆藏,形成更加宽广、快捷的信息通道;

第三,通过最现代化的手段——计算机网络操作技术使馆藏文献走向数字化。

以上内容参考网络-中国图书馆图书分类法

② 信息搜索定义

1
信息检索(information retrieval):是指将信息接一定的方式组织和贮存起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存贮与检索(information storage and retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即根据课题的需要,主要借助于检索工具,从信息集合中找出所需信息的过程,相当于人们所说的信息查寻(information search)。信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。

2
当你拿到一本书就会在封底或版权页看到由“ISBN”(国际标准书
号)和10位数字为标志组成的字样,其格式为:ISBN7-5004-1693-
8/I·200,它的含义是:ISBN组号-出版者号-书名号-校验号/图书
分类号·种次号。组号代表一个地区或地理区域、国家或集团的编号,
中国的编号是“7”;出版者号代表出版社的编号;书名号是出版社出
版的一种特定出版物的名称;校验号校验ISBN编号是否合法。中国加入
ISBN系统之后制定了相应的国家标准-中国标准书号,并于1987年1月
实施。
如此繁复的代号和数字组合有什么作用呢?其一,帮你了解图书的
出版规模。ISBN由十位数字组成,其中校验号恒定为一位数,组号可取
1-5位数。如果一个国家或地区的组号是五位数,其中出版者号与书名
号位数之和就是四位数,通过排列组合,这个国家或地区的出版量最多
只是一万种;而组号如果是一位数,那么其中出版号与书名号位数之和
就是八位数,其出版量将高达一亿种,组号的位数越大出版量越小,组
号的位数越小出版量越大。我国的组号是〃7〃,可见其出版量之大。
其二,帮你了解出版者。首先,可以了解出版者的出版规模和目前
的图书出版数量。ISBN的出版者号与书名号的位数之和恒等于八。目前
,我国出版者可取代码2至5位数,如果出版者号是三位,书名号就是五
位数,则出版量就是十万种,出版者号的位数越小,书名号的位数越大
,出版量也越多,反之出版量越少。例如:商务印书馆1996年7月出版
的《现代汉语词典》修订第三版,中国标准书号为ISBN7-100-01777
-7/H.519。“100”是商务印书馆的代码,“01777”是书名号,表示
商务可出版10万种图书,至1996年7月已出版了1778种(出版者所出版
的第一种图书书名号从0计算)。另外,可以了解出版者是综合性的还
是专业性的。ISBN的书名号与种次号分别代表的是可以出版多少种图书
,已经出版了多少种和某一类目出版了多少种。例如,人民文学出版社
的《当今十大奇案》,中国标准书号是ISBN7-02-000420-2/I·421
其书名号与种次号相等,说明人民文学出版社是专业性的出版社,它以
出版文学类的图书为主。
其三,方便了图书馆工作人员。由于ISBN具有世界唯一性,所以通
过ISBN检索的准确性要高于通过书名检索的准确性。书名有重名现象,
比如茅盾有长篇小说《虹》,而英国的劳伦斯也有长篇小说《虹》。通
过ISBN检索具有唯一性,检索的速度也要高于通过书名检索的速度。书
名少则几个字,多则十几个字,而ISBN只有十个阿拉伯数字,一般的工
作人员都能够录入且速度要比录入书名的速度快得多。
总之,中国标准书号的最大特点是将国际标准书号(ISBN)和全国
统一书号中的分类号和种次号的成份结合起来,结构简单层次性强,便
于计算机处理和检索,给出版、发行、订购、统计、分编等提供很大的
方便,是读者进入图书馆查阅图书的一个重要检索点。

3
计 算 机 检 索 系 统 的 构 成

计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。
一、计算机硬件
计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。

二、软件
软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。

三、数据库
根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
按国际上通用的分类方法,数据库可以划分为以下类型:

1. 参考数据库
参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。
书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。
指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

2. 源数据库
源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:
(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。
(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。
(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。
(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。
(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、图片或照片等资料类型的计算机存储与检索。
除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。

四、通讯网络
由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。

4
《中国图书馆分类法》有22大类:A 马克思主义、列宁主义、毛泽东思想、邓小平理论,B 哲学、宗教,C 社会科学总论,D 政治、法律,E 军事,F 经济,G 文化、科学、教育、体育,H 语言、文字,I 文学,J 艺术,K 历史、地理,N 自然科学总论,O 数理科学和化学,P 天文学、地球科学,Q 生物科学,R 医药、卫生,S 农业科学,T 工业技术,U 交通运输,V 航空、航天,X 环境科学、安全科学,Z 综合性图书。
详细类目可查阅图书馆主页《中国图书馆分类法》。

体育有:G 文化、科学、教育、体育

5
1.是否支持全文检索
2.检索结果如何排序,相关性,时间等,是否全面
3.检索功能是否全面,如布尔逻辑检索、关键词检索、位置检索、截词检索、限制检索等等
4.查询速度如何,维护更新如何
5.界面是否简单易用,易用性是否强
建议你找本关于《信息检索》的书来看看,我说的特别简单,手头没有书,你要是想具体看看,还得看书。人大出版社的那本信息检索不错。

6
根据文献的有关信息查找相应的馆藏目录或联合目录,找到收藏单位,再索取或复制原文。如果本单位图书馆没有收藏所需文献,用户可以通过馆际互借或文献传递服务获取。

7
学术性图书馆当然以国家图书馆最权威,各高校图书馆都收藏有相应的学术资源,可通过中国高校文献保障系统(Calis)来查重要高校的馆藏和信息服务情况。

③ 请问数据库有哪些种类呢

数据库共有3种类型,为关系数据库、非关系型数据库和键值数据库。

1、关系数据库

MySQL、MariaDB(MySQL的代替品,英文维基网络从MySQL转向MariaDB)、Percona Server(MySQL的代替品·)、PostgreSQL、Microsoft Access、Microsoft SQL Server、Google Fusion Tables、FileMaker、Oracle数据库、Sybase、dBASE、Clipper、FoxPro、foshub。

几乎所有的数据库管理系统都配备了一个开放式数据库连接(ODBC)驱动程序,令各个数据库之间得以互相集成。

2、非关系型数据库(NoSQL)

BigTable(Google)、Cassandra、MongoDB、CouchDB。

3、键值(key-value)数据库

Apache Cassandra(为Facebook所使用):高度可扩展、Dynamo、LevelDB(Google)。

(3)书目数据库的分类目录扩展阅读:

数据库模型:对象模型、层次模型(轻量级数据访问协议)、网状模型(大型数据储存)、关系模型、面向对象模型、半结构化模型、平面模型(表格模型,一般在形式上是一个二维数组。如表格模型数据Excel)。

数据库的架构可以大致区分为三个概括层次:内层、概念层和外层。

④ 数据库的类型

ASP数据库类型DBFDBCMDBExcelSQLServer

数据库是在计算机存储设备上按一定方式,合理组织并存储的相互有关联的数据的集合,是计算机技术和信息检索技术相结合的产物,是电子信息资源的主体,是信息检索系统的核心部分之一。按所提供的信息内容,数据库主要可分为参考数据库和源数据库。

1.参考数据库

主要存储一系列描述性信息内容,指引用户到另一信息源以获得完整的原始信息的一类数据库,主要包括书目数据库和指南数据库。

(1)书目数据库 存储描述如目录、题录、文摘等书目线索的数据库,又称二次文献信息数据库。如各种图书馆目录数据库、题录数据库和文摘数据库等属于此类,它的作用是为用户指出了获取原始信息的线索。

图书馆目录数据库,又称机读目录,其数据内容详细,除描述标题、作者、出版项等书目信息外,还提供用户索取原始信息的馆藏信息。题录、文摘数据库描述的数据内容与印刷型的题录、文摘相似,它提供了论文信息或专利信息等确定的信息来源,供用户检索。

(2)指南数据库 存储描述关于机构、人物、产品、活动等对象的数据库。与其它数据库相比,指南数据库为用户提供的不仅仅是有关信息,还包括各种类型的实体,多采用名称进行检索。如存储生产与经营活动信息的机构名录数据库、存储人物信息的人物传记数据库、存储产品或商品信息的产品指南数据库、存储基金信息的基金数据库等属于此类,它的作用指引用户从其它有关信息源获取更详细的信息。

2.源数据库

主要存储全文、数值、结构式等信息,能直接提供原始信息或具体数据,用户不必再转查其它信息源的数据库。它主要包括全文数据库和数值数据库。

(1)全文数据库 存储原始信息全文或主要部分的一种源数据库。如期刊全文数据库、专利全文数据库、网络全书全文数据库,用户使用某一词汇或短语,便可直接检索出含有该词汇或短语的原始信息的全文。

(2)数值数据库 存储以数值表示信息为主的一种源数据库,和它类似的有文本-数值数据库。与书目数据库比较,数值数据库是对信息进行深加工的产物,可以直接提供所需的数据信息。如各种统计数据库、科学技术数据库等。数值数据库除了一般的检索功能外,还具有准确数据运算功能、数据分析功能、图形处理功能及对检索输出的数据进行排序和重新组织等方面的功能。

4.2.2 数据库结构

1.书目数据库的结构

书目数据库是以文档形式组织一系列数据,这些数据被称为记录,一个记录又包含若干字段。

(1)记录与字段 记录是作为一个单位来处理有关数据的集合,是组成文档的基本数据单位。记录中所包含的若干字段,则是组成记录的基本数据单位。在书目数据库中,一个记录相当于一条题录或文摘,因此,一个记录通常由标题字段、作者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字段等组成。在有些字段中,又包含多个子字段,子字段是字段的下级数据单位。如,主题词字段含有多个主题词。按照字段所代表记录的性质不同,字段通常分为基本字段和辅助字段两类。常见的字段名称及代码见表4-1。

表4-1 字段名称及代码

基本字段
辅助字段

字段名称
字段代码
字段名称
字段代码

标 题
TI
记录号
DN

文 摘
AB
作 者
AU

叙 词
DE
作者单位
CS

标识词
ID
期刊名称
JN

出版年
PY

出版国
CO

语 种
LA

(2)文档 按一定结构组织的相关记录的集合。文档是书目数据库数据组织的基本形式,文档的组织方式与检索系统的硬件和软件功能密切相关。在书目数据库中,文档结构主要分为顺排文档和倒排文档。

1)顺排文档 记录按顺序存放,记录之间的逻辑顺序与物理顺序是一致的,相当于印刷型工具中文摘的排列顺序,是一种线形文档。顺排文档是构成数据库的主体部分,但其主题词等特征的标识呈无序状态,直接检索时,必须以完整的记录作为检索单元,从头至尾查询,检索时间长,实用性较差。

2)倒排文档 将顺排文档中各个记录中含有主题性质的字段(如主题词字段、标题字段、叙词字段等)和非主题性质字段(如作者字段、机构字段、来源字段等)分别提取出来,按某种顺序重新组织得到的一种文档。具有主题性质的倒排档,称基本索引档,非主题性质的倒排档,称辅助索引档。

综上所述,顺排档和倒排档的主要区别是:顺排档以完整的记录为处理和检索单元,是主文档,倒排档以记录中的字段为处理和检索单元,是索引文档。计算机进行检索时,先进入倒排档查找有关信息的存取号,然后再进入顺排档按存取号查找记录。

2.全文数据库的结构

一般的全文数据库结构与书目数据库相似,全文数据库的一个记录就是一个全文文本,记录分成若干字段。其主文档是以顺排形式组织的文本文档,倒排档是对应于记录可检字段的索引文档。

3.数值数据库的结构

数值数据库的结构要综合考虑数据库的内容及检索目的,即,在内容上,数值数据库的主要内容是数值信息,但不排除含有必要的说明性的文本信息,在检索上,便于单项检索和综合检索,还能对数值进行准确数据运算、数据分析、图形处理及对检索输出的数据进行排序和重新组织。数值数据库的数据结构可以是单元式,也可以是表册形式。前者是对原始数据的模拟,后者则是对统计表格的机读模拟。数值数据库通常有多种文档,如顺排挡、倒排挡、索引文档等。顺排挡是由数值数据组成,为主文档,另有相应的索引文档,为便于存取,索引文档采用基本直接存取结构的组织形式。倒排挡也有相应的索引文档,索引文档采取分级组织形式。数值数据库的文档结构,使所有文档都可以用于检索,所有数据都可用来运算,构成了数值数据库的特点。

4.指南数据库的结构

指南数据库的结构兼有书目数据库、全文数据库和数值数据库的特点,有顺排档、倒排档、索引文档和数据字典。一般而言,对涉及主题领域较多,内容综合性较强的大型指南数据库,顺排挡(主文档)可采用多子文档的结构,对单一主题领域和内容较专的,则采用单一主文档和不定长、多字段的记录格式为宜。

⑤ 主要的检索途径有哪几种类型

计算机检索系统的构成
计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。
一、计算机硬件
计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。
二、软件软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。
三、数据库根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
按国际上通用的分类方法,数据库可以划分为以下类型:
1. 参考数据库
参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。
书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。
指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。
2. 源数据库
源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:
(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。
(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。
(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。
(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。
(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、图片或照片等资料类型的计算机存储与检索。
除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。
四、通讯网络
由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。

⑥ 什么是目录数据库

何为目录数据库?

目录(Catalog)是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。一种出版物经过如此描述后形成一条记录,将所有的记录组织起来就形成了目录。

何为元数据库?

什么是元数据?
元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。
这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。元数据可以为数据说明其元素或属性(名称、大小、数据类型、等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

举几个简单的例子:
使用过数码相机的同学都应该知道,每张数码照片都会存在一个EXIF信息。它就是一种用来描述数码图片的元数据。根据EXIF标准,这些元数据包括:Image Description(图像描述、来源. 指生成图像的工具 )、Artist(作者)、Make( 生产者)、Model (型号)、….、等等。
生活中我们填写的《个人信息登记表》,包括姓名、性别、民族、政治面貌、一寸照片、学历、职称等等这些就是锁定kent.zhu这个人的元数据。

通常情况下元数据可以分为以下三类:固有性元数据、管理性元数据、描述性元数据。
固有性元数据;与事物构成有关的元数据。
管理性元数据;与事物处理方式有关的元数据。
描述性元数据;与事物本质有关的元数据。
当然,并不是说所数据总能清晰的划分在以上3类中。比如:一张由kent拍摄的大小为20K的JPG格式的印着一只小狗的圣诞卡照片。
它的固有性元数据包括:20K、JPG;管理性元数据:kent拍摄、圣诞卡;描述性元数据:狗、小狗、圣诞、照片、圣诞节、…
但是,圣诞卡则可以放在以上任何一个分类中。与事物构成有关(说明这个东东是什么)、与事物处理方式有关(说明这个东东的用途是什么)、与事物本质有关(可以直接用来描述这个东东)。

元数据之于信息架构的意义
元数据是一种很有效的方法,用以确保网站上各种形式的内容确实都能被查找到。比如我们常常为搜索很久之前看到的一张美女图片犯愁,而如果一个图片网站如果信息架构足够好,我们就能凭借我们回忆到的元数据(关于武藤兰的?2000年拍摄的?)清晰的找到。
元数据之于信息架构就像是房子的砖瓦,它可以根据需要摆放成不同的信息检索系统。元数据是所有组织系统的基础,从搜索到电子商务网站上的导航系统都强烈的依赖于元数据。
前面提到,元数据实际上是为产品的可查找性(Findability)服务的。而用户在查找信息的时候不会按照机器思维去找(不会输入该照片的ID),而是直接输入关于信息的描述性信息如:“小狗 圣诞卡”。也就意味着在创建关于描述性元数据的时候要尽量的提取出任官关于这个对象所讲述的故事,这些才是人们能记住的和习惯搜索的细节。

我们会发现,机械生成的元数据常常是不靠谱的,如在UCH系统下发布日志的时候系统会自动根据标题进行机械分析生成的一些元数据。
而充分利用手工元数据(handcrafted metadate)是提高可查找性的一个好方法。最常见的例子就是我们见到的Tag。Tag就是一种用户自创的元数据,其特点是无层次结构、自定义。比如这张Flickr照片下的手工元数据就为在Flickr上查找提供了更多的方便。

⑦ 文献信息源主要有哪几种类型

根据文献的媒体形式不同,文献可分为以下十类:

1.图书

图书是人类用来记录一切成就的主要载体,也是人类交流感情、获得知识、传承经验的重要媒介,对人类文明的发展贡献至钜。图书具有品种多、数量大、范围广的特点,一般给人们以系统、完整、连续的知识和信息。

2.期刊

从广义上来讲,期刊的分类可以分为非正式期刊和正式期刊两种。非正式期刊是指通过行政部门审核领取“内部报刊准印证”作为行业内部交流的期刊,一般只限行业内交流不公开发行,但也是合法期刊的一种,一般正式期刊都经历过非正式期刊过程。正式期 刊由国家新闻出版署与国家科委在商定的数额内审批,并编入“国 内统一刊号”,办刊申请比较严格,要有一定的办刊实力,正式期刊 有独立的办刊方针。期刊具有出版周期短、报道速度快、数量大、信息内容新等特点,是很重要的信息源。

文献的基本类型和特点有哪些?

3.报纸

报纸指以刊载新闻和新闻评论为主,通常散页印刷,不装订、没有封面的纸质出版物。现代报纸每日出版一次,称为日刊;或者每周出版一次,称为周刊。报纸的特点是报道及时,受众面广,具有群众性和通俗性。

4.会议文献

会议文献可分为会前、会中和会后三种。

(1 )会前文献包括征文启事、会议通知书、会议日程表、预印本和会前论文摘要等。

(2)会议期间的会议文献有开幕词、讲话或报告、讨论记录、会议决议和闭幕词等。

(3)会后文献有会议录、汇编、论文集、报告、学术讨论会报告、会议专刊等。其中,会议记录是会后将论文、报告及讨论记录整理汇编而公开出版或发表的文献。会议文献的特点是专业性强,并且能较全面、迅速地反映某一技术领域或学科发展水平、动态和趋势。

5.科技报告

科技报告是指记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告、报告文献。它出现于20世纪初,第二次世界大战后迅速发展,成为科技文献中的一大门类。每份报告自成一册,通常载有主持单位、报告撰写者、密级、报告号、研究项目号和合同号等。按内容可分为报告书、论文、通报、札记、技术译文、备忘录、特种出版物。科技报告具有单独成册、出版日期不定、内容专深、报道迅速、多为保密、控制发行等特点。

⑧ 谈谈你对数据库的了解

按国际上通用的分类方法,数据库分为以下三大类:
1.参考数据库(Reference databases),是能指引用户到另一信息源获取原文或其他细节的数据库,包括书目数据库(Bibliographic databases)如题录库、文摘索引库、图书馆机读目录库,和指南数据库(Referral databases或Directory databases),如企业名录库、产品数据库等;
2.源数据库(Source databases),指能直接提供所需原始资料或具体数据的数据库。包括数值数据库(Numeric databases)、全文数据库(Full text databases)、术语数据库(Terminological databases)和图像数据库(Graphic databases)。具体的如新闻消息全文库、法律法规全文库、商情全文库、期刊论文数据库、财务数据库、科技报告数据库、各种统计数据库、含有图片或照片的产品目录库、资料库等;
3.混合型数据库(Mixed databases),能同时存贮多种类型数据的数据库。

规模

易观国际近期发布《IT产品和服务-2007年第1季度中国数据库软件市场数据监测》,考察了中国数据库管理软件市场。数据显示,中国商业数据库市场2007年第1季度整体规模达到5.43亿人民币,比去年同期增长15%,与上季度环比增长1.53%。

从厂商竞争格局来看,国际软件巨头占据市场的绝大多数份额。Oracle、IBM、Microsoft和Sybase牢牢占据国内数据库软件市场前四位,拥有93.8%的市场份额。国产数据库的市场份额在本季度继续提升,正在抓住国家提倡自主创新的机遇,以“有自主知识产权”的产品为契机,满足部委和地方政府的信息整合平台需求

应用

随着信息时代的发展,数据库也相应产生了一些新的应用领域。主要表现在下面6个方面。

1.多媒体数据库

这类数据库主要存储与多媒体相关的数据,如声音、图像和视频等数据。多媒体数据最大的特点是数据连续,而且数据量比较大,存储需要的空间较大。

2.移动数据库

该类数据库是在移动计算机系统上发展起来的,如笔记本电脑、掌上计算机等。该数据库最大的特点是通过无线数字通信网络传输的。移动数据库可以随时随地地获取和访问数据,为一些商务应用和一些紧急情况带来了很大的便利。

3.空间数据库

这类数据库目前发展比较迅速。它主要包括地理信息数据库(又称为地理信息系统,即GIS)和计算机辅助设计(CAD)数据库。其中地理信息数据库一般存储与地图相关的信息数据;计算机辅助设计数据库一般存储设计信息的空间数据库,如机械、集成电路以及电子设备设计图等。

4.信息检索系统

信息检索就是根据用户输入的信息,从数据库中查找相关的文档或信息,并把查找的信息反馈给用户。信息检索领域和数据库是同步发展的,它是一种典型的联机文档管理系统或者联机图书目录。

5.分布式信息检索

这类数据库是随着Internet的发展而产生的数据库。它一般用于因特网及远距离计算机网络系统中。特别是随着电子商务的发展,这类数据库发展更加迅猛。许多网络用户(如个人、公司或企业等)在自己的计算机中存储信息,同时希望通过网络使用发送电子邮件、文件传输、远程登录方式和别人共享这些信息。分布式信息检索满足了这一要求。

6.专家决策系统

专家决策系统也是数据库应用的一部分。由于越来越多的数据可以联机获取,特别是企业通过这些数据可以对企业的发展作出更好的决策,以使企业更好地运行。由于人工智能的发展,使得专家决策系统的应用更加广泛。

⑨ 计算机信息检索系统由几个部分组成

一个完整的信息检索系统,通常由信息源、信息组织管理、系统功能、用户接口和系统支持技术等几个有机部分组成。

计算机信息检索系统:是利用计算机和一定的通信设备查找所需信息的检索方式,检索的系统就是人的设计操作和计算机自动化处理相结合的系统。

计算机信息检索系统的保密性是通过对信息条目的存取控制机构来实现的。对于以文件系统为基础的信息检索系统,存取控制一般只能在文件一级,即通过在打开文件时核对口令来控制非授权的用户检索信息。

对于以数据库技术为基础的检索系统,存取控制可以在文件、记录,甚至在信息条目中某信息项一级,既可以通过核对口令方式,也可以采取调用用户编写的编码、译码子程序的方式阻止非授权的用户调用保密的信息。

(9)书目数据库的分类目录扩展阅读

常用的检索技术主要有以下六种:

1. 布尔逻辑检索

利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”和逻辑非“NOT”。

2. 截词检索

截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索。

3. 位置检索位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。

4. 字段限定检索

字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。

5. 加权检索

加权检索是某些检索系统中提供的一种定量检索技术。

加权检索同布尔检索、截词检索等一样,也是文献检索的一个基本检索手段,但与它们不同的是,加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。

6. 聚类检索

聚类是把没有分类的事物,在不知道应分几类的情况下,根据事物彼此不同的内在属性,将属性相似的信息划分到同一类下面。