当前位置:首页 » 数据仓库 » 检索一个自己不太熟悉的数据库我们应首先
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

检索一个自己不太熟悉的数据库我们应首先

发布时间: 2022-09-21 05:01:26

1. 我的信息检索常见问题

一、网络环境下信息检索的常见问题

一是网络信息过于泛滥。如今,任何组织与个人均可通过网络相关信息,导致网络信息量飞速增加,而信息的质量与精度则不断降低,一些网站质量不高,且长时间不进行更新,导致用户面对这些信息显得无所适从,因而无法找到所需信息。
二是搜索引擎存在不足。虽然搜索引擎能够发挥网络导航之作用,但是也存在着类目设计不规范,内容存在重复和交叉现象等,而且重复链接信息偏多,查准率过低。
三是用户信息意识不强。尽管网络环境下用户可运用网络来获得信息,但尚有许多用户缺乏良好的信息意识,对于网络信息检索不够熟悉,难以快速获取相关信息。

二、网络环境下强化信息检索的对策

(-)通过提出信息需求以明确检索目标

用户在检索前一定要深入分析,明确所要检索的目标信息,这是确定检索策略的根本措施,也是判断检索效率高低之重点。
一是要了解所要检索信息的主体内容以及涉及到的学科范围,并且明确检索内容及其目的,这是用户选择检索工具的首要步骤。
二是确定需要文献类型、年代和文献范围等,在了解清楚以上内容之后再来选择相应的数据库并开展限定检索。
三是应明确查新、查准以及查全等指标性要求。如果想知识本领域的最新动态和进展,就应当注重“新”。

(二)选用合适的检索数据库和检索工具

目前,网络资源的种类相当多。每个检索系统常常涵盖了多个数据库。在进入到系统以后,一般都会出现分类目录让用户进行选择。

(三)实施概念分析以确认检索词

实施计算机检索是否能够得到满意的成效,一个关键环节就是要选好检索词。只要检索词分析得当,就能更好地进行选词和进行逻辑上的组配。

(四)合理构造信息检索表达形式

在构造信息检索表达形式之时,应当全面运用检索工具所支持的检索计算,允许运用检索标识与各类限定等,这也是实施有效检索的重要基础。

(五)合理地调整信息检索方式

在制定明确的检索方式,并且输入到检索系统之后,该系统所检索出来的结果并不是肯定能够满足用户心中所设想的信息检索要求。

(六)不断提升广大用户的信息素质

提升用户的信息素质与思想素质,这是提升信息检索能力的重要基础。知识、技能与能力等三者均为知识素质的重要体现,三者之间是相辅相成的。

2. 计算机检索的常用方法有哪些

明确检索要求和检索目标
计算机检索的第一步准备工作是明确检索要求和检索目标。
明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。
确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。
4.3.2 课题分析
1. 课题概念的分析方法 分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。
2. 隐含概念的分析方法 有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。
3. 核心概念的选取 有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。
为了提高文献的检准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。
4.3.3 检索词的扩展、选择和处理
目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。
1.相同概念的检索词的扩展 扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法
(1) 同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。
(2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符
("?") 和有限截词 ("??"和"?? ?")等多种,"?"有时还用做字符屏蔽符。
(3)主题词表方法 许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。
2.检索词的选择和处理 运用上述方法得到的词,首先应加以选择,即注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:

概念组面1:"社会保障" social security 概念组面2:"制度研究"system? Research
4.3.4 数据库的选择
不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。
选择数据库,我们一般应该遵循以下几条原则
1.按照课题的检索要求和目的,选择收录文献种类多、专业覆盖面宽、年代跨度对口的数据库;
2.当需要查找最新文献信息时,选择数据更新周期短的数据库;
3.当还需要获取原文时,选取原文获取较容易的数据库;
4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。
5.当几个数据库的内容交叉重复率比较高时,应选择检索费用比较低的数据库。
4.3.5 检索策略构成和调整方法
在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。
检索策略,又称提问逻辑,就是对多个检索词之间的相互关系和检索顺序作出的某种安排。构成检索策略就是运用计算机情报检索系统可以接受的方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求的过程。

1.布尔逻辑算符 规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。
(1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。
(2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。
(3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率.
2. 位置算符 位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种。
3.字段限制 字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。

4. 检索策略的调整 检索策略输入检索系统后,系统响应的检索结果有时不一定能满足课题检索的要求,例如:或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。
调整检索策略之前,首先要分析造成检索结果不理想的原因。对于输出篇数过多的情况,应分析是否是由下述原因造成的:①选用了多义性的检索词;②截词截得过短;③输入的检索词太少;④应该使用"与(AND)"的使用了"或(OR)";⑤优先运算符"()"使用错误。对于输出篇数过少的情况,应分析是否是由下述原因造成的:①检索词拼写错误;②遗漏重要的同义词或隐含概念;③检索词过于冷僻具体;④没有使用截词算符;⑤位置算符和字段算符使用的过多;⑥使用过多的"与(AND)"算符。
针对上述原因,如果是属于需要扩大检索范围,提高文献查全率,调整检索策略的方法有:①减少"与(AND)"算符,增加同义词或同族相关词使用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符(?);③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
如果是属于缩小检索范围,提高文献查准率的,调整检索策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限定检索词在指定的基本字段,或者指定的辅助字段出现,限制检索结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用"非(NOT)"算符,排除无关概念。
4.3.6 输出格式和方式的选择
所谓输出格式的选择是对记录字段的选择。所谓输出方式的选择是指对屏幕显示、打印和存盘的选择。 一般情况下,如果输出的是中间结果,属于基本字段的题目(TI)、文摘(AB)、叙词(DE)和识别词(ID)字段是必须的,这些字段有利于观察结果,对检索策略做进一步调整。如果是最终结果,可以根据时间、经费条件选择其中适用的格式。
输出方式的选择,要注意的问题是,数据库是否只允许打印、存盘选中的记录;在选定打印、存盘后,是否还须进一步选择"当前记录""全部记录""选中记录";另外如果是存盘,是否还有文件扩展名的限制。

另外给你推荐本书:参考下http://wenku..com/view/646426c58bd63186bcebbca4.html

3. 怎么检索文献资料

查文献时最好是从中文开始,然后是外文文献。主要有以下几种方法:
1. 根据文章出处,去一些较大图书馆查找原文。
2. 如果学校或单位有CNKI,维普,万方的话,就比较好办,中文文献一般都可以搞定,把关键词、期刊名称、卷,期、年等信息输入即可检索到。
3. 对于自然科学来讲英文文献检索首推Elsevier,Springer等。这些数据库里面文献很多,可以为我们提供很多的文献资源。
4.如果所在单位或大学没有购买这些数据库,我们可以去Science网上杂志找文章,对中国人完全免费!另外还可以通过Google学术搜索(scholar.google.com)来查询。里面一般会搜出来你要找的文献,在Google学术搜索里通常情况会出现每组几个等字样,然后进入后,分别点击,里面的其中一个就有可能会下到全文。
5. 如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,这样你就有可能下到你想要的文献的全文了。第一作者查不到个人主页,就接上面的方法查第二作者。

4. 检索工具选择的基本原则有哪些

检索工具选择的基本原则主要有:收录的文献信息需要覆盖检索课题的主题内容、就近原则,方便查阅、检索工具尽可能质量高、收录文献多、内容新、使用方便、检索工具记录来源、文献类型、语种等尽量满足检索课题要求、根据熟悉检索工具的程度。


检索工具是用于报道、存储和查找文献线索的工具和设备的总称。图书馆目录、期刊索引、电子计算机检索用的文献数据库等等都是检索工具。它具有报道文献、存储文献、检索文献三大基本功能。其类型有手工检索工具和机械检索工具两种。

手工检索工具指目录、索引、文摘等印刷型的二次文献。机械检索工具是指电子计算机情报检索系统的技术设备而言。

检索工具的特点:详细描述文献的内容特征,外表特征;每条文献记录必须有检索标识;文献条目按一定顺序形成一个有机整体,能够提供多种检索途径。

检索工具的类型:目录型检索工具(如馆藏目录,联合目录,国家书目,出版社与书店目录);题录型检索工具;文摘型检索工具。(如知识型文摘,报导型文摘);索引型检索工具。

以上内容参考:网络-检索工具

5. 论述信息检索的基本程序

这位同学啊,书上都有啊!看书完全可以知道的
进行信息检索,一般来说要经过以下基本程序:分析检索课题,选择检索系统及数据库,确定检索词,构建检索提问式,上机检索并调整检索策略,输出检索结果。
1、分析检索课题
利用计算机信息检索系统获取文献信息的用户,一般分为直接用户和间接用户两种类型。直接用户是指最终使用获得的信息进行工作的用户(如,科研人员,管理者,决策者等);间接用户是指专门从事计算机检索服务的检索人员。检索人员在接到用户的检索课题时应首先分析研究课题,全面了解课题的内容以及用户对检索的各种要求,从而有助于正确选择检索系统及数据库,制定合理的检索策略等。分析检索课题时应从以下几方面进行:
(1)弄清用户信息需求的目的和意图。
(2)分析课题涉及的学科范围、主题要求。
(3)课题所需信息的内容及其特征。
(4)课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、着者、机构等。
(5)课题对查新、查准、查全的指标要求。
2、选择检索系统和数据库
在全面分析检索课题的基础上,根据用户要求得到的信息类型、时间范围、课题检索经费支持等因素综合考虑后,选择检索系统和数据库。正确选择数据库,是保证检索成功的基础。选择数据库时必须从以下几个方面考虑:
(1)数据库收录的信息内容所涉及的学科范围;
(2)数据库收录的文献类型、数量、时间范围以及更新周期;
(3)数据库所提供的检索途径、检索功能和服务方式。
3、确定检索词
检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。检索词选择正确与否,直接影响着检索结果。在全面了解检索课题的相关问题后,提炼主要概念与隐含概念,排除次要概念,以便确定检索词。检索词的确定,一般有以下几种方法:
(1)先选用主题词。当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果。
(2)选用数据库规定的代码。许多数据库的文档中使用各种代码来表示各种主题范畴,有很高的匹配性。例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质登记号。
(3)选用常用的专业术语。在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词。
(4)选用同义词与相关词。同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。
4、构建检索提问式
检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索提问式构建得是否合理,将直接影响查全率和查准率。构建检索提问式时,应正确运用逻辑组配运算符:
(1)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高。
(2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。
(3)使用“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。另外,在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输入次序等。
5、上机检索并调整检索策略
构建完检索提问式后,就可以上机检索了。检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式作相应的修改和调整,直至得到比较满意的结果。
(1)检索结果信息量过多
产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下:
①减少同义词与同族相关词;
②增加限制概念,采用逻辑“与”连接检索词;
③使用字段限定,将检索词限定在某个或某些字段范围;
④使用逻辑”非”算符,排除无关概念;
⑤调整位置算符,由松变严,(F) (W)。
(2)检索结果信息量过少
造成检索结果信息量少的原因有以下几点:首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围,提高检索结果的查全率。调整检索策略的方法如下:
①选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度;
②减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念;
③去除某些字段限制;
④调整位置算符,由严变松,(W) (F)。
6、输出检索结果
根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段(全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送,至此,完成整个检索过程。