⑴ 文獻檢索資料庫中記錄由若干什麼構成
信息檢索試題 《信息檢索》期末考試題 班級 艙室3091 姓名:顏二磊一、選擇題(1分*38題) 1、根據國家相關標准,文獻的定義是指「記錄有(A )的一切載體」。 A.情報 B.信息 C.知識 D.數據 2、以作者本人取得的成果為依據而創作的論文、報告等,並經公開發表或出版的各種文獻,稱為( B ) A.零次文獻 B.一次文獻 C.二次文獻 D.三次文獻 3、文摘、題錄、目錄等屬於( B ) A.一次文獻 B.二次文獻 C.零次文獻 D.三次文獻 4、手稿、私人筆記等屬於( C)文獻,辭典、手冊等屬於( )文獻 A.一次,三次 B.零次,二次 C.零次,三次 D.一次,二次 5、按照出版時間的先後,應將各個級別的文獻排列成( A ) A.三次文獻、二次文獻、一次文獻 B.一次文獻、三次文獻、二次文獻 C.一次文獻、二次文獻、三次文獻 D.二次文獻、三次文獻、一次文獻 6、( B )的主要功能是檢索、通報、控制一次文獻,幫助人們在較短時間內獲取較多的文獻信息。 A.零次文獻 B.二次文獻 C.一次文獻 D.三次文獻 7、一次文獻、二次文獻、三次文獻是按照( A )進行區分的。 A.內容的公開次數 B.原創的層次 C.印刷的次數 D.評論的次數 8、從文獻的( C )角度區分,可將文獻分為印刷型、縮微型等。 A.內容的公開次數 B.載體類型 C.出版類型 D.公開程度 9、具有固定名稱、統一出版形式和一定出版規律的定期或不定期的連續出版物,稱為( D ) A.圖書 B.會議文獻 C.學位論文 D.期刊 10、利用文獻後面所附的參考文獻進行檢索的方法稱為( A ) A.追溯法 B.直接法 C.抽查法 D.綜合法 11、中國圖書館圖書分類法的分類號採用了( A ) A.拼音字母+數字 B.英語字母+數字 C.全部拼音字母 D.全部數字 12、( D )是報道文獻出版或收藏信息為主要功能的工具。 A.題錄 B.索引 C.文摘 D.目錄 13、按照順序表述文獻檢索常用的五個步驟是( D ) A.明確要求和分析課題,選擇檢索系統,獲取原文,確定檢索途徑和檢索策略,實施檢索以及調整檢索策略 B. 明確要求和分析課題,獲取原文,確定檢索途徑和檢索策略,實施檢索以及調整檢索策略選擇檢索系統 C. 明確要求和分析課題,實施檢索以及調整檢索策略選擇檢索系統,獲取原文,確定檢索途徑和檢索策略 D. 明確要求和分析課題,選擇檢索系統,確定檢索途徑和檢索策略,實施檢索以及調整檢索策略,獲取原文 14、課題「計算機在情報檢索中的應用」的中圖法分類號及類名為( D ) A.TP3計算機技術 B.TP399計算機技術的應用 C.G250圖書館學 D.G252.7情報檢索 15、邏輯運算符包括( D ) A.邏輯與 B.邏輯或 C.邏輯非 D.A,B和C 16、如果希望查找「玻璃復合薄膜的研究」這個課題相關的文獻,較好的檢索詞應該是( D) A.玻璃,復合,薄膜,研究 B.玻璃,復合,薄膜 C.復合,薄膜,研究 D.玻璃,薄膜,研究 17、記錄是對某一實體的全部屬性進行描述的結果,在全文資料庫中一條記錄相當於( C ),在書目資料庫中,一條記錄相當於( ) A.一條文摘,一篇完整的文獻 B.一條文摘,一條題錄 C.一篇完整的文獻,一條題錄或文摘 D.一條題錄,一條文摘 18、邏輯「與」運算符是用來組配(D ) A.不同檢索概念,用於擴大檢索范圍 B.相近檢索概念,擴大檢索范圍 C.不同檢索概念,用於縮小檢索范圍 D.相近檢索概念,縮小檢索范圍 19、具有概念交叉限定關系的兩個檢索詞之間應該使用( C) A.邏輯或 B.邏輯非 C.邏輯與 D.優先 20、邏輯「或」運算符是用來組配( B ) A.不同檢索概念,用於擴大檢索范圍 B.相近檢索概念,擴大檢索范圍 C.不同檢索概念,用於縮小檢索范圍 D.相近檢索概念,縮小檢索范圍 21、具有相近含義的同義詞或同族詞在構成檢索策略時應該使用(A )運算符予以組配。 A.邏輯與 B.邏輯或 C.邏輯非 D.位置 22、若想排除某概念,以縮小檢索范圍,可使用( B )運算符 A.邏輯與 B.邏輯非 C.邏輯或 D.位置 23、右截詞的含義是檢索所有含有與檢索詞( A )的記錄 A.前方一致 B.中間一致 C.後方一致 D.與輸入的檢索詞完全一致 24、就中國學術期刊資料庫(CNKI)的使用許可權而言,(D )是不正確的。 A.從任何公網終端都可以訪問其題錄信息 B.從有訪問許可權的上網終端可訪問其題錄信息 C.從有訪問許可權的上網終端可訪問其全文信息 D.從任何公網終端都可以訪問其全文信息 25、《中國學術期刊全文資料庫》中,( C )使用的優先算符是合理的。 A.(文學)*(翻譯) B.(文學+小說)*(翻譯) C. (文學+小說)*翻譯 D.文學+(小說)*(翻譯) 26、在《中國學術期刊全文資料庫》中,不可以進行( D )檢索 A.邏輯與 B.邏輯或 C.邏輯非 D.位置 27、《中國學術期刊全文資料庫》提供的文獻內容特徵檢索途徑有( B ) A.機構 B.篇名/關鍵詞/摘要 C.中文刊名 D.作者 28、《中國學術期刊全文資料庫》提供的文獻外表特徵的途徑有( B ) A.關鍵詞,篇名 B.機構,中文刊名 C.作者,篇名 D.文摘,中文刊名 29、查找南通航院師生2009年發表論文被《中國學術期刊全文資料庫》收錄情況,可選擇的檢索策略是( D ) A.作者機構欄位:南通航運職業技術學院 並且 作者欄位:師生 並且 年份欄位:2009 B.作者機構欄位:南通航運職業技術學院 並且 年份欄位:2009 C.作者機構欄位:南通 並且 航院職業技術學院 並且 年份欄位:2009 D.作者機構欄位:南通航院職業技術學院 並且 年份欄位:2009 30、《中國學術期刊全文資料庫》中選擇作者欄位,輸入「方誌」,選擇「模糊匹配」控制,系統給出的檢索結果不可能包含有作者姓名為( B ) A.方誌成 B.成方誌 C.方誌 D.方成志 31、若想在《中國學術期刊全文資料庫》中提高檢索結果的查准率,可使用(A ) A.在結果中檢索 B.優先算符 C.或者 D.位置檢索 32、《中國學術期刊全文資料庫》中,在單邏輯檢索的文摘欄位中輸入檢索詞「經濟」檢索的基礎上,再在篇名欄位中輸入「全球化」,選「在結果中檢索」再行檢索。這個檢索過程可以策略表示為( )。兩次檢索後,檢索范圍( B )了。 A.文摘欄位:經濟*篇名欄位:全球化,擴大 B. 文摘欄位:經濟*篇名欄位:全球化,縮小 C. 文摘欄位:經濟+篇名欄位:全球化,擴大 D. 文摘欄位:經濟+篇名欄位:全球化,縮小 33、《中國學術期刊全文資料庫》給出的檢索結果,為( D ) A.僅題錄 B.僅文摘 C.僅全文 D.題錄、文摘和全文三種 34、《中國學術期刊全文資料庫》的全文檢索結果( D ) A.直接在屏幕瀏覽無需全文瀏覽器,但下載存檔再閱讀需全文瀏覽器 B.直接在屏幕瀏覽無需全文瀏覽器,下載存檔再閱讀也無需全文瀏覽器 C.直接在屏幕瀏覽需全文瀏覽器,但下載存檔再閱讀無需全文瀏覽器 D.直接在屏幕瀏覽需全文瀏覽器,下載存檔再再閱讀也無需全文瀏覽器 35、CNKI資料庫的全文閱讀格式有兩種,其中一種是( C ) A:Articles Image_PDF , B:Aeticles Lmage , C: CAJ. 36、萬方資料庫使用布爾邏輯算符 and / or / not .其中A and B表示 ( A ) A:查找包括A和B的文獻,B;查找A與B其中之一的文獻, C:查找有A無B的文獻。 37、《中圖法》中基本大類由22個字母表示,「E」表示的是(C ) 「O」表示的 是 ( )。 A:經濟、軍事, B:自然科學、文學, C:軍事、數理科學和化學 D:經濟、外語 38、南通航運職業技術學院圖書館電子圖書系統有( C ) A:書生之家、古騰堡計劃,B:超星數字圖書館、Ebrary電子圖書,C:讀秀電子圖書,超星電子圖書,D:萬方數據,暢想之星二、判斷題(1分*32題)(錯「x」,對「v」)文獻是記錄知識的一切載體,即用文字、圖像、符號等手段記錄人類知識的各種載體( V)
文獻知識的內容與其記錄方式、載體材料無關( V )
文獻有知識內容、信息符號和載體材料三個不可分割的基本要素構成(X )
一次文獻是產生二、三次文獻的基礎,是檢索利用的主要對象(V )
從零次文獻、一次文獻到二次文獻,再到三次文獻,是一個知識內容由分散到集中,由無組織到系統化的過程( V )
按照加工深度不同區分,文獻可以分成零次、一次、二次核三次文獻(V )
文獻檢索的本質是用戶的文獻需求與存儲在文獻集合中的文獻內容進行匹配的過程( V )
文獻檢索是一種相關性檢索,檢索結果與檢索人員的檢索技巧等有關( V)
近一兩個月內新發表的文獻可以通過瀏覽圖書館閱覽室現期期刊的方法獲取。( V )
直接檢索法是通過各種檢索工具或資料庫查找文獻的方法(X )
作者途徑是按照文獻信息所包含的作者信息,利用作者姓名進行檢索的途徑( V )
聯合目錄反映多個圖書館的書刊訂閱收藏情況。( V)
目錄是將圖書、報刊等文獻中論文的篇目按照一定的排檢方法編制而成,供人們查找篇目出處的工具( X )
檢索語言是用來描述文獻的內容特徵、外表特徵和表達情報提問的一種人工語言。( V )
分類法是根據科學學科之間的邏輯歸屬關系,採用層次型或樹形結構,列舉人類所有的知識類別,並對每一知識分別標以相對固定的碼,從而形成的類表(V )
關鍵詞直接採用作者在文獻中使用的語言,是一種自然語言性質的主題語言( V )
目前資料庫已具備智能思考能力,故在檢索時無需人工擴展概念。( X)
將「彩色電視機」拆分成「彩色」AND「電視機」進行檢索,所得結果的數量比拆分前多.( V )
查全率是指檢索出的符合課題需要的文獻與檢索出的相關文獻量之比。(X)
查准率是指檢索出的符合課題需要的文獻與系統中含有的相關文獻量之比( X )
《中國學術期刊全文資料庫》是以收錄國內學術類核心期刊和專業特色期刊為主的全文資料庫.(V )
《中國學術期刊全文資料庫》的分類專輯起著選擇檢索范圍的作用。(V)
《中國學術期刊全文資料庫》分類專輯每次能選擇多個專輯。(V )
《中國學術期刊全文資料庫》的導航瀏覽只有中圖法瀏覽。(X)
《中國學術期刊全文資料庫》的檢索策略不可使用優先符「()」。( X)
使用《中國學術期刊全文資料庫》的「詞頻」控制,可以提高檢索結果的查准率。(V )
《中國學術期刊全文資料庫》「在結果中檢索」起到的事邏輯「或」的作用。(X )
《中國學術期刊全文資料庫》統一檢索文本框中可以輸入含有布爾邏輯算符的表達式( V)
《中國學術期刊全文資料庫》的「在結果中檢索」最多可以進行兩次。(X )
在《中國學術期刊全文資料庫》中將「列印機」擴展成「彩色列印機」後,可以增加檢索結果。( X )
在《中國學術期刊全文資料庫》中,需要預先下載安裝相應瀏覽器才可瀏覽CAJ格式的原文。(V )
《中國學術期刊全文資料庫》的原文可以轉不轉換成文本。(X ) 三、簡答題:(10分*3題) 1、信息、知識、情報、文獻的概念? 答:信息是事物現象及其屬性標識的集合,信息是知識的「子集或基石」,知識是信息的應用和生產性使用,
文獻是記錄知識的一切載體,即用文字、圖像、符號等手段記錄人類知識的各種載體,情報是一種普遍純在的
社會現象,人們在物質生產和知識生產的實踐活動中,源源不斷地創造、交流與利用各種各樣的情報。
⑵ 信息檢索重點
問答題
1.簡述信息、知識、文獻的概念及其三者之間的關系。
1.答:信息:是事物存在方式、運動狀態及其特徵的反映,是事物發出的信號、消息。
知識:是人類對自然界、人類社會中各種現象、規律的信息反映進行思維分析,加工提煉,經過系統化、理論化的結果。
文獻:記錄有知識的一切載體
三者從概念范疇上看,信息大於知識大於文獻,知識是信息的一部分,是理論化系統化的信息,文獻是知識中記載下來的那部分。
2.文獻按載體形式不同分為哪幾種類型,並舉例說明。
2.答:文獻按載體形式的不同分為:
手寫型文獻,如甲骨文、金文
印刷型文獻,如圖書、期刊
縮微型文獻,如縮微膠卷、縮微膠片
視聽型文獻,如錄像帶、錄音帶、科技電影
電子型文獻,如資料庫文獻和網路文獻
3.文獻的級別及其相互關系。
3.答:文獻按照加工程度不同分為零次、一次、二次和三次文獻四種。
其中零次文獻是指未公開出版的實驗記錄、原始錄音(像)、書信、手稿、口頭交流的信息或實物等;零次文獻在作者的加工處理後公開出版進入社會流通領域就變成一次文獻;根據一次文獻的各種特徵按照一定的規則和方法對其進行整理、加工、濃縮,後形成的文獻就是二次文獻;利用二次文獻線索對大量的一次文獻內容進行綜合、分析、加工、提煉後形成的文獻就是三次文獻。
4.在計算機檢索中,如何縮小檢索范圍?
4.答:在計算機檢索中,縮小檢索范圍的方法包括:
(1)增加用and連接的檢索詞,或用「二次檢索」
(2)用特定的副主題詞進行限定
(3)用欄位限定檢索,如標題詞檢索、主題詞檢索、加權檢索等
(4)進行文獻類型、語種、重要期刊、臨床核心期刊、年份等的限定檢索
(5)進入更專指的分類范圍內輸詞檢索
5.獲取文獻全文的方法有哪些?
5.答:獲取全文的方法包括:
(1)檢索網上全文資料庫
(2)利用網上出版社、雜志
(3)利用圖書館館藏目錄(館藏聯合目錄)
(4)利用「網上全文傳遞服務」
(5)向著者索取
6.常用的檢索途徑有哪些?
6.答:常用的檢索途徑包括:
自由詞檢索、主題詞檢索、分類檢索、著者檢索、機構檢索、引文檢索、限定檢索等
7.簡述信息檢索的原理
7.答:信息檢索的原理是:將描述特定用戶所需信息的提問特徵,與信息存儲的檢索標識進行異同的比較,從中找出與提問特徵一致或基本一致的信息。本質是用戶的信息需求與存儲在信息集合中的信息進行比較和選擇, 即匹配的過程。
8.計算機檢索通常包括哪些步驟?
8.答:信息檢索的步驟包括:
(1)分析檢索課題,明確目的和要求
(2)選擇合適的檢索工具
(3)選擇檢索途徑,確定檢索標識。
(4)查找文獻線索。
(5)瀏覽檢索結果,獲取原始文獻。
9. 簡述IM主題索引的編排規則。
9.答:主題索引的排列規則如下
(1)整個索引按主題詞字順排
(2)同一主題詞下按副主題詞字順排
(3)相關內容的文獻題錄分別納入相應的主題詞或者主題詞/副主題詞之下;一般總論性文獻直接入主題詞下,專指性文獻入相應的副主題詞下;同一文獻題錄可入多個主題詞之下
(4)同一主題詞或副主題詞下的文獻題錄,先排列英文文獻,後排列非英文文獻,非英文文獻的英譯標題用"[ ]"括起,以示區別
(5)英文文獻按刊名縮寫字順排
(6)非英文文獻先按文種縮寫字順排,同一文種下按刊名縮寫字順排。
10.《醫學主題詞表》(MeSH)字順表的參照系統有哪幾種?舉例說明其意義。
10.答:第一組:用代參照,用於處理詞與詞間的等同關系。在MeSH詞表中,對於多個同義詞只採用其中一個比較科學而通用的詞作規范化主題詞,其它的詞作為非主題詞(即款目詞)。用「款目詞see主題詞」和「主題詞X款目詞」表示。如:Cancer see Neoplasms Neoplasms X Cancer
第二組:屬分參照,用於處理詞與詞之間的等級關系,即整體與部分,上位概念與下位概念之間的關系。如某些范疇較小的主題概念主題詞,包含在某些范疇較大的主題詞之下,內容範圍較廣的詞是主題詞,其下的內容範圍較窄的詞不作主題詞,只作為次要主題詞。用「次要主題詞see under 主題詞」和「主題詞XU 次要主題詞」表示。如:Health Priorities see under Health Planning Health Planning XU Health Priorities 從1991年開始取消此種參照關系,所有次要主題詞升格為主題詞。
第三組:相關參照,用於處理詞間的相關關系,達到擴大檢索,提高查全率的目的。用「主題詞see related 主題詞」和「主題詞XR主題詞」表示。如:Population Control see related Family Planning Family Planning XR Population Control
為提高查全率和方便檢索,MeSH詞表於1991年和1992年又先後增設了「還應考慮參照(consider also)」和「主題詞/副主題片語配參照」。
11.按照存儲內容的不同,資料庫通常分為哪些類型?
11.答:書目資料庫、事實資料庫、數值資料庫、全文資料庫、圖像資料庫
12.什麼叫主題詞的擴展檢索,它的優越性何在?
12.答:選擇主題詞的擴展功能可以同時檢索主題詞和它的所有下位詞,這樣就可檢出用所選主題詞和更專指主題詞標引的所有文獻,可以更好的提高檢索的查全率。不擴展的情況下只會檢出用所選主題詞標引的文獻,不會檢出它的下位詞,即那些更專指主題詞標引的文獻。
13.什麼是查全率和查准率,二者之間有何關系?
13.答:查全率是指系統在進行某一檢索時,檢出的相關文獻量與系統文獻庫中相關文獻總量的比率,它反映該系統文獻庫中實用的相關文獻量在多大程度上被檢索出來。
查全率=【檢出相關文獻量/文獻庫內相關文獻總量】×100%
查准率是指系統在進行某一檢索時,檢出的相關文獻量與檢出文獻總量的比率,它反映每次從該系統文獻庫中實際檢出的全部文獻中有多少是相關的。
查准率=【檢出相關文獻量/檢出文獻總量】×100%
查全率與查准率是呈互逆關系的。要想做到查全,勢必會要對檢索范圍和限制逐步放寬,則結果是會把很多不相關的文獻也帶進來,影響了查准率。企圖是查全率和查准率都同時提高,不是很容易的。強調一方面,忽視另一方面,也是不妥當的。應當根據具體課題的要求,合理調節查全率和查准率,保證檢索效果。
14.影響查全率和查准率的因素有哪些?
14.答:(1)影響查全率的因素
影響查全率的因素從文獻存儲上來看,主要有:文獻庫收錄文獻不全;索引詞彙缺乏控制和專指性;詞表結構不完整;詞間關系模糊或不正確;標引不詳;標引前後不一致;標引人員遺漏了原文的重要概念和用詞不當等。此外,從情報檢索來看,主要有:檢索策略過於簡單;選詞和進行邏輯組配不當;檢索途徑和方法太少;檢索人員業務不熟悉和缺乏耐心;檢索系統不具備截詞功能和反饋功能,檢索時不能全面地描述檢索要求等。
(2)影響查准率的因素
影響查准率的因素主要有:索引詞不能准確描述文獻主題和檢索要求;組配規則不嚴密;選詞及詞間關系不正確;標引過於詳盡;組配錯誤;檢索時所使用檢索詞專指度不夠,檢索麵寬於檢索要求;檢索系統不具備邏輯「非」功能和反饋功能;檢索式中允許容納的詞數量有限;截詞部位不當,檢索式中使用邏輯「或」不當等。
15.獨立型搜索引擎的工作原理是什麼?
15.答:獨立式搜索引擎的工作原理是:
定期運行搜索軟體(或人工),搜集網路信息。
利用索引軟體進行自動標引,建立資料庫。
以Web頁面形式向用戶提供有關的信息資源導航、目錄索引及檢索界面,由用戶輸入檢索式。
通過檢索軟體進行檢索,匹配,按相關度排序輸出。
16.如何提高檢索的查全率?
16.答:提高查全率的方法:
(1)降低檢索詞的專指度,選出一些上位詞和相關詞補充到檢索式中。
(2)調節檢索式的網羅度,減少邏輯「與」的組配面。
(3)進行族性檢索,可採用分類檢索,或用一組同義詞、近義詞和相關詞,用「或」連接在檢索式中。
(4)採用截詞技術,取消某些限制過嚴的限制符。
17.如何提高檢索的查准率?
17.答:提高查准率的方法:
(1)提高檢索詞的專指度,換用專指度較強的規范詞或自由詞。
(2)增加「與」連接,進一步限定主題概念。
(3)限定檢索詞所在的可檢欄位,用位置算符控制檢索詞的詞間順序與位置。
(4)限制輸出文獻的外部特徵,如限制年限、語種、文獻類型等。
(5)用邏輯「非」限制與提問不相關的文獻的輸出。
(6)用主題詞檢索,不用或少用自由詞檢索。
18.依據我國專利法專利有哪幾種類型 各種類型的專利有效期為多長?
18.答:依據專利法保護對象分三種類型:發明專利、實用新型專利、外觀設計專利
發明專利,是專利法主要的保護對象。發明專利權有效期各國不同,我國為自申請之日起20年。
實用新型專利,在我國實用新型專利權有效期為自申請之日起10年。
外觀設計專利,在我國外觀設計專利權有效期為自申請之日起10年。
19.信息檢索系統的基本要素是什麼?
19.答:信息檢索系統的構成包括:
(1)檢索文檔,即文獻檢索標識的有機集合。
(2)技術設備,即能存儲信息及其標識,並實現存儲和檢索操作的各種技術設備。
(3)作用於系統的人如:文獻加工者、用戶、系統維護人員、管理人員。
(4)檢索工具如:檢索語言、文獻標引規則、輸入輸出標准等。
20.何謂資料庫的順排文擋和倒排文擋?
20.答:順序文檔(Sequential file)是以文獻記錄作為信息存儲單元,按文獻記錄入藏的存取號從小到大順序排列而形成的目錄式文檔,由於它存儲有關於每篇文獻的最完整信息,所以通常又把它稱為主文檔(Master File),相當於印刷型檢索工具的正文部分。倒排文檔(Inverted file)就是把記錄中一切可檢欄位或屬性值抽出,按某種順序重新加以組織後所得到的一種文檔。倒排檔從主文檔中派生出來,所以,又叫做輔助文檔。
21.獲取網路信息資源的主要工具有哪些?
21.答:獲取網路信息資源的主要工具包括:
(1)電子郵件
(2)FTP
(3)Archie
(4)Telnet
(5)Gopher
(6)Usenet
(7)www瀏覽器
(8)搜索引擎
22. 核心期刊的主要特點是什麼?
22.答:少數刊載某一學科大量高質量專業論文的期刊稱為核心期刊,其主要特點為:
(1)刊載專業文獻密度高,信息含量高;
(2)水平較高,代表本學科的最新發展水平;
(3)出版相對穩定,所載文獻壽命較長;
(4)利用率和被引率較高。
23.試述網際網路搜索引擎的概念、類型。
23.答:搜索引擎是Internet上具有查詢功能的網頁的統稱,即允許用戶遞交查詢,檢索出與查詢相關的網頁結果列表,並且排序輸出。
根據檢索內容分為:綜合性搜索引擎和專業性搜索引擎;
根據檢索功能分類:目錄式搜索引擎、全文式搜索引擎、智能式搜索引擎;
根據檢索范圍分類:獨立搜索引擎和元搜索引擎。
24.簡述會議論文的概念和特點,國內和國外會議論文的檢索系統有哪些?
24.答:會議文獻是指各種科學技術會議上所發表的論文、報告稿、講演稿等與會議有關的文獻。
會議文獻的主要特點是:傳播信息及時、論題集中、內容新穎、專業性強、質量較高,數量較大,出版類型多種多樣,往往代表某一學科或專業領域內最新學術研究成果,基本上反映了該學科或專業的學術水平、研究動態和發展趨勢。會議文獻是科技查新中重要的信息源之一。
國外會議論文檢索工具包括:ISI的Proceedings(ISTP+ISSHP);Papers First(OCLC first search的一個子庫);IEEE/IEE Electronic Library;AIPCofference Proceedings
國內可以進行會議論文檢索的系統包括:中國學術會議論文全文資料庫(萬方數據);中國重要會議論文全文資料庫(CNKI)
25. 周紅同學在檢索一個課題時,第一次檢索的結果有 172 條文獻,你建議一下她採用何種方式來縮小檢索范圍?
25.答:縮小檢索范圍的方法包括:
(1)提高檢索詞的專指度,換用專指度較強的規范詞或自由詞。
(2)增加「與」連接,進一步限定主題概念。
(3)限定檢索詞所在的可檢欄位。
(4)用位置算符控制檢索詞的詞間順序與位置。
(5)限制輸出文獻的外部特徵,如限制年限、語種、文獻類型等。
(6)用邏輯「非」限制與提問不相關的文獻的輸出。
(7)用主題詞檢索,不用或少用自由詞檢索。
26.Medline和Pubmed有什麼區別?
26.答:Pubmed和MEDLINE的區別主要體現在:
(1)文獻的收錄范圍:Pubmed除了收錄MEDLINE資料庫之外,還收錄了PREMEDLINE資料庫,以及出版商直接提供給Pubmed的數據。
(2)資料庫的更新時間:MEDLINE聯機資料庫為周更新,MEDLINE光碟的報道時差為1-3個月,而Pubmed為每天更新
(3)檢索機理:MEDLINE的檢索途徑只有兩個主題和作者,掌握Mesh表是檢索的首要條件,而Pubmed具有詞彙自動轉換匹配功能和主題詞自動擴展功能。
(4)連接功能:Pubmed具有與原文鏈接、相關文獻鏈接、相關圖書鏈接、相關分子生物學資料庫鏈接的功能
(5)免費全文:Pubmed提供超過60中期刊的免費全文瀏覽和檢索功能。
(6)費用:MEDLINE光碟需每年租賃資料庫,Pubmed免費。
27.專利文獻的概念及特點是什麼?
27.答:專利文獻是實行專利制度的國家及國際組織在審批專利過程中產生的官方文件及其出版物的總稱。專利文獻具有以下特點:
(1)專利文獻集技術、法律和經濟信息於一體,是一種數量巨大、內容廣博的戰略性信息資源;
(2)利文獻傳播最新技術信息;
(3)專利文獻的格式統一規范,高度標准化,並且具有統一的分類體系,便於檢索、閱讀;
(4)專利文獻對發明創造的揭示完整詳盡,技術內容相對可靠。
28.如果要查找有關「乙型肝炎流行病學」方面的中外文文獻,可以選擇哪些資料庫?請選擇其中一種資料庫,簡要檢索策略。
28.答:查找「乙型肝炎的流行病學」的文獻可選用的中文檢索系統包括:CNKI、維普、萬方、CBM等,
可選的外文檢索系統包括:MEDLINE、Pubmed、EDSCO、springerlink、Open Access等其中,在CNKI中的檢索策略為:
檢索項:篇名;檢索詞:乙型肝炎;邏輯:或者
檢索項:篇名;檢索詞:乙肝; 邏輯:並且
檢索項:主題;檢索詞:流行病學
在CBM中的檢索策略為:肝炎,乙型/[擴展全部樹]流行病學
29.通過哪些檢索系統可以查明濟寧醫學院圖書館是否有「computer communications」這本期刊?
29.答:可以選用的檢索系統包括:圖書館聯機檢索系統、超星數字圖書、書生數字圖書館
30. 請列出5個Google高級檢索語法,並舉例說明其用法。
30.答:可在下列語法中任選5個舉例
(1)「link」運算符: 查找與某一特定網頁建立鏈接的所有網頁,亦可在高級檢索模式下實現
(2)「related」運算符:自動查找與某一網頁處於同一級別的相似網頁,亦可通過高級檢索模式及檢索結果界面的「類似網頁」實現
(3)「info」運算符:可獲取Google庫存的有關某一網頁的全部信息
(4)「site」運算符: 將檢索結果限制在某一網域中,也可以通過高級檢索界面的「網域」選項來
(5)「Allintitle」運算符:要求提問詞全部在網頁標題中出現
(6)「allinurl」運算符:要求提問詞全部在URL中出現
(7)「inurl」運算符:要求提問詞部分在URL中出
(8)「filetype:」運算符是Google開發的非常強大實用的一個搜索語法。後面接文檔類型,可限制獲取某一文檔類型的網頁,後可接文獻類型舉例。
31. 在CBMWin4.0版中的查找某作者發表的文獻有幾種方式?分別是什麼?
31. 答:有四種
「基本檢索」中的著者檢索有三種方式:
一是在「檢索入口」下拉彩旦中選擇「作者」欄位,然後在檢索提問框內輸入著者姓名;
二是直接在檢索提問框內輸入著者姓名,後加「in au」;
三是直接在檢索提問框內輸入「au=」,後跟著者姓名,
「作者檢索」方式:直接在檢索提問框內輸入著者姓名。
32. 循證醫學證據的主要類型有哪些?
32.依據按質量和可靠程度大體可分為以下五級(可靠性依此降低):
一級:按照特定病種的特定療法收集所有質量可靠的隨機對照試驗後所作的系統評價或Meta分析;
二級:單個的樣本量足夠的隨機對照試驗結果;
三級:設有對照組但未用隨機方法分組的研究;
四級:無對照的系列病例觀察;
五級:專家意見或基於生理、病理生理和基礎研究的證據。
33. 列舉6種可以檢索引文的資料庫。
33.答:可以檢索引文的資料庫有:(任寫以下6種均可)
(1) SCI
(2) SSCI
(3) H&ACI
(4) 《中國科技論文與引文資料庫》(CSTPC)
(5) 《中國科學引文資料庫》
(6) 《中文社會科學引文索引》
(7) 《中文科技期刊引文資料庫》
(8) 中國知識基礎設施工程中的中國引文資料庫
(9) 《中國生物醫學文獻資料庫》
34.信息檢索的類型及特點。
34.答(1)個人信息源:聚集大量從事某工作領域的個人信息及有關各種事物的發展動態信息。
(2)組織機構信息源:主要指組織機構中的內部信息源。
(3)實物型信息源:以實物如文物、產品樣本、模型、雕塑等形式表現的信息資源。
(4)文獻型信息源:以文字、圖片、符號等各種方式記錄在各種載體上的知識和信息資源。
1)圖書:圖書也稱為書籍,是指內容比較成熟、資料比較系統、有完整定型裝幀形式的出版物。
2)期刊:期刊也稱雜志,是指那些定期或不定期出版,匯集了多位作者論著的連續出版物。
3)學位論文:是本科生、研究生為取得學位資格而撰寫的專業性研究論文。
4)科技報告:是作為科研成果的正式報告。
5)專利文獻:由政府專門機構出版、有創造發明的設計、製作工藝的詳細說明,表明在一定時限內發明所有者享有製造、使用、銷售佔有權的法律性文獻。
6)標准文獻:由權威機構批准、頒發的、可供人們執行的技術規格的規范性文獻。
7)產品樣本:廠商為介紹推銷其產品而印發的文獻。
8)會議文獻:是指在國際和各國國內專業學術會議上所發表的論文和報告。
9)政府出版物:由政府機構製作指定出版機構出版的文獻。
(5)電子型信息源:主要是指通過使用電子技術實現信息存儲和傳播的信息。
35.資料庫的組成。
35.答:資料庫由文檔、記錄和欄位組成。
(1)文檔:是按一定結構組織的相關記錄和結合。
(2)記錄:是構成文檔的基本數據單元。
(3)欄位:是比記錄更小的單元,是組成記錄的基本單元。
36.分類語言。
36.答:分類語言是按文獻的學科屬性,給予相應的分類號,用分類號來表達文獻的主題概念,根據分類表中的順序編排成分類索引,提供分類途徑共檢索文獻使用。
分類語言是運用邏輯分類原理,按文獻內容的學科、專業集中文獻,從知識分類的角度揭示各類文獻在內容上的區別和聯系。
分類語言較好地體現了學科和專業的系統性。
分類語言可分為體系分類語言和組配語言兩種,目前國內普遍採用前者。
36.主題語言。
37.答:主題語言是以高度概括的語詞解釋文獻的主題,並以此為標識組織檢索系統的語言。
主題語言分為標題詞、元詞、關鍵詞和敘詞。
(1)標題詞:是從自然語言中選取並經過規范化處理,表示事物概念的詞、片語或短語。
(2)元詞:是指能夠用以描述文獻所論及主體的最小、最基本詞彙。
(3)敘詞:使用能表達文獻主題並經過嚴格規范化的詞語。
(4)關鍵詞:是直接從文獻的標題,文獻或全文中抽選具有實質意義、能表達文獻主題概念,未經規范化處理的自然詞語詞彙。
38.信息檢索途徑。
38.答:1.分類文獻:是按文獻內容所屬的學科類別來檢索文獻的途徑,通過分類號或類別進行檢索。
2.主題途徑:是通過反應文獻內容主題的詞語來檢索文獻的途徑。
3.關鍵詞途徑:是用非規范化詞語自由標引,直接取自原文中能夠表達文獻內容主題、起關鍵作用的詞語。
4.著者途徑:是指按文獻的作者、編者、譯者的姓名或機構團體名稱字順檢索文獻的途徑。
5.題名途徑:是指按書名、刊名或文章篇名的字順進行檢索的一種途徑。
6.號碼途徑:是利用文獻代碼、序號編排成的「號碼索引」的一種途徑。
39.信息檢索素養的內涵。
39.答:1.信息意識:指信息在人腦中的反應即人對各種信息的自覺心裡反應,反應人在信息活動中對信息的認識、態度、價值趨向和一定需求。
2.信息知識:是指與信息有關的理論、知識和方法。
3.信息能力:是指有效利用信息技術和信息資源獲取信息、加工處理信息以及創造和交流新信息的能力。
4.信息道德:是指在信息獲取、使用、創造和傳播過程中應該遵守一定的倫理規范。
40.信息檢索策略。
40.答:1.分析檢索課題,明確目的要求。
信息檢索總是按照一定的課題需要進行的,每一項檢索課題都有明確的目的和具體的要求,因此在進行檢索之前,首先要對檢索課題進行認真而細致的分析研究,明確檢索的目的和要求。因為目的不同,要求也不同,選擇連鎖工具、連鎖方法等就有所不同。
2.檢索系統和資料庫的選擇。
信息檢索和資料庫的選擇主要主要考慮其所收錄的學科範圍、存貯年限、更新周期、標引質量、獨特性、所需費用、系統性能和輔助服務等方面考慮,還要注意綜合性和專業性資料庫配合使用。
3.選擇檢索途徑、確定檢索標識。
所謂檢索途徑也就是資料庫中的檢索項(欄位),是指從哪個角度或哪個方向入手進行檢索。
檢索標識是指確切表達文獻信息內容及外表特徵使用的符號或詞語,如分類號、主題詞、關鍵詞、作者姓名、期刊刊名等,檢索時要求准確找出檢索標識,以避免誤檢。
4.編輯檢索表達、調整檢索策略。
檢索表達式是用來表達檢索提問的邏輯檢索表達式,有選擇好的檢索標識根據檢索要求運用不同的運算符號進行組配,以達到較為理想的檢索效果。
但是實際的檢索過程中,用既定的檢索表達式檢出的結果往往不能一次就達到滿意,這就需要根據檢索情況分析原因及時調整檢索策略。
5.獲得原始文章。
(1)檢索網上全文資料庫。
(2)利用網上出版社、雜志。
(3)利用圖書館館藏目錄(館藏聯合目錄)。
(4)利用「網上全文傳遞服務」。
(5)直接向著者索取。
通過上述步驟的查找獲得的如不是文獻全文,可通過以下方式獲得。
⑶ 信息檢索用資料庫一般包括哪兩種文檔
資料庫主要由文檔、記錄和欄位三個層次組成
. 網路資料庫的特點
網路資料庫是重要的電子資源,與印刷型文獻及光碟、磁碟等電子出版物相比,網路版資料庫有著獨特的優勢,正日益受到圖書館及其用戶的青睞。
1.1 數據量大、增長迅速、更新速度快
在國外,資料庫生產已形成規模,走向產業化和商業化,這就使得網路資料庫的整體發展呈現出以下兩個特點。一是資料庫規模大、數據量多,增長迅速。如號稱世界上最大學術電子出版物供應商的Elsevier Science,通過ScienceDirtect可在線提供多個資料庫產品服務,包括一個綜合性的學術期刊全文資料庫、多個專題資料庫、12種參考工具書及15個書目資料庫,可檢索、瀏覽的信息資源包括1500多種全文學術期刊、 5900萬條文摘記錄、2百萬篇學術期刊論文。ISI的Web of Knowledge 信息平台上目前可提供服務的資料庫有:ISI三大引文索引資料庫、期刊目次庫、多個專業文獻信息及事實資料庫、會議錄及專利信息資料庫;現有數據容量為:核心期刊8600多種、學術會議錄論文記錄2百多萬條,專利信息2千多萬條、化學反應60多萬個、化合物1百多萬個;其數據的年增長量為:12000多個學術會議的22萬多條會議錄論文記錄,收入的期刊數量則以2.3%的速度遞增。
二是數據更新速度快、周期短,如SCI、ISTP、BA、EI等著名文摘索引的印刷版、光碟版一般為每季度或每月更新,而相應的網路版資料庫通常是每周更新;電子期刊資料庫的更新通常早於其相應的印刷版,為每周或每日更新;而電子報紙的更新速度則可以以小時、分秒計算。
⑷ 資料庫的類型
ASP資料庫類型DBFDBCMDBExcelSQLServer
資料庫是在計算機存儲設備上按一定方式,合理組織並存儲的相互有關聯的數據的集合,是計算機技術和信息檢索技術相結合的產物,是電子信息資源的主體,是信息檢索系統的核心部分之一。按所提供的信息內容,資料庫主要可分為參考資料庫和源資料庫。
1.參考資料庫
主要存儲一系列描述性信息內容,指引用戶到另一信息源以獲得完整的原始信息的一類資料庫,主要包括書目資料庫和指南資料庫。
(1)書目資料庫 存儲描述如目錄、題錄、文摘等書目線索的資料庫,又稱二次文獻信息資料庫。如各種圖書館目錄資料庫、題錄資料庫和文摘資料庫等屬於此類,它的作用是為用戶指出了獲取原始信息的線索。
圖書館目錄資料庫,又稱機讀目錄,其數據內容詳細,除描述標題、作者、出版項等書目信息外,還提供用戶索取原始信息的館藏信息。題錄、文摘資料庫描述的數據內容與印刷型的題錄、文摘相似,它提供了論文信息或專利信息等確定的信息來源,供用戶檢索。
(2)指南資料庫 存儲描述關於機構、人物、產品、活動等對象的資料庫。與其它資料庫相比,指南資料庫為用戶提供的不僅僅是有關信息,還包括各種類型的實體,多採用名稱進行檢索。如存儲生產與經營活動信息的機構名錄資料庫、存儲人物信息的人物傳記資料庫、存儲產品或商品信息的產品指南資料庫、存儲基金信息的基金資料庫等屬於此類,它的作用指引用戶從其它有關信息源獲取更詳細的信息。
2.源資料庫
主要存儲全文、數值、結構式等信息,能直接提供原始信息或具體數據,用戶不必再轉查其它信息源的資料庫。它主要包括全文資料庫和數值資料庫。
(1)全文資料庫 存儲原始信息全文或主要部分的一種源資料庫。如期刊全文資料庫、專利全文資料庫、網路全書全文資料庫,用戶使用某一詞彙或短語,便可直接檢索出含有該詞彙或短語的原始信息的全文。
(2)數值資料庫 存儲以數值表示信息為主的一種源資料庫,和它類似的有文本-數值資料庫。與書目資料庫比較,數值資料庫是對信息進行深加工的產物,可以直接提供所需的數據信息。如各種統計資料庫、科學技術資料庫等。數值資料庫除了一般的檢索功能外,還具有準確數據運算功能、數據分析功能、圖形處理功能及對檢索輸出的數據進行排序和重新組織等方面的功能。
4.2.2 資料庫結構
1.書目資料庫的結構
書目資料庫是以文檔形式組織一系列數據,這些數據被稱為記錄,一個記錄又包含若干欄位。
(1)記錄與欄位 記錄是作為一個單位來處理有關數據的集合,是組成文檔的基本數據單位。記錄中所包含的若干欄位,則是組成記錄的基本數據單位。在書目資料庫中,一個記錄相當於一條題錄或文摘,因此,一個記錄通常由標題欄位、作者欄位、來源欄位、文摘欄位、主題詞欄位、分類號欄位、語種欄位等組成。在有些欄位中,又包含多個子欄位,子欄位是欄位的下級數據單位。如,主題詞欄位含有多個主題詞。按照欄位所代表記錄的性質不同,欄位通常分為基本欄位和輔助欄位兩類。常見的欄位名稱及代碼見表4-1。
表4-1 欄位名稱及代碼
基本欄位
輔助欄位
欄位名稱
欄位代碼
欄位名稱
欄位代碼
標 題
TI
記錄號
DN
文 摘
AB
作 者
AU
敘 詞
DE
作者單位
CS
標識詞
ID
期刊名稱
JN
出版年
PY
出版國
CO
語 種
LA
(2)文檔 按一定結構組織的相關記錄的集合。文檔是書目資料庫數據組織的基本形式,文檔的組織方式與檢索系統的硬體和軟體功能密切相關。在書目資料庫中,文檔結構主要分為順排文檔和倒排文檔。
1)順排文檔 記錄按順序存放,記錄之間的邏輯順序與物理順序是一致的,相當於印刷型工具中文摘的排列順序,是一種線形文檔。順排文檔是構成資料庫的主體部分,但其主題詞等特徵的標識呈無序狀態,直接檢索時,必須以完整的記錄作為檢索單元,從頭至尾查詢,檢索時間長,實用性較差。
2)倒排文檔 將順排文檔中各個記錄中含有主題性質的欄位(如主題詞欄位、標題欄位、敘詞欄位等)和非主題性質欄位(如作者欄位、機構欄位、來源欄位等)分別提取出來,按某種順序重新組織得到的一種文檔。具有主題性質的倒排檔,稱基本索引檔,非主題性質的倒排檔,稱輔助索引檔。
綜上所述,順排檔和倒排檔的主要區別是:順排檔以完整的記錄為處理和檢索單元,是主文檔,倒排檔以記錄中的欄位為處理和檢索單元,是索引文檔。計算機進行檢索時,先進入倒排檔查找有關信息的存取號,然後再進入順排檔按存取號查找記錄。
2.全文資料庫的結構
一般的全文資料庫結構與書目資料庫相似,全文資料庫的一個記錄就是一個全文文本,記錄分成若干欄位。其主文檔是以順排形式組織的文本文檔,倒排檔是對應於記錄可檢欄位的索引文檔。
3.數值資料庫的結構
數值資料庫的結構要綜合考慮資料庫的內容及檢索目的,即,在內容上,數值資料庫的主要內容是數值信息,但不排除含有必要的說明性的文本信息,在檢索上,便於單項檢索和綜合檢索,還能對數值進行准確數據運算、數據分析、圖形處理及對檢索輸出的數據進行排序和重新組織。數值資料庫的數據結構可以是單元式,也可以是表冊形式。前者是對原始數據的模擬,後者則是對統計表格的機讀模擬。數值資料庫通常有多種文檔,如順排擋、倒排擋、索引文檔等。順排擋是由數值數據組成,為主文檔,另有相應的索引文檔,為便於存取,索引文檔採用基本直接存取結構的組織形式。倒排擋也有相應的索引文檔,索引文檔採取分級組織形式。數值資料庫的文檔結構,使所有文檔都可以用於檢索,所有數據都可用來運算,構成了數值資料庫的特點。
4.指南資料庫的結構
指南資料庫的結構兼有書目資料庫、全文資料庫和數值資料庫的特點,有順排檔、倒排檔、索引文檔和數據字典。一般而言,對涉及主題領域較多,內容綜合性較強的大型指南資料庫,順排擋(主文檔)可採用多子文檔的結構,對單一主題領域和內容較專的,則採用單一主文檔和不定長、多欄位的記錄格式為宜。
⑸ 文獻檢索
一
根據國家相關標准,文獻的定義是指「紀錄有知識的一切載體」
以作者本人取得的成果為依據而創作的論文報告等,並經公開發表或出版的各種文獻,稱為一次文獻
文摘、題錄、目錄等屬於二次文獻
手稿、私人筆記等屬於零次文獻,辭典、手冊等屬於三次文獻
二次文獻的主要功能是檢索、通報、控制一次文獻,幫助人們在較短時間內獲取較多的文獻信息
一次文獻、二次文獻、三次文獻是按照內容的公開次數進行區分的
從文獻的載體類型角度區分,可將文獻分為印刷型、縮微型等
具有固定名稱、統一出版形式和一定出版規律的定期或不定期的連續出版物,稱為期刊
期刊類型的專業文獻出版周期最短、發行量最大、報道最迅速及時。
在公開出版物中,當前的報紙文獻反映的信息內容可能最新
檔案文獻不屬於公開出版物
根據布拉德福文獻分散定律,閱讀核心期刊文獻是一種有效的情報獲取方法
期刊影響因子具有學科性、學術性、動態性 特點
二次文獻主要包括目錄、題錄等
專利、報告、標准 文獻屬於特種文獻
碩博士學位論文由 所在院校的圖書館、國家圖書館和中國科技信息研究所、所在院校的檔案室部門收藏
文獻知識的內容與其記錄方式、載體材料無關
一次文獻的內容新穎豐富,敘述具體詳盡,參考價值大,數量龐大,類型分散
一次文獻是產生二、三次文獻的基礎,是檢索利用的主要對象
從零次文獻、一次文獻到二次文獻,再到三次文獻,是一個知識內容由分散到集中,由無組織島系統化的過程
按照加工深度不同的區分,文獻可以分成零次、一次、二次和三次文獻
縮微型、聲像型和電子型文獻都屬於非印刷型出版物
圖書館館藏的書刊既包含紙質版書刊,也包含網路版書刊
紙質專利文獻主要由國家專利局以及各地的相應機構收藏
標准文獻由國家技術監督局以及各地的相應機構收藏
核心期刊是指經過專門機構研究認定的學術水平和影響力較高的期刊
核心期刊只針對某一個學科範圍。學科不同,核心期刊不同
期刊影響因子是指某種期刊在第三年得到的該刊前兩年文獻的引文數與該刊前兩年的總論文數之比
未經出版發行的或者沒有進入社會交流的最原始的文獻稱為零次文獻
文獻的載體形態有印刷型、縮微型、聲像型和電子型等,其中印刷型文獻是最基本的文獻形式,電子型文獻是文獻的發展方向
以個人接觸為主要形式的信息交流方式稱為直接交流方式,以社會文獻信息機構為媒介的交流方式稱為間接交流方式
國家文獻信息系統提供圖書、期刊等面廣量大的文獻
二
利用文獻後面所附的參考文獻進行檢索的方法稱為追溯法
中國圖書館圖書分類法的分類號採用了拼音字母+數字
目錄是報道文獻出版或收藏信息為主要功能的工具
按照順序表述文獻檢索常用的五個步驟是:明確要求和分析課題,選擇檢索體系,確定檢索途徑和檢索策略,實施檢索以及調整檢索策略,獲取原文
圖書分類法中,類名之間有上下位關系反映了學科概念之間的包含關系
分類途徑是按照文獻信息所屬的學科門類,利用分類號及其分類名進行檢索的途徑
禁用詞的含義是在檢索策略中不要使用該詞
EBSCO和網路的圖片搜索資料庫屬於多媒體資料庫
將資料庫的全部記錄按照記錄號的大小排列而成的文獻集合,稱為順排文檔
欄位時構成資料庫的最小單元
文獻資料庫中欄位的基本內容是對記錄具體屬性的描述
邏輯「與」算符是用來組配不同檢索概念,用於縮小檢索范圍
具有概念交叉限定關系的兩個檢索詞之間應該使用邏輯「與」
邏輯「或」算符是用來組配相近檢索概念,擴大檢索范圍
右截詞的含義是檢索所有含有與檢索詞前方一致的記錄
如果檢索結果過少,查全率很低,需要調整檢索范圍,此時調整檢索策略的方法有:用邏輯「或」或截詞增加同族概念
文獻檢索的直接法(游覽法)與間接法(常用法)的區別為,前者不使用檢索工具,檢索范圍受限制,後者使用檢索工具,檢索范圍較寬
按照檢索內容及結果區分,信息檢索包括文獻檢索,事實檢索,數據檢索
中國社會科學引文索引、全國報刊索引 檢索系統屬於題錄型檢索系統
選擇與課題相適應的檢索工具或資料庫,要根據課題要求的文獻類型,文獻語言
常用的檢索語言有 分類語言、敘詞語言、關鍵詞語言
分類語言的特點可以表述為:根據學科體系以及學科之間的邏輯關系組織類目體系、有著較為穩定的類名和相應的類號、有正式出版的分類表
根據定義,關鍵詞語言屬於自然語言、非規范語言,敘詞語言屬於人工語言、規范語言
關鍵詞語言的特點可以表示為較快地反映科技的最新發展、檢出的不切題文獻的比例較大、容易造成漏查
關鍵詞屬於自然語言,是作者在文獻中使用的語言;敘詞反映事物發展的速度相對慢,需使用敘詞表
敘詞語言的特點可以表示為以規范的詞或片語的形式固定下來,構成主題詞表,所有正式主題詞可以根據需要將它們組配起來,用以表達復雜的概念;學科體系嚴密,專門編有范疇索引和詞族索引,用於從學科的角度確定主題詞
在計算機檢索中,同一概念的同義詞擴展方法有學名或俗名、簡稱和全稱、術語和代碼等
評價檢索系統檢索效果的兩個最常用指標是查准率、查全率
通過期刊全文資料庫,可以得到文獻的題錄、文摘
基本欄位包括題目、文摘、主題詞等
輔助欄位包括作者、作者單位、語種等
構成機檢策略的算符有邏輯算符、位置算符等幾種類型
截詞符要緊接在詞干後面,截詞符和詞之間不能有空格,避免將檢索詞的詞干截得過短,一般詞干應在三個字母以上
已知確切地機構名稱、已知確切的作者姓名場合可以使用片語算符
如果檢索結果過多,誤檢率很高,調整檢索策略的方法有:用邏輯「與」或者邏輯「非」增加限制概念、用欄位算符或年份增加輔助限制、用「在結果中檢索」增加限制條件
擴大檢索結果的檢索策略方法:減少邏輯「與」算符;使用截詞字元;去除已有的欄位限制、位置算符限制
文獻檢索的本質是用戶的文獻需求與存儲在文獻集合中的文獻內容進行匹配的過程
文獻檢索是一種相關性檢索,檢索結果與檢索人員的檢索技巧等有關
游覽法的長處是可以獲得最新的文獻
主題途徑是按照文獻信息所包含的主題內容,利用事物的名稱術語進行檢索的途徑
作者途徑是按照文獻信息所包含的作者信息,利用作者姓名進行檢索的途徑
聯合目錄反映多個圖書館的書刊訂閱收藏情況
印刷型檢索工具能系統地查找早期的專業相關文獻
檢索語言時用拉力描述文獻的內容特徵、外表特徵和表達情報提問的一種人工語言
檢索語言主要有以代碼語言為特徵的分類語言和以事物名稱術語為特徵的主題語言兩大類
關鍵詞直接採用作者在文獻中使用的語言,是一種自然語言性質的主題語言
資料庫是指至少由一種文檔組成,能滿足特定目的或特定功能數據處理系統需要的數據集合
根據資料庫所含信息內容的不同,情報資料庫可分為文字型、數值型和多媒體型三類
資料庫的順排文檔和倒排文檔的主要區別是順排文檔在內容組織屬性上的無序性
位置算符是調整檢索策略,指定兩個檢索詞出現的順序和距離的算符
按獲取手段不同區分,信息檢索可分為:手工檢索和計算機檢索
信息檢索系統一般分為目錄、題錄、文摘等幾種類型
文獻檢索的首要步驟是分析課題
在《中圖法》以及任何類似的分類表中,被區分的類稱為 上位類。
資料庫主要由文檔、記錄和欄位三個層次組成
3
數據檢索以特定的數值性數據為檢索對象,它包括數據、圖表、公式
事實檢索包含檢索課題的背景知識、事件過程、人物機構等內容
資料性工具包括名人錄和機構名錄
區別於一般期刊論文或者教科書,參考工具書的突出特點是知識高度濃縮
集成電路參數資料庫屬於數值型資料庫
手冊是匯集機構名稱、人名、地名等基本情況和資料的工具書
欲了解中華全國律師協會成立以來的活動情況,可使用中國法律年鑒、協會主辦的中國律師網、全國協會一覽表
事實與數據檢索是指從有關參考性工具或者資料庫中查找事實和數據問題答案的過程
事實數據型資料庫是指紙質參考工具書內容相仿的光碟資料庫或者是網路資料庫
《中國大網路全書》是我國第一部具有權威性的大型綜合性網路全書
年鑒通常是某種網路全書的補充
手冊是匯集某一領域、某一方面經常需要查考的基本知識和數據資料,以供讀者隨時翻檢的一種工具書
年鑒是概述年內有關事物或學科的進展,匯集重要文獻和統計資料的連續性出版物
四 書目信息與ipac
1根據已知印刷型文獻的書目信息獲取原文的四個步驟:判斷文獻類型,提取檢索項,使用ipac,通過一定手續借閱
2查找ipac,確定書刊的館藏單位的一般順序為:本館 本市 全國
3查找早期的圖書,主要使用卡片或書本式目錄,查找近年的印刷版圖書的書目信息,主要使用ipac工具
4圖書館的ipac是用於查找:圖書、期刊等館藏信息
5圖書館的ipac資料庫是目錄型檢索系統
7ipac書目資料庫的題名關鍵字欄位和題名字順欄位的區別是前者的檢索結果檢索詞包含在題名中,後者的檢索結果以檢索詞起首。
期刊目錄資料庫 互聯網公網范圍內
Ipac系統/ ipac書目資料庫
上海大學期刊目錄資料庫
Ebsco資料庫 校園網范圍內
Elsevier sdos 資料庫
中國圖書館圖書分類號 和 中國科學院圖書館圖書分類法 在 分類號設置上的區別是前者採用拼音字母+數字 ,後者採用完全數字
1 描述文獻著者或編著者、題目和文獻來源的信息稱為文獻的書目信息
2 析出文獻信息是指從母體文獻(圖書或期刊)中取出的一篇有獨立責任者的文章的書目信息。
4使用上海大學圖書館主頁上的「館藏書目查詢」可以檢索到印刷型期刊的收藏情況。
5ipac系統中反映的期刊文獻信息通常為紙質版期刊的信息
6ipac系統可以解決圖書館有什麼書刊和書刊放在什麼地方的問題
9如果屬於早期的印刷版期刊,則需使用印刷型期刊館藏目錄或者聯合目錄
19已知文獻的書目信息 獲取原文的首要步驟是判斷文獻的出版類型。
圖書館ipac包含圖書、期刊等文獻類型的書目信息
在索刊號「TN/J11」中 TN是中國圖書館圖書分類號,J11是種次號
在索書號 53.815 0051中, 5.815是中國科學院圖書館圖書分類法, 0051是種次號
寫出已知文獻的書目信息獲取原文的三個步驟:判斷文獻類型、選擇檢索項查找ipac、更具所得信息借閱
5
《中國學術期刊全文資料庫》中,默認的檢索界面和默認的檢索欄位分別是:單邏輯界面和篇名/關鍵詞/文摘欄位或主題欄位
《中國學術期刊全文資料庫》提供的 文獻內容特徵檢索途徑有:篇名/關鍵詞/摘要
文獻外表特徵的途徑有:機構,中文刊名
查找上海大學師生2003年發表論文被《中國學術期刊全文資料庫》收錄情況,可選擇的俄檢索策略是:作者機構欄位:上海大學 並且 年份欄位:2003
《中國學術期刊全文資料庫》全文欄位主要適用於:課題包含的概念較多,通過篇名/關鍵詞/摘要欄位幾乎查不到什麼文獻
如果希望得到的文獻是國內較高水平的研究成果,通過《中國學術期刊全文資料庫》的基金項目欄位進行檢索可能是較好的選擇
模糊匹配比較適用於輔助欄位,精確檢索比較適用於基本欄位
《中國學術期刊全文資料庫》的詞頻控制應在文摘、全文登欄位檢索所得的文獻量過大場合下使用。
《中國學術期刊全文資料庫》給出的檢索結果為題錄、文摘和全文三種形式。
《中國知識基礎設施工程》提供的《中國學術期刊全文資料庫》鏡像站和公網《中國知識基礎設施工程》的《中國學術期刊全文資料庫》的區別在於更新周期、檢索結果
使用其輔助欄位信息,查找《中國學術期刊全文資料庫》提供的原文,檢索策略為:作者欄位:王國征 * 關鍵詞欄位:民事訴訟法;作者欄位:王國征 * 機構欄位:青島大學法學院
《中國學術期刊全文資料庫》可實現欄位檢索、優先運算、在結果中檢索功能
《中國學術期刊全文資料庫》是以收錄國內學術類核心期刊和專業特色期刊為主的全文資料庫。
《中國學術期刊全文資料庫》 的分類專輯起著選擇檢索范圍的作用。
分類專輯每次能選擇多個專輯
《中國學術期刊全文資料庫》同一檢索文本框中可以輸入含有布爾邏輯算符的表達式
《中國學術期刊全文資料庫》單邏輯檢索和多邏輯檢索都可以實現通航四包含邏輯「或」和邏輯「與」的檢索策略
已知課題名稱,使用《中國學術期刊全文資料庫》查找相關文獻。一般選擇篇名、文摘等與文獻內容相關的欄位中查找
寫出擴展檢索所得的檢索策略的兩種方法:一增加專輯,改選全部文科專輯;二擴展概念,將策略改稱:(外語 + 英語 + 法語 + 日語)*(教育 + 教學 + 教法)
6
EBSCO資料庫的Advanced Search檢索界面可在不同文本框同時實現不同欄位的跨欄位檢索
在EBSCO資料庫中,算符*和?分別是右截詞和中間屏蔽運算符
在EBSCO資料庫中,位置算符不得與欄位算符和優先算符同時使用
在EBSCO資料庫中,算符N3表示算符兩側的兩個檢索詞之間最多可插入三個詞,且兩詞位置可以互換
EBSCO資料庫中表示欄位限定的格式是:欄位簡稱 檢索詞
以空格為分隔連續輸入兩個以上的單詞作為EBSCO的檢索詞,系統默認其效果相當於片語檢索
EBSCO系統是一種非出版商的信息中介公司主辦的;同時提供題錄、文摘和全文、包括多個資料庫
EBSCO的輔助檢索途徑有:出版物publications,圖片images,被引文獻cited reference
檢索EBSCO資料庫時,出現的檢索結果篇數過多,可使用:增加使用邏輯「與」,增加使用邏輯「非」
EBSCO資料庫游覽出版物文本框(browse publications)界面的默認狀態是按字母(alphabetic)游覽
EBSCO資料庫游覽出版物文本框(browse publications)界面的按學科(by subject& description)提供從專業名稱檢索系統包含的全部期刊
EBSCO資料庫既可以檢索文本也可以檢索圖像
在EBSCO資料庫中,AU、SU、TI和AB代表的欄位含義是:作者、主題詞、篇名和文摘
EBSCO資料庫檢索策略
AB「stock market」運用了欄位和片語算符
AU William, F*運用了欄位和截詞算符
Economic*W5 reform運用了截詞和位置算符
TI((china OR Chinese)and literature)運用了優先、邏輯和欄位算符
判斷
文獻檢索是一種相關性檢索,檢索結果與檢索人員的檢索技巧等有關
如果希望檢索結果中不僅同時含有所希望的檢索詞,而且檢索詞之間必須以指定的間隔和順序出現,則檢索詞間可以用位置算符組合
《中國學術期刊全文資料庫》的詞頻率控制應在文摘、全文登欄位檢索所得的文獻量過大場合下使用
⑹ 信息檢索
第一章
信息:信息是事物存在的方式,運動狀態及其特徵的反映,是事物發出的信號,消息
信息的特徵:載體依附性 無線共享性 永不枯竭性 開發增值性 應用時效性 存在普遍性
知識:知識是信息的升華和結果,系統化理論化的的信息就稱為就稱為知識
文獻:用一定的方式記錄在一定的載體上的知識都稱之為文獻
信息源:個人為滿足信息的需要而獲得信息來源稱之為信息源
文獻信息源分為:圖書 期刊 學位論文 科技報告 專利文獻 標准文獻 產品樣本 會議文獻 政府出版物
零次文獻:未經出版發行或者未進入社會交流的最原始的文獻
一次文獻:以作者本人取得的成果為依據而創作的作文 報告等公開發表或出版的各種文獻
二次文獻:按照特定的目的進行篩選,即所謂用一定的檢索工具進行過加工的文獻
三次文獻:根據二次文獻提供的線索,選用大量一次文獻的內容,經過篩選 分類 綜合和濃縮而再度出版的文獻
信息素養:能認識到何時需要信息和有效的搜索 評估和使用所需要信息的能力
醫學信息素養包括: 信息意識 信息知識 信息能力 信息道德
信息檢索:信息檢索包括信息儲存和信息獲取兩個過程
信息檢索的類型:文獻檢索 事實檢索 數據檢索
第二章
資料庫由文檔 記錄和欄位組成
信息檢索的途徑:分類途徑 主題途徑 關鍵詞途徑 著者途徑 題名途徑 號碼途徑
信息檢索技術:布爾邏輯檢索 截詞檢索 位置檢索 限定欄位檢索
信息檢索的策略:一分析檢索課題,明白目的和要求 二,檢索系統和資料庫的選擇 三選擇檢索途徑 確定檢索標識 四 編制檢索表達式 調整檢索策略 五 獲取原始文獻
信息檢索的基本要求:全面 准確 快速
查全率與查准率是評價檢索效果的兩項重要指標
提高檢索效果的措施:
查准率:表示檢出的文獻中所需要相關文獻所佔的比例。查全率:表示檢出的相關的文獻與全部文獻庫中實際存儲的相關文獻的比例
1.提高查全率的措施:盡量採取主題詞語關鍵詞相結合進行檢索 主題詞檢索時要進行擴展檢索和使用全部副主題詞檢索 分類檢索時要進行擴展檢索和全部復分檢索 刪除某個不甚重要的概念組面,減少AND運算 多用同義詞進行「OR」運算檢索 採用截詞檢索
2.提高查准率的的措施:採用規范化的主題詞與副主題片語配進行檢索,少用或不用自由詞 採用限定主要概念主題詞欄位的加權方式進行檢索 增加概念組面,用AND運算符進行連接 用NOT算符排除無關概念 限制檢索欄位 如文獻類型 語種 作者 刊名等 調整放寬位置算符等
3信息檢索的作用
信息檢索是信息素養教育的主要內容
信息檢索是創新型人才的基本技能
信息檢索是科學研究的重要環節
信息檢索是開發信息資源的重要途徑
信息檢索是科學決策的重要前提。
⑺ 常用的中文文獻檢索資料庫有哪些
1、中國知網:
知網,是國家知識基礎設施的概念,由世界銀行於1998年提出。CNKI工程是以實現全社會知識資源傳播共享與增值利用為目標的信息化建設項目。由清華大學、清華同方發起,始建於1999年6月。
憑借優質的內容資源、領先的技術和專業的服務,中國知網在業界享有極高的聲譽,在2007年,中國知網旗下的《中國學術期刊網路出版總庫》獲首屆「中國出版政府獎」,《中國博士學位論文全文資料庫》、《中國年鑒網路出版總庫》獲提名獎。
2、萬方:
萬方資料庫是由萬方數據公司開發的,涵蓋期刊、會議紀要、論文、學術成果、學術會議論文的大型網路資料庫;也是和中國知網齊名的中國專業的學術資料庫。
其開發公司——萬方數據股份有限公司是國內第一家以信息服務為核心的股份制高新技術企業,是在互聯網領域,集信息資源產品、信息增值服務和信息處理方案為一體的綜合信息服務商。
3、中國年鑒網路出版總庫
中國年鑒網路出版總庫是目前國內最大的連續更新的動態年鑒資源全文資料庫。內容覆蓋基本國情、地理歷史、政治軍事外交、法律、經濟、科學技術、教育、文化體育事業、醫療衛生、社會生活、人物、統計資料、文件標准與法律法規等各個領域。
4、中國引文資料庫
該庫收錄了中國學術期刊(光碟版)電子雜志社出版的所有源資料庫產品的參考文獻,涉及期刊類型、學位論文類型、會議論文類型、圖書類型、專利類型、標准類型、報紙類型等超千萬次被引文獻。
該庫通過揭示各種類型文獻之間的相互引證關系,不僅可以為科學研究提供新的交流模式,同時也可以作為一種有效的科學管理及評價工具。
5、維普資料庫系統
維普資訊網建成於2000年,現已成為全球著名的中文信息服務網站,是Google Scholar最大的中文內容合作網站,中國最大的數字期刊資料庫,目前擁有2000餘家集團用戶,網站注冊用戶數超過200餘萬。
網站內容服務包括9000餘種/2000萬篇中文期刊全文;30餘個國家/11300餘種/800餘萬條外文期刊文獻;400多種重要中文報紙信息,學科覆蓋理、工、農、醫、文、史、哲、法各個領域,並提供網上每日更新。
⑻ 請問:標題、主題詞、分類號/索書號,這三個途徑檢索,總結其各有何優點
分類號檢索的優點:能夠在知道文獻所屬領域的情況下,盡快找到所需要的文獻信息;並且可以排除標題包含檢索關鍵詞但是主題並非所要檢索內容的文章。
缺點:有些文獻是跨學科領域的,所以可能會檢索到一些不是完全符合要求范圍的文章,需要進一步排除;還有可能在分類的時候並沒有把默寫文章按照某一個類別歸類,但是檢索者正好需要的是這一領域的文章,因此可能會漏掉信息 。
⑼ 資料庫的類型
資料庫是在計算機存儲設備上按一定方式,合理組織並存儲的相互有關聯的數據的集合,是計算機技術和信息檢索技術相結合的產物,是電子信息資源的主體,是信息檢索系統的核心部分之一。按所提供的信息內容,資料庫主要可分為參考資料庫和源資料庫。 1.參考資料庫 主要存儲一系列描述性信息內容,指引用戶到另一信息源以獲得完整的原始信息的一類資料庫,主要包括書目資料庫和指南資料庫。 (1)書目資料庫 存儲描述如目錄、題錄、文摘等書目線索的資料庫,又稱二次文獻信息資料庫。如各種圖書館目錄資料庫、題錄資料庫和文摘資料庫等屬於此類,它的作用是為用戶指出了獲取原始信息的線索。 圖書館目錄資料庫,又稱機讀目錄,其數據內容詳細,除描述標題、作者、出版項等書目信息外,還提供用戶索取原始信息的館藏信息。題錄、文摘資料庫描述的數據內容與印刷型的題錄、文摘相似,它提供了論文信息或專利信息等確定的信息來源,供用戶檢索。 (2)指南資料庫 存儲描述關於機構、人物、產品、活動等對象的資料庫。與其它資料庫相比,指南資料庫為用戶提供的不僅僅是有關信息,還包括各種類型的實體,多採用名稱進行檢索。如存儲生產與經營活動信息的機構名錄資料庫、存儲人物信息的人物傳記資料庫、存儲產品或商品信息的產品指南資料庫、存儲基金信息的基金資料庫等屬於此類,它的作用指引用戶從其它有關信息源獲取更詳細的信息。 2.源資料庫 主要存儲全文、數值、結構式等信息,能直接提供原始信息或具體數據,用戶不必再轉查其它信息源的資料庫。它主要包括全文資料庫和數值資料庫。 (1)全文資料庫 存儲原始信息全文或主要部分的一種源資料庫。如期刊全文資料庫、專利全文資料庫、網路全書全文資料庫,用戶使用某一詞彙或短語,便可直接檢索出含有該詞彙或短語的原始信息的全文。 (2)數值資料庫 存儲以數值表示信息為主的一種源資料庫,和它類似的有文本-數值資料庫。與書目資料庫比較,數值資料庫是對信息進行深加工的產物,可以直接提供所需的數據信息。如各種統計資料庫、科學技術資料庫等。數值資料庫除了一般的檢索功能外,還具有準確數據運算功能、數據分析功能、圖形處理功能及對檢索輸出的數據進行排序和重新組織等方面的功能。 4.2.2 資料庫結構 1.書目資料庫的結構 書目資料庫是以文檔形式組織一系列數據,這些數據被稱為記錄,一個記錄又包含若干欄位。 (1)記錄與欄位 記錄是作為一個單位來處理有關數據的集合,是組成文檔的基本數據單位。記錄中所包含的若干欄位,則是組成記錄的基本數據單位。在書目資料庫中,一個記錄相當於一條題錄或文摘,因此,一個記錄通常由標題欄位、作者欄位、來源欄位、文摘欄位、主題詞欄位、分類號欄位、語種欄位等組成。在有些欄位中,又包含多個子欄位,子欄位是欄位的下級數據單位。如,主題詞欄位含有多個主題詞。按照欄位所代表記錄的性質不同,欄位通常分為基本欄位和輔助欄位兩類。常見的欄位名稱及代碼見表4-1。 表4-1 欄位名稱及代碼基本欄位輔助欄位欄位名稱欄位代碼欄位名稱欄位代碼標題TI記錄號DN文摘AB作者AU敘詞DE作者單位CS標識詞ID期刊名稱JN出版年PY出版國CO語種LA(2)文檔 按一定結構組織的相關記錄的集合。文檔是書目資料庫數據組織的基本形式,文檔的組織方式與檢索系統的硬體和軟體功能密切相關。在書目資料庫中,文檔結構主要分為順排文檔和倒排文檔。 1)順排文檔 記錄按順序存放,記錄之間的邏輯順序與物理順序是一致的,相當於印刷型工具中文摘的排列順序,是一種線形文檔。順排文檔是構成資料庫的主體部分,但其主題詞等特徵的標識呈無序狀態,直接檢索時,必須以完整的記錄作為檢索單元,從頭至尾查詢,檢索時間長,實用性較差。 2)倒排文檔 將順排文檔中各個記錄中含有主題性質的欄位(如主題詞欄位、標題欄位、敘詞欄位等)和非主題性質欄位(如作者欄位、機構欄位、來源欄位等)分別提取出來,按某種順序重新組織得到的一種文檔。具有主題性質的倒排檔,稱基本索引檔,非主題性質的倒排檔,稱輔助索引檔。 綜上所述,順排檔和倒排檔的主要區別是:順排檔以完整的記錄為處理和檢索單元,是主文檔,倒排檔以記錄中的欄位為處理和檢索單元,是索引文檔。計算機進行檢索時,先進入倒排檔查找有關信息的存取號,然後再進入順排檔按存取號查找記錄。 2.全文資料庫的結構 一般的全文資料庫結構與書目資料庫相似,全文資料庫的一個記錄就是一個全文文本,記錄分成若干欄位。其主文檔是以順排形式組織的文本文檔,倒排檔是對應於記錄可檢欄位的索引文檔。 3.數值資料庫的結構 數值資料庫的結構要綜合考慮資料庫的內容及檢索目的,即,在內容上,數值資料庫的主要內容是數值信息,但不排除含有必要的說明性的文本信息,在檢索上,便於單項檢索和綜合檢索,還能對數值進行准確數據運算、數據分析、圖形處理及對檢索輸出的數據進行排序和重新組織。數值資料庫的數據結構可以是單元式,也可以是表冊形式。前者是對原始數據的模擬,後者則是對統計表格的機讀模擬。數值資料庫通常有多種文檔,如順排擋、倒排擋、索引文檔等。順排擋是由數值數據組成,為主文檔,另有相應的索引文檔,為便於存取,索引文檔採用基本直接存取結構的組織形式。倒排擋也有相應的索引文檔,索引文檔採取分級組織形式。數值資料庫的文檔結構,使所有文檔都可以用於檢索,所有數據都可用來運算,構成了數值資料庫的特點。 4.指南資料庫的結構 指南資料庫的結構兼有書目資料庫、全文資料庫和數值資料庫的特點,有順排檔、倒排檔、索引文檔和數據字典。一般而言,對涉及主題領域較多,內容綜合性較強的大型指南資料庫,順排擋(主文檔)可採用多子文檔的結構,對單一主題領域和內容較專的,則採用單一主文檔和不定長、多欄位的記錄格式為宜。