當前位置:首頁 » 數據倉庫 » 檢索一個自己不太熟悉的資料庫我們應首先
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

檢索一個自己不太熟悉的資料庫我們應首先

發布時間: 2022-09-21 05:01:26

1. 我的信息檢索常見問題

一、網路環境下信息檢索的常見問題

一是網路信息過於泛濫。如今,任何組織與個人均可通過網路相關信息,導致網路信息量飛速增加,而信息的質量與精度則不斷降低,一些網站質量不高,且長時間不進行更新,導致用戶面對這些信息顯得無所適從,因而無法找到所需信息。
二是搜索引擎存在不足。雖然搜索引擎能夠發揮網路導航之作用,但是也存在著類目設計不規范,內容存在重復和交叉現象等,而且重復鏈接信息偏多,查准率過低。
三是用戶信息意識不強。盡管網路環境下用戶可運用網路來獲得信息,但尚有許多用戶缺乏良好的信息意識,對於網路信息檢索不夠熟悉,難以快速獲取相關信息。

二、網路環境下強化信息檢索的對策

(-)通過提出信息需求以明確檢索目標

用戶在檢索前一定要深入分析,明確所要檢索的目標信息,這是確定檢索策略的根本措施,也是判斷檢索效率高低之重點。
一是要了解所要檢索信息的主體內容以及涉及到的學科範圍,並且明確檢索內容及其目的,這是用戶選擇檢索工具的首要步驟。
二是確定需要文獻類型、年代和文獻范圍等,在了解清楚以上內容之後再來選擇相應的資料庫並開展限定檢索。
三是應明確查新、查准以及查全等指標性要求。如果想知識本領域的最新動態和進展,就應當注重「新」。

(二)選用合適的檢索資料庫和檢索工具

目前,網路資源的種類相當多。每個檢索系統常常涵蓋了多個資料庫。在進入到系統以後,一般都會出現分類目錄讓用戶進行選擇。

(三)實施概念分析以確認檢索詞

實施計算機檢索是否能夠得到滿意的成效,一個關鍵環節就是要選好檢索詞。只要檢索詞分析得當,就能更好地進行選詞和進行邏輯上的組配。

(四)合理構造信息檢索表達形式

在構造信息檢索表達形式之時,應當全面運用檢索工具所支持的檢索計算,允許運用檢索標識與各類限定等,這也是實施有效檢索的重要基礎。

(五)合理地調整信息檢索方式

在制定明確的檢索方式,並且輸入到檢索系統之後,該系統所檢索出來的結果並不是肯定能夠滿足用戶心中所設想的信息檢索要求。

(六)不斷提升廣大用戶的信息素質

提升用戶的信息素質與思想素質,這是提升信息檢索能力的重要基礎。知識、技能與能力等三者均為知識素質的重要體現,三者之間是相輔相成的。

2. 計算機檢索的常用方法有哪些

明確檢索要求和檢索目標
計算機檢索的第一步准備工作是明確檢索要求和檢索目標。
明確檢索要求就是要搞清楚本課題屬於什麼學科,所需文獻的類型及語種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇資料庫、構造檢索策略都是十分重要的。
確定檢索目標也是進行計算機信息檢索前應搞清楚的准備工作。例如:如果屬於開題調研,則應盡可能地檢索出與之相關的全部文獻,即要求較高的查全率;以便充分地做好開題的准備工作;如果屬於探索性、開創性的課題,則只需要查出一些啟發性的文獻,對查准率和查全率要求都不一定有很高的要求。
4.3.2 課題分析
1. 課題概念的分析方法 分析課題就是分析出課題所涉及的主要概念,並找出能代表這些概念的若干個詞或片語,進而分析概念之間的上、下、左、右關系。對於新學科、交叉學科和邊緣學科的課題,則要搞清楚這些概念之間的關系。概念分析的結果應以概念組為單元的詞或片語的形式列出,以便下一步制訂檢索策略時使用。
2. 隱含概念的分析方法 有些課題的實質性內容往往很難從課題的名稱上反映出來,課題所隱含的概念和相關的內容需要從課題所屬的專業角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。例如:"社會保障"包含"養老保險"、"失業保險"、"醫療保險"和"社會救濟"等概念,如果要檢索社會保障方面的文獻,應該析出上述概念,才能保證文獻的查全率。
3. 核心概念的選取 有些檢索詞中已經含有的某些概念,在概念分析中應予以排除。例如:課題"公司勞動獎勵、職工培訓和養老保險制度管理的理論和實踐",如果把"勞動獎勵","職工培訓","養老保險","公司","制度","管理"六個概念全部組配起來,則會造成大量文獻漏檢。實際上,勞動力資源管理已經包含了勞動獎勵、職工培訓和養老保險三個方面,而且,勞動力管理必然是針對該三個方面而言的。因此,本課題只須採用"勞動力資源"和"管理"這兩個本質概念即可。
為了提高文獻的檢准率,應該從相應的規范詞表中選擇所需的檢索詞。並且在確定檢索詞時,除了要考慮反映主題概念的同義詞、近義詞等相關的檢索詞外,還要注意選擇被選用檢索詞的縮寫詞和不同拼法的詞,以避免漏檢有關的文獻。
4.3.3 檢索詞的擴展、選擇和處理
目前的計算機信息檢索系統,還不具備智能思考的能力,還不會對所輸入的檢索詞以及涉及的所有詞進行自動、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關的詞,從中做出選擇,並利用截詞等方法對檢索詞予以歸並。
1.相同概念的檢索詞的擴展 擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法
(1) 同義詞方法。在同一概念的范疇內,從語言角度,選擇不同的名稱、不同的拼寫方法和單復數形式。不同的名稱包括學名和俗名、簡稱和全稱,商品名和物質或產品名,事物的代碼和事物的學名。不同的拼寫方法,以英語為例,包括英式英語和美式英語的區別。
(2)截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數英語單詞的單復數變化和英美不同拼寫形式),可以採用截詞方法擴展檢索詞。這種方法要求在詞干後使用截詞符。截詞符一般包括"?"和"*"兩種。具體採用什麼形式,各個系統都有明確的規定。例如:在DIALOG系統中,截詞符號有無限截詞算符
("?") 和有限截詞 ("??"和"?? ?")等多種,"?"有時還用做字元屏蔽符。
(3)主題詞表方法 許多資料庫都編有自己的主題詞表。在資料庫編有主題詞表的情況下,應該盡量從詞表中選擇檢索詞。使用主題詞表,不僅可以使檢索詞更加規范,提高檢索結果的准確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關詞,使獲得的檢索結果更為理想。
2.檢索詞的選擇和處理 運用上述方法得到的詞,首先應加以選擇,即注意選用本專業通用的術語(應避免使用冷僻詞和根據中文術語自譯生造的詞),然後以概念為單位,構成組面(facets)。例如:課題"東西方社會保障制度比較研究"的概念組面和檢索詞為:

概念組面1:"社會保障" social security 概念組面2:"制度研究"system? Research
4.3.4 資料庫的選擇
不同資料庫的學科範圍不同,檢索指令不同,收費的標准也不同。所以,在檢索之前應該閱讀有關資料庫的使用介紹,以便選擇資料庫時做到心中有數。
選擇資料庫,我們一般應該遵循以下幾條原則
1.按照課題的檢索要求和目的,選擇收錄文獻種類多、專業覆蓋面寬、年代跨度對口的資料庫;
2.當需要查找最新文獻信息時,選擇數據更新周期短的資料庫;
3.當還需要獲取原文時,選取原文獲取較容易的資料庫;
4.在同時有多個資料庫可供選擇的情況下,應首先選擇比較熟悉的資料庫。
5.當幾個資料庫的內容交叉重復率比較高時,應選擇檢索費用比較低的資料庫。
4.3.5 檢索策略構成和調整方法
在實際檢索過程中,僅需一個檢索詞就能滿足檢索要求的情況並不很多。通常我們需要使用多個檢索詞構成檢索策略,以滿足由多概念組配而成的較為復雜課題的要求。
檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關系和檢索順序作出的某種安排。構成檢索策略就是運用計算機情報檢索系統可以接受的方法,包括布爾邏輯算符、位置邏輯算符等方法,表達課題檢索要求的過程。

1.布爾邏輯算符 規定檢索詞之間的邏輯關系的算符,稱為布爾邏輯算符。布爾邏輯算符包括邏輯"或(OR)"、"與(AND)"和"非(NOT)"。
(1) 或(OR)運算符。也可用"+"代替,是用來組配具有同義或同族概念的詞,如同義詞、相關詞等。其含義是,檢出的記錄中,至少含有兩個檢索詞中的一個。OR算符的基本作用是擴大檢索范圍,增加命中文獻量,提高檢索結果的查全率,OR運算符還有一個去重的功能。在實際檢索中,同一組面中含義相同的詞,相互之間都使用OR運算符。另外,在使用截詞方法檢索具有相同詞乾的檢索詞時,這些詞之間也自動地隱含了邏輯"或"的關系。
(2) 與(AND)運算符。也可用"*"代替,用來組配不同檢索概念。其含義是檢出的記錄必須同時含有所有的檢索詞。AND算符的基本作用是縮小檢索范圍,減少命中文獻量,提高檢索結果的查准率。在實際檢索中,不同概念組面之間以及同一組面內的不同含義的詞之間通常使用AND算符。
(3) 非(NOT)運算符。也可用"-"代替,但在檢索時建議使用NOT,以避免與詞間的分隔符"-"混淆,NOT算符是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其後的詞。NOT算符的基本作用是縮小檢索范圍,提高檢索結果的查准率.
2. 位置算符 位置算符又稱鄰接算符(adjacent operators),適用於兩個檢索詞以指定間隔距離或者指定的順序出現的場合,比如,以片語形式表達的概念;彼此相鄰的兩個或兩個以上的詞;被禁用詞或特殊符號分隔的詞等。位置算符是調整檢索策略的一種重要手段。按照兩個檢索詞出現的順序和距離,可以有多種位置算符,而且對同一種位置算符,檢索系統不同,規定的位置算符也不同。例如,Compendex光碟資料庫使用的位置算符"(N)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序可以顛倒)、"(F)"(表示其兩側的檢索詞必須在同一欄位(例如同在題目欄位或文摘欄位)中出現,兩詞的詞序可以顛倒)、"(S)"(表示其兩側的檢索詞必須在同一句子中出現,兩詞的詞序可以顛倒)和"(W)"(表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其它詞或字母,兩詞的詞序不可以顛倒)四種。
3.欄位限制 欄位限制也是調整檢索策略的一種重要的手段。它是限定檢索詞必須在資料庫記錄中規定的欄位范圍內出現的文獻,方為命中文獻的一種檢索方法。如果想指定在題名等欄位中查找所希望的檢索詞,就需要使用欄位限制。欄位限制適用於在已有一定數量輸出記錄的基礎上,通過指定欄位的方法,減少輸出篇數,提高檢索結果的查准率的場合。由於欄位限制採用前綴和後綴的形式,因此又稱為前綴限制和後綴限制。例如Compendex光碟資料庫基本欄位限制的用法是在需要指定欄位的檢索詞後加上後綴運算符"/"和段碼。這個資料庫輔助欄位限制的用法是在需要指定欄位的檢索詞(有時檢索詞須放在雙引號內)之前加上段碼和前綴運算符"="。

4. 檢索策略的調整 檢索策略輸入檢索系統後,系統響應的檢索結果有時不一定能滿足課題檢索的要求,例如:或者檢出的篇數過多,而且不相關文獻所佔比例很大,或者檢出的文獻數量太少,有時甚至為零,這時就需要調整檢索策略。
調整檢索策略之前,首先要分析造成檢索結果不理想的原因。對於輸出篇數過多的情況,應分析是否是由下述原因造成的:①選用了多義性的檢索詞;②截詞截得過短;③輸入的檢索詞太少;④應該使用"與(AND)"的使用了"或(OR)";⑤優先運算符"()"使用錯誤。對於輸出篇數過少的情況,應分析是否是由下述原因造成的:①檢索詞拼寫錯誤;②遺漏重要的同義詞或隱含概念;③檢索詞過於冷僻具體;④沒有使用截詞算符;⑤位置算符和欄位算符使用的過多;⑥使用過多的"與(AND)"算符。
針對上述原因,如果是屬於需要擴大檢索范圍,提高文獻查全率,調整檢索策略的方法有:①減少"與(AND)"算符,增加同義詞或同族相關詞使用邏輯或(OR)將它們連接起來;②在詞干相同的單詞後使用截詞符(?);③去除已有的欄位限制、位置算符限制(或者改用限製程度較小的位置算符)。
如果是屬於縮小檢索范圍,提高文獻查准率的,調整檢索策略的方法有:①減少同義詞或同族相關詞;②增加限制概念,用邏輯與(AND)將它們連接起來;③使用欄位限制,或者限定檢索詞在指定的基本欄位,或者指定的輔助欄位出現,限制檢索結果的文獻類型、語種、出版國家;④使用適當的位置算符;⑤使用"非(NOT)"算符,排除無關概念。
4.3.6 輸出格式和方式的選擇
所謂輸出格式的選擇是對記錄欄位的選擇。所謂輸出方式的選擇是指對屏幕顯示、列印和存檔的選擇。 一般情況下,如果輸出的是中間結果,屬於基本欄位的題目(TI)、文摘(AB)、敘詞(DE)和識別詞(ID)欄位是必須的,這些欄位有利於觀察結果,對檢索策略做進一步調整。如果是最終結果,可以根據時間、經費條件選擇其中適用的格式。
輸出方式的選擇,要注意的問題是,資料庫是否只允許列印、存檔選中的記錄;在選定列印、存檔後,是否還須進一步選擇"當前記錄""全部記錄""選中記錄";另外如果是存檔,是否還有文件擴展名的限制。

另外給你推薦本書:參考下http://wenku..com/view/646426c58bd63186bcebbca4.html

3. 怎麼檢索文獻資料

查文獻時最好是從中文開始,然後是外文文獻。主要有以下幾種方法:
1. 根據文章出處,去一些較大圖書館查找原文。
2. 如果學校或單位有CNKI,維普,萬方的話,就比較好辦,中文文獻一般都可以搞定,把關鍵詞、期刊名稱、卷,期、年等信息輸入即可檢索到。
3. 對於自然科學來講英文文獻檢索首推Elsevier,Springer等。這些資料庫裡面文獻很多,可以為我們提供很多的文獻資源。
4.如果所在單位或大學沒有購買這些資料庫,我們可以去Science網上雜志找文章,對中國人完全免費!另外還可以通過Google學術搜索(scholar.google.com)來查詢。裡面一般會搜出來你要找的文獻,在Google學術搜索里通常情況會出現每組幾個等字樣,然後進入後,分別點擊,裡面的其中一個就有可能會下到全文。
5. 如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 學術搜索),用作者的名字來搜索,是因為很多國外作者都喜歡把文章的全文(PDF)直接掛在網上,一般情況下他們會把自己的文章掛在自己的個人主頁(home page)上,這樣可能也是為了讓別的研究者更加了解自己的學術領域,這樣你就有可能下到你想要的文獻的全文了。第一作者查不到個人主頁,就接上面的方法查第二作者。

4. 檢索工具選擇的基本原則有哪些

檢索工具選擇的基本原則主要有:收錄的文獻信息需要覆蓋檢索課題的主題內容、就近原則,方便查閱、檢索工具盡可能質量高、收錄文獻多、內容新、使用方便、檢索工具記錄來源、文獻類型、語種等盡量滿足檢索課題要求、根據熟悉檢索工具的程度。


檢索工具是用於報道、存儲和查找文獻線索的工具和設備的總稱。圖書館目錄、期刊索引、電子計算機檢索用的文獻資料庫等等都是檢索工具。它具有報道文獻、存儲文獻、檢索文獻三大基本功能。其類型有手工檢索工具和機械檢索工具兩種。

手工檢索工具指目錄、索引、文摘等印刷型的二次文獻。機械檢索工具是指電子計算機情報檢索系統的技術設備而言。

檢索工具的特點:詳細描述文獻的內容特徵,外表特徵;每條文獻記錄必須有檢索標識;文獻條目按一定順序形成一個有機整體,能夠提供多種檢索途徑。

檢索工具的類型:目錄型檢索工具(如館藏目錄,聯合目錄,國家書目,出版社與書店目錄);題錄型檢索工具;文摘型檢索工具。(如知識型文摘,報導型文摘);索引型檢索工具。

以上內容參考:網路-檢索工具

5. 論述信息檢索的基本程序

這位同學啊,書上都有啊!看書完全可以知道的
進行信息檢索,一般來說要經過以下基本程序:分析檢索課題,選擇檢索系統及資料庫,確定檢索詞,構建檢索提問式,上機檢索並調整檢索策略,輸出檢索結果。
1、分析檢索課題
利用計算機信息檢索系統獲取文獻信息的用戶,一般分為直接用戶和間接用戶兩種類型。直接用戶是指最終使用獲得的信息進行工作的用戶(如,科研人員,管理者,決策者等);間接用戶是指專門從事計算機檢索服務的檢索人員。檢索人員在接到用戶的檢索課題時應首先分析研究課題,全面了解課題的內容以及用戶對檢索的各種要求,從而有助於正確選擇檢索系統及資料庫,制定合理的檢索策略等。分析檢索課題時應從以下幾方面進行:
(1)弄清用戶信息需求的目的和意圖。
(2)分析課題涉及的學科範圍、主題要求。
(3)課題所需信息的內容及其特徵。
(4)課題所需信息的類型,包括文獻類型、出版類型、年代范圍、語種、著者、機構等。
(5)課題對查新、查准、查全的指標要求。
2、選擇檢索系統和資料庫
在全面分析檢索課題的基礎上,根據用戶要求得到的信息類型、時間范圍、課題檢索經費支持等因素綜合考慮後,選擇檢索系統和資料庫。正確選擇資料庫,是保證檢索成功的基礎。選擇資料庫時必須從以下幾個方面考慮:
(1)資料庫收錄的信息內容所涉及的學科範圍;
(2)資料庫收錄的文獻類型、數量、時間范圍以及更新周期;
(3)資料庫所提供的檢索途徑、檢索功能和服務方式。
3、確定檢索詞
檢索詞是表達文獻信息需求的基本元素,也是計算機檢索系統中進行匹配的基本單元。檢索詞選擇正確與否,直接影響著檢索結果。在全面了解檢索課題的相關問題後,提煉主要概念與隱含概念,排除次要概念,以便確定檢索詞。檢索詞的確定,一般有以下幾種方法:
(1)先選用主題詞。當所選的資料庫具有規范化詞表時,應優先選用該資料庫詞表中與檢索課題相關的規范化主題詞,從而可獲得最佳的檢索效果。
(2)選用資料庫規定的代碼。許多資料庫的文檔中使用各種代碼來表示各種主題范疇,有很高的匹配性。例如,世界專利文摘資料庫中的分類代碼,化學文摘資料庫中的化學物質登記號。
(3)選用常用的專業術語。在資料庫沒有專用的詞表或詞表中沒有可選的詞時,可以從一些已有的相關專業文獻中選擇常用的專業術語作為檢索詞。
(4)選用同義詞與相關詞。同義詞、近義詞、相關詞、縮寫詞、詞形變化等應盡量選全,以提高查全率。
4、構建檢索提問式
檢索提問式是計算機信息檢索中用來表達用戶檢索提問的邏輯表達式,由檢索詞和各種布爾邏輯算符、位置算符、截詞符以及系統規定的其他組配連接符號組成。檢索提問式構建得是否合理,將直接影響查全率和查准率。構建檢索提問式時,應正確運用邏輯組配運算符:
(1)使用邏輯「與」算符可以縮小命中范圍,起到縮檢的作用,得到的檢索結果專指性強,查准率也就高。
(2)使用邏輯「或」算符可以擴大命中范圍,得到更多的檢索結果,起到擴檢的作用,查全率也就高。
(3)使用「非」算符可以縮小命中范圍,得到更切題的檢索效果,也可以提高查准率,但是使用時要慎重,以免把一些相關信息漏掉。另外,在構建檢索提問式時,還要注意位置算符、截詞符等的使用方法,及各個檢索項的限定要求及輸入次序等。
5、上機檢索並調整檢索策略
構建完檢索提問式後,就可以上機檢索了。檢索時,應及時分析檢索結果是否與檢索要求一致,根據檢索結果對檢索提問式作相應的修改和調整,直至得到比較滿意的結果。
(1)檢索結果信息量過多
產生檢索結果信息量過多的原因可能有以下兩點:一是主題詞本身的多義性導致誤檢;二是對所選的檢索詞的截詞截得太短。在這種情況下,就要考慮縮小檢索范圍,提高檢索結果的查准率。調整檢索策略的方法如下:
①減少同義詞與同族相關詞;
②增加限制概念,採用邏輯「與」連接檢索詞;
③使用欄位限定,將檢索詞限定在某個或某些欄位范圍;
④使用邏輯」非」算符,排除無關概念;
⑤調整位置算符,由松變嚴,(F) (W)。
(2)檢索結果信息量過少
造成檢索結果信息量少的原因有以下幾點:首先,選用了不規范的主題詞或某些產品的俗稱,商品名稱作為檢索詞;其二,同義詞、相關詞、近義詞沒有運用全;其三,上位概念或下位概念沒有完整運用。針對這種情況,就要考慮擴大檢索范圍,提高檢索結果的查全率。調整檢索策略的方法如下:
①選全同義詞與相關詞並用邏輯」或」將它們連接起來,增加網羅度;
②減少邏輯「與」的運算,丟掉一些次要的或者太專指的概念;
③去除某些欄位限制;
④調整位置算符,由嚴變松,(W) (F)。
6、輸出檢索結果
根據檢索系統提供的檢索結果輸出格式,選擇需要的記錄以及相應的欄位(全部欄位或部分欄位),將結果顯示在顯示器屏幕上、存儲到磁碟或直接列印輸出,網路資料庫檢索系統還提供電子郵件發送,至此,完成整個檢索過程。