web信息檢索技術的研究現狀_網路信息檢索的現狀與發展

❶ 賴茂生的個人作品

（1）《信息資源管理教程》.清華大學出版社，2006年10月
（2）《信息經濟學》.北京大學出版社，2006年第一主編
（3）《計算機情報檢索（第二版）》. 北京大學出版社,2006
（4）Managing IT in Government, Business & Communities. IRM Press, Hershey PA, U.S.A., 2003. 本人和研究生傅欣、張莉揚負責其中第七章的撰寫工作.
（5）《20世紀圖書館學情報學》. 北京圖書館出版社, 2002年11月. 本人和研究生侯艷飛、李箐負責其中一個分支——「20世紀信息檢索技術新進展」的撰寫工作.
（6）《網路傳播研究》. 上海科學普及出版社, 2002年7月. 主編之一, 論文集.
（7）《21世紀情報學教育發展戰略研討會論文集》. 科學技術文獻出版社, 2002年7月. 主策劃之一.
（8）《信息數字化與法律：數字圖書館建設中的法律問題》. 法律出版社, 2002年6月. 本人和研究生孫廣芝、田敏負責其中兩篇研究報告的撰寫工作.
（9）《社會科學信息資源網路建設》. 北京圖書館出版社, 2002年1月. 主編之一, 多人合著.
（10）《電子商務案例》. 東北財經大學出版社, 2001年12月. 本人和研究生田敏負責其中3個案例的撰寫工作.
（11）《信息科學技術與當代社會》. 教育部高教司組編, 大學生文化素質教育書系. 高等教育出版社, 2000年8月. 本人和研究生范曉虹負責書中第一章「信息科學技術的產生和發展」撰寫工作.
（12）《企業信息化知識手冊》. 北京出版社, 1999年9月. 主編, 多人合著.
（13）《信息高速公路——面向未來社會的震盪》. 山東教育出版社, 1996年12月. 二人合著.
（14）《科技文獻檢索教學大綱》. 高等教育出版社, 1996年3月. 本人負責其中三章的編寫工作.
（15）《21世紀的信息技術》. 科學技術文獻出版社, 1995年7月. 二人合著.
（16）《計算機情報檢索》. 北京大學出版社, 1993年3月. 主編, 三人合著.
（17）《檔案幹部繼續教育講座》. 中央電視大學出版社, 1992年9月. 本人負責其中一講「情報科學與情報技術」.
（18）《中國大網路全書》（圖書·情報·檔案類）. 中國大網路全書出版社, 1992年. 本人負責若干條目的撰寫和審改工作.
（19）《科技文獻檢索指導》. 北京大學出版社, 1992年1月. 主編.
（20）《圖書館學情報學詞典》. 書目文獻出版社, 1991年12月. 分支學科負責人.
（21）《文摘的概念與方法》（譯著）. 書目文獻出版社, 1991年6月. 主譯之一, 負責統稿.
（22）《索引編制工作手冊》（譯著）. 北京大學出版社, 1988年4月. 主譯之一, 負責統稿.
（23）《目錄學論文選》. 書目文獻出版, 1985年. 主編之一.
（24）《科技文獻檢索》. 北京大學出版社, 1985年. 主編. 1988年獲國家教委優秀教材二等獎. 1994年修訂再版,2007第9次印刷
學術論文 2007年以後
1 賴茂生，閆慧，關於中國公益信息制度的戰略思考，圖書情報工作 2011
2 賴茂生，邢博，從公務員招聘看我國情報學人才培養，情報科學 2010
3 賴茂生，知識時代的LIS如何定位和發展，圖書情報工作 2010
4 賴茂生，EA、制度與頂層設計，電子政務 2010
5 賴茂生，趙康，企業信息管理人員信息行為和信息素養研究，情報科學 2010-07-15 3 308
7 賴茂生，龍健，新媒體的節目內容創新研究，科技傳播 2010-02-23 1 232
8 賴茂生，屈鵬，大學生信息檢索能力調查分析，大學圖書館學報 2010-01-21 7 919
9 龍健，賴茂生，DOI的興起與我國的對策，情報雜志 2009
10 賴茂生，龍健，信息化調研綜述，產權導刊 2009
11 賴茂生，信息公開制度建設與電子政務深化應用，電子政務 2009-09-15 1 247
12 賴茂生，屈鵬，用戶需求模式協同構建的初步探索，情報科學 2009-09-15 1 181
13 趙康，賴茂生，我國期刊網路出版業的市場環境分析，情報探索 2009-09-15 0 125
14 王芳，賴茂生，我國電子政務發展現狀與對策研究，電子政務 2009-08-15 11 727
15 賴茂生，孫鵬飛，高校信息素養評價標准發展研究，情報科學 2009-08-15 8 549
16 賴茂生，提升學科理論水平關注信息制度研究——祝賀《情報理論與實踐》創刊45周年，情報理論與實踐 2009
17 賴茂生，屈鵬，中文搜索引擎查詢與反饋詞語特徵研究，中文信息學報 2009
18 賴茂生，葉元齡，閆慧，李璐，從產業融合看數字內容產業發展——基於廣東產業發展的分析，情報科學 2009
19 趙康，賴茂生，知識管理成熟度模型的應用研究，醫學信息學雜志 2009
20 賴茂生，屈鵬，趙康，論期刊評價的起源和核心要素，重慶大學學報(社會科學版) 2009
21 賴茂生，屈鵬，網路用戶的搜索入口與跳轉行為研究，情報理論與實踐 2009
22 賴茂生，屈鵬，搜索引擎查詢日誌的詞性標注和挖掘研究，現代圖書情報技術 2009
23 賴茂生，屈鵬，網路用戶的查詢與點擊行為研究，情報理論與實踐 2009
24 賴茂生，屈鵬，李璐，張麗麗，網路用戶搜索的語言使用行為研究——實驗設計與搜索價值，情報理論與實踐 2009
25 趙康，賴茂生，知識管理成熟度模型的結構與創建，中國科技資源導刊 2009
26 賴茂生，深入了解前沿,把握情報學的發展方向，圖書情報工作 2009
27 賴茂生，屈鵬，謝靜，知識組織最新研究與實踐進展，圖書情報工作 2009
28 賴茂生，閆慧，葉元齡，李璐，內容產業與文化產業整合與協同理論和實踐研究，情報科學 2009
29 賴茂生，屈鵬，相關性基礎理論及其在檢索建模中的作用研究，情報理論與實踐 2008
30 葉元齡，賴茂生，農村居民信息需求對農村信息化政策的啟示——基於廣東的分析，科技管理研究 2008
31 賴茂生，閆慧，葉元齡，李璐，內容產業與文化產業的關系研究，情報科學 2008
32 賴茂生，閆慧，網路搜索中語言使用特徵研究，現代圖書情報技術 2008
33 賴茂生，閆慧，用戶自然和社會屬性對網路搜索中語言使用行為的影響，現代圖書情報技術 2008
34 賴茂生，信息公開與信息資源開發利用，電子政務 2008
35 賴茂生，閆慧，龍健，海峽兩岸信息資源產業比較研究，情報科學 2008
36 賴茂生，信息管理的核心領域和發展前瞻——兼論信息管理本科課程體系建設問題，第十三屆中國信息經濟學會學術年會論文集 2008
37 賴茂生，屈鵬，網路用戶信息獲取語言使用行為研究，現代圖書情報技術 2008
38 黃敏，賴茂生，語義檢索研究綜述，圖書情報工作 2008
39 賴茂生，閆慧，龍健，海峽兩岸信息資源產業比較研究，情報科學 2008
40 賴茂生，閆慧，龍健，論信息資源產業及其范疇，情報科學 2008
41 賴茂生，把握前沿,規劃遠景,扎實推進學科建設，圖書情報工作 2008
42 賴茂生，王琳，李宇寧，情報學前沿領域的調查與分析，圖書情報工作 2008
43 賴茂生，王琳，楊文欣，李宇寧，情報學前沿領域的確定與討論，圖書情報工作 2008
44 黃昆，賴茂生，圖像情感特徵的分類與提取，計算機應用 2008
2005年-2007年
[1] Guifa Teng, Maosheng Lai, Peng Li. A New Retrieval Scheme Using Meaning Attributes for Ancient Chinese Medical Literature, INFORMATION, Vol.8, No.3, 2005
[2] Guifa Teng, Maosheng Lai, Jianbin Ma. Feature Extracion of Chinese E-mail Documents for Authorship Mining, INFORMATION, Vol.8, No.3, 2005
[3] 王琳、賴茂生：對知識資本與虛擬經濟研究的思考，信息時代的經濟學與管理學，2005年信息經濟學年會論文集，清華大學出版社，2005年5月，351－356頁
[4] 陳芬、賴茂生：美國的基因信息隱私權保護，信息時代的經濟學與管理學，2005年信息經濟學年會論文集，清華大學出版社，2005年5月，282－286頁
[5] 熊艷紅、賴茂生：中國數字內容產業現狀簡析，信息時代的經濟學與管理學，2005年信息經濟學年會論文集，清華大學出版社，2005年5月，140－148頁
[6] 申靜、賴茂生、錢程：知識型服務創新對信息和通信技術聚合的影響.情報科學, 2005(10)
[7] 賴茂生：讀《參考咨詢新論》有感. 圖書館工作與研究，2005（4）
[8] 賴茂生：高校知識管理浮出水面.中國教育網路，2005（9）
[9] 賴茂生：如何破解知識社區三大難題專家把脈數字資源建設. 中國教育網路, 2005(8)
[10] 賴茂生、侯艷飛：跨語言檢索技術:策略與方法.鄭州大學學報(哲學社會科學版),2005(4)
[11] 汪媛、賴茂生：網路版全文資料庫綜合評價模型的測試應用分析. 情報科學, 2005(7)
[12] 王妙婭、賴茂生：跨語言信息檢索中的詢問翻譯方法及其研究進展.現代圖書情報技術,2005(4)
[13] 傅湘玲、賴茂生、黃昆：企業內容服務的戰略設計與實施. 情報學報, 2005(3)
[14] 湯艷莉、賴茂生：ontology在自然語言檢索中的應用.現代圖書情報技術,2005(2)
[15] 黃昆、賴茂生：感性工學及其在圖像檢索中的應用, 現代圖書情報技術, 2006(5)
[16] 岳珍、賴茂生：國外「情景分析」方法的進展. 情報雜志, 2006(7)
[17] 黃昆、賴茂生：以用戶情感為線索的圖像檢索研究. 情報科學, 2006(9)
[18] 賴茂生、吳龍婷等：國外用戶網路搜索行為研究進展, 情報學報, 2006(s1)
[19] 賴茂生、王琳：情報檢索發展路徑的轉向, 情報學報，2006（6）
[20] 岳珍、賴茂生：基於信息構建的網站設計理念研究. 情報科學，2006（11）
[21] 陳芬、賴茂生：視頻檢索的用戶策略. 情報科學, 2007(1)
[22] 岳珍、賴茂生：特派員制度的創新意義.中國科技論壇, 2007(3)
[23] 賴茂生：數字時代的情報學.圖書情報工作, 2007(4)
[24]丁璐璐，賴茂生，移動通信增值服務的運營模式研究，江西圖書館學刊 2007
[25]王琳，賴茂生，信息集成的領域分析研究，圖書情報知識 2007
[26]耿騫，賴茂生，自然語言檢索的實現及其關鍵問題，情報科學 2007
[28]屈鵬,隆捷; 吳龍婷; 賴茂生，國內外情報學研究現狀的統計分析,情報資料工作 2007
[29]王琳; 賴茂生，信息技術接受機制研究——對企業知識管理系統導入的啟示,情報科學 2007
[30]邱惟明; 賴茂生，中國軟體產業規模和軟體人才趨勢的系統動力學分析,情報科學 2007
[31]葉元齡; 賴茂生，關於發展公益性信息服務的思考，商業時代 2007
[32]黃昆，賴茂生，彩色自然風景圖片的四季特徵提取，情報學報 2007
2004年之前
[1]信用信息及其傳播. 《情報科學》 2004年05期合著
[2]Web信息檢索技術及研究進展. 《現代圖書情報技術》 2004年05期合著
[3]繼續發揮好情報學理論傳播主渠道的作用. 《情報理論與實踐》 2004年04期
[4]商標圖像檢索技術述評. 《現代圖書情報技術》 2004年04期合著
[5]信息資源開發利用基本理論研究. 《情報理論與實踐》 2004年03期
[6]信息哲學研究綜述. 《情報理論與實踐》 2004年03期合著
[7]企業知識管理集成的研究. 《情報學報》 2004年03期合著
[8]信息經濟學體系探索. 《情報學報》 2004年01期合著
[9]關於信息構建(IA)的十個問題. 《江西圖書館學刊》 2004年01期
[10]信息技術與零售之王沃爾瑪. 《情報科學》，2003年09期
[11]信息空間構建相關問題探討——用戶體驗和系統可用性. 《情報理論與實踐》 2003年01期合著
[12]認知過程鏈與情報學的新定位. 《情報資料工作》. 2003: 3, p5-7. 合著.
[13]信息技術在商業經營管理中的應用. 《情報理論與實踐》. 2003: 3, p249-252. 合著.
[14]中國網路咨詢業的發展及對策. 《情報理論與實踐》. 2003: 2, p102-105. 合著.
[15]信息空間構建相關問題探討. 《情報理論與實踐》. 2003: 1, p8-10. 合著.
[16]情報學教育的現狀與發展. 《情報理論與實踐》. 2003: 1, p80-84+88.
[17]情報學的學科發展與教育問題. 《情報學報》. 2003: 1, p1-10.
[18]從信息不對稱理論談我國信用體系建設中的信息支持問題. 《情報資料工作》. 2003: 1, p10-12 [19]國內IT管理咨詢業的興起與發展. 《電子商務世界》. 2002: 12, p86-87.
[20]IT管理咨詢業發展分析. 《電子商務世界》. 2002: 11, p90-91.
[21]IT管理咨詢企業運營分析. 《電子商務世界》. 2002: 10, p80-81.
[22]「三問」IT管理咨詢. 《電子商務世界》. 2002: 9, p28-29.
[23]網路傳播的內涵、功能和效果初探. 《第四屆全國科技傳播研究會年會論文集》，上海科學技術出版社, 2002年7月. P1-14.
[24]第三屆全國科技傳播研討會論文綜述. 《第四屆全國科技傳播研究會年會論文集》. 上海科學技術出版社, 2002年7月. P378-388.
[25]Images Organization on Network. 《數字圖書館：新世紀信息技術的機遇與挑戰國際研討會論文集》. 北京圖書館出版社, 2002年7月. 合著.
[26]The Integration of Material Flow, Cash Flow and Information Flow in E-Commerce. 《信息資源管理協會國際會議論文集》. 2002年5月. 合著.
[27]Information Resource Development in China. 《信息資源管理協會國際會議論文集》. 2002年5月. 合著.
[28]論信息經濟的制度變遷. 《情報學報》. 2002: 5, p608-612. 合著.
[29]信息空間構建（IA）初探. 《中國圖書館學報》. 2002: 4, p79-81. 合著.
[30]基於語義聯想的中文圖像搜索引擎——構想與實驗. 《現代圖書情報技術》. 2002: 3, p63-65. 合著.
[31]商業企業信息化的腳步. 《信息系統工程月刊》. 2002: 1, p6-7. 合著.
[32]政府信息公開與立法研究. 《情報學報》. 2001: 3, p276-281. 合著.
[33]知識管理與企業核心競爭力. 《中國信息導報》. 2001: 12, p8-9. 合著.
[34]中國網路咨詢的現狀和發展前景. 《慶祝中國科技信息事業創建45周年學術討論會》. 中國石化出版社, 2001年10月.
[35]網路信息檢索工具評價實驗. 《情報學報》. 2001: 6 & 8, p299-301, p430-434. 合著.
[36]企業競爭情報活動研究. 《情報學報》. 2001: 4, p174-179. 合著.
[37]信息化與數字鴻溝. 《現代信息技術》. 2000: 12, p84-86.
[38]現代咨詢機構的若干特徵. 《中國信息導報》. 2000: 9, p54-56. 合著.
[39]亞馬遜漂流——由亞馬遜的經營模式想到的. 《信息系統工程月刊》. 2000: 6, p16-17. 合著.
[40]信息主管如何駕馭信息. 《信息化建設》. 2000: 5, p25-27.
[41]電子商務活動中的隱私保護問題. 《中國信息導報》. 2000: 5, p56-57.
[42]情報學的發展觀. 《圖書情報知識》. 2000: 4, p2-4+9.
[43]從電子出版到數字出版. 《中國電子出版》. 2000: 3, p40-41.
[44]21世紀的電子信息服務體系. 《中國信息導報》. 2000: 1 & 2, p6-9, p10-12.
[45]信息主管：從信息管理到知識管理. CONDEX/China』 99 講演. 1999年3月.
[46]網際網路信息傳播中的管理問題及其對報刊的影響. 《中國新聞學院學報》. 1999: 2.
[47]對當前「知識經濟」宣傳的思考. 《科學決策》. 1998: 5, p20-21.
[48]CNII and State-owned Enterprises Reform. 第二屆信息基礎結構國際研討會論文, 1998年4月.
[49]企業需要高素質的CIO. 中國計算機報. 1998: 3.
[50]CIO的概念和歷史沿革. 中國計算機報. 1998: 1.
[51]淺議情報科學及其教育問題. 《情報科學》. 1998: 1, p12-15.
[52]信息高速公路的知識產權問題研究. 《廣州市信息服務業發展與管理研討會論文集》, 1997年10月. P82-91.
[53]總結經驗,深化改革,開創函授教育新局面. 《北京大學學報》（哲社版）（信息管理系五十周年專刊）. 1997年9月.
[54]立足於大信息觀念的專業教育改革. 《北京大學學報》（哲社版）（信息管理系五十周年專刊）. 1997年9月.
[55]科技傳播學的研究范圍和內容框架初探. 中國第二屆科技傳播暨中國科學社與中國近代科技傳播研討會論文, 1997年6月, 杭州.
[56]我國信息資源管理的政策立法研究. 《中國信息化法制建設研討會論文集》, 1997年3月. 合著.
[57]我國現行信息資源管理的政策與法律研究. 《科技與法律》. 1997: 1-3. 合著.
[58]國民經濟信息化政策立法的國際經驗研究. 《科技與法律》. 1997: 1-3. 合著.
[59]Effects of National Economy Informatization on Ecation. 信息資源與社會發展國際研討會論文, 1996年, 武昌.
[60]美國情報學會第58屆年會評述. 《高校社會科學研究與理論教學》. 1996: 3.
[61]科技傳播中的法律問題. 《科技傳播研究——首屆科技傳播研討會論文選》. 孫寶寅主編. 清華大學出版社, 1996年3月. 合著.
[62]九十年代的信息經濟學研究動態. 中國信息經濟學會1995年年會, 1995年, 北京.
[63]光碟技術及其應用進展. 《情報學年評》（第一卷）. 1995.
[64]多媒體技術和電子出版發展概況. 《電子出版》. 1995: 12, 1996: 1.
[65]基於超文本結構的後控詞表管理系統. 《情報學報》. 1995: 5. 合著.
[66]華語地區資料庫著作權法規研究. 《情報科學技術》. 1995: 4.
[67]中文全文資料庫開發與檢索技術. 《高校文獻信息》. 1995: 2. 合著.
[68]歐共體在資料庫版權保護方面的進展. 《情報學報》. 1995: 2. 合著.
[69]中國資料庫產業的知識產權保護. 《科技與法律》. 1995: 1. 合著.
[70]企業競爭情報體系的建立與發展. 全國競爭情報與企業發展研討會論文, 1994年9月, 北京. 合著.
[71]中小企業情報需求分析. 《情報理論與實踐》. 1994: 1. 合著.
[72]漢語自動標引加權方法實驗研究. 《第十屆全國計算機情報管理學術討論會會議文集》, 1993年10月. 合著.
[73]日本圖書館學情報學教育分析比較. 《中國圖書館學報》. 1993: 2.
[74]國外自動編目的理論研究和實踐探索. 《大學圖書館學報》. 1993: 1. 合著.
[75]中文圖書自動編目的初步構想. 《現代圖書情報技術》. 1993: 1. 合著.
[76]情報檢索詞彙的後控技術. 第九屆全國計算機情報管理學術討論會論文, 1992年10月, 浙江梅寧. 合著.
[77]An Outline of Automatic Cataloguing for Chinese Books. Paper to be presented
to International Symposium and Exhibition on the Latest Development in
Technologies of Library Service. Sep. 7-11, 1992, Beijing. With Ding Wei.
[78]情報檢索系統的詞彙控制技術. 《情報學報》. 1992: 2.
[79]Vocabulary Control Methods for Information Retrieval Systems. Paper to be presented to The 3rd Beijing International Symposium on Computerized Information Management, Oct. 14-18, 1991.
[80]關於敘詞法性能的探討. 《情報學刊》. 1991: 4. 合著.
[81]電子圖書館的構想與實現. 《情報科學技術》. 1991: 3.
[82]日本的資料庫產業. 《現代圖書情報技術》. 1991: 1.
[83]Development of the System of Automatic Indexing for Chinese Scientific & Technical Literature. In Database Development and Chinese Information Needs; Proceeding of the Second Beijing International Symposium on Computerized Information Retrieval. Ed. By Zeng Minzu, Aslib, London, 1990. P179-188.
[84]資料庫與光碟技術發展動向. 第八屆全國計算機情報管理學術討論會論文, 1990年10月, 長沙.
[85]CD-ROM的性質、應用與影響. 《現代圖書情報技術》. 1988: 1, p31-38.
[86]漢語科技文獻自動標引系統. 《情報學報》. 1987: 4, p277-284. 合著.
[87]標引深度及其優化. 《北京大學學報》（哲社版）. 1986: 4.
[88]情報咨詢服務. 《科技情報工作》. 1985: 10-11, p24-26, p24-25.
[89]國外兩大電視信息檢索系統. 《大學圖書館通訊》. 1985: 3, p21-25.
[90]新的情報技術之二——電視信息檢索系統. 《大學圖書館通訊》. 1985: 3, p34-37.
[91]新的情報技術——光學錄像盤和光碟技術. 《大學圖書館通訊》. 1985: 1, p25-28.
[92]評1945-1981年間美國聯邦政府有關二次情報系統與機構的政策（譯文）. 《圖書館學情報學參考資料》. 書目文獻出版社, 1984. 第4輯, p1-8.
[93]我國出版的科技文獻檢索刊物. 《科技情報工作》. 1984: 7, p29-32.
[94]著者索引和專用索引. 《科技情報工作》. 1983: 11, p25-26.
[95]引文索引. 《科技情報工作》. 1983: 10, p29-31.
[96]關鍵詞索引. 《科技情報工作》. 1983: 8, p33.
[97]後組式字順主題索引. 《科技情報工作》. 1983: 7, p29-32.
[98]先組式字順主題索引. 《科技情報工作》. 1983: 6, p29-32.
[99]檢索工具的索引. 《科技情報工作》. 1983: 5, p23-26.
[100]目錄性和題錄性檢索工具. 《科技情報工作》. 1983: 4, p28-31+27.
[101]文摘性檢索工具. 《科技情報工作》. 1983: 3, p28-31.
[102]文獻檢索與檢索工具. 《科技情報工作》. 1983: 2, p31-33.
[103]情報與文獻. 《科技情報工作》. 1980: 12, p17.
[104]關於情報學的范圍. 《科技情報工作》. 1980: 3, p31-33.

❷ 急急急～網路信息檢索方法與應用論文

我給你找了一篇，摘要如下：
隨著Internet在全世界范圍內迅猛發展，網上龐大的數字化信息和人們獲取信息之間的矛盾日益突出。因此，對網路信息的檢索技術及其發展趨勢進行探討和研究，是一個既迫切而又實用的課題。本文通過對網路信息檢索的基本原理、網路信息檢索的技術及工具、網路信息檢索的現狀等方面進行分析研究，並對網路信息檢索的發展趨勢進行了預測，旨在尋找提高網路信息檢索的手段和方法的有效途徑，並最終提高網路信息的檢索效果，使得網路信息資源得到充分有效地利用。
全文主要包括六個部分，
第一部分為網路信息檢索述評，主要是闡述了網路信息檢索所涉及到的有關概念，如信息檢索技術、網路信息檢索的特點及網路信息檢索效果評價。
第二部分重點討論了網路信息檢索的基本技術。如信息推拉技術、數據挖掘技術、信息過濾技術、自然語言處理技術等等，旨在弄清網路信息檢索的技術支撐，為預測網路信息檢索的發展趨勢作下鋪墊。
第三部分對網路信息檢索的重要工具——搜索引擎進行了闡述，主要從其檢索機制入手，分析了不同種類的搜索引擎的檢索特點及功能。其獨到之處在於對搜索引擎的基本功能進行了比較全面的概括，並對目前流行的搜索引擎進行科學的分類...
第四部分分析討論了檢索技術的另一分支—基於內容的檢索技術
第五部分則分析了網路信息搜索工具的局限，主要從文本信息檢索和多媒體信息檢索兩方面進行闡述。

好不容易給轉成 .txt文本，貼在下面：
1.1網路信息資源
網路信息資源是指「通過國際Intemet可以利用的各種信息資源」的總稱。
隨著Intemet的迅速發展，網上信息資源也以指數形式增加，網路信息資源作
為一種新型的信息資源，發揮著越來越重要的作用，其內容幾乎無所不包，涉
及政治、經濟、文化、科學、娛樂等各個方面;其媒體形式多種多樣，包括文
本、圖形、圖像、聲音、視頻等;其范圍覆蓋社會科學、自然科學、人文科學
和工程技術等各個領域。
1.2信息檢索技術
信息檢索技術是現代信息社會中非常關鍵的技術之一。信息檢索是指將信
息按一定的方式組織和存儲起來，並根據信息用戶的信息需求查找所需信息的
過程和技術，所以信息檢索的全稱又叫「信息存儲與檢索」。狹義的信息檢索
僅指從信息集合中找出所需信息的過程，也就是利用信息系統檢索工具查找所
需信息的過程。人們獲取信息源的方式主要有:①遵循傳統的檢索方法在浩如
煙海的圖書館資料中，通過人工查找索引找到對應的文獻索引號再獲取文獻原
文;②聯機信息檢索。這其中也存在一個發展過程，由檢索結果來看，從提供
目錄、文摘等相關的二次信息檢索到可以直接獲得電子版的全文;由檢索方法
來看，從對特定關鍵詞或者如作者、機構等輔助信息作為檢索入口的常規檢索
到以原始文獻中任意詞檢索的全文檢索等等。其中，全文檢索由於其包含信息
的原始性、信息檢索的徹底性、所用檢索語言的自然性等特點在近年來發展比
較迅速，成為深受人們關注的一種非常有效的信息檢索技術，它是從大容量文
檔庫中精確定位所需信息的最有效手段l3]。
.3.2web信息檢索
其檢索方式有:瀏覽器方式和搜索引擎方式。
(l)瀏覽器方式(Br，singsystelns)。只要能夠進入hitemct就能夠通過瀏
覽器，利用HTTP協議提供的WV乃萬服務，瀏覽認觸b頁面和通過W匕b頁面提
供的檢索方式訪問資料庫。
(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息檢
索服務的W七b站點，它是以一定的技術和策略在intemet中搜集和發現網路信
息，並對網路信息進行理解、提取和處理，建立資料庫，同時以認倪b形式提
供一個檢索界面，供用戶輸入檢索關鍵詞、片語或短語等檢索項，代替用戶在
資料庫中查找出與提問相匹配的記錄，同時返回結果且按相關度排序輸出，從
而起到快速查找信息的目的。搜索引擎所處理的信息資源主要包括萬維網服務
器上的信息，另外還包括電子郵件和新聞組信息。搜索引擎服務的宗旨是為滿
足用戶的信息需要，所以它是面向用戶的，採用的方式是互動式的。
網路信息檢索工具採用主動提交或自動搜索兩種方法搜索數據。
1.4網路信息檢索效果評價
目前，得到普遍認同的檢索效果的評價標准主要有以下幾個:查全率、查
准率、收錄范圍、輸出格式，其中以查全率和查准率最為重要。
現代信息科學技術的發展，為人們提供了多種多樣的信息獲取和傳送方法
及技術，從「信源」與「用戶」的關系來看，可分為兩種模式:「信息推送」
模式(InformationPush)，由「信源」主動將信息推送給「用戶」，如電台廣播;
「信息拉取」模式(InformationPull)，由「用戶」主動從「信源」中拉取信息，
如查詢資料庫。
2.2.1信息推送技術
「推」模式網路信息服務，是基於網路環境下的一種新的服務形式，即信
息服務者在網上利用「Push」技術為特定用戶開展信息服務的方式。Push技術
之所以成為Intemet上一項新興的技術，是因為藉助該技術使網路信息服務具
有主動性，不僅可以直接把用戶感興趣的信息推送給用戶，而且可有效地利用
網路資源，提高網路吞吐率;再者，Push技術還允許用戶與提供信息的伺服器
之間透明地進行通信，極大地方便了用戶。
所謂Push技術，又稱「推送」技術、Web廣播(Webeasting)技術，實質
上是一種軟體，這種軟體可以根據用戶定義的准則，自動搜集用戶最可能發生
興趣的信息，然後在適當的時候，將其傳遞至用戶指定的「地點」。因而從技
術上看，「推」模式網路信息服務就是具有一定智能性的、可以自動提供信息
服務的一組計算機軟體，該軟體不僅能夠了解、發現用戶的興趣(可能關心的
某些主題的信息)，還能夠主動從網上搜尋信息，並經過篩選、分類、排序，
然後按照每個用戶的特定要求，主動推送給用戶141。
(l)信息推送方式。信息推送方式分兩類，即網播方式和智能方式。
網播方式有:頻道式推送。頻道式網播技術是目前普遍採用的一種模式，
它將某些頁面定義為瀏覽器中的頻道，用戶可像選擇電視頻道那樣接受有興趣
的網播信息;郵件式推送，用電子郵件方式主動將所推送信息發布給各用戶，
如國際會議的通知、產品的廣告等:網頁式推送。在一個特定網頁內將所推送
信息發布給各用戶，如某企業、某組織、某個人的網頁;專用式推送。採用專
門的信息發送和接收軟體，信源將信息推送給專門用戶，如機密的點對點通信。
智能推送方式有:操作式推送(客戶推送式)，由客戶數據操作啟動信息
推送。當某客戶對數據進行操作時，把修改後的新數據存入資料庫後，即啟動
信息推送過程，將新數據推送給其他客戶;觸發式推送(伺服器推送式)，由
ll碩士學位論文
MASTER，5THESIS⑧
資料庫中的觸發器啟動信息推送過程，將新數據推送給其他客戶，當數據發生
變化，如出現增加(Insert)、刪除(Delete)、修改(update)操作時，觸發器
啟動信息推送過程。
(2)信息推送的特徵。信息推送的特徵有:主動性、針對性、智能性、高效
性·靈活性和綜合性I5]。
主動性。Push技術的核心就是服務方不需要客戶方的及時請求而主動地將
數據傳送到客戶方。因而，主動性是「推」模式網路信息服務最基本特徵之一。
這也是它與基於瀏覽器的「拉」(Pull)模式的被動服務的鮮明對比。
針對性(個性化)。針對性是說，Push技術可以針對用戶的特定信息需求
進行檢索、加工和推送，並根據用戶的特定信息需求為其提供個人定製的檢索
界面。
智能性。Push伺服器能夠根據用戶的要求自動搜集用戶感興趣的信息並定
期推送給用戶。甚至，Push技術中的「客戶代理(ClientAgent)」可以定期自
動對預定站點進行搜索，收集更新信息送回用戶。同時個人信息服務代理和主
題搜索代理還可為了提高「推送」的准確性，控制搜索的深度，過濾掉不必要
的信息，將認飛b站點的資源列表及其更新狀態配以客戶代理完成。因而，網
絡環境下的「推」模式信息服務具有較高的智能性。這也是傳統的定題服務
(SDI)不能比的。
高效性。高效性是網路環境下「推」模式信息服務的又一個重要特徵。Push
技術的應用可在網路空閑時啟動，有效地利用網路帶寬，比較適合傳送大數據
量的多媒體信息。
靈活性。靈活性是指用戶可以完全根據自己的方便和需要，靈活地設置連
接時間，通過E一mail、對話框、音頻、視頻等方式獲取網上特定信息資源。
綜合性。「推」模式網路信息服務的實現，不僅需要信息技術設備，而且
還依賴於搜尋軟體、分類標引軟體等多種技術的綜合[6]。
但在當前信息技術的發展階段，「推」技術還存在很大的缺陷，比如:不
能確保信息發送，沒有狀態跟蹤，缺乏群組管理功能等等。因此，國內外的研
究者們又提出超級推(BeyondPush)技術的理論。所謂超級推技術是在保留、繼
承、完善了Push的優點(主動傳遞和個性化定製)，摒棄了Push的諸多缺點之
!2碩士學位論文
MASTER，5THESIS管
後而發展起來的一種新型的Push技術。它的最大特點是在於保證傳送。即所
有的信息都是在特定的時間送給特定的信息用戶，同時保持連續性的用戶資
料，隨時可以知道誰收到了信息，信息是否為該用戶定製，用戶環境是否適當
等等[刀。
2.2.2信息拉取技術
常用的、典型的信息拉取技術，如資料庫查詢，是由用戶主動查詢資料庫，
從資料庫中拉取所需信息。其主要優點是:針對性好，用戶可針對自己的需求
有目的地去查詢、搜索所需的信息。
Intemet上的信息拉取技術可以說是資料庫查詢技術的擴展和延伸。在網
絡上，用戶面對的不止是一個資料庫，而是擁有海量信息的hitemet環境，因
此，各種網路信息拉取(查詢)的輔助工具—搜索引擎應運而生了。信息推送與信息拉取兩種模式各有其特點，在實際中常常是將兩者的結合
起來，常用的結合方式為:
(1)「先推後拉」式。先及時地推送最新信息(更新的動態信息)，再有針
對性地拉取所需的信息。這樣，便於用戶注意信息變化的新情況和趨勢，從而
動態地選取需要深入了解的信息。
(2)「先拉後推」式。用戶先拉取所需信息，然後根據用戶的興趣，再有針
對性地推送相關的其它信息。
(3)「推中有拉」式。在信息推送過程中，允許用戶隨時中斷、定格在所感
興趣的網頁上，作進一步的搜索，主動拉取更豐富的信息。
(4)「拉中有推」式。在用戶拉取信息的搜索過程中，根據用戶輸入的關鍵
詞，信源主動推送相關信息和最新信息。這樣既可以及時地、有針對性時為用
戶服務，又可以減輕網路的負擔，並便於擴大用戶范圍[8]。
因此，信息推送與信息拉取相結合是當前Intemet、資料庫系統及其它信
息系統為用戶提供主動信息服務的一個發展方向。
2.3Web挖掘技術
隨著功temet的發展，W己b已經成為人類社會的公共信息源。在hitemet
給人類帶來前所未有的信息機遇的同時，又使得人類的信息環境更加復雜，人碩士學位論文
MASTER，5THESIS⑧
類如何利用信息的問題非但沒有如預想的通過信息技術的發展得到圓滿的解
決，相反，隨著信息技術的發展，信息量的激增，造成了個人實際所需信息量
與研觸b上的海量信息之間的矛盾，因而也就造成了個人利用信息的困難。在
這種情況下，雖然出現了叭范b環境下的專門檢索工具，但是由於搜索引擎是
由傳統檢索技術發展而來，在當前用戶要求不斷提高的情況下，傳統的搜索技
術己經不能夠滿足人們的需要。為了更加有效地利用網路信息資源，W七b挖掘
作為新的知識挖掘的手段，為Web信息的利用提出了新的解決方案叨。
2.3，1姍eb挖掘的內容
數據挖掘就是從大量的、不完全的、有雜訊的、模糊的、隨機的數據中，
提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
Web挖掘則是從WWW及其相關的資源和行為中抽取有用的模式和隱含信息。其
中WWW及其相關資源是指存在於WWW之上的Web文檔及Web伺服器上的日誌文
件以及用戶資料，從Web挖掘的概念中應當看出Web挖掘在本質上是一種知識
發現的手段，它主要從下面3個方面進行仁』時。
(1)Web內容挖掘。W七b內容挖掘是從W匕b數據中抽取知識，以實現Web
資源的自動檢索，提高web數據的利用效率。隨著Intemet的進一步延伸，Web
數據越來越龐大，種類越來越繁多，數據的形式既有文本數據信息，也有圖像、
聲音、視頻等多媒體數據信息，既有來自於資料庫的結構化數據，也有用HTML
標記的半結構化數據及非結構化的自由文本數據信息。因而，對W己b內容信
息挖掘主要從下面兩個角度進行〔」]。
一是從信息檢索的角度，主要研究如何處理文本格式和超級鏈接文檔，這
些數據是非結構化或半結構化的。處理非結構化數據時，一般採用詞集方法，
用一組組詞條來表示非結構化的文本，先用信息評價技術對文本進行預處理，
然後採取相應的模型進行表示。另外，還可以用最大字序列長度、劃分段落、
概念分類、機器學習和自然語言統計等方法來表示文本。處理半結構化數據時，
可以利用一些相關演算法給超級鏈接分類，尋求認七b頁面關系，抽取規則。同
處理非結構化數據相比，由於半結構化數據增加了HTM毛標記信息及Web文
檔內部超鏈結構，使得表示半結構化數據的方法更加豐富。
二是從資料庫的角度，主要處理結構化的W匕b資料庫，也就是超級鏈接
14⑧蕊譽蕊
文檔，數據多採用帶權圖或者對象嵌入模型(OME)，或者關系資料庫表示，
應用一定的演算法，尋找出網站頁面之間的內在聯系，其主要目的是推導出Web
站點結構或者把W匕b變成一個資料庫，以便進行更好的信息管理和查詢。數
據庫管理一般分成三個方面:一是模型化，研究認觸b上的高級查詢語言，使
其不局限於關鍵字查詢;二是信息的集成與抽取，把每個W七b站點及其包裝
程序看成是一個認范b數據源，通過W七b數據倉庫(data~house)或虛擬W七b資料庫實現多種數據來源的集成;三是叭幾b站點的創建與重構，通過研
究web上的查詢語言來實現建立並維護web站點的途徑[』「]。
(2)札b結構挖掘。W匕b結構挖掘，主要指的是通過對W七b文檔的分析，從
文檔之間的組織結構獲取有用的模式。W匕b內容挖掘研究的是文檔內的關系，
W七b結構挖掘關注的則是網站中的超級鏈接結構之間的關系，找到隱藏在一個
個頁面之後的鏈接結構模型，可以用這個模型對W七b頁面重新分類，也可以
用於尋找相似的網站。
W七b結構挖掘處理的數據類型為W七b結構化的數據。結構化數據是描述
網頁內容組織方式的數據，頁內結構可以用超文本標記語言等表示成樹型結
構，此外頁間結構還可以用連接不同網頁的超鏈結構表示。文檔間的鏈接反映
了文檔信息間的某種聯系，如隸屬平行關系、引用與被引用關系等。對W七b
頁面的超級鏈接進行分類，可以判斷與識別頁面信息間的屬性關系。由於Web
頁面內部存在或多或少的結構信息，通過研究W亡b頁面內部結構，可尋找出
與用戶選定的頁面集合信息相關的其它頁面信息模式，以檢測W己b站點所展
示的信息完整程度。
③Web行為挖掘。所謂W己b用戶行為挖掘主要是通過對認尼b伺服器的日
志文件以及用戶信息的分析，從而獲得有關用戶的有用模式。W七b行為挖掘的
數據信息主要指網路日誌中包括的用戶行為模式，它包括檢索時間、檢索詞、
檢索路徑、檢索結果以及對哪些檢索結果進行了瀏覽。由於W七b自身的異質、
分布、動態、無統一結構等特點，使得在認七b網上進行內容挖掘比較困難，
它需要在人工智慧和自然語言理解等方面有所突破。所幸的是基於W七b服務
器的109日誌存在著完整的結構，當信息用戶訪問web站點時，與訪問相關的
頁面、時間、用戶ro等信息，日誌中都作了相應的記錄，因而對其進行信息
l5碩士學位論文
MASTER，5THESIS⑥
挖掘是可行的，也是有意義的。在技術實踐過程中，一般先把日誌中的數據映
射成諸種關系信息，並對其進行預處理，包括清除與挖掘不相關的信息等。為
了提高性能，目前對109日誌數據信息挖掘採用的方法有路徑分析、關聯規則、
模式發現、聚類分析等。為了提高精確度，行為挖掘也應用到站點結構信息和
頁面內容信息等方面。
2.3.2web挖掘技術在網路信息檢索中的應用
(l)Web內容挖掘在檢索中的應用。W匕b內容挖掘是指從文檔內容及其描述
中獲取知識的過程，由於用傳統的信息檢索技術對W己b文檔的處理不夠深入，
因此，可以利用叭觸b內容挖掘技術來對網路信息檢索中的W己b文檔處理部分
進行進一步的完善，具體而言表現在以下幾個方面。
①文本總結技術。文本總結技術是指從文檔中抽取出關鍵信息，然後以簡
潔的形式對W匕b文檔的信息進行摘要或表示。這樣用戶通過瀏覽這些關鍵信
息，就可以對W七b網頁的信息有大致的了解，決定其相關性並對其進行取捨。
②文本分類技術。W匕b內容挖掘中的文本分類指的是按照預先定義的主題
類別，利用計算機自動為文檔集合中的每一個文檔進行分類。分類在網路信息
檢索中的價值在於可以縮小檢索范圍，大大提高查准率。目前，己經出現了很
多文本分類技術，如TFIFF演算法等，由於文本挖掘與搜索引擎所處理的文本幾
乎完全一樣，所以可以直接將文本分類技術應用於搜索引擎的自動分類之中，
通過對大量頁面自動、快速、有效的分類，來提高文檔檢索的查准率。
③文本聚類技術。文本聚類與文本分類的過程J險洽相反，文本聚類指的是
將文檔集合中的文檔分為更小的簇，要求同一簇內的文檔之間的相似性盡可能
大，而簇與簇之間的關系盡可能小，這些簇相當於分類表中的類目。文本聚類
技術不需要預先定義好的主題類別，從而使得搜索引擎的類目能夠與所收集的
信息相適應。文本聚類技術與人工分類相比，它的分類更加迅速、客觀。同時，
文本聚類可與文本分類技術相結合，使得信息處理更加方便。可以對檢索結果
進行分類，並將相似的結果集中在一起。
(2)Web結構挖掘在網路信息檢索中的應用。W匕b的信息組織方式採用了一
種非平面結構，一般來說W己b的信息組織方式是根據內容來進行組織的。但
是由於W匕b的這些結構信息比較難以處理，所以搜索引擎一般不處理這些信
16碩士學位論文
MASTER，S竹正515⑧
息，而是將叭觸b頁面作為平面機構的文本進行處理。但是，在從觸b結構挖掘
中，通過對研觸b文檔組織結構的挖掘，搜索引擎可以進一步擴展搜索引擎的
檢索能力，改善檢索效果〔』3]。
(3)脆b行為挖掘在網路信息檢索中的應用。認觸b行為挖掘是一種通過挖掘
總結出用戶的檢索行為的模式。用戶的檢索行為一直是信息檢索中重要的研究
內容，通過研觸b行為挖掘，不僅可以發現多數用戶潛在共同的行為模式，而
且還可以發現單個用戶的個性化行為，對這些模式進行研究，可以更好地對搜
索引擎的檢索效果進行反饋，以便進一步改進搜索策略，提高檢索效果。
2.3.3web挖掘技術的局限及方向
(1)孔b內容挖掘。W七b上的數據不管是用HTML還是XML標記語言表示，
都不能完全解決W七b數據的非結構性問題，特別是漢語句子格式繁多，虛詞、
實詞沒有絕對的界限，切分詞難度大，這些是造成無法對數據進行完全自動標
引的根本性問題，因此，從七b內容挖掘技術有必要結合數據倉庫等信息技術進
行信息存儲，並最終實現智能化、自動化的數據表示和標引，以供搜索之用。
通常數據的表示和數據的利用形式是相互關聯的，因此，設計相應的具有高查
全率和查准率的挖掘演算法也和數據表示一樣是未來的方向之一。另外多媒體數
據如何進行識別分類標引，這也是未來的研幾b內容挖掘研究的難點和方向。
(2)梅b結構數據挖掘。隨著Intemet的迅猛發展，網站的內容也越來越豐
富，結構也越來越龐雜，用有向圖表示巨型網站鏈接結構將不能滿足數據處理
的需要，需要設計新的數據結構來表示網站結構。
由於用來作對比分析發現問題所在的用戶使用信息只有日誌流，那麼，對
用戶使用日誌流中每一鏈接關系如何識別、採用什麼結構表示、如何抽取有用
的模式等等，不僅是認飛b行為挖掘的重要研究內容也是網站結構挖掘的重要
研究方向之一。
(3)，eb用戶行為挖掘。由於Iniemet傳輸協議HTTP的無狀態性，客戶端、
代理伺服器端緩存的存在，使用戶訪問日誌分別存在於伺服器、代理伺服器和
客戶端，因此，從W七b用戶訪問日誌中研究用戶訪問規律最大的難點在於如
何把分布於不同位置的訪問日誌經過預處理，形成一個個用戶一次的訪問期
間。通常來講，對於靜態W七b網站，伺服器端的日誌容易取得，客戶端和代
l7理伺服器用戶訪問日誌不容易取得;其次，由於一個完整的W匕b是由一個個
圖片和框架頁面組成的，而用戶訪問伺服器也有並發性，在確定用戶訪問內容
時，必須從伺服器日誌中甄選出某個用戶實際請求的頁面和頁面的主要內容。
另外，由於目前已經有的數據挖掘演算法主要是在大量交易數據基礎上發展起來
的，在處理海量Web用戶訪問日誌中也需要重新設計演算法結構〔』41。
2.4信息過濾技術
hitemet開放式的環境，為人們檢索和利用信息提供了極大的方便，但同
時，網路環境也為人們及時准確地檢索到所需信息帶來了麻煩。這是因為，第
一，網路環境中信息的來源復雜多樣，隨意性大，任何人、任何單位不管其背
景和動機如何都可以在網路上發布信息，信息的產生和傳播沒有經過篩選和審
定，因此信息的可靠性、質量和價值成為用戶普遍擔心的一大問題;第二，目
前大多數據搜索工具的檢索范圍是綜合性的，它們的Robots盡可能地把各種
網頁抓回來，經過簡單加工後存放在資料庫中備檢;第三，搜索引擎直接提供
給用戶的檢索途徑大都是基於關鍵詞的布爾邏輯匹配，返回給用戶的就是所有
包括關鍵詞的文獻，這樣的檢索結果在數量上遠遠超出了用戶的吸收和使用能
力，讓人感到束手無策。這就是人們經常談論的「信息過載」、「信息超載」現
象。信息過濾技術就是在這樣的背景下開始受到人們的重視，它的目的就是讓
搜索引擎具有更多的「智力」，讓搜索引擎能夠更加深入、更加細致地參與到
用戶的整個檢索過程中，從關鍵詞的選擇、檢索范圍的確定到檢索結果的精煉，
幫助用戶在浩如煙海的信息中找到和需求真正相關的資料。
2.4.1信息過濾模型
信息過濾其實質仍是一種信息檢索技術，因此它仍依託於某一信息檢索模
型，不同的檢索模型有不同的過濾方法。51。
(1)利用布爾邏輯模型進行過濾。布爾模型是一種簡單的檢索模型。在檢索
中，它以文獻中是否包含關鍵詞來作為取捨標准，因此，它不需要對網頁數據
進行深度的加工。最簡單的關鍵詞表可以設計成只有三個欄位:關鍵詞、包括
關鍵詞的文獻號、關鍵詞在相應文獻中出現的次數。檢索時，用戶提交關鍵詞

……………………………………
太長發不全希望對你有用實在不行聯系我（給我留言）我發給你郵箱。

❸ 網路信息檢索的現狀與發展

網路信息檢索的現狀與發展
1990年以前，網路信息檢索的現狀與發展沒有任何人能夠檢索互聯網上的信息。應該說，所有的網路信息檢索工具都是從1990年的Alan Emtage等人發明的Archie開始的，雖然它當時只可以實現簡單意義上的FTP文件檢索。隨著World Wide Web的出現和發展，基於網頁的信息檢索工具出現並迅速發展起來。1995年基於網路信息檢索工具本身的檢索工具元搜索引擎由美國華盛頓大學的Eric Selberg 等發明。伴隨著網路技術的發展，網路信息檢索工具也取得了十足的發展，那麼這些檢索工具的現狀和發展趨勢如何呢？本文將試作以探討。

1.基於網頁的網路信息檢索工具的現狀和發展趨勢

1.1現狀。網頁是網際網路的最主要的組成部份，也是人們獲取網路信息的最主要的來源，為了方便人們在大量繁雜的網頁中找尋自己需要的信息，這類檢索工具發展的最快。一般認為，基於網頁的信息檢索工具主要有網頁搜索引擎和網路分類目錄兩種。網頁搜索引擎是通過「網路蜘蛛」等網頁自動搜尋軟體搜索到網頁，然後自動給網頁上的某些或全部字元做上索引，形成目標摘要格式文件以及網路可訪問的資料庫，供人們檢索網路信息的檢索工具。網路目錄則是和搜索引擎完全不同，它不會將整個網路中每個網站的所有頁面都放進去，而是由專業人員謹慎地選擇網站的首頁，將其放入相應的類目中。網路目錄的信息量要比搜索引擎少得多，再加上不同的網路目錄分類標准有些混亂，不便人們使用，因此雖然它標引質量比較高，利用它的人還是要比利用搜索引擎的人少的多。

但是由於網路信息的復雜性和網路檢索技術的限制，這類檢索工具也有著明顯的不足。（1）隨著網頁數量的迅猛增加,人工無法對其進行有效的分類、索引和利用。網路用戶面對的是數量巨大的未組織信息，簡單的關鍵詞搜索,返回的信息數量之大,讓用戶無法承受。（2）信息有用性評價困難。一些站點在網頁中大量重復某些關鍵字,使得容易被某些著名的搜索引擎選中，以期藉此提高站點的地位,但事實上卻可能沒有提供任何對用戶有價值的信息。（3）網路信息日新月異的變更,人們總是期望挑出最新的信息。然而網路信息時刻變動,實時搜索幾乎不可能，就是剛剛瀏覽過的網頁,也隨時都有更新、過期、刪除的可能。

1.2發展趨勢。網路信息檢索工具的發展主要體現在進一步改進、完善檢索工具和檢索技術，以提高檢索服務質量，改變網路信息檢索不盡如意的地方。主要體現在以下幾個方面：

1.21網路檢索工具開發提供商之間合作越來越緊密。過去一般網路檢索工具提供商只依靠自己建立的資料庫來提供檢索服務，檢索范圍有限，而現在某些著名的搜索引擎在購買其他公司的資料庫或者技術內核，有的與其他搜索引擎建立夥伴關系，以便用戶使用。比如著名雅虎現在採用的是Google的搜索內核，網易也曾經使用Google的搜索內核技術來豐富自己的搜索引擎資料庫，矽谷動力、廣州視窗、新浪、搜狐、Chinaren、21cn、263、Tom等搜索引擎使用融合了網路的搜索內核技術等等。

1.22信息檢索工具專業化及服務內容深化。一些檢索工具已經不再盲目追求加大收錄和標引量，而更加註重突出專業特色。在lycos搜索引擎目錄中，我們可以看到商業搜索引擎、IT搜索引擎、人才搜索引擎、金融搜索引擎、醫學搜索引擎等專業化的網路信息檢索紛紛出現，信息檢索工具的專業化已經成為一種不可逆轉的趨勢。信息檢索服務商將服務更加深化：Google推出了網頁引文查詢服務，通過它可以查看自己所要查詢的資料被其他網站引用的情況，從而使用戶更好的把握網頁信息的質量；2003年8月，第三代中文搜索引擎慧聰問世，它則集「廣泛的地域搜索」、「強大的行業搜索」、「完美的MP3、Flash搜索」眾多搜索功能為一體，還開發了「針對內容的相關性查詢」和「符合漢語特性的模糊查詢」，可以實現漢語拼音查詢和同音詞糾錯。

1.23網路信息工具智能化的發展趨勢：（1）信息檢索工具的智能化首先是網路蜘蛛的智能化。針對網路信息的動態更替性，網路蜘蛛通過啟發式學習採取最有效的搜索策略,選擇最佳時機獲取從Internet上自動收集、整理的信息。網路蜘蛛能在網路的任何地方工作,能盡可能地挖掘和獲得信息。網路蜘蛛還要有網頁跟蹤監測功能，如果網頁出現更新、刪除等情況要及時在資料庫中更新。網路蜘蛛具有跨平台工作和處理多種混合文檔結構的能力。（2）其次是檢索軟體的智能化。現在主要有智能搜索引擎、智能瀏覽器、智能代理。這些網路檢索工具都非常重視開發實現基於自然語言形式的輸入，檢索者可以將自己的檢索提問以及所習慣的短語、片語甚至句子等自然語言的形式輸入，智能化的檢索軟體將能夠自動分析，而後形成檢索策略進行檢索。比如現在的網路搜索可以在你輸入關鍵詞以後，不斷提供一些相近的關鍵詞供你選擇，直至找到你所需要的結果。Google則藉助於機器翻譯技術，將一種自然語言轉變成另外一種自然語言，使用戶能夠使用母語搜索非母語的網頁，並以母語瀏覽搜索結果。尤里卡、問一問、和國外的ASK Jeeves則通過語義技術和檢索技術的結合，可是實現檢索工具對搜索詞在語義層次上的理解，為用戶提供最准確地檢索服務。

2.基於FTP文件的搜索工具。

2.1現狀。如前所述，搜索引擎的雛形以及最早的搜索引擎都是基於FTP文件搜索的。最早的FTP搜索引擎是基於文本顯示的Archie。後來由於WEB的出現，FTP搜索引擎發展受到了一定的影響。直到基於WEB的FTP搜索引擎出現，它才越來越多受到人們的歡迎，用戶量也在迅速上升，重要性也日漸顯現出來。FTP搜索引擎的功能是搜集匿名FTP伺服器提供的目錄列表並向用戶提供文件信息的查詢服務。目前，國內做的最好的、規模最大的當屬天網FTP文件搜索引擎，現在可以搜索2400萬個文件（數據來源於天網主頁），2002年時的統計日訪問量是40萬次，這在世界FTP搜索引擎界也算是一個佼佼者。另外國內還有清華9#搜索引擎、西安交大思源搜索、華南木棉搜索引擎、網路指南針、中科大天狼搜索引擎以及南京理工的「一網打盡」搜索引擎等等，國外的有Philes.com、AlltheWeb.com、Filesearching.com、souborak.com和ftpfind.com等，其中ftpfind.com是目前國外最先進的，支持包括站點快照和文件分類等新興功能，而且文件數據量非常大。

近幾年來，雖然FTP搜索引擎技術發展的很快，但相對WWW搜索引擎而言，FTP搜索引擎為數不多，技術上也還不十分成熟，還有很多需要改進的地方：（1）FTP搜索引擎的收錄數量還比較少，搜索引擎的規模和質量還是要取決於其維護的信息量。據統計，全球匿名FTP服務提供的文件條目已經有數億條，即便是目前規模最大的Philes.com，據陳華、李曉明2002年7月份統計也只有209，698，206 個文件。（2）檢索功能還不完善。檢索功能是一個搜索引擎最重要的部分，有很多搜索引擎還不能支持「and」和「or」等簡單的布爾檢索，使得資料庫中的文件不能被檢索到。（3）FTP伺服器本身特點決定了FTP搜索引擎弱點，即由於FTP伺服器有開放時間、有的還限制IP地址、有的限制登陸的用戶量、不同的伺服器設立的聯接埠號並不相同等決定了其搜索到的結果有一部分是不能訪問的，大大降低了用戶的滿意度。

2.2發展趨勢。正如前文所述，FTP文件搜索引擎技術還不是很成熟，但其發展非常迅速，其發展趨勢主要表現在以下幾個方面：（1）檢索功能日益豐富。天網FTP文件搜索引擎現在可以實現以文件大小、文件的上傳日期、以及網段（比如說是華北網、華東網等）等多個條件的高級檢索來限制檢索結果；AlltheWeb.com增加了檢索方式（規則表達檢索、准確檢索、瀏覽、對大小寫敏感與否等等），限制主機（是e還是gov或者com等），文件類型以及文件大小、日期等功能。（2）檢索服務的個性化。現在FTP搜索引擎研究者已經開始注意這一方面，天網ftp搜索引擎已經有了很多可以個性化的選項：可以設置用戶不同偏好的排序方式，可以設定國外文件優先還是本國文件優先，對於國外用戶是不是應該國外文件優先，是FTP上文件優先還是WWW上的文件優先，是選擇中文的還是英文的等等。AlltheWeb.com則是可以完成更豐富的個性化設置，比如說可以選擇一個主機提供一個結果、設置語言、搜索的文件大小設置、是否亮度顯示搜索關鍵詞、設置使用者語言、以及鍵盤快捷鍵等等。

3.基於網路檢索工具的檢索技術的現狀和發展趨勢。

3.1隨著網上信息資源的膨脹發展，一種搜索引擎，無論它多麼完善都不可能滿足一個人所有的檢索需求。如果遇到文獻普查、專題查詢、新聞調查與溯源、軟體及MP3下載地址搜索等情況，人們就更需要使用多種搜索引擎來比較、篩選和相互印證。為解決逐一登陸各搜索引擎，在各搜索引擎中分別多次輸入同一檢索請求（檢索字串）等煩瑣操作，基於網路檢索工具的檢索工具產生了。

目前這列檢索工具只要有兩種：集成搜索引擎和元搜索引擎。所謂集成搜索引擎是在一個檢索界面上鏈接若干種獨立的搜索引擎，檢索時，一次檢索輸入，可以指定搜索引擎也可以要求多個引擎同時檢索，搜索結果由各搜索引擎分別以不同頁面提交的網路檢索工具，其實是利用網站鏈接技術形成的搜索引擎集合。集成搜索引擎製作與維護技術簡單，可隨時對所鏈接的搜索引擎進行增刪調整和及時更新，尤其大規模專業（如FLASH、MP3等）搜索引擎集成鏈接，深受特定用戶群歡迎。如國內天網搜霸和網路搜霸，國外比較著名的有「搜索之家」（http://so.web165.com/）、「網際瑞士軍刀」（http://free.okey.net/~free/search1.htm）等。另一個是元搜索引擎，用戶只需遞交一次檢索請求，由元搜索引擎負責轉換處理後提交給多個預先選定的獨立搜索引擎，並將所有查詢結果集中起來以整體統一的格式呈現到用戶面前。國外比較著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle（以上五個為2002年度的最佳元搜索引擎）等。目前國內現在還沒有見到真正意義上的元搜索引擎。元搜索引擎雖沒有網頁搜尋機制，亦無獨立的索引資料庫，但在檢索請求提交、檢索介面代理和檢索結果顯示等方面，均有自己研發的特色元搜索技術支持。目前元搜索引擎技術主要有並行處理式和串列處理式兩大類。並行式元搜索引擎運行時是將查詢請求同時發向各個獨立搜索引擎，然後將的結果按特定的順序呈現給用戶；串列式元搜索引擎運行時是將查詢請求先發向某個獨立搜索引擎，待其返回結果後再將請求發往另一個獨立搜索引擎。

從第一個元搜索引擎Metacrawler誕生至今，這一新型的網路檢索工具異軍突起，發展迅速，目前可用的元搜索引擎已近百種。由於元搜索引擎的功能受著源搜索引擎和元搜索技術的雙重製約，元搜索引擎比較理想的並不多見。信息檢索專家邢志宇將元搜索引擎存在的問題歸納如下：（1）大多元搜索引擎不支持多語種，尤其是漢語檢索；（2）一些元搜索引擎實現檢索語法轉換的能力有限，不支持指定欄位檢索，不能充分發揮各個獨立搜索引擎的高級檢索功能；（3）部分元搜索引擎無源搜索引擎列表，用戶不能自主選擇和調用源搜索引擎；（4）大部分元搜索引擎僅支持調用AltaVista、Excite、GoTo．com、Yahoo！、Infoseek、Lycos等常用的搜索引擎，一些大型搜索引擎如NorthernLight、HotBot等被排除在外，人為地限制了搜索資源的利用；（5）在檢索結果上，元搜索引擎只能返回十幾、數十條「相關度」較高的結果，大量可能有價值的源搜索引擎的檢索結果被忽視，影響檢索結果的全面性。

3.2發展趨勢。這類檢索工具的發展趨勢主要表現在下面幾個方面：（1）檢索結果整理的深化。如Vivisimo、EZ2WWW、MetaCrawler等可以實現搜索結果的自動分類，用戶即可以利用傳統的方式瀏覽結果，也可以利用其同屏的分類結果提示找尋自己需要的內容。EZ2WWW高級搜索功能提供1000多種專項資源檢索，可進行目錄檢索。SurfWax有一個其它元搜索引擎沒有的獨特功能，即點擊每條結果左邊的「網址撳鈕」圖標，可瀏覽該結果包括的任何頁面，並顯示搜索語句在文件中的位置，也可以把搜索結果和文件存儲起來以備後用。天網搜霸已經擁有了獨特的鏈接檢測功能，在幾秒鍾內檢查當前頁面查詢結果是否可以訪問,如果為標注綠色，則鏈接可連通(目前僅檢測頁面內以http://和ftp://開頭的鏈接)（2）檢索界面的個性化趨勢。天網搜霸和Google提供了IE瀏覽器的插件，安裝後就會被嵌到IE的工具欄，用戶不用登陸天網的主頁，就可以實現檢索。用戶可以將自己喜歡的搜索引擎設置為主要搜索，也可以添加用戶自己喜歡的搜索引擎。天網搜霸不久前剛剛推出了可以嵌在Windows系統任務欄上的插件，現在用戶連打開IE瀏覽器都不需要了。Mamma可以選擇使用短語檢索功能、設定檢索時間、設定每頁可顯示記錄數，還提供了專門檢索頁面文件標題的特殊檢索服務，以及通過E－mail傳輸檢索結果的特色功能。MetaCrawler可以實現搜索引擎的選擇調用，基於域名、地區或國家的檢索結果過濾，最長檢索時間設置，每頁可顯示的和允許每個搜索引擎返回的檢索結果數量的設定，設定檢索結果排序依據（包括相關度、域名、源搜索引擎）個性化定製保存。（3）智能化。ProFusion可以自動實現符合特殊檢索語法要求的轉換，如在調用Excite、InfoSeek、WebCrawler時將「NEAR」轉換成「AND」，在調用GoTo、Yahoo時將「NOT」刪除等；Mamma也支持常用檢索語法在不同搜索引擎中的轉換；C4可以支持自然語言檢索，雖然它沒有自己的資料庫，卻可以提供網上的檢索結果。

❹ 國內外有哪些關於web安全的開發和研究，現水平如何

web安全是未來主要的被攻擊對象，占安全威脅35%以上，目前最先進的技術是 AI Security 使用人工湖智能的方式去防禦不知道或已經知道的安全威脅，這方面國內只有兩家企業有這塊核心的技術，分別是：網路安全與中雲網安。為甚麼要用人工智慧去抵禦攻擊，不是人工智慧有多先進，而是黑客行為已經在使用 AI 人工智慧的方式在製造傳統無法抵禦與方法在攻擊比以往成百倍計算能力的攻擊行為，所有一切傳統的安全防範只要一擊必垮，所以，只有一物治一物，必須對症下葯才能防護得住。

❺ 求一篇信息檢索的論文,字越多越好~

四、智能檢索
智能檢索利用分詞詞典、同義詞典，同音詞典改善檢索效果，比如用戶查詢「計算機」，與「電腦」相關的信息也能檢索出來；進一步還可在知識層面或者說概念層面上輔助查詢，通過主題詞典、上下位詞典、相關同級詞典，形成一個知識體系或概念網路，給予用戶智能知識提示，最終幫助用戶獲得最佳的檢索效果，比如用戶可以進一步縮小查詢范圍至「微機」、「伺服器」或擴大查詢至「信息技術」或查詢相關的「電子技術」、「軟體」、「計算機應用」等范疇。另外，智能檢索還包括歧義信息和檢索處理，如「蘋果」，究竟是指水果還是電腦品牌，「華人」與「中華人民共和國」的區分，將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關性反饋等技術結合處理，高效、准確地反饋給用戶最需要的信息。

五、計算機信息檢索隨著1946年世界上第一台電子計算機問世，計算機技術逐步走進信息檢索領域，並與信息檢索理論緊密結合起來；離線批量情報檢索系統、聯機實時睛報檢索系統相繼研製成功並商業化，20世紀60年代到80年代，在信息處理技術、通訊技術、計算機和資料庫技術的推動下，信息檢索在教育、軍事和商業等各領域高速發展，得到了廣泛的應用。DiMog國際聯機情報檢索系統是這一時期的信息檢索領域的代表，至今仍是世界上最著名的系統之一。在單語言檢索中，計算機檢索系統利用網路蜘蛛進行網路信息的收集，然後利用自動標引技術對搜集的信息進行標引形成索引信息庫。用戶輸入檢索式後，計算機把檢索式與資料庫中索引項進行匹配，按索引式與標引項相關性大小降序輸出檢索結果。跨語言檢索中，只要在檢索過程中加入語言處理技術，就可以使一種語言與其他語言對應。信息檢索是經濟生活和科學研究的一個重要組成部分，尤其在今天這個飛速發展的信息時代，如何廣泛、快速、准確地獲取對自己有價值的信息，特別是如何藉助電子化、網路化的手段去獲取有價值的信息，直接影響到教學、科研等工作的成敗。因此信息檢索的方法和技能，越來越成為現代科技工作者和教師所必備的基本技能。目前，計算機信息檢索已成為廣大用戶獲取信息的主要方式，而且呈現出聯機信息檢索、光碟信息檢索以及網際網路信息檢索多元並存的信息檢索格局。如何快速、准確及有效地檢索到所需信息，已成為日益突出的問題，那麼，了解各信息檢索系統的特點是實施信息檢索最基本的前提。下面就其三種計算機信息檢索系統作一介紹。
1．聯機信息檢索系統。所謂聯機信息檢索，是指信息用戶利用終端設備，通過國際通訊網路與世界上的信息檢索系統，進行直接的人機對話，從檢索系統的資料庫中查找出用戶所需信息的全過程。一個聯機信息檢索系統，通常由檢索服務機構、國際通訊網路和終端組成。
2．光碟信息檢索系統。光碟信息檢索系統是單機信息檢索系統的一種，它解決了單機檢索系統數據存儲量少的缺點，是目前應用較為廣泛的一種計算機信息檢索系統。在信息檢索領域應用的光碟主要是只讀光碟。
3．網際網路信息檢索。作為用戶最多、影響最大的計算機網路，網際網路堪稱世界上資源最豐富的信息庫和文檔資料庫，幾乎能滿足全球范圍內對任何信息的需求。網際網路信息檢索系統一般由計算機伺服器、通信網路、通信協議。網路信息檢索伺服器、用戶終端等構成。

六、網路信息檢索網路信息檢索簡單地10說就是網路環境下的信息檢索。它與傳統信息環境下的檢索有很大的不同，網路信息檢索具有多樣性、靈活性也超出了傳統的信息檢索。原來傳統途徑可獲得的信息，現在幾乎全部可以通過網路檢索得到，而且更快、更新、更准確。隨著計算機、多媒體和現代通訊技術的飛速發展，以印刷型文獻為主的學校圖書館開始向以電子信息和虛擬信息為主的數字圖書館轉化，Internet創造了豐富和多元化的學習資源，實現了資源共享。
隨著學習社會化、終身學習體系的誕生和進一步推進，網路在中小學教育中的應用也日益廣泛和深入起來。Internet為我們帶來了豐富的學校綜合教育信息資源，它是提供Internet上的可用於學校綜合教育過程的，在學校教育系統中傳遞的信息。近幾年，Internet的發展使信息採集、傳播和利用無論是從規模還是速度都達到了空前的水平。信息內容涉及廣泛，幾乎包括工農業生產、科技、教育、文化藝術、商業、資訊、娛樂休閑等諸多方面。在Intemet上，購物、在線教育、在線股市、遠程醫療、點播電影、網路會議、網路展覽都已變成現實，成為人類技術和文明的巨大財富，是全球取之不盡，用之不竭的信息資源基地。豐富信息資源帶到人們面前的同時，也帶來了問題：人們在蘊含豐富的信息面前無所適從，在浩如煙海的信息海洋中迅速、准確獲取自己最需要的信息，變得十分困難。因此，20世紀90年代中期出現了檢索萬維網信息資源的搜索引擎技術。萬維網是目前網際網路上最受歡迎的檢索服務系統，它利用超鏈接技術將全球的信息資源連接起來，用戶通過瀏覽器就可以實現對網站頁面的訪問。
21世紀是一個高度信息化的社會，信息就是商品、信息就是財富、信息就是資源、信息就是機會，因此人人都渴望及時獲得有用的信息。如果說搜集信息是人類賴以生存、發展的一種本能，那麼信息檢索則是每個大學生和科研人員必須具備的一種基本技能。在計算機、網路通信技術日新月異，互聯網遍及世界各個角落的今天，我們正身置於廣袤無垠的信息海洋中。面對這樣一個新知識、新技術不斷涌現、知識新陳代謝頻繁的世界，想要一勞永逸地獲取知識是不可能的。我們只有終身學習，不斷地獲取、更新知識，才能不被社會所淘汰。要有效、快速地獲取和利用最新信息，就必須掌握信息檢索的技能。大學生在校求學期間所獲得的不應該僅僅是「黃金」，更重要的是應獲得「點金術」，其中之一就是信息檢索的能力。通過檢索和利用各種信息，不僅可以深化所學的知識；而且可以開闊視野，拓寬知識面；也為自學前人的知識、不斷更新知識以及從事科學研究和發明創造奠定基礎。

❻ 網路信息檢索及其發展趨勢是什麼

一、智能化

智能化是網路信息檢索未來主要的發展方向。智能檢索是基於自然語言的檢索形式，機器根據用戶所提供的以自然語言表述的檢索要求進行分析，而後形成檢索策略進行搜索。用戶所需要做的僅僅是告訴計算機想做什麼，至於怎樣實現則無須人工干預，這意味著用戶將徹底從繁瑣的規則中解脫出來。近幾年來，智能信息檢索(intelligent information retrieval)作為人工智慧(AI)的一個獨立研究分支得到了迅速發展。在Internet技術迅速普及的今天，面向Internet的信息獲取與精化技術已成為當代計算機科學與技術領域中迫切需要研究的課題，將人工智慧技術應用於這一領域是人工智慧走向應用的一種新的契機與突破口。

二、可視化

可視化(visualization)的歷史可以追溯到2400多年前。哲學家柏拉圖指出，我們通過看來識別物體。據統計，人獲取信息有70％一80％靠視覺，20％靠聽覺，10％靠觸覺。用圖像(visual)取代文字幫助人們檢索的優點在於：圖像的表達方式生動、形象、准確、效率更高，能從多角度揭示，而純文字的表達方式是模糊、一維的。

三、簡單化

未來家用電腦將朝著智能化、網路化、人性化和綠色環保的方向發展；操作系統的用戶友好性將不斷增強，如微軟和蘋果公司都在致力於操作系統網路化研究，以便使其中的任一應用程序都能「連接」進行「網路檢索」，並與網路「交互」；各搜索引擎檢索界面更加「傻瓜化」。使用戶學習和進行網路信息檢索更加容易；網上自動標引、自動文摘、自動跟蹤、自動漫遊、機器翻譯、多媒體技術、動態鏈技術、數據挖掘和信息推拉等技術逐步發展、完善，會越來越方便用戶及時准確地檢索信息。這些硬體與軟體技術的發展都有利於網路信息檢索的簡單化。

四、多樣化

多樣化首先表現在可以檢索的信息形態多樣化，如文本、聲音、圖像、動畫。目前網路信息檢索的主體是文本信息，基於內容的檢索技術和語音識別技術的發展，將使多媒體信息的檢索變得逐漸普遍。

多樣化的第二個表現是檢索工具向多國化、多語種化方向發展。網路的迅速發展，使得整個世界變成了地球村，世界各地上網人數的不斷增多，使得英語已無法滿足所有用戶的需要，語言障礙越來越明顯。

多樣化的第三個表現是網上檢索工具的服務多元化。網上檢索工具已不僅僅是單純的檢索工具，正在向其他服務范疇擴展，提供站點評論、天氣預報、新聞報道、股票點評、各種黃頁(如電話號碼)、航班和列車時刻表、地圖等多種面向大眾的信息服務、免費電子信箱，以多種形式滿足用戶的需要。無論是在國際上還是在國內，檢索工具都在朝多元化方向發展，為用戶提供全方位服務。

多樣化還表現在網路信息檢索可以間接地服務於其他行業。例如數據挖掘技

術可用於分析歷史數據的變化趨勢，預測未來發展方向，發現大量數據中潛在的模式規律，為投資、科研、項目評估等提供有力的依據；還可以系統地、定量地分析目前較為熱門的研究發展領域及查詢頻繁更新的文獻資料種類，可使信息中心、圖書館等信息服務機構不斷調整文獻資料及圖書的訂閱、收集工作，有的放矢，向以需求為驅動的方向發展，建立一套更為系統、科學的管理方式。

五、個性化

個性化指各網站注重內容的特色化和注重個性化的服務。

網路資源的指數級膨脹，使得用戶在獲得自己需要的信息資源時要花費大量的時間和精力。隨著互聯網的飛速發展，每個人的不同信息需求將凸現於標准化、單一的「大眾需求」之上，並成為各個搜朋夠或網站努力追求的對象。不同的打有消費者個人烙印的產品將成為某個消費者區別他人、感覺自我存在及獨特的外在標志，個性化服務成功的實質在於提供了真正適應用戶需要的產品，貫徹了以用戶為中心的理念。

六、商業化

網路檢索系統擁有全世界數量眾多的用戶，吸引了大量的廣告，為電子信息的增值服務提供了廣闊的空間。網路檢索系統已成為新的投資熱點。網路檢索系統不再僅僅是一種檢索工具，而且成為一項產業，它的商業利益成為推動系統完善和擴展的主要動力，網路信息的檢索與利用由公用性轉向商業化。美國著名的數字媒體評估公司Jupiter Media Metrix日前發布研究報告稱,「搜索引擎公司推出的付費添加服務是一個正在興起的、前景光明的網際網路領域，相對於目前低迷的在線廣告市場來說，它的發展潛力是非常巨大的。」

web信息檢索技術的研究現狀

與web信息檢索技術的研究現狀相關的內容