內容簡介

  《信息檢索:實現和評價搜索引擎》從多個視角對信息檢索技術進行了深入講解,內容涵蓋了信息檢索系統的架構、基礎技術、詞條和詞項、靜態和動態倒排索引、查詢處理、索引壓縮技術、概率模型、語言模型、分類和過濾、融合和元學習、評價方法以及並行信息檢索、Web檢索和XML檢索等具體應用。本書以模塊化的方式進行組織,理論性強,體系完整,同時強調實踐。作者以認真嚴謹的態度實現了書中絕大部分的主要方法,並詳盡地描述了各種方法的適用環境以及取得的效果。

  《信息檢索:實現和評價搜索引擎》可作為高等院校信息管理與信息系統、計算機科學與技術、情報學、圖書館學以及電子商務等專業的高年級本科生和研究生的教材和參考書,對於從事信息檢索與網絡分析等實際工作的從業人員也具有較高的參考價值。
 

目錄

出版者的話
譯者序

前言
符號
第一部分 基礎知識
第1章 緒論
1.1 什麼是信息檢索
1.1.1 web搜索
1.1.2 其他搜索應用
1.1.3 其他信息檢索應用
1.2 信息檢索系統
1.2.1 信息檢索系統基礎架構
1.2.2 文檔及其更新
1.2.3 性能評價
1.3 使用電子文本
1.3.1 文本格式
1.3.2 英文文本中的分詞
1.3.3 詞項分布
1.3.4 語言模型
1.4 測試集
1.5 開源信息檢索系統
1.5.1 lucene
1.5.2 indri
1.5.3 wumpus
1.6 延伸閱讀
1.7 練習
1.8 參考文獻
第2章 基礎技術
2.1 倒排索引
2.1.1 延伸例子:詞組查找
2.1.2 實現倒排索引
2.1.3 文檔和其他元素
2.2 檢索與排名
2.2.1 向量空間模型
2.2.2 鄰近度排名
2.2.3 布爾檢索
2.3 評價
2.3.1 查全率和查准率
2.3.2 排名檢索的有效性指標
2.3.3 創建測試集
2.3.4 效率指標
2.4 總結
2.5 延伸閱讀
2.6 練習
2.7 參考文獻
第3章 詞條與詞項
3.1 英語
3.1.1 標點與大寫
3.1.2 詞干提取
3.1.3 停詞
3.2 字符
3.3 字符n?gram
3.4 歐洲語言
3.5 cjk語言
3.6 延伸閱讀
3.7 練習
3.8 參考文獻
第二部分 索引
第4章 靜態倒排索引
第5章 查詢處理
第6章 索引壓縮
第7章 動態倒排索引
第三部分 檢索和排名
第8章 概率檢索
第9章 語言模型及其相關方法
第10章 分類和過濾
第11章 融合和元學習
第四部分 評價
第12章 度量有效性
第13章 度量效率
第五部分 應用和擴展
第14章 並行信息檢索
第15章 web搜索
第16章 xml檢索
第六部分 附錄
附錄a 計算機性能
網路書店 類別 折扣 價格
  1. 新書
    87
    $339