网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 信息检索导论(修订版)/图灵计算机科学丛书
分类 计算机-操作系统
作者 (美)克里斯托夫·曼宁//普拉巴卡尔·拉格万//(德)欣里希·舒策
出版社 人民邮电出版社
下载
简介
目录
第1章 布尔检索
1.1 一个信息检索的例子
1.2 构建倒排索引的初体验
1.3 布尔查询的处理
1.4 对基本布尔操作的扩展及有序检索
1.5 参考文献及补充读物
第2章 词项词典及倒排记录表
2.1 文档分析及编码转换
2.1.1 字符序列的生成
2.1.2 文档单位的选择
2.2 词项集合的确定
2.2.1 词条化
2.2.2 去除停用词
2.2.3 词项归一化
2.2.4 词干还原和词形归并
2.3 基于跳表的倒排记录表快速合并算法
2.4 含位置信息的倒排记录表及短语查询
2.4.1 二元词索引
2.4.2 位置信息索引
2.4.3 混合索引机制
2.5 参考文献及补充读物
第3章 词典及容错式检索
3.1 词典搜索的数据结构
3.2 通配符查询
3.2.1 一般的通配符查询
3.2.2 支持通配符查询的k-gram索引
3.3 拼写校正
3.3.1 拼写校正的实现
3.3.2 拼写校正的方法
3.3.3 编辑距离
3.3.4 拼写校正中的 k-gram索引
3.3.5 上下文敏感的拼写校正
3.4 基于发音的校正技术
3.5 参考文献及补充读物
第4章 索引构建
4.1 硬件基础
4.2 基于块的排序索引方法
4.3 内存式单遍扫描索引构建方法
4.4 分布式索引构建方法
4.5 动态索引构建方法
4.6 其他索引类型
4.7 参考文献及补充读物
第5章 索引压缩
5.1 信息检索中词项的统计特性
5.1.1 Heaps定律:词项数目的估计
5.1.2 Zipf定律:对词项的分布建模
5.2 词典压缩
5.2.1 将词典看成单一字符串的 压缩方法
5.2.2 按块存储
5.3 倒排记录表的压缩
5.3.1 可变字节码
5.3.2 γ编码
5.4 参考文献及补充读物
第6章 文档评分、词项权重计算及 向量空间模型
6.1 参数化索引及域索引
6.1.1 域加权评分
6.1.2 权重学习
6.1.3 最优权重g 的计算
6.2 词项频率及权重计算
6.2.1 逆文档频率
6.2.2 tf-idf 权重计算
6.3 向量空间模型
6.3.1 内积
6.3.2 查询向量
6.3.3 向量相似度计算
6.4 其他tf-idf 权重计算方法
6.4.1 tf的亚线性尺度变换方法
6.4.2 基于最大值的tf归一化
6.4.3 文档权重和查询权重机制
6.4.4 文档长度的回转归一化
6.5 参考文献及补充读物
第7章 一个完整搜索系统中的评分计算
7.1 快速评分及排序
7.1.1 非精确返回前K篇文档的方法
7.1.2 索引去除技术
7.1.3 胜者表
7.1.4 静态得分和排序
7.1.5 影响度排序
7.1.6 簇剪枝方法
7.2 信息检索系统的组成
7.2.1 层次型索引
7.2.2 查询词项的邻近性
7.2.3 查询分析及文档评分函数的 设计
7.2.4 搜索系统的组成
7.3 向量空间模型对各种查询操作的支持
7.3.1 布尔查询
7.3.2 通配符查询
7.3.3 短语查询
7.4 参考文献及补充读物
第8章 信息检索的评价
8.1 信息检索系统的评价
8.2 标准测试集
8.3 无序检索结果集合的评价
8.4 有序检索结果的评价方法
8.5 相关性判定
8.6 更广的视角看评价:系统质量及用户效用
8.6.1 系统相关问题
8.6.2 用户效用
8.6.3 对已有系统的改进
8.7 结果片段
8.8 参考文献及补充读物
第9章 相关反馈及查询扩展
9.1 相关反馈及伪相关反馈
9.1.1 Rocchio相关反馈算法
9.1.2 基于概率的相关反馈方法
9.1.3 相关反馈的作用时机
9.1.4 Web上的相关反馈
9.1.5 相关反馈策略的评价
9.1.6 伪相关反馈
9.1.7 间接相关反馈
9.1.8 小结
9.2 查询重构的全局方法
9.2.1 查询重构的词汇表工具
9.2.2 查询扩展
9.2.3 同义词词典的自动构建
9.3 参考文献及补充读物
第10章 XML检索
10.1 XML的基本概念
10.2 XML检索中的挑战性问题
10.3 基于向量空间模型的XML检索
10.4 XML检索的评价
10.5 XML检索:以文本为中心与以数据为中心的对比
10.6 参考文献及补充读物
第11 章 概率检索模型
11.1 概率论基础知识
11.2 概率排序原理
11.2.1 1 0风险的情况
11.2.2 基于检索代价的概率排序 原理
11.3 二值独立模型
11.3.1 排序函数的推导
11.3.2 理论上的概率估计方法
11.3.3 实际中的概率估计方法
11.3.4 基于概率的相关反馈方法
11.4 概率模型的相关评论及扩展
11.4.1 概率模型的评论
11.4.2 词项之间的树型依赖
11.4.3 Okapi BM25:一个非二值的 模型
11.4.4 IR中的贝叶斯网络 方法
11.5 参考文献及补充读物
第12章 基于语言建模的信息检索模型
12.1 语言模型
12.1.1 有穷自动机和语言模型
12.1.2 语言模型的种类
12.1.3 词的多项式
内容推荐
本书是一本讲授信息检索的经典教材。全书共21章,前8章详述了信息检索的基础知识,包括倒排索引、布尔检索及词项权重计算和评分算法等,后13章介绍了一些高级话题,如基于语言建模的信息检索模型、基于机器学习的检索结果排序方法和web搜索技术等。另外,本书还着重讨论了文本分类、聚类等信息检索中不可或缺的组成部分。全书语言流畅,由浅入深,一气呵成。
本书适合作为高等院校相关专业高年级本科生和研究生的课程教材,也可供信息检索领域的研究人员和专业人士参考。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/26 13:09:55