网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 信息检索(算法与启发式方法第2版)/图灵计算机科学丛书
分类 计算机-操作系统
作者 (美)格罗斯曼//弗里德
出版社 人民邮电出版社
下载
简介
编辑推荐

本书从发展的角度描述了ad hoc信息检索,讨论了用来实现大规模数据检索的最新算法,详细介绍了推理网络和系统的效率,并且对每种方法都给出了详细可行的实例。此外,本书整合了结构化和非结构化数据的处理技术,这是其他教材所不具备的。

第2版新增加了旧语言模型和跨语言检索,还讨论了许多当前的热点话题,如XML、P2P信息检索、文本查重、文档并行聚类、不同检索策略的融合、信息中间表示等。

本书兼顾了学科广度和主题深度,把握了最新的发展趋势,是信息检索领域的一本名著。

内容推荐

本书是“信息检索”课程的优秀教材,书中对信息检索的概念、原理和算法进行了详细介绍,内容主要包括检索模型与算法、检索实用策略、跨语言信息检索、查询处理、融合结构化数据和文本、并行信息检索以及分布式信息检索等,并给出了阐述算法的大量实例。

本书有一定的广度和深度,而且所有的内容都用当前的技术阐述,是高等院校计算机及信息管理等专业本科生和研究生的理想教材,对信息检索领域的科研和技术人员也是很好的参考书。

目录

第1章 引言

第2章 检索模型与算法

 2.1 向量空间模型

2.1.1 相似度计算举例

2.1.2 相似度

 2.2 概率检索模型

2.2.1 简单的词项权重

2.2.2 非二值独立模型

2.2.3 泊松模型

2.2.4 文档片段

2.2.5 概率模型的关键问题

 2.3 语言模型

2.3.1 平滑

2.3.2 语言模型举例

 2.4 推理网络

2.4.1 相关背景

2.4.2 链接矩阵

2.4.3 相关性排序

2.4.4 推理网络实例

 2.5 扩展布尔检索

2.5.1 引入查询权重

2.5.2 扩展为任意数量的查询词

2.5.3 自动插入布尔逻辑

 2.6 LSI

2.6.1 LSI举例

2.6.2 选择较优的K值

2.6.3 与其他检索模型比较

2.6.4 可能的扩展

2.6.5 运行时性能

 2.7 神经网络

2.7.1 向量空间

2.7.2 相关反馈

2.7.3 学习与调整

2.7.4 概率检索

2.7.5 基于片段的概率检索

2.7.6 联合权重

2.7.7 文档聚类

 2.8 遗传算法

2.8.1 文档表示形式

2.8.2 查询权重的自动赋值

2.8.3 自动生成带权重的布尔查询

 2.9 模糊集检索

2.9.1 布尔检索

2.9.2 使用概念层次

2.9.3 采用区间和提升效率

 2.10 本章小结

 2.11 练习题

第3章 检索实用策略

 3.1 相关反馈

3.1.1 基于向量空间模型的相关反馈

3.1.2 基于概率模型的相关反馈

 3.2 聚类

3.2.1 结果集聚类

3.2.2 层次聚类

3.2.3 不采用预定义矩阵的聚类方法

3.2.4 在层次聚类结果中进行查询

3.2.5 效率方面

 3.3 基于段落的检索

3.3.1 基于标记的段落划分方法

3.3.2 动态段落划分方法

3.3.3 合并基于段落的相似度

 3.4 n元语法

3.4.1 D'Amore与Mah方法

3.4.2 Damashek算法

3.4.3 Pearce与Nicholas方法

3.4.4 Teufel

3.4.5 Cavnar和Vayda

 3.5 回归分析

 3.6 同义词表

3.6.1 自动构建同义词表

3.6.2 使用人工构建的同义词表

 3.7 语义网络

3.7.1 距离计算方法

3.7.2 基于“概念”扩展查询词

3.7.3 基于约束激活扩散的排序

 3.8 语言解析

3.8.1单个词

3.8.2 简单短语

3.8.3 复杂短语

 3.9 本章小结

 3.10 练习

第4章 CUR

 4.1 简介

4.1.1 资源

4.1.2 评测

 4.2 跨越语言障碍

4.2.1 查询翻译

4.2.2 文档翻译

4.2.3 短语翻译

4.2.4 译文的选择

4.2.5 翻译删减技术

 4.3 跨语言检索模型与算法

4.3.1 CLIR中的语言模型

4.3.2 双语语料库方法

4.3.3 可比语料库方法

 4.4 跨语言检索实用策略

4.4.1 跨语言检索的相关反馈

4.4.2 词干还原

4.4.3 n元语法模型

4.4.4 音译名

4.4.5 命名实体识别

4.4.6 检索融合

 4.5 本章小结

 4.6 练习题

第5章 检索效率优化

 5.1 倒排索引

5.1.1 构建倒排索引

5.1.2 压缩倒排索引

5.1.3 变长索引压缩

5.1.4 基于倒排表大小的变长压缩

5.1.5 索引剪枝

5.1.6 在构建索引前对文档重新排序

 5.2 查询处理

5.2.1 倒排索引的修订

5.2.2 部分结果集检索

5.2.3 简化向量空间

 5.3 签名文件

 5.4 重复文档检测

5.4.1 精确重复检测

5.4.2 近似重复检测

 5.5 本章小结

 5.6 练习题

第6章 结构化数据与文本的融合

 6.1 关系模型回顾

 6.2 相关工作进展

6.2.1 独立系统的融合

6.2.2 自定义运算符

6.2.3 NFN方法

6.2.4 使用标准SQL进行文献搜索

 6.3 信息检索作为关系应用

6.3.1 预处理

6.3.2 实施案例

6.3.3 布尔检索

6.3.4 邻近搜索

6.3.5 使用标准SQL计算相关度

6.3.6 相关反馈在关系模型中的实现

6.3.7 关系信息检索系统

 6.4 使用关系模式进行半结构化搜索

6.4.1 背景

6.4.2 使用静态关系模式支持XML-QL

6.4.3 存储XML元数据

6.4.4 跟踪XML文档

6.4.5 INDEX关系

 6.5 多维数据模型

 6.6 协同器

6.6.1 因特网协同器

6.6.2 內联网协同器

 6.7 本章小结

 6.8 练习题

第7章 并行信息检索

 7.1 并行文本扫描搜索

7.1.1 文本硬件扫描

7.1.2 并行签名文件

 7.2 并行索引川

7.2.1 在连接机上实现并行索引

7.2.2 连接机的倒排索引

7.2.3 在DAP上实现并行索引

7.2.4 并行索引划分

7.2.5 在CM-5机上实现并行倒排索引算法

7.2.6 在倒排表上执行布尔操作

7.2.7 作为RDBMS应用的并行检索

7.2.8 并行索引小结

 7.3 聚类与分类

 7.4 大型的并行信息检索系统

7.4.1 PADRE

7.4.2 并行信息检索框架

7.4.3 PLIERS

 7.5 本章小结

 7.6 练习题

第8章 分布式信息检索

 8.1 分布式检索的理论模型

8.1.1 集中式信息检索系统模型

8.1.2 分布式信息检索系统模型

 8.2 Web搜索

8.2.1 Web搜索引擎评测

8.2.2 高准确率检索

8.2.3 查询日志分析

8.2.4 PageRank算法

8.2.5 Web搜索引擎的效果提升

 8.3 结果融合

 8.4 P2P信息系统

 8.5 其他的体系结构

8.5.1 共享磁盘体系结构

8.5.2 分布式磁盘体系结构

 8.6 本章小结

 8.7 练习题

第9章 总结与下一步研究方向

参考文献

索引

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/4/4 8:13:44