推荐序
译者序
前言
第1章 文本挖掘概述
第2章 从文本信息到数值向量
第3章 用文本进行预测
第4章 信息检索和文本挖掘
第5章 文档集的结构发现
第6章 在文档中查询信息
第7章 面向预测的数据源:数据库、混杂数据与Web
第8章 实例分析
第9章 新研究方向
附录A 软件说明
参考文献
作者索引
主题索引
电脑普及带来的一个结果是文档以数字形式呈现出来,加之Intemet的广泛使用,这些文档就变得唾手可得。文本挖掘,即对非结构化的自然语言文本的分析过程,主要针对的是如何从这些文档中提取信息。
绍洛姆·韦斯编著的《预测性文本挖掘基础》是一本入门级的教科书,是在修订施普林格已经成功出版的文本挖掘领域的参考书基础上得到的,旨在能够帮助读者了解这个快速发展的领域。同时,该书也整合了包括数据挖掘、机器学习、数据库以及计算语言学方面很多的理论,因此这本独一无二的书也提供了一些文本挖掘方面比较实用的建议。书中深层次地讨论了文档分类、信息检索、聚类和组织文档、信息提取、基于web的数据源的预测和评价问题。要学习本书,如果读者有数据挖掘方面的知识自然很好,但这并不是必须的。《预测性文本挖掘基础》中有些地方涉及到一些高级概念,这些需要读者有一定的数学功底,当然我们也提供了一些直观上的解释来帮助那些非专业读者。
绍洛姆·韦斯编著的《预测性文本挖掘基础》提供了丰富的实例和软件环境,并且介绍了大量的有实际学术研究价值的内容。本书追求实践,同时也包含了广泛的对文本挖掘有帮助的内容,既涵盖了预测学习方法,又引出了信息检索、搜索引擎和聚类等技术。如果读者可以跟随这本书,使用我们提供的软件动手分析每一实例,相信一定可以大有收获。
本书适用于IT开发人员,管理人员,同时也适用于计算机专业的研究生。