当Lucene首次出现时,这个超级快速的搜索引擎便让人惊叹不已。现在,Lucene仍然在发展中。它的高性能、易用的API,诸如数字域的处理功能、有效载荷、近实时搜索等特性,以及在索引和搜索速度上的显著提升使得它成为领先的搜索工具。
清晰的写作思路、可重用代码示例以及无与伦比的使用建议。使得Michael McCandless的《Lucene实战(第2版)》仍然是将搜索功能集成至自己应用程序方面的权威指南。该书经过全面修订,将向你介绍如何对文档进行索引。文档格式包括MS Word、PDF、HTML和XML等。它也将为你介绍搜索、排序和过滤,并针对本书第1版内容进行了大量的改进。书中的源代码是基于Luoene 3.0.1的。
Michael McCandless的《Lucene实战(第2版)》基于Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用tika提取文本、Lucene的高级扩展、使用其他编程语言访问Lucene、Lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为读者展示了一个奇妙的搜索世界。
《Lucene实战(第2版)》适合于已具有一定Java编程基本的读者,以及希望能够把强大的搜索功能添加到自己的应用程序中的开发人员。本书对于从事搜索引擎工作的工程技术人员,以及在Java平台上进行各类软件开发的人员和编程爱好者,也具有很好的学习参考价值。
第1部分 Lucene核心
第1章 初识Lucene
1.1 应对信息爆炸
1.2 Lucene是什么
1.2.1 Lucene能做些什么
1.2.2 Lucene的历史
1.3 Lucene和搜索程序组件
1.3.1 索引组件
1.3.2 搜索组件
1.3.3 搜索程序的其他模块
1.3.4 Lucene与应用程序的整合点
1.4 Lucene实战:程序示例
1.4.1 建立索引
1.4.2 搜索索引
1.5 理解索引过程的核心类
1.5.1 IndexWriter
1.5.2 Directory
1.5.3 Analyzer
1.5.4 Document
1.5.5 Field
1.6 理解搜索过程的核心类
1.6.1 IndexSearcher
1.6.2 Term
1.6.3 Query
1.6.4 Termquery
1.6.5 Topdocs
1.7 小结
第2章 构建索引
第3章 为应用程序添加搜索功能
第4章 Lucene的分析过程
第5章 高级搜索技术
第6章 扩展搜索
第2部分 Lucene应用
第7章 使用tika提取文本
第8章 Lucene基本扩展
第9章 Lucene高级扩展
第10章 其他编程语言使用Lucene
第11章 Lucene管理和性能调优
第3部分 案例分析
第12章 案例分析1:Krugle
第13章 案例分析2:Siren
第14章 案例分析3:Linkedin
附录A 安装Lucene
附录B Lucene索引格式
附录C Lucene/Contrib Benchmark
附录D 资源