第1章 统计中文分词技术
1.1 词法分析问题
1.2 词典与基于规则分词
1.3 仿词识别与最少分词技术
1.4 基于词网格的N-gram统计分词技术
1.5 数据平滑与专业词抽取
1.6 本章小结
第2章 词性标注与序列标注
2.1 三个序列标注问题
2.2 隐马尔可夫序列标注
2.3 CRF模型与序列标注
2.4 CRF中文词性标注
2.5 组合分类器的序列标注方法
2.6 实验结果与分析
2.7 本章小结
第3章 命名实体识别
3.1 中文命名实体识别特点与任务描述
3.2 ME模型及其适用性
3.3 基于ME模型的中文命名实体识别
3.4 双层混合模型方法研究
3.5 实验结果与分析
3.6 本章小结
第4章 文本分类技术
4.1 文本的向量空间模型
4.2 文本相似度与kNN分类
4.3 朴素贝叶斯文本分类
4.4 朴素贝叶斯分类中的特征缺失补偿策略
4.5 基于SVM的文本分类
4.6 基于分类技术的歧义消解问题
4.7 本章小结
第5章 文本聚类技术
5.1 聚类方法与文本聚类问题
5.2 k-均值与k-中心点文本聚类方法
5.3 文本层次聚类方法
5.4 基于聚类技术的词义分析
5.5 其他聚类方法
5.6 本章小结
第6章 文本检索技术
6.1 Web检索系统构成与文本检索的评价
6.2 信息检索模型与布尔模型
6.3 向量空间模型与相关性反馈检索模型
6.4 扩展的布尔模型与概率模型
6.5 信息检索与信息过滤及信息推荐的关系
6.6 本章小结
第7章 垃圾邮件过滤与情感分析
7.1 垃圾邮件过滤问题与框架
7.2 朴素贝叶斯垃圾邮件过滤方法
7.3 ME模型与SVM垃圾邮件过滤方法
7.4 情感分析问题
7.5 情感分析方法
7.6 本章小结
第8章 个性化协同过滤推荐技术
8.1 推荐问题提出
8.2 通用推荐与个性化推荐
8.3 基本协同过滤推荐方法
8.4 基于SVD的协同过滤推荐
8.5 改进协同过滤推荐方法
8.6 本章小结
第8第9章 组合推荐技术
9.1 基于内容的推荐技术
9.2 基于分类技术的推荐方法
9.3 基于推理的推荐技术
9.4 混合推荐方法
9.5 本章小结
参考文献