张霄军编著的《计算语言学(211院校研究生规划教材)》在内容安排和写作方法上既不漏掉计算语言学基本概念和基础原理,又不会过于抽象和形式化。本书是一本用“新写作”呈现“旧内容”的研究生教材,是211院校研究生规划教材。
第1章 计算语言学简介
1.1 什么是计算语言学?
1.2 计算语言学与自然语言处理
第2章 计算语言学基础
2.1 概率论与信息论
2.1.1 概率论基础知识
2.1.2 信息论基础知识
2.2 形式语言理论与自动机
2.2.1 形式语法理论
2.2.2 自动机理论
第3章 词处理
3.1 词与词处理
3.1.1 什么是“词”?
3.1.2 词性
3.1.3 词处理
3.2 汉语的自动分词
3.2.1 现代汉语分词规范
3.2.2 汉语自动分词方法
3.3 英语形态分析
3.4 词性标注方法
3.4.1 词性标记集
3.4.2 词性标注方法
第4章 短语处理
4.1 短语结构语法
4.1.1 名词短语
4.1.2 动词短语
4.1.3 并列结构
4.1.4 短语结构语法实例
4.2 格语法
4.2.1 经典格语法
4.2.2 改进的格语法
4.3 部分句法分析
4.3.1 浅层分析
4.3.2 骨架分析
4.4 HNC理论与机器翻译调序
第5章 句处理
5.1 语法理论
5.1.1 转换
5.1.2 生成
5.2 句法分析
5.2.1 自顶向下的分析
5.2.2 自底向上的分析
5.2.3 左角分析法
5.2.4 CYK算法
5.2.5 Earley算法
5.2.6 概率上下文无关语法
5.3 句法生成实例
5.3.1 译词生成
5.3.2 个案实现
第6章 机器翻译
6.1 机器翻译概述
6.1.1 机器翻译历史
6.1.2 机器翻译现状
6.1.3 机器翻译应用
6.2 机器翻译方法
6.2.1 基于理性的方法
6.2.2 基于经验的方法
6.2.3 基于混合的方法
6.2.4 机器翻译的难点
6.3 机器翻译评测
6.3.1 机器翻译评测分类
6.3.2 人工评测与自动评测
6.3.3 翻译质量量化评测研究综述
6.3.4 NIST 2005机器翻译(MT-05)评测
第7章 信息检索
7.1 单语信息检索
7.1.1 检索策略与方法
7.1.2 搜索引擎
7.1.3 检索效果评测
7.2 跨语言信息检索
7.2.1 多语言信息系统
7.2.2 主要的问题
7.2.3 基本方法
7.2.4 其他方法
7.2.5 跨语言信息检索评测
参考文献
附录1:Vitenbi算法实例
1.C语言代码
2.Java语言代码
附录2:词性标记集
词性标记集1:北京大学计算语言学研究所的词性标记集
诃性标记集2:中科院计算所的词性标记集
词性标记集3:教育部语言文字应用研究所的词性标记集
词性标记集4:清华大学计算机系的词性标记集
词性标记集5:Brown语料库的词性标记集
词性标记集6:Penn Treebank词性标记集
词性标记集7:C5词性标记集
后记