网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 图解语音识别(全彩印刷)/图灵程序设计丛书
分类 人文社科-社会科学-语言文字
作者 (日)荒木雅弘
出版社 人民邮电出版社
下载
简介
目录
第1章 开篇
1.1 什么是语音识别
1.2 语音识别的历史
1.3 语音识别的用处
1.4 为什么很难
1.5 本书的目标
1.6 小结
第2章 什么是语音
2.1 语音学
2.2 声音是如何产生的——发音语音学
2.3 声音的真面目——声学语音学
2.4 声音是如何被感知的——感知语音学
2.5 总结
第3章 统计模式识别
3.1 什么是模式识别
3.2 统计模式识别的思路
3.3 生成模型的训练
3.4 判别模型的训练
3.5 统计语音识别的概要
3.6 总结
第4章 有限状态自动机
4.1 什么是有限状态自动机
4.2 用有限状态自动机表达的语言
4.3 各种各样的有限状态自动机
4.4 有限状态自动机的性质
4.5 总结
第5章 语音特征的提取
5.1 特征提取的步骤
5.2 语音信号的数字化
5.3 人类听觉模拟——频谱分析
5.4 另一个精巧设计——倒谱分析
5.5 噪声去除
5.6 总结
第6章 语音识别:基本声学模型
6.1 声学模型的单位
6.2 什么是隐马尔可夫模型
6.3 隐马尔可夫模型的概率计算
6.4 状态序列的估计
6.5 参数训练
6.6 总结
第7章 语音识别:高级声学模型
7.1 实际的声学模型
7.2 判别训练
7.3 深度学习
7.4 总结
第8章 语音识别:语言模型
8.1 基于语法规则的语言模型
8.2 统计语言模型的思路
8.3 统计语言模型的建立方法
8.4 总结
第9章 语音识别:搜索算法
9.1 填补声学模型和语言模型之间的空隙
9.2 状态空间搜索
9.3 用树形字典减少浪费
9.4 用集束搜索缩小范围
9.5 用多次搜索提高精度
9.6 总结
第10章 语音识别:WFST运算
10.1 WFST的合成运算
10.2 确定化
10.3 权重移动
10.4 最小化
10.5 总结
第11章 语音识别:使用WFST进行语音识别
11.1 WFST转换
11.2 声学模型的WFST转换
11.3 发音字典的WFST转换
11.4 语言模型的WFST转换
11.5 WFST的搜索
11.6 总结
第12章 语义分析
12.1 什么是语义表示
12.2 基于规则的语义分析处理
12.3 基于统计的语义分析处理
12.4 智能手机的语音服务
12.5 总结
第13章 语音对话系统的实现
13.1 对话系统的开发方法
13.2 基于规则的对话管理
13.3 针对对话管理的统计方法
13.4 总结
第14章 终篇
14.1 语音分析工具WaveSurfer
14.2 HMM构建工具HTK
14.3 大词汇量连续语音识别引擎Julius
14.4 虚拟代理对话工具MMDAgent
14.5 深入学习之路
思考题的解答
参考文献
后记
导语
本书通过图解的方式对语音识别技术进行尽可能简单的解释。现在
的语音识别技术,其主流方法基于统计学,所以如果对它进行准确且严
谨的说明,就要罗列晦涩难懂的数学公式。因此,尽管本书只讲解基本
概念,也不能完全避免数学公式的出现,但本书会用插图来辅助说明公
式背后的思路,希望能够帮助读者直观地理解其中的含义。
内容推荐
本书从语音识别的历史和基础知识讲起,通过图解的方式对语音识别技术进行了尽可能简单的解释。内容涉及语音学基础知识、统计模式识别、有限状态自动机、语音特征的提取、声学模型和语言模型、搜索算法和基于WFST的语音识别技术等。
此外,本书没有将语音识别限定在“将语音转换成文本”的传统范畴内,而是在此基础上,还讲解了从语音识别技术到人机对话技术的演进过程和方法。内容涉及语义分析和语音对话系统的实现。
本书图例丰富,内容直观且深入浅出,适合语音识别的相关从业人员入门以及对语音识别感兴趣的人士阅读。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/14 11:36:07