![]()
内容推荐 本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干优选深度学习技术。本书适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读,所有的算法及技术细节都提供了详尽的参考文献,给出了深度学习在语音识别中应用的全景。 作者简介 俞栋,1998年加入微软公司,现任微软研究院首席研究员、浙江大学兼职教授和中科大客座教授。他是语音识别和深度学习方向的资深专家,出版了两本专著,发表了150多篇论文,是近60项的发明人及有广泛影响力的深度学习开源软件CNTK的发起人和主要作者之一。他在基于深度学习的语音识别技术上的工作带来了语音识别研究方向的转变,极大地推动了语音识别领域的发展,并获得2013年IEEE信号处理协会很好论文奖。俞栋博士现担任IEEE语音语言处理专业委员会委员,曾担任IEEE/ACM音频、语音及语言处理汇刊、IEEE信号处理杂志等期刊的编委。 目录 译者序 序 前言 术语缩写 符号 1简介 1.1自动语音识别:更好的沟通之桥 1.1.1人类之间的交流 1.1.2人机交流 1.2语音识别系统的基本结构 1.3全书结构 1.3.1部分:传统声学模型 1.3.2第二部分:深度神经网络 1.3.3第三部分:语音识别中的DNN-HMM混合系统 1.3.4第四部分:深度神经网络中的表征学习 1.3.5第五部分:不错的深度模型 部分传统声学模型 2混合高斯模型 2.1随机变量 2.2高斯分布和混合高斯随机变量 2.3参数估计 2.4采用混合高斯分布对语音特征建模 3隐马尔可夫模型及其变体 3.1介绍 3.2马尔可夫链 3.3序列与模型 3.3.1隐马尔可夫模型的性质 3.3.2隐马尔可夫模型的仿真 3.3.3隐马尔可夫模型似然度的计算 3.3.4计算似然度的高效算法 3.3.5前向与后向递归式的证明 3.4期望优选化算法及其在学习HMM参数中的应用 3.4.1期望优选化算法介绍 3.4.2使用EM算法来学习HMM参数——Baum-Welch算法 3.5用于解码HMM状态序列的维特比算法 3.5.1动态规划和维特比算法 3.5.2用于解码HMM状态的动态规划算法 3.6隐马尔可夫模型和生成语音识别模型的变体 3.6.1用于语音识别的GMM-HMM模型 3.6.2基于轨迹和隐藏动态模型的语音建模和识别 3.6.3使用生成模型HMM及其变体解决语音识别问题 第二部分深度神经网络 4深度神经网络 5不错模型初始化技术 第三部分语音识别中的深度神经网络-隐马尔可夫混合模型 6深度神经网络-隐马尔可夫模型混合系统 7训练和解码的加速 8深度神经网络序列鉴别性训练 第四部分深度神经网络中的特征表示学习 9深度神经网络中的特征表示学习 10深度神经网络和混合高斯模型的融合 11深度神经网络的自适应技术 第五部分先进的深度学习模型 12深度神经网络中的表征共享和迁移 13循环神经网络及相关模型 14计算型网络 15总结及未来研究方向 参考文献 |