编辑推荐 第4版教材与第3版相比,系统介绍了深度学习技术的基本原理以及典型方法,并且在语音增强、说话人识别、语音编码、语音合成与转换、语音信号情感处理各章增加了深度学习技术在上述方向上的应用。增加了有关多模态语音信号处理的内容,在第13章中介绍了这个全新方向上的近期新理论与应用成果。 本教材入选战略性新兴领域“十四五”高等教育教材体系建设团队——新一代信息技术(新一代通信技术)。本教材的出版得到了国家自然科学基金面上项目、江苏省高等教育教学改革重中之重研究课题、江苏省教育科学“十四五”规划重点课题资助。 内容推荐 本书介绍了语音信号处理的基础、原理、方法和应用,以及该学科领域近年来取得的一些新的研究成果和技术。全书共分13章,内容包括:绪论、语音信号处理的基础知识、语音信号处理的常用算法、语音信号分析、语音信号特征提取技术、语音增强、语音识别、说话人识别、语音编码、语音合成与转换、语音信号情感处理、声源定位、多模态语音信号处理。 本书可作为高等院校的教材或教学参考书,同时也可供语音信号处理等领域的工程技术人员参考。 目录 前言 第1章绪论 第2章语音信号处理的基础知识 2.1语音发音及感知系统 2.2语音信号生成的数学模型 2.3语音基本概念与参数 2.4语音信号的数字化和预处理 2.5语音信号处理的应用 2.6思考与复习题 第3章语音信号处理的常用算法 3.1矢量量化 3.2隐马尔可夫模型 3.3深度学习 3.4思考与复习题 第4章语音信号分析 4.1概述 4.2语音分帧 4.3语音信号的时域分析 4.4语音信号的频域分析 4.5语音信号的倒谱分析 4.6语音信号的线性预测分析 4.7语音信号的小波分析 4.8思考与复习题 第5章语音信号特征提取技术 5.1概述 5.2端点检测 5.3基音周期估计 5.4共振峰估计 5.5思考与复习题 第6章语音增强 6.1概述 6.2语音特性、人耳感知特性及噪声特性 6.3滤波器法 6.4相关特征法 6.5非线性处理法 6.6减谱法与维纳滤波法 6.7基于深度学习的语音增强 6.8思考与复习题 第7章语音识别 7.1概述 7.2语音识别原理和识别系统的组成 7.3孤立字(词)识别系统 7.4连续语音识别系统 7.5语音识别系统的性能评测 7.6思考与复习题 第8章说话人识别 8.1概述 8.2说话人识别方法和系统结构 8.3基于矢量量化的说话人识别系统 8.4基于动态时间规整的说话人确认系统 8.5基于高斯混合模型(GMM)的说话人识别系统 8.6基于深度学习的说话人识别 8.7尚需进一步探索的研究课题 8.8思考与复习题 第9章语音编码 9.1概述 9.2语音编码的评价指标 9.3语音信号的波形编码 9.4语音信号的参数编码 9.5语音信号的混合编码 9.6基于深度学习的语音编码 9.7思考与复习题 第10章语音合成与转换 10.1概述 10.2语音合成算法 10.3基于深度学习的语音合成 10.4常用的语音转换方法 10.5语音转换的研究方向 10.6思考与复习题 第11章语音信号情感处理 11.1概述 11.2情感理论与情感诱发实验 11.3情感的声学特征分析 11.4实用语音情感识别算法 11.5基于深度学习的语音情感识别 11.6应用与展望 11.7思考与复习题 第12章声源定位 12.1概述 12.2双耳听觉定位原理及方法 12.4基于传声器阵列的声源定位 12.5总结与展望 12.6思考与复习题 第13章多模态语音信号处理 13.1概述 13.2视觉信息辅助的语音增强 13.3视觉信息辅助的语音合成 13.4视觉信息辅助的语音识别 13.5多模态融合的语音情感信息处理 13.6总结与展望 13.7思考与复习题 附录汉英名词术语对照 参考文献 |