智能语音处理张雄伟等编机械工业出版社豆瓣PDF电子书bt网盘迅雷下载科学技术-自然科学-自然科普-霍普软件下载网

前言
章智能语音处理导论1
1.1概述1
1.2经典语音处理2
1.2.1语音处理的发展2
1.2.2语音基本表示方法3
1.2.3语音处理基本方法3
1.2.4经典语音处理方法的不足4
1.3智能语音处理5
1.3.1智能语音处理的基本概念5
1.3.2智能语音处理的基本框架5
1.3.3智能语音处理的基本模型6
1.4语音处理的应用7
1.4.1语音处理的传统应用领域8
1.4.2语音处理的新应用领域11
1.5小结14
参考文献14
第2章稀疏和压缩感知15
2.1引言15
2.2稀疏和稀疏表示16
2.2.1稀疏16
2.2.2稀疏表示18
2.3冗余字典19
2.3.1基本概念19
2.3.2字典学习20
2.3.3字典学习算法22
2.3.4原子选择算法25
2.4压缩感知27
2.4.1基本概念27
2.4.2压缩感知模型29
2.4.3观测矩阵30
2.4.4信号重构32
2.5小结33
参考文献33
第3章隐变量模型36
3.1引言36
3.2高斯混合模型36
3.2.1基本概念37
3.2.2GMM参数估计37
3.3隐马尔可夫模型39
3.3.1基本概念39
3.3.2HMM关键问题42
3.4高斯过程隐变量模型48
3.4.1基本模型48
3.4.2GPLVM的理论来源49
3.4.3GPLVM模型训练50
3.5小结51
参考文献51
第4章组合模型52
4.1引言52
4.2主成分分析53
4.2.1基本模型53
4.2.2求解算法54
4.3非负矩阵分解56
4.3.1基本模型56
4.3.2求解算法57
4.3.3NMF与其他数据表示模型的关系58
4.4鲁棒组合模型60
4.4.1组合模型的鲁棒性分析61
4.4.2鲁棒主成分分析61
4.4.3鲁棒非负矩阵分解63
4.5小结64
参考文献64
第5章人工神经网络和深度学习65
5.1引言65
5.2神经网络基础66
5.2.1神经元模型66
5.2.2浅层神经网络67
5.2.3深度神经网络68
5.3深度学习69
5.3.1基本概念和形式69
5.3.2深度网络的学习方法70
5.4深度神经网络的典型结构71
5.4.1深度置信网络71
5.4.2自动编码器与栈式自动编码器72
5.4.3卷积神经网络74
5.4.4循环神经网络75
5.4.5生成式对抗网络77
5.5小结79
参考文献79
第6章语音压缩编码81
6.1引言81
6.2基于字典学习的语音信号压缩感知82
6.2.1语音信号的稀疏性82
6.2.2语音在常见变换域的稀疏化83
6.2.3基于K-L展开的语音非相干字典84
6.2.4基于K-L非相干字典的语音压缩重构87
6.2.5实验仿真与性能分析88
6.3基于梅尔倒谱系数重构的语音压缩编码93
6.3.1基于梅尔倒谱分析的抗噪语音编码模型94
6.3.2基于稀疏约束的梅尔倒谱96
6.3.3梅尔倒谱系数的量化算法99
6.3.4实验仿真与性能分析103
6.4基于深度学习的语音压缩编码107
6.4.1基于DAE的幅度谱编码和量化107
6.4.2基于DAE的低速率语音编码110
6.4.3实验仿真与性能分析111
6.5小结113
参考文献113
第7章语音增强115
7.1引言115
7.2语音增强技术基础116
7.2.1语音增强的估计参数116
7.2.2智能语音增强的语音特征117
7.2.3性能评价118
7.3基于非负矩阵分解的语音增强120
7.3.1基本模型121
7.3.2基于不相交约束非负矩阵分解的语音增强122
7.3.3基于CNMF字典学习的语音增强127
7.4基于深度学习的语音增强136
7.4.1基于听觉感知加权的深度神经网络语音增强方法136
7.4.2基于听觉感知掩蔽的深度神经网络语音增强方法141
7.5小结151
参考文献152
第8章语音转换155
8.1引言155
8.2语音转换基本原理155
8.3语音转换模型与评价156
8.3.1语音分析/模型156
8.3.2语音参数的选择157
8.3.3时间对齐157
8.3.4转换模型和规则158
8.3.5转换性能评价159
8.4基于非负矩阵分解的谱转换160
8.4.1概述160
8.4.2基于卷积非负矩阵分解的谱转换161
8.4.3声道谱转换效果164
8.5基于深度神经网络的谱转换168
8.5.1深度学习驱动下的语音转换168
8.5.2面向谱转换的神经网络模型选择168
8.5.3基于BLSTM和神经网络声码器交替训练的语音转换171
8.6小结176
参考文献176
第9章说话人识别178
9.1引言178
9.2说话人识别基础179
9.2.1说话人识别系统框架179
9.2.2典型的说话人识别模型180
9.3基于i-vector的说话人识别及其改进181
9.3.1基于i-vector的说话人识别概述181
9.3.2用于提高i-vector鲁棒性的帧加权方法182
9.3.3实验结果与分析187
9.4基于深度神经网络的说话人识别187
9.4.1基于深度神经网络的说话人识别概述187
9.4.2基于对比度损失函数优化说话人矢量189
9.4.3实验结果与分析191
9.5说话人识别系统的攻击与防御192
9.5.1攻击和防御的背景192
9.5.2说话人识别系统的攻击方法192
9.5.3说话人识别攻击的检测方法194
9.5.4实验结果与分析196
9.6小结196
参考文献197
0章骨导语音增强200
10.1引言200
10.2骨导语音增强基础201
10.2.1骨导语音的产生与特性201
10.2.2骨导语音盲增强的特点202
10.2.3骨导语音盲增强的典型方法203
10.3基于长短时记忆网络的骨导语音盲增强205
10.3.1骨导/气导语音的谱映206
10.3.2基于深度残差BLSTM的骨导语音盲增强方法207
10.3.3实验仿真及性能分析211
10.4基于均衡-生成组合谱映的骨导语音盲增强215
10.4.1均衡法215
10.4.2基于均衡-生成组合谱映的骨导语音盲增强方法216
10.4.3实验仿真及性能分析218
10.5小结222
参考文献223
1章智能语音处理展望224
11.1智能语音处理的未来224
11.2有待解决的关键技术225
11.2.1语音识别226
11.2.2语音228
11.2.3语音增强229
11.2.4语音处理中的安全问题230
11.3小结230
参考文献230
缩略语232

本书从智能化社会对语音处理提出的新要求出发，按照导论-基础理论-应用实践的顺序，系统地介绍了智能语音处理涉及的基础理论、基本技术、主要方法以及典型的智能语音处理应用。首先概述了智能语音处理的相关背景；接着介绍了智能语音处理涉及的基础理论和相关技术，包括稀疏和压缩感知、隐变量模型、组合模型、人工神经网络和深度学习；然后结合具体算法，介绍了智能语音处理的典型应用。包括语音压缩编码、语音增强、语音转换、说话人识别、骨导语音增强；很后对智能语音处理的未来发展进行了展望。本书内容广泛，重点突出，既有深入浅出的原理阐述，又有创新科研成果的总结凝练，理论与实际结合紧密，可读性强。本书可以作为高等院校人工智能、电子信息工程、物联网工程、数据科学与大数据技术、通信工程等专业高年级本科生以及智能科学与技术、信号与信息处理、网络空间安全、通信与信息系统等学科研究生的参考教材，也可供从事语音处理技术研究与应用的科研及工程技术人员参考。

书名	智能语音处理
分类	科学技术-自然科学-自然科普
作者	张雄伟等编
出版社	机械工业出版社
下载
简介	目录前言章智能语音处理导论1 1.1概述1 1.2经典语音处理2 1.2.1语音处理的发展2 1.2.2语音基本表示方法3 1.2.3语音处理基本方法3 1.2.4经典语音处理方法的不足4 1.3智能语音处理5 1.3.1智能语音处理的基本概念5 1.3.2智能语音处理的基本框架5 1.3.3智能语音处理的基本模型6 1.4语音处理的应用7 1.4.1语音处理的传统应用领域8 1.4.2语音处理的新应用领域11 1.5小结14 参考文献14 第2章稀疏和压缩感知15 2.1引言15 2.2稀疏和稀疏表示16 2.2.1稀疏16 2.2.2稀疏表示18 2.3冗余字典19 2.3.1基本概念19 2.3.2字典学习20 2.3.3字典学习算法22 2.3.4原子选择算法25 2.4压缩感知27 2.4.1基本概念27 2.4.2压缩感知模型29 2.4.3观测矩阵30 2.4.4信号重构32 2.5小结33 参考文献33 第3章隐变量模型36 3.1引言36 3.2高斯混合模型36 3.2.1基本概念37 3.2.2GMM参数估计37 3.3隐马尔可夫模型39 3.3.1基本概念39 3.3.2HMM关键问题42 3.4高斯过程隐变量模型48 3.4.1基本模型48 3.4.2GPLVM的理论来源49 3.4.3GPLVM模型训练50 3.5小结51 参考文献51 第4章组合模型52 4.1引言52 4.2主成分分析53 4.2.1基本模型53 4.2.2求解算法54 4.3非负矩阵分解56 4.3.1基本模型56 4.3.2求解算法57 4.3.3NMF与其他数据表示模型的关系58 4.4鲁棒组合模型60 4.4.1组合模型的鲁棒性分析61 4.4.2鲁棒主成分分析61 4.4.3鲁棒非负矩阵分解63 4.5小结64 参考文献64 第5章人工神经网络和深度学习65 5.1引言65 5.2神经网络基础66 5.2.1神经元模型66 5.2.2浅层神经网络67 5.2.3深度神经网络68 5.3深度学习69 5.3.1基本概念和形式69 5.3.2深度网络的学习方法70 5.4深度神经网络的典型结构71 5.4.1深度置信网络71 5.4.2自动编码器与栈式自动编码器72 5.4.3卷积神经网络74 5.4.4循环神经网络75 5.4.5生成式对抗网络77 5.5小结79 参考文献79 第6章语音压缩编码81 6.1引言81 6.2基于字典学习的语音信号压缩感知82 6.2.1语音信号的稀疏性82 6.2.2语音在常见变换域的稀疏化83 6.2.3基于K-L展开的语音非相干字典84 6.2.4基于K-L非相干字典的语音压缩重构87 6.2.5实验仿真与性能分析88 6.3基于梅尔倒谱系数重构的语音压缩编码93 6.3.1基于梅尔倒谱分析的抗噪语音编码模型94 6.3.2基于稀疏约束的梅尔倒谱96 6.3.3梅尔倒谱系数的量化算法99 6.3.4实验仿真与性能分析103 6.4基于深度学习的语音压缩编码107 6.4.1基于DAE的幅度谱编码和量化107 6.4.2基于DAE的低速率语音编码110 6.4.3实验仿真与性能分析111 6.5小结113 参考文献113 第7章语音增强115 7.1引言115 7.2语音增强技术基础116 7.2.1语音增强的估计参数116 7.2.2智能语音增强的语音特征117 7.2.3性能评价118 7.3基于非负矩阵分解的语音增强120 7.3.1基本模型121 7.3.2基于不相交约束非负矩阵分解的语音增强122 7.3.3基于CNMF字典学习的语音增强127 7.4基于深度学习的语音增强136 7.4.1基于听觉感知加权的深度神经网络语音增强方法136 7.4.2基于听觉感知掩蔽的深度神经网络语音增强方法141 7.5小结151 参考文献152 第8章语音转换155 8.1引言155 8.2语音转换基本原理155 8.3语音转换模型与评价156 8.3.1语音分析/模型156 8.3.2语音参数的选择157 8.3.3时间对齐157 8.3.4转换模型和规则158 8.3.5转换性能评价159 8.4基于非负矩阵分解的谱转换160 8.4.1概述160 8.4.2基于卷积非负矩阵分解的谱转换161 8.4.3声道谱转换效果164 8.5基于深度神经网络的谱转换168 8.5.1深度学习驱动下的语音转换168 8.5.2面向谱转换的神经网络模型选择168 8.5.3基于BLSTM和神经网络声码器交替训练的语音转换171 8.6小结176 参考文献176 第9章说话人识别178 9.1引言178 9.2说话人识别基础179 9.2.1说话人识别系统框架179 9.2.2典型的说话人识别模型180 9.3基于i-vector的说话人识别及其改进181 9.3.1基于i-vector的说话人识别概述181 9.3.2用于提高i-vector鲁棒性的帧加权方法182 9.3.3实验结果与分析187 9.4基于深度神经网络的说话人识别187 9.4.1基于深度神经网络的说话人识别概述187 9.4.2基于对比度损失函数优化说话人矢量189 9.4.3实验结果与分析191 9.5说话人识别系统的攻击与防御192 9.5.1攻击和防御的背景192 9.5.2说话人识别系统的攻击方法192 9.5.3说话人识别攻击的检测方法194 9.5.4实验结果与分析196 9.6小结196 参考文献197 0章骨导语音增强200 10.1引言200 10.2骨导语音增强基础201 10.2.1骨导语音的产生与特性201 10.2.2骨导语音盲增强的特点202 10.2.3骨导语音盲增强的典型方法203 10.3基于长短时记忆网络的骨导语音盲增强205 10.3.1骨导/气导语音的谱映206 10.3.2基于深度残差BLSTM的骨导语音盲增强方法207 10.3.3实验仿真及性能分析211 10.4基于均衡-生成组合谱映的骨导语音盲增强215 10.4.1均衡法215 10.4.2基于均衡-生成组合谱映的骨导语音盲增强方法216 10.4.3实验仿真及性能分析218 10.5小结222 参考文献223 1章智能语音处理展望224 11.1智能语音处理的未来224 11.2有待解决的关键技术225 11.2.1语音识别226 11.2.2语音228 11.2.3语音增强229 11.2.4语音处理中的安全问题230 11.3小结230 参考文献230 缩略语232 内容推荐本书从智能化社会对语音处理提出的新要求出发，按照导论-基础理论-应用实践的顺序，系统地介绍了智能语音处理涉及的基础理论、基本技术、主要方法以及典型的智能语音处理应用。首先概述了智能语音处理的相关背景；接着介绍了智能语音处理涉及的基础理论和相关技术，包括稀疏和压缩感知、隐变量模型、组合模型、人工神经网络和深度学习；然后结合具体算法，介绍了智能语音处理的典型应用。包括语音压缩编码、语音增强、语音转换、说话人识别、骨导语音增强；很后对智能语音处理的未来发展进行了展望。本书内容广泛，重点突出，既有深入浅出的原理阐述，又有创新科研成果的总结凝练，理论与实际结合紧密，可读性强。本书可以作为高等院校人工智能、电子信息工程、物联网工程、数据科学与大数据技术、通信工程等专业高年级本科生以及智能科学与技术、信号与信息处理、网络空间安全、通信与信息系统等学科研究生的参考教材，也可供从事语音处理技术研究与应用的科研及工程技术人员参考。
随便看	时光志（网王）天下无球 [网王]雪割之花闲游小说世界2 小禽兽被围观了盐车行评《爷是人妖爷怕谁？！》暗恋「火影°白牙同人」重行似曾那时旧相识凤华 RP冒险小队，出发~ 天凉好个受暮梦（新撰组）冷酷总裁和俏女佣行尸走肉暗精灵的舞蹈评《繁枝》评《麒麟[现代军文]》恋上冬天评《剑鬼蛊师》暂时空你是我的…天然灭蚊器何处安放相思涯花似锦时归 JDiff TOKI LineTest SquareBid For Mac SMasterMind For Mac Listening Singing Teacher For Mac Neuronyx For Mac Integrity For Mac Bonjour Mounter X Lossless Decoder For Mac DeskFun 孢子银河冒险修改器 V10.19.2016 绿色版联众记牌器 V3.90 绿色特别版天天QQ记牌器 V2.66 绿色免费版太阳帝国的原罪十五项修改器 V3.0 英文绿色版刀锋电竞 V2.0.3 官方安装版 QQ四国军棋作弊器 V5.12 官方安装版 QQ四国军旗作弊器 V5.03 绿色版炫舞高手绿色区辅助 V4.6.4 绿色版超级无敌QQ七雄争霸助手 V2017.6.17 绿色版欲望格斗2去马赛克补丁 V1.0 绿色版 complement complementary complementary angle complementary medicine complete completely completeness completion complex complexion [BT下载][杖与剑的魔剑谭][第09集][WEB-AAC-ZEROTV/0.39G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][夜樱家的大作战][第23集][WEB-MP4/0.55G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][夜樱家的大作战][第23集][WEB-MKV/1.27G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][他们的奇妙时光][第13集][WEB-MKV/0.30G][国语配音/中文字幕][1080P][流媒体][ParkTV] [BT下载][他们的奇妙时光][第13集][WEB-MKV/0.29G][国语配音/中文字幕][1080P][流媒体][MiniTV] [BT下载][喜剧之王·单口季][第04集][WEB-MKV/22.45G][国语配音/中文字幕][4K-2160P][H265][流媒体][ParkTV] [BT下载][夜樱家的大作战][第23集][WEB-MKV/0.34G][中文字幕][1080P][流媒体][ParkTV] [BT下载][夜樱家的大作战][第23集][WEB-MKV/0.52G][中文字幕][4K-2160P][H265][流媒体][ParkTV] [BT下载][小市民系列][第09集][WEB-MKV/0.53G][中文字幕][1080P][流媒体][ParkTV] [BT下载][少寨主且慢][短剧][第19-20集][WEB-MKV/0.19G][国语配音/中文字幕][1080P][流媒体][ParkTV] 《饥荒》莎草纸有什么用?《饥荒》怎么做? 《辐射4》鼹鼠疾病怎么治?《辐射4》鼹鼠疾病解药怎么获得? 《辐射4》异形破坏者怎么获得?《辐射4》异形破坏者武器代码是什么? 侠客风云传杭州衙门宝箱开启攻略侠客风云传救萧凯有什么好处？辐射4最好的近战武器是什么？辐射4最好的近战武器怎么获得？辐射4加点重置方法有哪些？辐射4加点重置有什么损失么？辐射4怎么加点最好？辐射4加点流派什么厉害？《辐射4》无限动力装甲在哪里?《辐射4》无限动力装甲代码是多少? 辐射4怎么偷东西？辐射4偷东西有什么技巧？