网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 人工智能(语音识别理解与实践)(精)
分类
作者 俞栋//邓力//俞凯//钱彦旻
出版社 电子工业出版社
下载
简介
作者简介
"俞栋
电气电子工程师学会会士(IEEE Fellow)、靠前计算机学会杰出科学家(ACM Distinguished Scientist)。现任腾讯人工智能实验室副主任、腾讯公司杰出科学家,香港中文大学(深圳)、上海交通大学、浙江大学等多所高校的客座/兼职教授。加入腾讯前,是微软雷德蒙研究院语音与对话系统首席研究员。作为语音识别和深度学习方向的有名学者,出版了两本专著和 200 多篇论文(Google Scholar 引用近 3 万),是 80 余项的发明人以及深度学习开源软件 CNTK 的发起人和主要作者之一。在基于深度学习的语音识别和分离技术上进行了一系列开创性工作,极大地推动了语音处理领域的发展发表的论文获得了 2005 年 ACMSE 很好论文奖以及 2013 年和 2016年 IEEE 信号处理学会很好论文奖。曾担任 IEEE 语音语言处理专业委员会委员(IEEE Speech and Language Processing Technical Committee)、IEEE 西雅图分会副主席和 APSIPA 杰出讲师,也曾任 IEEE/ACM 音频、语音及语言处理汇刊(IEEE/ACM Transactions on Audio,Speech &LanguageProcessing)和 IEEE 信号处理杂志(IEEE Signal ProcessingMagazine)等期刊的编委,以及多个靠前会议的技术委员会和组织委员会成员。
邓力
人工智能、机器学习和语音语言信号处理获得者有名专家,曾任微软首席人工智能科学家和深度学习技术中心研究经理。在美国威斯康星大学先后获得硕士和博士学位,然后在加拿大滑铁卢大学任教获得终身正教授职务,并曾任麻省理工学院研究员职位。1999 年加入微软研究院历任数职,并在 2014 年年初创办深度学习技术中心,主持微软公司及其研究院的人工智能和深度学习领域的技术创新工作。研究方向包括自动语音与说话者识别、口语识别与理解、语音–语音翻译、机器翻译、语言模式、统计方法与机器学习、听觉和其他生物信息处理、深层结构学习、类脑机器智能、图像语言多模态深度学习,商业大数据深度分析等,在相关领域做出了重大贡献。被评选为加拿大国家工程院院士、美国华盛顿科学院院士、美国声学学会会士(ASA Fellow)、电气电子工程师学会会士和理事、靠前语音通信协会会士(ISCA Fellow),并凭借在深度学习与自动语音识别方向做出的杰出贡献,荣获 2015 年度 IEEE信号处理技术成就奖。曾在很好杂志和会议上发表与上述研究方向相关的300 余篇学术论文,出版过 5 部著作,发明及合作发明 70 多项。曾担任 IEEE 信号处理杂志(IEEE Signal Processing Magazine)和IEEE/ACM 音频、语音及语言处理汇刊(IEEE/ACM Transactions onAudio,Speech & LanguageProcessing)的主编。于 2017 年 5 月加入美国城堡基金任首席人工智能官(Chief AI Officer) 至今。
俞凯
上海交通大学计算机科学与工程系教授,思必驰公司创始人、首席科学家。清华大学自动化系学士、硕士,剑桥大学工程系博士。入选中组部“千人计划”(青年项目),获得国家自然科学基金委很好青年科学基金,并任上海市“东方学者”特聘教授。作为 IEEE 不错会员,担任 IEEE 语音语言处理专业委员会委员,IEEE/ACM 音频、语音及语言处理汇刊编委;担任中国人工智能产业发展联盟学术和知识产权组组长、中国语音产业联盟技术工作组副组长、中国计算机学会语音对话及听觉专业组副主任。长期从事对话式人工智能的研究和产业化工作,研究兴趣涉及语音识别、合成、理解、对话系统、认知型人机交互等智能语音语言处理技术的多个核心技术领域,发表靠前期刊和会议论文 150 余篇,获得靠前语音通信协会(ISCA)2008-2012 计算机语音及语音很优论文奖、2019 语音通信很优论文奖和 InterSpeech 等靠前会议很优论文奖,担任 InterSpeech、SigDial 等靠前会议程序委员会主席和技术领域主席。2014 年获得中国人工智能学会颁发的“吴文俊人工智能科学技术奖”进步奖,获评“2016 科学中国人年度人物”,2017 年获得中国计算机学会“杰出演讲者”,2018 年获得中国计算机学会“青竹奖”。创立思必驰公司,进行智能语音及对话技术的产业化。思必驰公司已经具有较高的行业影响力,作为中国人工智能领域创业公司的很好代表,被列入 2016 高盛优选人工智能报告“AI Key Players” 及 2017 年 Gartner“Cool Vendors for AI (East Asia)”报告。
钱彦旻
上海交通大学计算机科学与工程系副教授,博士生导师,上海交大–思必驰联合实验室副主任。华中科技大学学士、清华大学博士、英国剑桥大学工程系博士后,上海市青年英才扬帆计划获得者。现为 IEEE 不错会员、ISCA 会员,同时是靠前开源项目 Kaldi 语音识别工具包的 13 位创始成员之一。担任 InterSpeech、ISCSLP 等靠前会议的领域主席和 TPC 委员,IEEE T-ASLP、IEEE J-STSP、IEEE SPL、ICASSP、InterSpeech 等期刊和靠前会议审稿人。有 10 余年从事智能语音及语言处理、人机交互、模式识别及机器学习的研究和产业化工作经验。在本领域的品质靠前期刊和会议上发表学术论文 130 余篇,Google Scholar 引用总数 6500 余次,申请 50余项,合作撰写和翻译多本外文图书。3 次获得领域内靠前非常不错期刊和会议的很优论文奖,包括靠前语音通信协会(ISCA)和欧洲信号处理联盟(EURASIP)在 2019 年颁发的 Speech Communication 杂志五年很优论文奖,靠前会议 IEEE ASRU2019 颁发的很优论文奖和 IEEE ISCSLP2016颁发的很优学生论文奖。作为负责人和主要参与者参加了包括国家自然科学基金、国家重点研发计划、国家 863、英国 EPSRC 等多个项目;作为主要参与人所负责搭建的多类别复杂广播语音处理系统在 MGB2015 靠前竞赛中获得语音识别、说话人分割聚类等全部 4 个单项的世界名。2014年,因在智能语音技术产业化方面的贡献,获得中国人工智能学会颁发的“吴文俊人工智能科学技术奖”。目前的研究领域包括:语音识别、说话人和语种识别、语音抗噪与分离、语音情感感知、自然语言理解、深度学习建模、多媒体信号处理等。"
目录
章 简介
1.1 自动语音识别:更好的沟通之桥
1.1.1 人类之间的交流
1.1.2 人机交流
1.2 语音识别系统的基本结构
1.3 口语理解与人机对话系统
1.4 全书结构
第Ⅰ部分 传统声学模型
第2章 混合高斯模型
2.1 随机变量
2.2 高斯分布和混合高斯随机变量
2.3 参数估计
2.4 采用混合高斯分布对语音特征建模
第3章 隐马尔可夫模型及其变体
3.1 介绍
3.2 马尔可夫链
3.3 序列与模型
3.3.1 隐马尔可夫模型的性质
3.3.2 隐马尔可夫模型的仿真
3.3.3 隐马尔可夫模型似然度的计算
3.3.4 计算似然度的高效算法
3.3.5 前向与后向递归式的证明
3.4 期望优选化算法及其在学习HMM参数中的应用
3.4.1 期望优选化算法介绍
3.4.2 使用EM算法来学习HMM参数——Baum-Welch算法
3.5 用于解码HMM状态序列的维特比算法
3.5.1 动态规划和维特比算法
3.5.2 用于解码HMM状态的动态规划算法
3.6 隐马尔可夫模型和生成语音识别模型的变体
3.6.1 用于语音识别的GMM-HMM模型
3.6.2 基于轨迹和隐藏动态模型的语音建模和识别
3.6.3 使用生成模型HMM及其变体解决语音识别问题
第Ⅱ部分 深层神经网络在语音识别中的应用及分析
第4章 全连接深层神经网络
4.1 全连接深层神经网络框架
4.2 使用误差反向传播进行参数训练
4.2.1 训练准则
4.2.2 训练算法
4.3 实际应用
4.3.1 数据预处理
4.3.2 模型初始化
4.3.3 权重衰减
4.3.4 丢弃法
4.3.5 批规范化
……
第Ⅲ部分 先进深度学习模型在语音识别中的应用
第Ⅳ部分 不错语音识别方法
第Ⅴ部分 复杂场景下的语音识别
第Ⅵ部分 口语理解及对话系统的深度学习实践
第Ⅶ部分 总结及展望
缩略词表
作者简介
参考文献
内容推荐
全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括"深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/1/31 20:37:55