内容推荐 本书从技术、应用和产业3个维度为切入点,对智能语音语义领域相关的热点和趋势展开研究。本书首先以“从人际交流到人机对话”开篇,讲述人类语音生成、传播和感知的过程,引发对于机器智能语音听说的思考,进而阐述技术探索发展史;分析了以语音交互为核心的技术现状,综合剖析提出全双工、端到端模型构建、语音假冒攻击等热点;其次,从政策、投融资和产业规模上,分析整体智能语音产业环境,纵观国内外企业在相关技术和产品上的积极布局,介绍了智能语音的产业链和产业格局;最后,围绕语音交互技术形成的应用,以智能汽车、智能家居、可穿戴设备、智能客服、医疗、教育等诸多细分领域为代表,提出“AI+基础服务”“AI+硬件设备”“AI+垂直行业”3种应用转化参考模式,并列举实际具体案例和解决方案。 本书适合从事人工智能技术研发、产品应用、市场规划的工程技术人员和管理人员参考使用,也可作为高等院校人工智能相关专业师生的参考用书。同时,也适合对人工智能语音技术感兴趣的相关人员阅读。 作者简介 李荪,中国信息通信研究院云计算与大数据研究所人工智能研究员及高级业务主管,工业和信息化部人工智能关键技术与应用评测重点实验室和“可信AI”评测智能交互评测专家。研究方向包括人工智能政策、标准、产业,涵盖机器学习、语音感知认知技术、智能人机交互以及行业应用融合,重点参与工业和信息化部与地方政府多个人工智能课题研究和产业规划项目,牵头起草多项人工智能技术服务国际和行业标准,累计发表论文10余篇。 目录 第1章 从人际交流到人机对话 1.1 语言“塑造”了人类 1.1.1 语言在人类进化过程中的作用 1.1.2 语言的功能 1.2 语言与语言科学 1.2.1 人类语言概况 1.2.2 和语言有关的科学与技术 1.3 语音的产生与感知 1.3.1 语音交互与言语链 1.3.2 语音的声学基础 1.3.3 语音产生的生理基础 1.4 人与机器的对话 1.4.1 人类语言交际的转向 1.4.2 语音的数字化表达 第2章 智能语音基本技术 2.1 主流的语音交互技术 2.1.1 语音识别 2.1.2 声纹识别 2.1.3 语音合成 2.1.4 自然语言处理 2.1.5 对话管理 2.1.6 角色分离 2.1.7 语音增强 2.2 深度学习成为加速器:新技术到“黑科技” 2.2.1 端到端技术 2.2.2 预训练机制 2.2.3 模型压缩和轻量化部署 第3章 智能语音产业发展 3.1 产业环境 3.1.1 产业发展历程 3.1.2 重点政策解析 3.1.3 发展规划布局 3.1.4 创新合作模式 3.2 市场及生态 3.2.1 行业市场价值逐渐释放 3.2.2 生态格局呈现多元化 3.2.3 企业成长方面的一些思考 3.3 标准及规范 3.3.1 技术评估指标介绍 3.3.2 国内外标准制定现状 3.3.3 标准需求及发展趋势 3.4 产业应用创新实践 3.4.1 “AI语音+终端”:消费级市场潜力显现疫情催发新业态 3.4.2 “AI语音+服务”:智能语音深度赋能平台服务 3.4.3 “AI语音+场景”:突破价值释放“最后一公里” 第4章 AI语音与热点话题和技术:千丝万缕的联系 4.1 语音+大数据+云 4.1.1 我们身边的大数据 4.1.2 语音的特殊身份 4.1.3 数据类型与存储 4.1.4 语音结构化 4.2 语音 安全 4.2.1 语音欺诈,又一个潘多拉盒子 4.2.2 知己知彼:了解和研究语音欺诈、攻击手段 4.2.3 降维打击:抗攻击防欺诈的一张盾牌 4.2.4 国内政策法规的保护臂膀 4.2.5 个人语音数据全生命周期的安全建议 4.3 语音+普惠服务 4.3.1 新技术的应用要做到普惠 4.3.2 智能语音技术可以提供什么样的普惠服务 4.3.3 科技和人类的和谐共生 4.4 语音+多模态交互 4.4.1 语音交互新挑战和探索 4.4.2 多模态交互成为趋势 4.4.3 语音助手向智慧助手发展 结束语 参考文献 |