本书结合作者们对说话人识别进行的研究和工作,在对说话人识别的基本概念和方法进简要介绍的基础上详细介绍了他们在测试语料库、特征组合、特征变换、识别模型以及应用系统开发的最新重要研究成果。
全书分为五篇,共十五章,主要内容包括说话人特征分析与优化,基于支持向量机的识别模型,基于主成分分析分类器的说话人识别,声门信息融合,支持说话人识别研究与开发的开发式平台SONAR等。
说话人识别是根据语音波形中反映说话人生理和行为的特征的语音参数,自动识别说话人身份的技术。本书作者结合多年的科研工作,分5个部分介绍了说话人识别的基本概念、方法以及最新研究进展。第1部分概括介绍说话人识别的主要概念、基本原理、研究历史与现状,以及测试语料库的构建;第2部分介绍作者对特征提取提出的不同改进方法,包括特征组合与特征变换;第3部分是作者提出的新的说话人识别模型,包括支持向量机、动态贝叶斯网络、主成分分析;第4部分介绍作者在基于信息融合的说话人识别上的创新工作;第5部分介绍作者开发的一个软件平台及其基础上的两个具体应用系统,最后是全书总结并展望发展趋势。
本书可供信息工程、电子工程、计算机科学与技术、公安、军事侦察等领域的科技工作者参考,也可以作为高等院校信号与信息处理、通信与电子系统、模式识别、生物医学等学科专业的研究生或高年级本科生的教学参考书。
第一篇 绪论
第1章 背景与概述
1.1 研究背景及意义
1.1.1 说话人识别介绍
1.1.2 说话人识别的优势与应用前景
1.2 研究进展与趋势
1.2.1 研究历史
1.2.2 研究现状
1.2.3 发展趋势
1.2.4 存在的问题
1.3 本书结构
参考文献
第2章 技术基础与理论
第3章 说话人识别语料库
第二篇 特征提取
第4章 说话人特征分析与优化
第5章 基于主成分分析(PCA)的说话人特征变换
第6章 基于线性判别分析(LDA)的说话人特征变化
第7章 基于轨线模型的说话人特征时序性发掘
第三篇 识别模型
第8章 基于支持向量机的识别模型
第9章 基于动态贝叶斯网络的识别模型
第10章 基于主成分分析分类器的说话人识别
第四篇 信息融合
第11章 声门信息融合
第12章 人脸信息融合
第五篇 应用展望
第13章 支持说话人识别研究与开发的开发式平台SONAR
第14章 应用系统
第15章 总结与展望