![]()
内容推荐 韩冰主编的《数字音视频处理(普通高等教育电子信息类十三五课改规划教材)》从人类听觉、视觉的处理机制出发,系统地介绍了听觉和视觉感知模型、数字音频技术、音视频(图像)压缩编码技术、音视频(图像)处理技术和基于内容的音视频(图像)检索技术等内容。在介绍各部分内容的同时,给出了相关知识的应用实例,具有较高的参考学习和实用价值。本书覆盖的学科领域十分广泛,包括人工智能、信号处理、图像处理、语音处理、视频处理和模式识别等一系列学科。读者可以通过本书,学习到很多具有普遍价值的知识和具体的应用方法。 本书可作为高等学校电子信息工程、通信工程和计算科学与技术等相关专业的本科、研究生教材,同时也可作为高职、高专音视频应用相关课程的参考书。 目录 第1章 绪论 1.1 数字音视频基础 1.2 数字音视频技术的发展趋势 1.3 数字音视频系统的组成 1.4 本章小结 第2章 听视觉处理的脑机制 2.1 听觉的生理基础 2.1.1 听觉感知模型的国内外研究现状 2.1.2 人类听觉系统简介 2.1.3 听觉特性 2.1.4 听觉掩蔽 2.1.5 听觉加工理论 2.2 视觉的生理基础 2.2.1 研究现状 2.2.2 视觉感知 2.2.3 人类视觉系统概述 2.2.4 视觉注意机制 2.3 本章小结 第3章 数字音频技术基础 3.1 数字信号处理基础 3.1.1 线性和时不变 3.1.2 冲激响应和卷积 3.1.3 傅里叶变换、拉普拉斯变换和Z变换 3.1.4 离散时间傅里叶变换(DTFT)与离散傅里叶变换(DFT) 3.2 语音信号产生模型 3.2.1 语音信号产生机理 3.2.2 语音信号产生的数字模型 3.3 语音信号的时域模型 3.3.1 语音信号的预处理 3.3.2 短时平均能量 3.3.3 短时平均过零率 3.3.4 短时自相关函数 3.4 语音信号的频谱分析 3.4.1 短时傅里叶变换(STFT)的定义和物理意义 3.4.2 短时傅里叶变换的取样率 3.4.3 语音信号的重构 3.4.4 窗长及形状对STFT的影响 3.4.5 语音的语谱图分析 3.4.6 语音的倒谱 3.5 本章小结 第4章 音视频获取软件和方法 4.1 音频信号采集软件和方法 4.1.1 常见的音频采集设备的特点 4.1.2 音频采集软件Windows录音机 4.1.3 音频处理工具Sony Sound Forge 4.2 图像/视频信号采集工具和方法 4.2.1 图像信息采集技术 4.2.2 视频信息采集技术 4.3 音频/视频格式的转换 4.3.1 音频格式转换 4.3.2 视频格式转换 4.4 本章小结 第5章 音频压缩编码 5.1 音频压缩概述 5.1.1 音频信号 5.1.2 音频压缩的必要性和可能性 5.2 音频编码技术 5.2.1 波形编码 5.2.2 参数编码 5.2.3 混合编码 5.2.4 感知编码 5.3 MPEG音频编码标准 5.3.1 MPEG-1音频压缩编码标准 5.3.2 MPEG-2音频压缩编码标准 5.3.3 MPEG-4音频压缩编码标准 5.4 本章小结 第6章 图像视频压缩编码 6.1 图像视频压缩概述 6.1.1 图像视频信号的特点 6.1.2 图像视频压缩的必要性和可行性 6.2 图像压缩编码技术 6.2.1 图像压缩编码系统的基本结构 6.2.2 统计编码 6.2.3 变换编码 6.2.4 矢量量化编码 6.2.5 预测编码 6.3 视频编码技术 6.3.1 视频编码系统的一般结构 6.3.2 视频编码方案分类 6.3.3 采用时间预测和变换编码的视频编码 6.4 静止图像压缩标准 6.4.1 JPEG静止图像压缩标准 6.4.2 JPEG 2000静止图像压缩标准 6.5 MPEG视频编码标准 6.6 本章小结 第7章 数字音频处理技术 7.1 语音信号合成的基本方法 7.1.1 概述 7.1.2 共振峰合成法 7.1.3 线性预测合成法 7.1.4 基音同步叠加法 7.1.5 文语转换系统 7.2 语音识别的基本技术和方法 7.2.1 概述 7.2.2 语音识别原理 7.2.3 特征表示与提取 7.2.4 动态时间规整 7.2.5 有限状态矢量量化技术 7.2.6 孤立字(词)语音识别系统 7.2.7 连续语音识别系统 7.3 本章小结 第8章 数字图像/视频处理技术 8.1 图像的低层视觉处理 8.1.1 概述 8.1.2 空域滤波增强 8.1.3 频域增强 8.2 图像的中层视觉处理 8.2.1 概述 8.2.2 图像分割的定义和依据 8.2.3 边缘点检测 8.2.4 边缘线跟踪 8.2.5 门限化分割 8.2.6 区域分割法 8.3 视频处理中的关键技术研究 8.3.1 概述 8.3.2 镜头边界检测 8.3.3 视频关键帧的提取方法 8.3.4 视频目标检测 8.4 本章小结 第9章 基于内容的视频检索技术 9.1 引言 9.1.1 信息检索 9.1.2 多媒体检索 9.2 基于内容的音频检索 9.2.1 国内外研究现状 9.2.2 基于内容的音频检索的总体框架 9.2.3 基于内容的音频检索的难点 9.2.4 现有的音频检索系统 9.3 基于内容的图像检索技术 9.3.1 基于内容的图像检索系统的检索过程和关键技术 9.3.2 现有的图像检索系统 9.3.3 图像检索系统的发展趋势 9.4 基于内容的视频检索技术 9.4.1 引言 9.4.2 基于内容的视频检索及关键技术 9.4.3 现有的基于内容的视频检索系统 9.4.4 TRECVID(The Text Retrieval Conference Video Track)会议 9.4.5 存在的问题及发展趋势 9.5 本章小结 参考文献
|