![]()
内容推荐 本书主要讲述深度学习在音乐生成领域的研究意义、具体方法、方向目标、表示、挑战策略、框架融合等,并对表示与框架融合方面进行详细描述。深度学习与音乐生成技术相结合的方式策略、该领域研究结果的评判标准以及交叉知识的具体体现是本书的重要部分。 深度学习和音乐生成技术的融合是一个新颖的研究方向,而本书没有拘泥于使用何种框架进行实现,而是通过对比多种实现方式提供多方面的思路,对于后续学者的研究有较强的引导作用。 本书适合对音乐生成技术和深度学习前沿技术感兴趣的读者阅读,能够开拓视野,同时对广大音乐和计算机爱好者也有一定的参考价值。 目录 第1章 引言 1.1 动机 1.1.1 基于计算机的音乐系统 1.1.2 自主创作与辅助创作 1.1.3 符号化人工智能与次符号化人工智能 1.1.4 深度学习 1.1.5 现状和未来 1.2 这本书是讲什么的 1.2.1 其他书籍和资料来源 1.2.2 其他模型 1.2.3 深度学习与马尔可夫模型 1.2.4 学习需求和路线图 1.2.5 本书涉及的范围 第2章 方法 2.1 五个维度 2.1.1 目标 2.1.2 表表示 2.1.3 架构 2.1.4 挑战 2.1.5 策略 2.2 讨论 第3章 目标 3.1 属性 3.1.1 音乐类型 3.1.2 目标与应用 3.1.3 生成模式 3.1.4 音乐风格 第4章 表示 4.1 数据的阶段和类型 4.2 音频数据与符号化数据 4.3 基于音频的表示 4.3.1 波形表示 4.3.2 转换表示 4.3.3 声音频谱图 4.3.4 声色谱图 4.4 符号化表示 4.5 主要概念 4.5.1 音符 4.5.2 休止符 4.5.3 音程 4.5.4 和弦 4.5.5 节奏 4.6 多声部/多轨道 4.7 音乐格式 4.7.1 MIDI格式 4.7.2 钢琴打孔纸卷格式 4.7.3 文本格式 4.7.4 标记语言 4.7.5 领谱 4.8 时间范围和粒度 4.8.1 时间范围 4.8.2 时间粒度 4.9 元数据 4.9.1 音符保持/结束 4.9.2 音名表示(与异名同音) 4.9.3 特征提取 4.10 音乐表现力 4.10.1 时间节奏 4.10.2 音乐力度 4.10.3 音频 4.11 编码 4.11.1 编码策略 4.11.2 One-Hot、Many-Hot及Multi-One-Hot编码 4.11.3 编码小结 4.11.4 Binning 4.11.5 优缺点 4.11.6 和弦 4.11.7 特殊的音符保持与休止符 4.11.8 鼓和打击乐器 4.12 数据集 4.12.1 移调和对齐 4.12.2 音乐数据集和语料库 第5章 架构 5.1 神经网络简介 5.1.1 线性回归 5.1.2 符号 5.1.3 模型训练 5.1.4 梯度下降训练算法 5.1.5 从模型到体系架构 5.1.6 从模型到线性代数表示 5.1.7 从简单模型到多元模型 5.1.8 激活函数 5.2 基本组件 5.2.1 前馈计算 5.2.2 同时计算多个输入数据 5.3 机器学习 5.3.1 定义 5.3.2 机器学习分类 5.3.3 组成 5.3.4 优化 5.4 体系架构 5.5 多层神经网络 5.5.1 抽象表示法 5.5.2 深度 5.5.3 输出激活函数 5.5.4 代价函数 5.5.5 解释 5.5.6 熵与交叉熵 5.5.7 前馈传播 5.5.8 训练 5.5.9 过拟合 5.5.10 正则化 5.5.11 超参数 5.5.12 平台和库 5.6 自动编码器 5.6.1 稀疏自动编码器 5.6.2 变分自动编码器 5.6.3 堆栈式自动编码器 5.7 受限玻尔兹曼机 5.7.1 训练 5.7.2 采样 5.7.3 变量的类型 5.8 递归神经网络 5.8.1 可视表示 5.8.2 训练 5.8.3 长短时记忆(LSTM) 5.8.4 注意力机制 5.9 卷积架构模式 5.9.1 原理 5.9.2 卷积的阶段 5.9.3 池化 5.9.4 多层卷积结构 5.9.5 基于时变的卷积 5.10 基于调控的架构模式 5.11 生成对抗网络(GAN)体系架构模式 5.12 强化学习 5.13 复合架构 5.13.1 复合的类型 5.13.2 双向RNN 5.13.3 RNN编码器-解码器 5.13.4 变分RNN编码器-解码器 5.13.5 面向复调的循环网络 5.13.6 进一步的复合架构 5.13.7 组合的局限性 第6章 挑战及策略 6.1 架构和表示维度的符号 6.2 入门示例 6.2.1 单步前馈策略 6.2.2 示例:MiniBach——《圣咏曲》对位伴奏符号音乐生成系统 6.2.3 第一个分析 6.3 局限性及挑战 6.4 基于ExNihilo的生成 6.4.1 解码器前馈 6.4.2 采样 6.5 音乐长度的可变性 6.6 音乐内容的可变性 6.7 音乐表现力 6.8 RNN与迭代前馈的再探讨 6.8.1 #1示例:Time-windowed——旋律符号音乐生成系统 6.8.2 #2示例:Sequential——旋律符号音乐生成系统 6.8.3 #3示例:BLSTM——和弦伴奏符号音乐生成系统 6.8.4 总结 6.9 旋律-和弦交互 6.9.1 #1示例:RNN-RBM——面向复调的符号音乐生成系统 6.9.2 #2示例:Hexahedria——面向复调的符号音乐生成架构 6.9.3 #3示例:Bi-Axial LSTM——面向复调的符号音乐生成架构 6.10 控制 6.10.1 控制策略的维度 6.10.2 采样 6.10.3 调控 6.10.4 输入操纵 6.10.5 输入操控和采样 6.10.6 强化学习 6.10.7 Unit Selec1ion 6.11 风格迁移 6.11.1 作曲风格转移 6.11.2 音色风格迁移 |