内容推荐 本书系统地讲解了深度学习技术,阐明核心概念和实践编程技术,是开发者、数据科学家、分析师,以及之前没有机器学习或统计经验的人员人员的理想选择。 本书介绍了深度神经网络的人工神经元和全连接、卷积和循环层等基本构建模块,展示了如何使用它们来构建先进的架构。书中还讲解了如何使用这些概念构建计算机视觉和自然语言处理(NLP)网络,包括Mask R-CNN、GPT和BERT。此外,书中还描述了自然语言翻译器和能根据图像内容生成自然语言系统的原理。 本书基于TensorFlow和Keras提供了简洁、注释良好的代码示例,还提供了相应的PyTorch示例,涵盖了工业和学术界关于深度学习的两个主要Python库。最后,介绍了神经结构搜索(NAS),并探索了重要的伦理问题,为进一步学习深度学习提供了资源。 作者简介 周翊民,中国科学院深圳先进技术研究院研究员,主要从事智能控制、最优控制、机器学习、无人机、智能电网等方面研究。 目录 推荐序一 推荐序二 前言 第1章 Rosenblatt感知器 1.1 双输入感知器示例 1.2 感知器学习算法 1.3 感知器的局限性 1.4 组合多个感知器 1.5 感知器的几何解释 1.6 理解偏差项 第2章 基于梯度的学习 2.1 感知器学习算法的直观解释 2.2 用梯度下降法解决学习问题 2.3 网络中的常量与变量 2.4 感知器学习算法的解析 2.5 感知器学习算法的几何描述 2.6 重新审视不同类型的感知器 2.7 使用感知器进行模式识别 第3章 Sigmoid神经元与反向传播 3.1 改进的神经元实现多层网络的梯度下降 3.2 激活函数的选择 3.3 复合函数和链式法则 3.4 利用反向传播计算梯度 3.4.1 前向传播阶段 3.4.2 后向传播阶段 3.4.3 权重调整 3.5 每层具有多个神经元的反向传播 3.6 编程示例:学习XOR函数 3.7 网络结构 第4章 用于多分类的全连接网络 4.1 训练网络时所用数据集简介 4.1.1 探索数据集 4.1.2 数据集中的人为偏见 4.1.3 训练集、测试集和泛化 4.1.4 超参数调优和测试集信息泄漏 4.2 训练与推理 4.3 扩展网络和学习算法以进行多分类 4.4 用于数字分类的网络 4.5 多分类的损失函数 4.6 编程示例:手写数字分类 4.7 小批量梯度下降 第5章 走向DL:框架和网络调整 5.1 编程示例:转移到DL框架 …… 第6章 全连接网络在回归中的应用 第7章 卷积神经网络在图像分类中的应用 第8章 深度卷积神经网络和预训练模型 第9章 用循环神经网络预测时间序列 第10章 长短期记忆 第11章 使用LSTM和集束搜索自动补全文本 第12章 神经语言模型和词嵌入 第13章 Word2vec和GloVe的词嵌入 第14章 序列到序列网络和自然语言翻译 第15章 注意力机制和Transformer架构 第16章 用于图像字幕的一对多网络 第17章 其他主题 第18章 总结和未来展望 附录A 线性回归和线性分类 附录B 目标检测和分割 附录C Word2vec和GloVe之外的词嵌入 附录D GPT、BERT和RoBERTa 附录E Newton-Raphson法与梯度下降法 附录F 数字分类网络的矩阵实现 附录G 卷积层与数学卷积的关系 附录H 门控循环单元 附录I 搭建开发环境 附录J 备忘清单 参考文献 |