![]()
内容推荐 本书通过扎实、详细的内容和清晰的结构,从算法理论、算法源码、实验结果等方面对深度学习算法进行分析和介绍。本书共三篇,第一篇主要介绍深度学习在计算机视觉方向的一些卷积神经网络,从基础骨干网络、轻量级CNN、模型架构搜索3个方向展开,介绍计算机视觉方向的里程碑算法;第二篇主要介绍深度学习在自然语言处理方向的重要突破,包括基础序列模型和模型预训练;第三篇主要介绍深度学习在模型优化上的进展,包括模型优化方法。 通过阅读本书,读者可以深入理解主流的深度学习基础算法,搭建起自己的知识体系,领会算法的本质,学习模型优化方法。无论是从事深度学习科研的教师及学生,还是从事算法落地实践的工作人员,都能从本书中获益。 作者简介 刘岩,澳门大学计算机科学专业硕士,目前就职于京东零售-技术与数据中心。在学生期间从事人工智能相关研究,发表多篇计算机视觉、自然语言处理等方向的专利和学术论文。毕业后从事深度学习相关工作,擅长前沿人工智能算法的原理分析和应用落地,擅长计算机视觉、自然语言处理等方向的技术,先后参与并负责了多个深度学习算法在不同场景的业务落地,如光学字符识别、公式识别、人脸识别、手势识别、视频抠像、文本分类/命名实体识别、预训练语言模型、语音识别、图神经网络等。目前主要负责电商场景下预训练语言模型的研发以及舆情风险的智能识别与治理。 知乎账号:大师兄 目录 第一篇 卷积神经网络 第1章 基础骨干网络 1.1 起源:LeNet-5和AlexNet 1.1.1 从LeNet-5开始 1.1.2 觉醒:AlexNet 1.2 更深:VGG 1.2.1 VGG介绍 1.2.2 VGG的训练和测试 1.3 更宽:GoogLeNet 1.3.1 背景知识 1.3.2 Inception v1 1.3.3 GoogLeNet 1.3.4 Inception v2 1.3.5 Inception v3 1.3.6 Inception v4 1.3.7 Inception-ResNet 1.4 跳跃连接:ResNet 1.4.1 残差网络 1.4.2 残差网络背后的原理 1.4.3 残差网络与模型集成 1.5 注意力:SENet 1.5.1 SE块 1.5.2 SE-Inception和SE-ResNet 1.5.3 SENet的复杂性分析 1.5.4 小结 1.6 更密:DenseNet 1.6.1 DenseNet算法解析及源码实现 1.6.2 压缩层 1.6.3 小结 1.7 模型集成:DPN 1.7.1 高阶RNN、DenseNet和残差网络 1.7.2 DPN详解 1.7.3 小结 1.8 像素向量:iGPT 1.8.1 iGPT详解 1.8.2 实验结果分析 1.8.3 小结 1.9 Visual Transformer之Swin Transformer 1.9.1 网络结构详解 1.9.2 SwinTransformer家族 1.9.3 小结 1.10 Vision Transformer之CSWin Transformer 1.10.1 CSWin Transformer概述 1.10.2 十字形窗口自注意力机制 1.10.3 局部加强位置编码 1.10.4 CSWin Transformer块 1.10.5 CSWin Transformer的复杂度 1.10.6 小结 1.11 MLP?:MLP-Mixer 1.11.1 网络结构 1.11.2 讨论 …… 第二篇 自然语言处理 第三篇 模型优化 |