网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 破解深度学习(基础篇):模型算法与实现
分类 教育考试-考试-计算机类
作者 瞿炜
出版社 人民邮电出版社
下载
简介
编辑推荐
1.B站知名人工智能垂直类博主梗直哥创作,基于全网累计播放百万次的人工智能系列视频和课程编写。
2.配套视频(原付费内容)助力学习,提升学习效率,讲解深度学习背后的基础知识。
3.涵盖当前深度学习的热点领域,从理论到实战全方位展开,全面解除前沿技术。
4.知乎、B站、公众号、知识星球等设有交流互动渠道,针对不同读者群体提供不的教学内容和方法。
内容推荐
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。
本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和推荐工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神经网络)。
本书系统全面,深入浅出,且辅以生活中的案例进行类比,以此降低学习难度,帮助读者迅速掌握深度学习的基础知识。本书适合有志于投身人工智能领域的人员阅读,也适合作为高等院校人工智能专业的教学用书。
目录
第 1章 欢迎来到深度学习的世界\t1
1.1  什么是深度学习\t1
1.2  主要核心模型\t3
1.2.1  卷积神经网络\t3
1.2.2  循环神经网络\t4
1.2.3  注意力机制\t4
1.2.4  深度生成模型\t5
1.2.5  小结\t6
1.3  研究和应用领域\t6
1.3.1  计算机视觉\t6
1.3.2  语音技术\t7
1.3.3  自然语言处理\t7
1.3.4  多模态融合\t8
1.3.5  小结\t9
1.4  使用的技术栈\t9
1.4.1  编程语言\t9
1.4.2  深度学习框架\t9
1.4.3  数据集\t10
1.4.4  代码编辑器\t10
1.4.5  项目IDE\t10
1.4.6  小结\t10
第 2章 必要的数学预备知识\t11
2.1  线性代数\t12
2.1.1  学人工智能为什么要学线性
     代数\t12
2.1.2 线性代数名字的由来\t13
2.1.3  线性代数的本质作用\t13
2.1.4  学线性代数为何总强调几何
     意义\t13
2.1.5  标量\t14
2.1.6  向量\t14
2.1.7  矩阵\t17
2.1.8  张量\t19
2.1.9  小结\t20
2.2  微积分\t20
2.2.1  极限\t21
2.2.2  导数\t21
2.2.3  微分\t23
2.2.4  偏导数\t23
2.2.5  梯度\t24
2.2.6  链式法则\t24
2.2.7  小结\t25
2.3  概率统计\t25
2.3.1  什么是概率\t25
2.3.2  概率和统计\t28
2.3.3  贝叶斯定理\t30
2.3.4  优选似然估计\t31
2.3.5  小结\t31
第3章 环境安装和工具使用\t33
3.1  配置深度学习环境\t34
3.1.1  CUDA简介\t34
3.1.2  显卡驱动\t34
3.1.3  安装CUDA\t35
3.1.4  安装Anaconda\t37
3.1.5  小结\t39
3.2  conda实用命令\t39
3.2.1  Anaconda 图形化界面介绍\t39
3.2.2  conda的命令行操作\t41
3.2.3  小结\t43
3.3  Jupyter Notebook快速上手\t44
3.3.1  Jupyter Notebook的安装与
运行\t45
3.3.2  常用配置项\t47
3.3.3  快捷键\t48
3.3.4  Markdown语法\t49
3.3.5  小结\t50
3.4  安装深度学习框架PyTorch\t50
3.4.1  PyTorch、CUDA与
NVIDIA\t50
3.4.2  安装PyTorch\t50
3.4.3  验证安装是否成功\t51
3.4.4  小结\t52
第4章 深度神经网络:误差倒查
分解\t53
4.1  神经网络原理\t53
4.1.1  神经元模型\t53
4.1.2  神经网络结构\t54
4.1.3  损失函数\t57
4.1.4  反向传播\t58
4.1.5  小结\t59
4.2  多层感知机\t59
4.2.1  线性模型的局限\t60
4.2.2  多层感知机模型\t61
4.2.3  激活函数\t61
4.2.4  小结\t66
4.3  前向传播和反向传播\t67
4.3.1  前向传播\t67
4.3.2  反向传播\t68
4.3.3  小结\t70
4.4  多层感知机代码实现\t70
4.4.1  搭建神经网络的步骤\t71
4.4.2  代码实现\t71
4.4.3  小结\t76
4.5  回归问题\t76
4.5.1  一元线性回归\t77
4.5.2  多元线性回归\t78
4.5.3  多项式回归\t79
4.5.4  简单理解梯度下降\t80
4.5.5  代码实现\t80
4.5.6  小结\t84
4.6  分类问题\t84
4.6.1  多分类问题的数学表示\t85
4.6.2  Softmax回归\t86
4.6.3  对数损失函数\t86
4.6.4  交叉熵损失函数\t87
4.6.5  代码实现\t87
4.6.6  小结\t90
第5章 常见挑战及对策:一切为了
泛化能力\t91
5.1  训练问题分析\t91
5.1.1  模型架构设计\t91
5.1.2  过拟合与欠拟合\t92
5.1.3  代码实现\t94
5.1.4  小结\t99
5.2  过拟合欠拟合应对策略\t99
5.2.1  数据集选择\t99
5.2.2  模型选择\t100
5.2.3  训练策略选择\t101
5.2.4  小结\t102
5.3  正则化\t102
5.3.1  正则化定义\t103
5.3.2  L1正则化\t103
5.3.3  L2正则化\t104
5.3.4  范数惩罚\t105
5.3.5  权重衰减\t105
5.3.6  小结\t106
5.4  Dropout方法及代码实现\t106
5.4.1  基本原理\t106
5.4.2  直观解释\t107
5.4.3  优缺点分析\t109
5.4.4  代码实现\t109
5.4.5  小结\t112
5.5  梯度消失和梯度爆炸\t112
5.5.1  根源分析\t113
5.5.2  梯度消失\t114
5.5.3  梯度爆炸\t114
5.5.4  解决办法\t115
5.5.5  小结\t117
5.6  模型文件的读写\t117
5.6.1  张量的保存和加载\t117
5.6.2  模型参数的保存和加载\t118
5.6.3  小结\t119
第6章 梯度下降算法及变体:高效
求解模型参数\t120
6.1  为什么要学很优化\t120
6.1.1  深度学习的很优化\t120
6.1.2  训练误差和泛化误差\t121
6.1.3  常见的优化挑战\t123
6.1.4  小结\t125
6.2  损失函数及其性质\t126
6.2.1  起源和重要性\t126
6.2.2  优选似然估计\t126
6.2.3  优选后验\t128
6.2.4  贝叶斯估计\t129
6.2.5  损失函数的性质\t129
6.2.6  小结\t133
6.3  梯度下降算法\t133
6.3.1  搜索逼近策略\t134
6.3.2  梯度\t134
6.3.3  偏导数链式法则\t135
6.3.4  学习率\t136
6.3.5  梯度下降算法\t136
6.3.6  小结\t137
6.4  梯度下降算法的各种变体\t137
6.4.1  加速版改进:随机梯度
下降法\t138
6.4.2  折中版改进:小批量随机梯度
下降法\t139
6.4.3  一阶动量改进版:动量法\t140
6.4.4  二阶动量改进版:AdaGrad
算法\t142
6.4.5  自动调整学习率:RMSProp和
AdaDelta算法\t144
6.4.6  自适应动量:Adam算法\t145
6.4.7  算法大串联及讨论\t145
6.4.8  小结\t147
6.5  梯度下降算法代码实现\t147
6.5.1  梯度下降过程\t147
6.5.2  不同优化器效果对比\t151
6.5.3  小结\t155
6.6  学习率调节器\t155
6.6.1  简介\t155
6.6.2  常见的学习率调节器\t156
6.6.3  代码实现\t157
6.6.4  模型训练对比\t158
6.6.5  常见学习率调节器的实现\t160
6.6.6  小结\t161
第7章 基础卷积神经网络:图像处理
利器\t162
7.1  为什么要用卷积神经网络\t162
7.1.1  全连接层的问题\t162
7.1.2  多层感知机的局限\t163
7.1.3  解决思路\t164
7.1.4  小结\t164
7.2  图像卷积\t165
7.2.1  卷积\t165
7.2.2  图像卷积\t166
7.2.3  互相关运算\t167
7.2.4  小结\t168
7.3  卷积层\t168
7.3.1  网络结构\t169
7.3.2  感受野\t169
7.3.3  与全连接层的区别\t170
7.3.4  小结\t172
7.4  卷积层常见操作\t172
7.4.1  填充\t172
7.4.2  步长\t173
7.4.3  卷积常见参数关系\t173
7.4.4  多通道卷积\t174
7.4.5  分组卷积\t175
7.4.6  小结\t176
7.5  池化层\t176
7.5.1  卷积神经网络典型结构\t177
7.5.2  优选池化和平均池化\t177
7.5.3  池化层特点\t178
7.5.4  小结\t179
7.6  卷积神经网络代码实现\t179
7.6.1  LeNet简介\t179
7.6.2  代码实现\t180
7.6.3  模型训练\t182
7.6.4  小结\t184
第8章 基础循环神经网络:为序列
数据而生\t185
8.1  序列建模\t185
8.1.1  序列数据\t185
8.1.2  序列模型\t187
8.1.3  小结\t188
8.2  文本数据预处理\t189
8.2.1  预处理流程\t189
8.2.2  去除噪声\t189
8.2.3  分词\t190
8.2.4  去除停用词\t190
8.2.5  标准化\t191
8.2.6  词表\t191
8.2.7  特征提取\t191
8.2.8  小结\t193
8.3  循环神经网络\t194
8.3.1  核心思想\t194
8.3.2  展开计算图\t194
8.3.3  RNN结构\t195
8.3.4  训练模式\t196
8.3.5  小结\t197
8.4  RNN的反向传播\t197
8.4.1  沿时间反向传播\t197
8.4.2  参数梯度\t198
8.4.3  小结\t199
8.5  时间序列数据预测\t199
8.5.1  数据集准备\t200
8.5.2  构建模型\t202
8.5.3  小结\t207
8.6  编解码器思想及Seq2Seq模型\t208
8.6.1  编解码器思想\t208
8.6.2  序列到序列学习\t209
8.6.3  编码器\t210
8.6.4  解码器\t210
8.6.5  模型训练\t211
8.6.6  束搜索算法\t211
8.6.7  小结\t214
8.7  Seq2Seq模型代码实现\t214
8.7.1  模型架构\t214
8.7.2  Seq2Seq模型简单实现\t215
8.7.3  小结\t222
第9章 注意力神经网络:赋予模型
认知能力\t223
9.1  注意力机制的原理\t224
9.1.1  生物学中的注意力\t224
9.1.2  深度学习中的注意力机制\t225
9.1.3  编解码器思想和注意力机制的
结合\t225
9.1.4  注意力的计算\t228
9.1.5  全局注意力、局部注意力和
自注意力\t230
9.1.6  注意力机制与Transformer\t231
9.1.7  注意力机制的应用\t231
9.1.8  小结\t232
9.2  复杂注意力机制\t233
9.2.1  经典注意力机制计算的
局限性\t233
9.2.2  键值对注意力\t234
9.2.3  多头注意力\t235
9.2.4  自注意力\t236
9.2.5  小结\t238
9.3  注意力池化及代码实现\t239
9.3.1  注意力可视化\t239
9.3.2  注意力池化\t241
9.3.3  小结\t246
9.4  Transformer模型\t246
9.4.1  模型结构\t246
9.4.2  编码器结构\t247
9.4.3  多头自注意力层\t248
9.4.4  位置嵌入\t249
9.4.5  残差结构\t250
9.4.6  解码器\t251
9.4.7  编解码器的协同工作\t252
9.4.8  线性层和Softmax层\t253
9.4.9  优缺点\t254
9.4.10  小结\t254
9.5  Transformer模型的代码实现\t255
9.5.1  任务数据\t255
9.5.2  Transformer模型\t256
9.5.3  小结\t264
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/22 13:32:19