![]()
作者简介 高彦杰,大数据和人工智能研发工程师,任职于微软亚洲研究院。专注AI深度学习平台及数据处理技术,参与多项AI与数据处理相关项目,对AI底层系统到上层算法应用都有广泛的兴趣与研究。对Hadoop和Spark等大数据技术有很好深入的研究和丰富的实践经验,著有畅销书《Spark:大数据技术,应用与性能优化》和《Spark大数据分析实战》。 于子叶,算法工程师,就职于华生基因,中科院博士。曾参与电磁异常监测与四川地区灾害智能识别系统。专注于图形、信号相关的机器学习方法。对算法底层原理有深入研究。 较早接触TensorFlow,对深度学习等人工智能技术有很好深入的研究,曾参与多个机器学习项目的研发。数学基础深厚,是较少进行基础理论研究的工作者,对现有自然科学所需算法从原理到实践均有深入的研究。此外,对高性能计算HPC也有较为系统和深入的认识。 目录 前言 章了解深度学习1 1.1什么是深度学习1 1.1.1深度学习能解决的问题2 1.1.2深度学习适用的领域3 1.2深度学习的技术发展6 1.2.1基础技术发展7 1.2.2应用技术发展8 1.3深度学习的知识点汇总10 1.3.1深度学习的预备技术11 1.3.2深度学习的技术构成12 1.3.3深度学习向其他行业与技术领域的延伸13 1.4深度学习工具与平台介绍15 1.4.1深度学习框架15 1.4.2深度学习基础架构18 1.4.3深度学习开发工具19 1.4.4深度学习辅助工具20 1.4.5深度学习云平台服务20 1.5本章小结22 1.6参考资料23 第2章深度学习技术24 2.1深度学习基础24 2.1.1感知器26 2.1.2激活函数27 2.1.3输入层、隐藏层、输出层29 2.1.4前向传播与反向传播求导29 2.2CNN30 2.2.1前馈网络解决图像存在的问题31 2.2.2卷积神经网络31 2.2.3图像的几个不变性33 2.2.4卷积34 2.2.5池化38 2.2.6Inception39 2.2.7Flatten层和全连接层39 2.2.8跳层连接40 2.2.9经典CNN41 2.3RNN41 2.3.1RNN结构42 2.3.2基本结构与前向传播43 2.3.3BPTT44 2.3.4LSTM46 2.3.5RNN拓展50 2.4最优化算法52 2.4.1梯度下降52 2.4.2Adam54 2.5本章小结56 第3章TensorFlow基础57 3.1TensorFlow57 3.2获取与安装60 3.3变量及作用域61 3.4构建计算图66 3.5全连接网络构建71 3.6CNN构建78 3.7RNN构建82 3.8多架构运行85 3.8.1GPU使用85 3.8.2多CPU使用86 3.9队列使用88 3.10本章小结89 第4章TensorFlow进阶90 4.1TensorFlow架构与原理90 4.2TensorFlow扩展93 4.2.1TFLayers94 4.2.2TFSlim95 4.2.3TFLearn96 4.2.4Keras99 4.3Tensorboard与问题监控101 4.4改善深度神经网络103 4.5性能优化建议105 4.6深度神经网络结构107 4.6.1Inception结构107 4.6.2ResNet结构108 4.6.3Seq2Seq结构108 4.6.4Attention109 4.7本章小结110 第5章语音识别器111 5.1任务分析111 5.2数据与特征分析114 5.2.1语音数据库114 5.2.2语音数据特征115 5.3主流语音识别网络结构119 5.3.1用于语音识别的CNN120 5.3.2用于语音识别的RNN122 5.4CTCLoss123 5.5文本向量化126 5.5.1英文文本向量化126 5.5.2中文文本向量化129 5.5.3文本标签比对130 5.6完整构建神经网络131 5.6.1构建CNN识别网络132 5.6.2用于语音识别的RNN136 5.7数据训练138 5.8参数调优140 5.9实际数据分析141 5.10本章小结142 第6章对话机器人143 6.1对话机器人概述与应用领域143 6.2对话机器人主流技术145 6.2.1基于模板的对话机器人145 6.2.2基于检索技术的对话机器人146 6.2.3基于深度学习的对话机器人146 6.3对话机器人的前沿与功能扩展147 6.4深度学习对话机器人原理149 6.5构建对话机器人150 6.5.1Bot界面与交互150 6.5.2语料预处理155 6.5.3模型构建161 6.5.4训练流程163 6.5.5在线推断165 6.6本章小结166 第7章人脸识别器167 7.1任务分析167 7.2Detection、Aliment与Identify170 7.3数据特征分析172 7.3.1人脸位置和范围数据173 7.3.2人脸关键点数据174 7.3.3人脸识别数据库176 7.4haar分类器方式178 7.4.1固定特征的提取178 7.4.2分类器180 7.4.3代码实现182 7.5神经网络方法演进183 7.6人脸识别网络构建185 7.6.1人脸检测网络MTCNN185 7.6.2用于人脸检测的GoogleNet188 7.7主流人脸识别网络差异分析190 7.8TensorFlow搭建网络191 7.9参数调优193 7.10实战分析195 7.11本章小结197 第8章自动驾驶198 8.1自动驾驶的介绍与应用领域198 8.1.1自动驾驶的应用场景199 8.1.2自动驾驶分级199 8.2自动驾驶技术201 8.2.1端到端的自动驾驶历史202 8.2.2底层硬件支撑技术平台203 8.3深度增强学习204 8.4行车检测208 8.4.1物体检测208 8.4.2YOLO模型209 8.4.3车辆图像数据探索211 8.4.4车辆视频数据预处理212 8.4.5迁移学习212 8.4.6模型推断213 8.4.7绘制检测结果213 8.5端到端自动驾驶216 8.5.1英伟达EndtoEnd模型216 8.5.2评估指标219 8.5.3数据分析219 8.5.4读入视频,并处理图像222 8.5.5深度学习模型构建与训练222 8.5.6可视化结果223 8.6本章小结224 8.7参考资料224 第9章可视化实践225 9.1可视化发展225 9.2可视化过程227 9.3Matplotlib228 9.4ECharts230 …… 内容推荐 本书共10章,可分为3个部分:靠前~2章为靠前部分,简介深度学习算法的发展历史和前沿技术简;第3~4章为第二部分,介绍深度学习主流框架;第5~10章为第三部分,主要为实践案例部分,结合应用场景使用深度学习技术解决相应问题,譬如语音识别器、聊天机器人、人脸识别器、对战机器人、推荐引擎构建等。 |