![]()
内容推荐 人工智能领域正在以超乎人们想象的速度发展,本书赶在人工智能彻底“占领”世界之前完成编写,实属万幸。 书中收录了超过100道机器学习算法工程师的面试题目和解答,其中大部分源于Hulu算法研究岗位的真实场景。本书从日常工作、生活中各种有趣的现象出发,不仅囊括了机器学习的基本知识,而且还包含了成为优秀算法工程师的相关技能,更重要的是凝聚了笔者对人工智能领域的一颗热忱之心,旨在培养读者发现问题、解决问题、扩展问题的能力,建立对机器学习的热爱,共绘人工智能世界的宏伟蓝图。 “不积跬步,无以至千里”,本书将从特征工程、模型评估、降维等经典机器学习领域出发,构建一个算法工程师必备的知识体系;见神经网络、强化学习、生成对抗网络等最新科研进展之微,知机器学习领域胜败兴衰之著;“博观而约取,厚积而薄发”,在最后一章为读者展示生活中各种引领时代的人工智能应用。 作者简介 诸葛越,她是学霸——美国斯坦福大学计算机硕士与博士,纽约州立大学石溪分校应用数学硕士,曾就读于清华大学计算机科学与技术系。 她是互联网企业高管——Hulu(葫芦软件)公司全球研发副总裁、中国研发中心总经理,曾任览盛移动科技有限公司联合创始人兼首席执行官,雅虎北京全球研发中心产品总监,微软北京研发中心项目总经理。 她还是两个孩子的妈妈——开设有微信公众号“东西方教育”,大儿子已在英国剑桥大学攻读自然学科。 目录 推荐序 前言 机器学习算法工程师的自我修养 第1章 特征工程 第1节 特征归一化 第2节 类别型特征 第3节 高维组合特征的处理 第4节 组合特征 第5节 文本表示模型 第6节 Word2Vec 第7节 图像数据不足时的处理方法 第2章 模型评估 第1节 评估指标的局限性 第2节 ROC曲线 第3节 余弦距离的应用 第4节 A/B测试的陷阱 第5节 模型评估的方法 第6节 超参数调优 第7节 过拟合与欠拟合 第3章 经典算法 第1节 支持向量机 第2节 逻辑回归 第3节 决策树 第4章 降维 第1节 PCA方差理论 第2节 PCA小平方误差理论 第3节 线性判别分析 第4节 线性判别分析与主成分分析 第5章 非监督学习 第1节 K均值聚类 第2节 高斯混合模型 第3节 自组织映射神经网络 第4节 非监督学习算法的评估 第6章 概率图模型 第1节 概率图模型的联合概率分布 第2节 概率图表示 第3节 生成式模型与判别式模型 第4节 马尔可夫模型 第5节 主题模型 第7章 优化算法 第1节 有监督学习的损失函数 第2节 机器学习中的优化问题 第3节 经典优化算法 第4节 梯度验证 第5节 随机梯度下降法 第6节 随机梯度下降法的加速 第7节 L1正则化与稀疏性 第8章 采样 第1节 采样的作用 第2节 均匀分布随机数 第3节 常见的采样方法 第4节 高斯分布的采样 第5节 马尔科夫蒙特卡洛采样法 第6节 贝叶斯网络的采样 第7节 不均衡样本集的重采样 第9章 前向神经网络 第1节 多层感知机与布尔函数 第2节 深度神经网络中的激活函数 第3节 多层感知机的反向传播算法 第4节 神经网络训练技巧 第5节 深度卷积神经网络 第6节 深度残差网络 第10章 循环神经网络 第1节 循环神经网络和卷积神经网络 第2节 循环神经网络的梯度消失问题 第3节 循环神经网络中的激活函数 第4节 长短期记忆网络 第5节 Seq2Seq模型 第6节 注意力机制 第11章 强化学习 第1节 强化学习基础 第2节 视频游戏里的强化学习 第3节 策略梯度 第4节 探索与利用 第12章 集成学习 第1节 集成学习的种类 第2节 集成学习的步骤和例子 第3节 基分类器 第4节 偏差与方差 第5节 梯度提升决策树的基本原理 第6节 XGBoost与GBDT的联系和区别 第13章 生成式对抗网络 第1节 初识GANs的秘密 第2节 WGAN:抓住低维的幽灵 第3节 DCGAN:当GANs遇上卷积 第4节 ALI:包揽推断业务 第5节 IRGAN:生成离散样本 第6节 SeqGAN:生成文本序列 第14章 人工智能的热门应用 第1节 计算广告 第2节 游戏中的人工智能 第3节 AI在自动驾驶中的应用 第4节 机器翻译 第5节 人机交互中的智能计算 后记 作者随笔 参考文献 |