内容推荐 本书中的设计模式针对机器学习中反复出现的问题给出最佳实践和解决方案。作者为来自谷歌的三位工程师,他们整理了已证实的方法,帮助数据科学家解决整个机器学习过程中的常见问题。这些设计模式将数百位专家的经验转化成直接、易懂的建议。在这本书中,你会找到关于数据和问题表示、操作化、可重复性、可复现性、灵活性、可解释性和公平性的30种模式的详细解释。每个模式包括对问题的描述、各种可能的解决方案,以及针对你的情况选择最佳技术的建议。 你将学习: ·识别和减轻在训练、评估以及部署机器学习模型时的常见挑战 ·为不同类型的机器学习模型表示数据,包括嵌入、特征交叉等 ·针对具体问题选择合适的模型类型 ·使用检查点、分发策略和超参数优化,建立一个鲁棒的训练循环 ·部署可扩展的机器学习系统,通过它你可以再训练和更新以反映新的数据 ·为用户解释模型的预测结果,确保模型公平地对待用户 ·提高模型的准确性、可复现性和弹性 作者简介 瓦利阿帕·拉克什曼南是Google云计算平台专家服务部门的技术主管。他希望将机器学习普及化,让任何人、从任何地方,在无需深入了解统计学、编程知识,也无需购买大量硬件的情况下使用Google云平台提供的卓越架构。 目录 前言 第1章 机器学习设计模式的需求 什么是设计模式? 如何使用这本书 机器学习术语 模型和框架 数据与特征工程 机器学习过程 数据和模型工具 角色 机器学习中的常见挑战 数据质量 可复现性 数据漂移 规模 多目标 总结 第2章 数据表示设计模式 简单数据表示 数值输入 分类输入 设计模式1:哈希特征 问题 解决方案 为什么有效 权衡和替代 设计模式2:嵌入 问题 解决方案 为什么有效 权衡和替代 设计模式3:特征交叉 问题 解决方案 为什么有效 权衡和替代 设计模式4:多模态输入 问题 解决方案 权衡和替代 总结 第3章 问题表示设计模式 设计模式5:重构 问题 解决方案 为什么有效 权衡和替代 设计模式6:多标签 问题 解决方案 权衡和替代 设计模式7:集成 问题 解决方案 为什么有效 权衡和替代 设计模式8:级联 问题 解决方案 权衡和替代 设计模式9:中立类 问题 解决方案 为什么有效 权衡和替代 设计模式10:再平衡 问题 解决方案 权衡和替代 总结 第4章 模型训练模式 典型训练循环 随机梯度下降 Keras训练循环 训练设计模式 设计模式11:有用的过拟合 问题 解决方案 为什么有效 权衡与替代 设计模式12:检查点 问题 解决方案 为什么有效 权衡和替代 设计模式13:迁移学习 问题 解决方案 为什么有效 权衡和替代 设计模式14:分布式策略 问题 解决方案 为什么有效 权衡和替代 设计模式15:超参数调优 问题 解决方案 为什么有效 权衡和替代 总结 第5章 具有弹性服务的设计模式 设计模式16:无状态服务函数 问题 解决方案 为什么有效 权衡和替代 设计模式17:批处理服务 问题 解决方案 为什么有效 权衡和替代 设计模式18:持续的模型评估 问题 解决方案 为什么有效 权衡和替代 设计模式19:两阶段预测 问题 解决方案 权衡和替代 设计模式20:带键值预测 问题 解决方案 权衡和替代 总结 第6章 可复现设计模式 设计模式21:变换 问题 解决方案 权衡和替代 设计模式22:可重复拆分 问题 解决方案 权衡和替代 设计模式23:桥接模式 问题 解决方案 权衡和替代 设计模式24:窗口推理 问题 解决方案 权衡和替代 设计模式25:工作流管道 问题 解决方案 为什么有效 权衡和替代 设计模式26:特征仓库 问题 解决方案 为什么有效 权衡和替代 设计模式27:模型版本控制 问题 解决方案 权衡和替代 总结 第7章 负责任的人工智能 设计模式28:启发式基准 问题 解决方案 权衡和替代 设计模式29:可解释预测 问题 解决方案 权衡和替代 设计模式30:公平性透镜 问题 解决方案 权衡和替代 总结 第八章 连接模式 模式参考 交互模式 机器学习项目中的模式 机器学习生命周期 人工智能准备 按用例和数据类型划分的常用模式 自然语言理解 计算机视觉 预测分析 推荐系统 欺诈和异常检测 |