![]()
作者简介 瓦利阿帕·拉克什曼南是Google云计算平台专家服务部门的技术主管。他希望将机器学习普及化,让任何人、从任何地方,在无需深入了解统计学、编程知识,也无需购买大量硬件的情况下使用Google云平台提供的卓越架构。 目录 前言 第1章 用数据做出更好的决策 许多相似的决策 数据工程师的角色 云计算让数据工程师成为可能 云计算使数据科学能力得到倍增 用案例研究揭示难解的真相 基于概率的决策 数据和工具 代码入门 本章总结 第2章 将数据摄取到云端 航空公司准点数据 可知性 训练-服务偏差 下载程序 数据集属性 为什么不就地存储数据? 向上扩展 水平扩展 使用Colossus和Jupiter让数据存放在原位 摄取数据 对Web表单进行反向工程 下载数据集 数据探索和清理 将数据上传到 Google 云端存储 每月下载计划 使用Python摄取数据 Flask Web App 在App Engine上运行 确保URL的安全 计划Cron任务 本章总结 代码实验 第3章 创建引人注目的仪表板 使用数据仪表板对模型进行解释 为什么要先构建数据仪表板? 准确、忠实于数据且良好的设计 将数据加载到Google Cloud SQL 创建Google Cloud SQL实例 与Google云计算平台交互 控制对MySQL的访问 创建表 向表中填充数据 建立第一个模型 应急表 阈值优化 机器学习 构建数据仪表板 Data Studio入门 创建图表 为最终用户添加控件 用饼图显示所占比例 解释应急表 本章总结 第4章 流数据:发布和摄取 第5章 交互式数据探索 第6章 Cloud Dataproc上的贝叶斯分类器 第7章 机器学习:Spark上的逻辑回归 第8章 时间窗化的聚合特征 第9章 使用TensorFlow的机器学习分类器 第10章 实时机器学习 附录 有关机器学习数据集中敏感数据的注意事项 内容推荐 本书将带领你了解如何使用Google云计算平台,轻松构建复杂的统计和机器学习解决方案,解决实际业务问题。本书作为一本动手指南,为开发人员展示了如何在数据科学领域实现端到端的数据管道,以及如何在Google云计算平台上使用统计和机器学习的方法和工具。通过阅读本书,你将学习多种数据科学方法,并使用这些方法在示例项目上制定业务决策。 随后,你就可以在Google云计算平台上针对自己的项目构建统计和机器学习解决方案了,同时探索该平台为数据科学提供的更多革命性和协作特性。 在本书中,你将学到: 使用App Engine应用实现自动化定期数据摄取。 在Google Data Studio中创建并生成数据仪表板。 构建实时数据分析管道,实现流式数据分析。 使用Google BigQuery实现可交互式数据探索。 在Cloud Dataproc群集上创建贝叶斯模型。 使用Spark构建逻辑回归机器学习模型。 使用Cloud Dataflow数据管道计算时间聚合特征。 使用TensorFlow构建高性能预测模型。 将你的模型部署为微服务,并且从批处理和实时数据管道中使用它。 |