网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 基于AWS的数据科学实践
分类 教育考试-考试-计算机类
作者 (美)克里斯·弗雷格利//安杰·巴斯
出版社 中国电力出版社
下载
简介
内容推荐
通过阅读这本实用手册,人工智能(AI)和机器学习(ML)从业者将会学习如何在Amazon网络服务(AWS)上成功构件并部署数据科学项目。Amazon AI和ML服务栈将数据科学、数据工程和应用开发统一在一起,来帮助你提升技能。这本手册向你展示如何在云上搭建和运行流水线,并将运行结果在几分钟内(而不是几天)集成到应用中。此外,本书作者还在全书各个章节点明了降低开销并提升性能的方法。
将Amazon AI和ML服务栈应用到真实世界的应用场景,如自然语言处理、计算机视觉、欺诈检测、对话式设备等。
使用Amazon SageMaker Autopilot,通过自动化机器学习(AutoML)实现特定应用场景的子集。
深入理解一个基于BERT的自然语言处理场景的模型开发的完整生命周期,包括数据接入、数据分析以及更多。
将所有组件包装成一个可重复的机器学习运维流水线。
通过Amazon Kinesis和Amazon Managed Streaming for Apache Kafka(MSK),在实时数据流中探索实时机器学习、异常检测和流分析。
了解数据科学项目和工作流中的最佳安全实践,包括在数据接入和分析、模型训练和部署过程中应用AWS Identity and Access Management(IAM)、鉴权、授权。
作者简介
克里斯·弗雷格利是AWS的首席AI和机器学习开发者和布道者,居住在旧金山。他经常在全世界的AI和机器学习会议上演讲,包括O’Reilly AI Superstream系列。之前,Chris曾是PipelineAI的创建者,Databricks的解决方案工程师,以及Netflix的软件工程师。
目录
前言
第1章 基于AWS的数据科学概述
1.1 云计算的益处
1.2 数据科学流水线与工作流
1.3 机器学习运维最佳实践
1.4 使用Amazon SageMaker实现Amazon人工智能服务和机器学习自动化
1.5 在AWS上实现数据接入、探索与准备
1.6 使用Amazon SageMaker训练和调试模型
1.7 使用Amazon SageMaker和AWS Lambda函数部署模型
1.8 AWS上的流分析和机器学习
1.9 AWS基础设施和定制化硬件
1.10 使用标签、预算和告警减少开销
1.11 小结
第2章 数据科学的应用场景
2.1 在每个行业实现创新
2.2 个性化产品推荐
2.3 使用Amazon Rekognition检测不当视频
2.4 需求预测
2.5 使用Amazon Fraud Detector识别虚假账号
2.6 使用Amazon Macie检测隐私泄漏
2.7 对话装置和语音助手
2.8 文本分析和自然语言处理
2.9 认知式搜索和自然语言理解
2.10 智能客户支持中心
2.11 工业人工智能服务和预测性维护
2.12 使用AWS IoT和Amazon SageMaker实现家庭自动化
2.13 从医疗卫生档案中提取医疗信息
2.14 自我优化的智能云基础设施
2.15 认知式的预测性商业智能
2.16 培养下一代人工智能和机器学习开发者
2.17 使用量子计算实现大自然的操作系统
2.18 提升性能并节省开支
2.19 小结
第3章 自动化机器学习
3.1 用SageMaker Autopilot实现自动化机器学习
3.2 用SageMaker Autopilot跟踪实验
3.3 用SageMaker Autopilot训练并部署文本分类器
3.4 用Amazon Comprehend实现自动化机器学习
3.5 小结
第4章 将数据接入云
4.1 数据湖
4.2 用Amazon Athena查询Amazon S3数据湖
4.3 用AWS Glue Crawler持续接入新数据
4.4 用Amazon Redshift Spectrum构建数据湖仓
4.5 在Amazon Athena和Amazon Redshift之间选择
4.6 降低开销并提升性能
4.7 小结
第5章 探索数据集
5.1 AWS上可用于浏览数据的工具
5.2 使用SageMaker Studio可视化数据湖
5.3 查询数据仓库
5.4 使用Amazon QuickSight创建数据仪表
5.5 使用Amazon SageMaker和Apache Spark检测数据质量问题
5.6 数据集的偏差检测
5.7 使用SageMaker Clarify检测不同类别的数据偏移问题
5.8 使用AWS Glue DataBrew分析数据
5.9 节省开支并提升性能
5.10 小结
第6章 为模型训练准备数据集
6.1 特征选择和特征工程
6.2 使用SageMaker处理任务进行规模化特征工程
6.3 通过SageMaker特征存储(Feature Store)共享特征
6.4 使用SageMaker Data Wrangler接入并转换数据
6.5 使用Amazon SageMaker追踪构件和实验谱系
6.6 使用AWS Glue DataBrew接入并转换数据
6.7 小结
第7章 训练第一个模型
7.1 理解SageMaker 基础设施
7.2 使用SageMaker JumpStart 部署预先训练的BERT模型
7.3 开发一个SageMaker模型
7.4 自然语言处理简史
7.5 BERT转换器架构
7.6 从头训练BERT
7.7 微调预先训练的BERT模型
7.8 创建训练脚本
7.9 从SageMaker笔记本启动训练脚本
7.10 评估模型
7.11 使用SageMaker 调试器调试和剖析模型训练
7.12 阐述和解释模型预测
7.13 检测模型偏差并解释预测
7.14 BERT的更多训练选项
7.15 节省开支并提升性能
7.16 小结
第8章 规模化训练与优化模型
8.1 自动发现模型的最优超参数
8.2 对额外的SageMaker超参数调优任务应用热启动
8.3 使用 SageMaker分布式训练扩大训练规模
8.4 节省开支并提升性能
8.5 小结
第9章 部署模型到生产环境
9.1 选择实时预测或批量预测
9.2 使用SageMaker Endpoints进行实时预测
9.3 使用 Amazon CloudWatch控制SageMaker Endpoints自动伸缩
9.4 部署新模型与更新模型的策略
9.5 测试与比较新模型
9.6 模型性能监控与漂移检测
9.7 监控已部署的SageMaker Endpoints数据质量
9.8 监控已部署的 SageMaker Endpoints模型质量
9.9 监控已部署的SageMaker Endpoints偏差漂移
9.10 监控已部署的SageMaker Endpoints特征归因(Feature Attribution)漂移
9.11 使用SageMaker批量转换进行批量预测
9.12 AWS Lambda函数与Amazon API网关
9.13 优化和管理边缘模型
9.14 使用TorchServe部署PyTorch模型
9.15 使用AWS Deep Java库进行 TensorFlow-BERT推理
9.16 节省开支并提升性能
9.17 小结
第10章 流水线和机器学习运维
10.1 机器学习运维
10.2 软件流水线
10.3 机器学习流水线
10.4 使用SageMaker 流水线进行流水线编排
10.5 使用SageMaker 流水线实现自动化
10.6 更多流水线选项
10.7 人机回圈工作流
10.8 节省开支并提升性能
10.9 小结
第11章 流分析与机器学习
11.1 在线学习与离线学习
11
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/14 11:05:49