作者简介 佐伊纳·特哈达(Zoiner Tejada),作为软件架构师、CTO和初创公司的CEO,在软件行业具有超过17年的咨询经验,在云计算、大数据、数据分析和机器学习方面拥有丰富的专业经验。Zoiner作为首批获得Microsoft Azure MVP(微软最有价值专家)称号的专家,已连续5年获得该荣誉,目前除了Microsoft Azure MVP,Zoiner也是Microsoft数据平台方向的MVP。Zoiner毕业于斯坦福大学,具有计算机科学学士学位。 目录 序 前言 第1章 企业数据分析基础 数据分析管道 数据湖 Lambda架构 Kappa架构 在Lambda和Kappa间进行选择 Azure分析管道 数据分析场景介绍 示例代码和示例数据集 小结 第2章 将数据导入Azure 摄取加载层 批量数据加载 硬盘传送 流数据加载 小结 第3章 在Azure中存储摄取的数据 文件存储 队列存储 小结 第4章 Azure中的实时数据处理 流处理 在Azure中每次处理一个元组 小结 第5章 Azure中的实时微批处理 Azure中的微批处理 小结 第6章 Azure中的批处理 HDInsight上的MapReduce批处理 HDInsight上的Hive批处理 HDInsight上的Pig批处理 HDInsight上的Spark批处理 使用SQL数据仓库的批处理 使用数据湖分析的批处理 Azure Batch批处理 小结 第7章 Azure中的交互式查询 Azure SQL数据仓库的可交互式查询 Hive和Tez交互式查询 Spark SQL交互式查询 USQL交互式查询 小结 第8章 Azure中的冷\\热访问服务层 Azure Redis缓存 Document DB SQL数据库 SQL数据仓库 HDInsight上的HBase Azure搜索 小结 第9章 智能和机器学习 Azure机器学习 HDInsight上的R服务 SQL R服务 Microsoft认知服务 小结 第10章 Azure中的元数据管理 使用Azure数据目录管理元数据 小结 第11章 保护在Azure中的数据 身份和访问管理 数据保护 审计 小结 第12章 执行数据分析 使用Power BI进行分析 在蓝色天际机场场景中使用Power BI批量分析报表 展望
内容推荐 Microsoft Azure在存储、处理和分析不同摄取速度、形态和大小的数据方面提供了超过25种平台即服务(PaaS)功能,用以实现数据分析管道。对于你的公司业务来说,该如何选择恰当的功能呢?针对如何建立Azure大数据分析解决方案这一问题,本书提供了极具实践性的参考框架。 《精通Azure数据分析》作者佐伊纳·特哈达介绍了包括数据湖和Lambda架构在内的基本概念,同时结合示例代码详细解释了数据分析管道中的各个阶段。为了帮助你在数据分析的各个阶段中选择适当的Azure服务,本书还通过一个案例场景对全书内容进行了扩展,对书中所涉及的各项Azure服务,以示例代码的形式展示了它们在现实世界中的真实用例。 |