约根森等编著的这本《微软大数据解决方案》以清晰的思路、通俗易懂的语言和形象具体的实例为读者讲述了大数据的含义和作用,并重点介绍了微软的大数据平台解决方案。从手把手教导搭建你的第一个大数据环境开始,通过实景模拟将大数据相关技术娓娓道来。从数据存储结构到数据仓库,从Hadoop、MapReduce到Hive、HBase、HCatalog,一个个晦涩的技术名词在你的脑海中逐渐清晰,最后介绍了数据仓库与Hadoop的集合,现实生活中如何使用和运营大数据,让你从一个大数据世界的“菜鸟”华丽蜕变为能理解微软平台大数据解决方案的“专家”。
本书适合有志于学习微软大数据解决方案的读者阅读,零基础也可以快速融入大数据的世界中;也适合大数据行业的专家总体回顾微软大数据解决方案的整体架构。
Microsoft强大的大数据平台Windows Azure HDInsight和Hortonworks Data Platform for Windows改变了企业处理、存储和管理数据的方式。Microsoft的大数据解决方案套件被设计用于与公司现有的数据基础设施以及SQLServer、Hadoop等产品进行无缝集成,使客户不必中断工作流或关键流程即可实施这些方案。假如需要设计和实施全面部署的大数据解决方案的详明规划蓝图,约根森等编著的《微软大数据解决方案》一书无疑是最佳选择。
本书主要内容包括如下:使用Windows Azure HDInsight、Hortonworks Data Platform for Windows和开源工具将大数据解决方案集成到企业中;在企业内部存储、管理、分析和共享大数据;安装和配置Hortonworks Data Platform for Windows;学习大数据与SQL Server及Hadoop的整合;使用Microsoft和Had00p BIT具呈现数据;为企业创建和执行综合性大数据战略;直接获取Microsoft大数据产品团队的最前沿研究成果。
第I部分 大数据的含义
第1章 行业需求与解决方案
1.1 何谓“大”数据
1.2 Hadoop简史
1.2.1 Google
1.2.2 Nutch
1.3 Hadoop的概念
1.3.1 衍生品和分发版
1.3.2 Hadoop分发版
1.3.3 Hadoop生态系统的核心
1.3.4 Hadoop中的重要Apache项目
1.3.5 Hadoop的未来
1.4 本章小结
第2章 Microsoft大数据解决方法
2.1 “优质组合”的故事
2.2 生态系统中的竞争
2.2.1 SQL on Hadoop现状
2.2.2 Hortonworks和Stinger
2.2.3 Cloudera和Impala18
2.2.4 Microsoft对Hadoop中SQL应用的贡献
2.3 Hadoop的部署
2.3.1 部署要素
2.3.2 部署拓扑结构
2.3.3 部署计分卡
2.4 本章小结
第II部分 使用Microsoft建立大数据
第3章 配置首个大数据环境
3.1 入门
3.2 开始安装
3.3 安装过程
3.3.1 本地安装:单节点安装
3.3.2 HDInsight服务:云端安装
3.3.3 Windows Azure存储管理器选项
3.4 验证新集群
3.4.1 登录HDInsight服务
3.4.2 通过日志验证HDP功能
3.5 常见的安装后任务
3.5.1 加载首个文件
3.5.2 验证Hive和
3.6 本章小结
第III部分 存储并管理大数据
第4章 HDFS、Hive、HBase和HCatalog
……
第5章 HDFS的数据存储与管理
第6章 添加Hive结构
第7章 使用HBase和HCatalog来扩展功能
第IV部分 使用大数据
第8章 使用SSIS、Pig和Sqoop进行有效的大数据ETL
第9章 使用Pig和Hive进行数据研究和高级数据清理
第V部分 大数据与SQL Server的整合
第10章 数据仓库与Hadoop整合
第11章 使用Windows BI呈现大数据
第12章 大数据分析
第13章 大数据与云
第14章 现实生活中的大数据
第VI部分 继续向前发展大数据
第15章 创建和执行大数据计划
第16章 运营的大数据管理