拉吉夫·蒂瓦里,是一位有着超过15年经验的自由大数据架构师,他的研究方向包括大数据、数据分析、数据管理、数据架构、数据清洗/数据整合、数据仓库,以及银行和其他金融组织中的数据智能等。
他毕业于瓦拉纳西印度理工学院(IIT)电子工程专业,在英国工作了10年有余,大部分时间居住在英国金融城——伦敦。从2010年起,Rajiv就开始使用Hadoop,当时银行部门使用Hadoop的还很少。他目前正在帮助1级投资银行在Hadoop平台上实施一个大型风险分析项目。
王小宁,中国人民大学统计学院14级硕士,16级博士,统计之都副主编,中国人民大学数据挖掘中心分布式计算负责人,研究兴趣包括统计机器学习和缺失数据。
第1章 大数据回顾
大数据是什么
数据量
数据速度
数据类型
大数据技术的演进
过去
现在
未来
大数据愿景
存储
NoSQL
NoSQL数据库类型
资源管理
数据治理
批量计算
实时计算
数据整合工具
机器学习
商务智能和可视化
大数据相关的职业
Hadoop架构
HDFS集群
MapReduce V1
MapReduce V2——YARN
Hadoop生态圈简介
驯服大数据
Hadoop——英雄
HDFS——Hadoop分布式系统
Hadoop版本
发行版——本地部署
发行版——云端
总结
第2章 金融服务中的大数据
各个行业的大数据使用情况
卫生保健
人类科学
电信
在线零售商
为什么金融部门需要大数据
金融部门的大数据应用案例
HDFS上的数据归档
监管
欺诈检测
交易数据
风险管理
客户行为预测
情感分析——非结构化
其他应用案例
金融大数据的演进过程
应该如何学习金融大数据
把你的数据上传到 HDFS上
从 HDFS上查询数据
在 Hadoop上的 SQL
实时
数据治理和运营
ETL工具
数据分析和商业智能
金融大数据的实现
关键挑战
克服挑战
总结
第3章 在云端使用 Hadoop
大数据云的故事
原因
时机
收获
项目细节——在云中进行风险模拟
解决方案
现实世界
目标世界
数据转换
数据分析
总结
第4章 使用 Hadoop进行数据迁移.
项目细节——归档你的交易数据
解决方案
项目第一阶段——分裂交易数据到数据仓库和 Hadoop
项目第二阶段——完成数据从关系型数据仓库到 Hadoop的迁移
总结
第5章 入门
项目详细信息——风险和监管报告
解决方案
现实世界
目标世界
数据收集
数据转换
数据分析
总结
第6章 变得有经验.
实时大数据
项目细节——识别欺诈交易
解决方案
现实世界
目标世界
马尔科夫链模型执行——批处理模式
数据收集
数据转换
总结
第7章 深入扩展 Hadoop的企业级应用
扩展开来——实际上的水平
更多的大数据使用案例
使用案例——再谈欺诈问题
解决方案
使用案例——用户投诉
解决方案
使用案例——算法交易
解决方案
使用案例——外汇交易
解决方案
使用案例——基于社交媒体的交易数据
解决方案
使用案例——非大数据
解决方案
数据湖
Lambda架构
大数据管理
Apache Falcon概览
安全性
总结
第8章 Hadoop的快速增长
Hadoop发行版的升级周期
最佳实践和标准
环境
与 BI和 ETL工具的集成
提示
新的趋势
总结
随着数据的增长以及企业每天处理越来越多的数据,Hadoop作为一个数据平台已经变得很流行。金融行业想要最小化风险和最大化收益,Hadoop作为一个主宰大数据市场的工具,在其中起着很大的作用。
拉吉夫·蒂瓦里著的《Hadoop金融大数据分析》介绍了大数据和Hadoop的基础知识,让读者掌握项目管理、欺诈检测等TOP大数据金融项目,其中不仅包含行业参考和代码模板,同时包括实现中使用的多个Hadoop组件。
读完本书,读者会理解一些行业领先的架构模式、大数据管理经验、窍门和大数据最佳实践方案,以便基于Hadoop成功地开发出适合自己的解决方案。
在互联网+时代,数据是炙手可热的重要资源,网络使用基础的提升,数据流量增大,用户需求多样化和多变对架构设计提出严峻考验,而Hadoop为快速响应用户需求提供了重要技术支撑。《Hadoop金融大数据分析》作者拉吉夫·蒂瓦里从事数据研究近15年,在Hadoop应用方面有许多实战经验,他通过实际案例帮助读者学习如何借助Hadoop来处理巨大数据信息,对于开发者、分析师、架构师、管理者等都具有很好的指导。