第一部分 大数据揭秘
第1章 大数据的故事
到了21世纪初,是什么发生了改变
数据为什么变得这么多
产生数字化数据设备的广泛应用
正在迅速下降的磁盘存储成本
RAM成本的直线下降
处理能力成本的直线下降
为什么大数据成为如此火热的话题
成功的大数据先驱者
开源软件为软件开发人员提供了竞争环境
云计算让启动和扩展计划变得更加容易
小贴士
问题
第2章 人工智能、机器学习和大数据
什么是人工智能和机器学习
人工智能的起源
为何近来人工智能又再次兴起
人造神经网络和深度学习
人工智能如何帮助分析大数据
一些谨慎的话
小贴士
问题
第3章 为什么大数据有用
全新的数据使用方式
一种新的数据思维方式
遵循数据驱动的方法
更强的数据工具
小贴士
问题
第4章 大数据分析的应用案例
A/B测试
推荐引擎/下一个最佳购物建议
预测:需求和收入
节省IT成本
市场营销
社交媒体
定价
客户维系/客户忠诚度
购物车弃置管理(实时)
转化率优化
商品定制化(实时)
重新定位(实时)
诈骗检测(实时)
减少客户流失
预测维护
供应链管理
顾客终身价值
线索评分
人力资源
情绪分析
小贴士
问题
第5章 理解大数据生态系统
什么让数据变“大”
分布式数据存储
分布式计算
快速数据/流数据
雾计算/边缘计算
开源软件
许可
代码分发
开源的好处
大数据中的开源软件
云计算
小贴士
问题
第二部分 将大数据生态系统应用到组织中
第6章 大数据如何指导组织战略
你的客户
获取数据
使用数据
你的竞争者
外部的因素
你的产品
小贴士
问题
第7章 形成大数据和数据科学的战略
项目团队
启动会议
启动输出
范围界定阶段
小贴士
问题
第8章 实施数据科学——分析、算法和机器学习
四种分析方法
模型、算法和黑箱
人工智能和机器学习
分析软件
分析工具
敏捷分析
小贴士
问题
第9章 选择技术
交付给最终用户
选择技术时需要考虑的方面
小贴士
问题
第10章 组建团队
数据科学家
你需要的数据角色
领导力
雇用数据团队
大规模招聘和收购创业公司
外包
对于小型公司而言
小贴士
问题
第11章 数据治理与法律遵从
个人数据
数据科学和隐私披露
数据治理
治理报告
小贴士
问题
第12章 在组织中成功部署大数据
我们的项目为何失败了
总结
小贴士
问题
术语