![]()
内容推荐 由美国托马斯`埃尔、瓦吉德`哈塔克和保罗`布勒所合著的这本书《大数据导论(英文版)/经典原版书库》是面向商业和技术专业人员的大数据指南,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者更清晰地理解大数据技术。本书可作为高等院校相关专业“大数据基础”“大数据导论”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。 目录 部分 大数据基础 章 理解大数据 概念与术语 数据集 数据分析 数据分析学 描述性分析 诊断性分析 预测性分析 规范性分析 商务智能 关键绩效指标 大数据特征 容量 速率 多样性 真实性 价值 不同数据类型 结构化数据 非结构化数据 半结构化数据 元数据 案例学习背景 历史背景 技术基础和自动化环境 商业目标和障碍 案例学习 确定数据特征 容量 速率 多样性 真实性 价值 确定数据类型 第2章 采用大数据的商业动机与驱动 市场动态 业务架构 业务流程管理 信息与通信技术 数据分析与数据科学 数字化 开源技术与商用硬件 社交媒体 超连通社区与设备 云计算 万物互联网 案例学习 第3章 大数据采用及规划考虑 组织的先决条件 数据获取 隐私性 安全性 数据来源 有限的实时支持 不同的性能挑战 不同的管理需求 不同的方法论 云 大数据分析的生命周期 商业案例评估 数据标识 数据获取与过滤 数据提取 数据验证与清理 数据聚合与表示 数据分析 数据可视化 分析结果的使用 案例学习 大数据分析的生命周期 商业案例评估 数据标识 数据获取与过滤 数据提取 数据验证与清理 数据聚合与表示 数据分析 数据可视化 分析结果的使用 第4章 企业级技术与大数据商务智能 联机事务处理 联机分析处理 抽取、转换和加载技术 数据仓库 数据集市 传统商务智能 即席报表 仪表板 大数据商务智能 传统数据可视化 大数据的数据可视化 案例学习 企业技术 大数据商务智能 第二部分 存储和分析大数据 第5章 大数据存储的概念 集群 文件系统和分布式文件系统 NoSQL 分片 复制 主从式复制 对等式复制 分片和复制 结合分片和主从式复制 结合分片和对等式复制 CAP定理 ACID BASE 案例学习 第6章 大数据处理的概念 并行数据处理 分布式数据处理 Hadoop 处理工作量 批处理型 事务型 集群 批处理模式 MapReduce批处理 Map和Reduce任务 映射 合并 分区 洗牌和排序 归约 MapReduce的简单实例 理解MapReduce算法 实时模式处理 SCV原则 事件流处理 复杂事件处理 大数据实时处理与SCV 大数据实时处理与MapReduce 案例学习 处理工作量 批处理模式处理 实时模式处理 第7章 大数据存储技术 磁盘存储设备 分布式文件系统 RDBMS数据库 NoSQL数据库 特征 理论基础 类型 键-值存储 文档存储 列簇存储 图存储 NewSQL数据库 内存存储设备 内存数据网格 同步读 同步写 异步写 异步刷新 内存数据库 案例学习 第8章 大数据分析技术 定量分析 定性分析 数据挖掘 统计分析 A/B测试 相关性分析 回归性分析 机器学习 分类(有监督的机器学习) 聚类(无监督的机器学习) 异常检测 过滤 语义分析 自然语言处理 文本分析 情感分析 视觉分析 热点图 时间序列图 网络图 空间数据制图 案例学习 相关性分析 回归性分析 时间序列图 聚类 分类 附录A 案例结论 |