![]()
内容推荐 陆晟、刘振川、汪关盛等编著的《大数据理论与工程实践》兼顾理论与实践需求,主要面向架构师,或者是有具体大数据问题需要解决的工程师;也适合从零开始搭建大数据结构,或者需要将现有的非大数据的需求修改成大数据方案的读者。你将从书中学到以下方面的知识:数据存储、计算资源、计算模型、大数据应用、数据治理、大数据与人工智能。 目录 第1章 概述 大数据处理的特征 基本处理模型 工程角度的大数据历史 大数据的基本处理框架 大数据的技术实施方法 第2章 数据 数据存储 数据寻址 列式存储 键值对高速缓存 持久化的高速缓存 大数据表 第3章 计算资源 集群总线 资源调度 资源控制 第4章 计算模型 MapReduce SQL类查询 流式计算 图计算 第5章 大数据应用 搜索信息匹配 搜索信息排名 文档相似性判定 文档主题生成 用户画像 广告投放决策 基数计算 第6章 数据治理 元数据管理 主数据管理 数据标准 数据管理成熟度评估 数据资产 数据治理的组织构架 第7章 大数据和人工智能 大数据和计算机视觉 大数据和语音识别 大数据和博弈 术语表 作者介绍
导语 陆晟、刘振川、汪关盛等编著的这本《大数据理论与工程实践》对数据的收集、存储和处理,CPU及网络等资源的分配和同步等做了全面和详细的介绍,是一本关于大数据理论和工程实践的不多见的好书,内容比其他讨论大数据技术的书要更广泛和深入。本书有助于读者了解大数据从蓝图设计到工程落地需要考虑和到位的各层技术。 |