内容推荐 本书由基础篇和实战篇两部分组成。基础篇包括大数据概述、大数据技术、大数据处理平台、大数据采集与存储、新型数据库、大数据分析与处理、数据可视化。通过基础篇的学习,读者可对大数据技术有一个概括性的了解。实战篇以企业案例为主线,详细介绍大数据分析与处理的技术实现过程,包括大数据分析基础环境搭建、大数据平台搭建、大数据分析案例技术实战。 本书可作为高职院校电子信息类、计算机类及相关专业大数据基础课程教材,也可供大数据爱好者自学使用。 目录 前言 基础篇 项目1 大数据概述 任务1 大数据概念 任务2 大数据来源 任务3 大数据价值及大数据影响 任务4 大数据应用与大数据安全 项目拓展 思考与练习 项目2 大数据技术 任务1 大数据技术概述 任务2 Hadoop概述 项目拓展 思考与练习 项目3 大数据处理平台 任务1 大数据处理平台架构 任务2 离线大数据处理平台Hadoop 任务3 大数据综合处理平台Spark 项目拓展 思考与练习 项目4 大数据采集与存储 任务1数据采集 任务2 数据预处理 任务3 大数据存储 任务4 分布式文件系统 项目拓展 思考与练习 项目5 新型数据库 任务1 关系型数据库 任务2 NoSQL 任务3 NoSQL的类型与产品 项目拓展 思考与练习 项目6 大数据分析与处理 任务1 大数据分析方法 任务2 大数据分析技术 项目拓展 思考与练习 项目7 数据可视化 任务1 数据可视化概念 任务2 数据可视化方法 任务3 数据可视化应用 项目拓展 思考与练习 实战篇 项目8 大数据分析基础环境搭建 任务1虚拟系统的搭建 任务2 Linux主机的配置 项目拓展 思考与练习 项目9 大数据平台搭建 任务1 Hadoop平台的两种搭建方式 任务2 Hadoop平台下离线大数据分析平台的搭建方式 任务3 Hadoop平台下实时大数据分析平台的搭建方式 项目拓展 思考与练习 项目10 大数据分析案例技术实战 任务1 法律服务大数据分析与探索 任务2 基于Maven的项目开发环境搭建 任务3 离线基础数据分析与统计 任务4 离线基础数据的过滤与统计 任务5 离线数据的处理 任务6 实时数据分析与处理 项目拓展 思考与练习 参考文献 |