Spark项目实战/大数据技术与应用丛书清华大学出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

本书运用Spark计算框架的核心组件对电商数据进行分析，以项目形式呈现，其内容涵盖环境搭建、数据分析、数据持久化和数据可视化，涉及JavaEE、ECharts、Hadoop、HBase、Spark、Kafka和ZooKeeper等技术点的综合应用。针对项目开发过程的每个环节都进行了深入讲解，使读者由浅入深地了解每个环节的知识内容。
本书共分为7章。第1章主要介绍项目开发的基本情况；第2章主要介绍大数据集群环境的搭建；第3章主要介绍通过Spark实现热门品类Top10分析，并对分析结果进行持久化操作；第4章主要介绍通过Spark实现各区域热门商品Top3分析，并对分析结果进行持久化操作；第5章主要介绍通过Spark SQL实现网站转化率统计，并对分析结果进行持久化操作；第6章主要介绍通过Spark Streaming实现广告点击流实时统计，并实时持久化统计结果；第7章主要介绍通过可视化技术将第3～6章的分析与统计结果进行图形化展示。
本书配有视频、源代码、教学设计、教学PPT、教学大纲等资源。同时，为了帮助初学者更好地学习书中的内容，还提供了在线答疑，欢迎读者关注。
本书适合拥有Spark基础的读者阅读，也可以作为高等院校相关课程的教学参考书。读者不仅能够通过项目实战巩固基础知识的学习效果，还能学习商业智能系统的开发过程。

第1章项目概述
1.1 项目需求和目标
1.2 预备知识
1.3 项目架构设计及技术选取
1.4 开发环境和开发工具介绍
1.5 项目开发流程
1.6 硬件要求
1.7 本章小结
第2章搭建大数据集群环境
2.1 安装准备
2.1.1 认识Linux操作系统
2.1.2 创建虚拟机
2.1.3 启动虚拟机并安装Linux操作系统
2.1.4 克隆虚拟机
2.1.5 配置Linux操作系统网络及主机名
2.1.6 SSH配置
2.1.7 配置时间同步
2.2 安装JDK
2.3 ZooKeeper集群部署
2.3.1 ZooKeeper集群的安装与配置
2.3.2 ZooKeeper集群的启动与关闭
2.4 Hadoop集群部署
2.4.1 Hadoop高可用集群规划
2.4.2 安装Hadoop
2.4.3 Hadoop高可用集群配置
2.4.4 启动Hadoop高可用集群
2.5 Spark集群部署
2.5.1 Spark集群部署模式
2.5.2 Spark集群安装配置
2.5.3 Spark集群测试
2.6 HBase集群部署
2.6.1 HBase集群规划
2.6.2 HBase集群安装配置
2.6.3 启动HBase集群
2.7 Kafka集群部署
2.7.1 Kafka集群的安装与配置
2.7.2 启动Kafka集群
2.8 本章小结
第3章热门品类Top10分析
3.1 数据集分析
3.2 实现思路分析
3.3 实现热门品类Top
3.3.1 创建项目
3.3.2 创建Spark连接并读取数据集
3.3.3 获取业务数据
3.3.4 统计品类的行为类型
3.3.5 过滤品类的行为类型
3.3.6 合并相同品类的行为类型
3.3.7 根据品类的行为类型进行排序
3.3.8 数据持久化
3.4 运行程序
3.5 本章小结
第4章各区域热门商品Top3分析
4.1 实现思路分析
4.2 实现各区域热门商品Top
4.2.1 创建Spark连接并读取数据集
4.2.2 获取业务数据
4.2.3 过滤商品的行为类型
4.2.4 转换数据格式
4.2.5 统计每个区域中的不同商品
4.2.6 根据区域进行分组
4.2.7 根据区域内商品的查看次数进行排序
4.2.8 数据持久化
4.3 运行程序
4.4 本章小结
第5章网站转化率统计
5.1 数据集分析
5.2 实现思路分析
5.3 实现网站转化率统计
5.3.1 生成用户浏览网页数据
5.3.2 修改pom.xml文件
5.3.3 创建Spark连接并读取数据集
5.3.4 统计每个页面访问次数
5.3.5 获取每个用户浏览网页的顺序
5.3.6 合并同一用户浏览的网页
5.3.7 统计每个单跳的次数
5.3.8 计算页面单跳转化率
5.3.9 数据持久化
5.4 运行程序
5.5 本章小结
第6章广告点击流实时统计
6.1 数据集分析
6.2 实现思路分析
6.3 数据库设计
6.4 实现广告点击流实时统计
6.4.1 修改pom.xml文件
6.4.2 生产用户广告点击流数据
6.4.3 创建Spark Streaming连接
6.4.4 读取用户广告点击流数据
6.4.5 获取业务数据
6.4.6 读取黑名单用户数据
6.4.7 过滤黑名单用户
6.4.8 统计每个城市不同广告的点击次数
6.4.9 添加黑名单用户
6.4.10 数据持久化
6.5 运行程序
6.6 本章小结
第7章数据可视化
7.1 系统概述
7.1.1 技术选取
7.1.2 系统架构
7.2 数据表设计与实现
7.2.1 数据表介绍
7.2.2 Phoenix集成HBase
7.2.3 建立Phoenix与HBase表映射
7.3 创建Spring Boot项目
7.4 实现热门品类Top10数据可视化
7.4.1 创建实体类Top10Entity
7.4.2 创建数据库访问接口Top10Dao
7.4.3 创建控制器类Top10Controller
7.4.4 创建HTML文件top10.html
7.4.5 运行项目实现热门品类Top10数据可视化
7.5 实现各区域热门商品Top3数据可视化
7.5.1 创建实体类Top3Entity
7.5.2 创建数据库访问接口Top3Dao
7.5.3 创建控制器类Top3Controller
7.5.4 创建HTML文件top3.html
7.5.5 运行项目实现各区域热门商品Top3数据可视化
7.6 实现页面单跳转化率数据可视化
7.6.1 创建实体类ConversionEntity
7.6.2 创建数据库访问接口ConversionDao
7.6.3 创建控制器类ConversionController
7.6.4 创建HTML文件conversion.html
7.6.5 运行项目实现页面单跳转化率数据可视化
7.7 实现广告点击流实时统计可视化
7.7.1 创建实体类AdsEntity
7.7.2 创建数据库访问接口AdsDao
7.7.3 创建控制器类AdsController
7.7.4 创建HTML文件ads.html
7.7.5 运行项目实现广告点击流实时统计可视化
7.8 本章小结

书名	Spark项目实战/大数据技术与应用丛书
分类
作者
出版社	清华大学出版社
下载
简介	内容推荐本书运用Spark计算框架的核心组件对电商数据进行分析，以项目形式呈现，其内容涵盖环境搭建、数据分析、数据持久化和数据可视化，涉及JavaEE、ECharts、Hadoop、HBase、Spark、Kafka和ZooKeeper等技术点的综合应用。针对项目开发过程的每个环节都进行了深入讲解，使读者由浅入深地了解每个环节的知识内容。本书共分为7章。第1章主要介绍项目开发的基本情况；第2章主要介绍大数据集群环境的搭建；第3章主要介绍通过Spark实现热门品类Top10分析，并对分析结果进行持久化操作；第4章主要介绍通过Spark实现各区域热门商品Top3分析，并对分析结果进行持久化操作；第5章主要介绍通过Spark SQL实现网站转化率统计，并对分析结果进行持久化操作；第6章主要介绍通过Spark Streaming实现广告点击流实时统计，并实时持久化统计结果；第7章主要介绍通过可视化技术将第3～6章的分析与统计结果进行图形化展示。本书配有视频、源代码、教学设计、教学PPT、教学大纲等资源。同时，为了帮助初学者更好地学习书中的内容，还提供了在线答疑，欢迎读者关注。本书适合拥有Spark基础的读者阅读，也可以作为高等院校相关课程的教学参考书。读者不仅能够通过项目实战巩固基础知识的学习效果，还能学习商业智能系统的开发过程。目录第1章项目概述 1.1 项目需求和目标 1.2 预备知识 1.3 项目架构设计及技术选取 1.4 开发环境和开发工具介绍 1.5 项目开发流程 1.6 硬件要求 1.7 本章小结第2章搭建大数据集群环境 2.1 安装准备 2.1.1 认识Linux操作系统 2.1.2 创建虚拟机 2.1.3 启动虚拟机并安装Linux操作系统 2.1.4 克隆虚拟机 2.1.5 配置Linux操作系统网络及主机名 2.1.6 SSH配置 2.1.7 配置时间同步 2.2 安装JDK 2.3 ZooKeeper集群部署 2.3.1 ZooKeeper集群的安装与配置 2.3.2 ZooKeeper集群的启动与关闭 2.4 Hadoop集群部署 2.4.1 Hadoop高可用集群规划 2.4.2 安装Hadoop 2.4.3 Hadoop高可用集群配置 2.4.4 启动Hadoop高可用集群 2.5 Spark集群部署 2.5.1 Spark集群部署模式 2.5.2 Spark集群安装配置 2.5.3 Spark集群测试 2.6 HBase集群部署 2.6.1 HBase集群规划 2.6.2 HBase集群安装配置 2.6.3 启动HBase集群 2.7 Kafka集群部署 2.7.1 Kafka集群的安装与配置 2.7.2 启动Kafka集群 2.8 本章小结第3章热门品类Top10分析 3.1 数据集分析 3.2 实现思路分析 3.3 实现热门品类Top 3.3.1 创建项目 3.3.2 创建Spark连接并读取数据集 3.3.3 获取业务数据 3.3.4 统计品类的行为类型 3.3.5 过滤品类的行为类型 3.3.6 合并相同品类的行为类型 3.3.7 根据品类的行为类型进行排序 3.3.8 数据持久化 3.4 运行程序 3.5 本章小结第4章各区域热门商品Top3分析 4.1 实现思路分析 4.2 实现各区域热门商品Top 4.2.1 创建Spark连接并读取数据集 4.2.2 获取业务数据 4.2.3 过滤商品的行为类型 4.2.4 转换数据格式 4.2.5 统计每个区域中的不同商品 4.2.6 根据区域进行分组 4.2.7 根据区域内商品的查看次数进行排序 4.2.8 数据持久化 4.3 运行程序 4.4 本章小结第5章网站转化率统计 5.1 数据集分析 5.2 实现思路分析 5.3 实现网站转化率统计 5.3.1 生成用户浏览网页数据 5.3.2 修改pom.xml文件 5.3.3 创建Spark连接并读取数据集 5.3.4 统计每个页面访问次数 5.3.5 获取每个用户浏览网页的顺序 5.3.6 合并同一用户浏览的网页 5.3.7 统计每个单跳的次数 5.3.8 计算页面单跳转化率 5.3.9 数据持久化 5.4 运行程序 5.5 本章小结第6章广告点击流实时统计 6.1 数据集分析 6.2 实现思路分析 6.3 数据库设计 6.4 实现广告点击流实时统计 6.4.1 修改pom.xml文件 6.4.2 生产用户广告点击流数据 6.4.3 创建Spark Streaming连接 6.4.4 读取用户广告点击流数据 6.4.5 获取业务数据 6.4.6 读取黑名单用户数据 6.4.7 过滤黑名单用户 6.4.8 统计每个城市不同广告的点击次数 6.4.9 添加黑名单用户 6.4.10 数据持久化 6.5 运行程序 6.6 本章小结第7章数据可视化 7.1 系统概述 7.1.1 技术选取 7.1.2 系统架构 7.2 数据表设计与实现 7.2.1 数据表介绍 7.2.2 Phoenix集成HBase 7.2.3 建立Phoenix与HBase表映射 7.3 创建Spring Boot项目 7.4 实现热门品类Top10数据可视化 7.4.1 创建实体类Top10Entity 7.4.2 创建数据库访问接口Top10Dao 7.4.3 创建控制器类Top10Controller 7.4.4 创建HTML文件top10.html 7.4.5 运行项目实现热门品类Top10数据可视化 7.5 实现各区域热门商品Top3数据可视化 7.5.1 创建实体类Top3Entity 7.5.2 创建数据库访问接口Top3Dao 7.5.3 创建控制器类Top3Controller 7.5.4 创建HTML文件top3.html 7.5.5 运行项目实现各区域热门商品Top3数据可视化 7.6 实现页面单跳转化率数据可视化 7.6.1 创建实体类ConversionEntity 7.6.2 创建数据库访问接口ConversionDao 7.6.3 创建控制器类ConversionController 7.6.4 创建HTML文件conversion.html 7.6.5 运行项目实现页面单跳转化率数据可视化 7.7 实现广告点击流实时统计可视化 7.7.1 创建实体类AdsEntity 7.7.2 创建数据库访问接口AdsDao 7.7.3 创建控制器类AdsController 7.7.4 创建HTML文件ads.html 7.7.5 运行项目实现广告点击流实时统计可视化 7.8 本章小结
随便看	红颜惑骨涅槃之苦穿回唐朝和李白做朋友玄幻修真录血色诱饵（吸血鬼文）耽美微小说合集 [网王]错过 xxxx 浮生织梦随笔美与丑 [鼬佐]兄弟反穿现代唯君所依洛华殇有灵气的傲娇熊重生之重来幸福的日子（综漫）这只是个黑化的过程一碎钟情折子戏-浮夏语瑜非鱼两生花 [家教]蠢孩子日常系战斗Fight！青鸟传说爸爸去哪儿之盛夏年华全世界只有我没重生鼠大侠连点器 V2.6.1.3 官方最新版 CalPicker文本计算器 V4.0 官方版元贝驾考 v8.1.7 元贝驾考 V1.7.0 绿色版刀锋营销客户端 V1.0 avast V9.0.2005 RC3 免费安装版 ESET NOD32 Antivirus(杀毒软件) V9.0.377.1(64位) 官方安装版兴业银行 v3.0.1 神鹰QQ聊天记录查看器 V15.0 绿色版恋恋YY批量多开器 V5.8 绿色版看点快报电脑版得物电脑版虎扑电脑版美团外卖电脑版一嗨租车电脑版兼职猫电脑版死亡军队无线电频率银河队员异教徒的人族工程幸福工厂 indecorous indeed indefatigable indefensible indefinable indefinite indefinite article indefinitely indelible indelicate [BT下载][舍不得星星][第18集][WEB-MKV/0.28G][国语配音/中文字幕][1080P][H265][流媒体][ZeroTV] [BT下载][舍不得星星][第17-18集][WEB-MKV/2.41G][国语音轨/简繁英字幕][4K-2160P][H265][流媒体][MiniTV] [BT下载][衡山论道][全8集][WEB-MP4/4.40G][国语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][擅长逃跑的少主殿下][第12集][WEB-MP4/0.65G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][鹿乃子乃子虎视眈眈][第11集][WEB-MP4/0.38G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][鹿乃子乃子虎视眈眈][全12集][WEB-MKV/16.00G][简繁英字幕][1080P][流媒体][ZeroTV] [BT下载][鹿乃子乃子虎视眈眈][全12集][WEB-MKV/13.76G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][时不时说一句俄语来掩饰害羞的邻座艾莉同学][第11集][WEB-MP4/0.30G][中文字幕][1080P][流媒体][ZeroTV] [BT下载][杖与剑的魔剑谭][全12集][WEB-AAC-ZEROTV/16.16G][简繁英字幕][1080P][流媒体][ZeroTV] [BT下载][女子高中生的虚度日常][全7集][WEB-MKV/20.14G][无字片源][1080P][流媒体][ZeroTV] 《羊了个羊》1月31日羊羊大世界通关攻略比亚迪预计2022年净利润超160亿同比增长超425.42% 《女神异闻录3携带版》二周目继承内容介绍《女神异闻录4黄金版》猎杀者打法攻略猎杀者怎么打从电影《流浪地球2》感受硬核科幻的重工业美学《速度与激情10》发新片场照罗德里格兹扮相曝光《原神》蔷薇再开时满奖励攻略汇总丽莎皮肤免费获取方法海战游戏单机推荐海战游戏单机版有哪些《原神》丽莎免费皮肤获取方法原神丽莎皮肤怎么获得《女神异闻录4黄金版》美津雄之影打法教程