Spark全栈数据分析(美)罗素·朱尼电子工业出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

书名

Spark全栈数据分析

分类

作者

(美)罗素·朱尼

出版社

电子工业出版社

下载

简介

内容推荐

罗素·朱尼著的《Spark全栈数据分析》介绍了作者提出的基于Spark的敏捷数据科学方法论，结合作者在行业中多年的实际工作经验，为数据科学团队提供了一套以类似敏捷开发的方法开展数据科学研究的实践方法。书中展示了工业界一些常见工具的使用，包括从前端显示到后端处理的各个环节，手把手地帮助数据科学家快速将理论转化为真正面向用户的应用程序，从而让读者在利用数据创造真正价值的同时，也能不断完善自己的研究。
本书适合初学者阅读，数据科学家、工程师、分析师都能在本书中有所收获。

作者简介

罗素·朱尼，Russell Jurney在博彩游戏中练就了数据分析的技能，构建了网络应用程序来分析美国和墨西哥的博彩机器的表现。在涉足创业、互动媒体、记者等行业后，他搬到硅谷，在Ning和Linkedln从事构建分析型应用的工作。Russell现在是Data Syndrome的首席顾问，他帮助公司使用本书所介绍的原则和方法构建分析型产品。

前言
第Ⅰ部分准备工作
第1章理论
导论
定义
方法学
敏捷数据科学宣言
瀑布模型的问题
研究与应用开发
敏捷软件开发的问题
最终质量：偿还技术债
瀑布模型的拉力
数据科学过程
设置预期
数据科学团队的角色
认清机遇与挑战
适应变化
过程中的注意事项
代码审核与结对编程
敏捷开发的环境：提高生产效率
用大幅打印实现想法
第2章敏捷工具
可伸缩性＝易用性
敏捷数据科学之数据处理
搭建本地环境
配置要求
配置Vagrant
下载数据
搭建EC2环境
下载数据
下载并运行代码
下载代码
运行代码
Jupyter笔记本
工具集概览
敏捷开发工具栈的要求
Python
使用JSON行和Parquet序列化事件
收集数据
使用Spark进行数据处理
使用MongoDB发布数据
使用Elasticsearch搜索数据
使用Apache Kafka分发流数据
使用PySpark Streaming处理流数据
使用scikit-learn与Spark MLlib进行机器学习
使用Apache Airflow（孵化项目）进行调度
反思我们的工作流程
轻量级网络应用
展示数据
本章小结
……
第Ⅱ部分攀登金字塔
附录A 安装手册

随便看

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

书名	Spark全栈数据分析
分类
作者	(美)罗素·朱尼
出版社	电子工业出版社
下载
简介	内容推荐罗素·朱尼著的《Spark全栈数据分析》介绍了作者提出的基于Spark的敏捷数据科学方法论，结合作者在行业中多年的实际工作经验，为数据科学团队提供了一套以类似敏捷开发的方法开展数据科学研究的实践方法。书中展示了工业界一些常见工具的使用，包括从前端显示到后端处理的各个环节，手把手地帮助数据科学家快速将理论转化为真正面向用户的应用程序，从而让读者在利用数据创造真正价值的同时，也能不断完善自己的研究。本书适合初学者阅读，数据科学家、工程师、分析师都能在本书中有所收获。作者简介罗素·朱尼，Russell Jurney在博彩游戏中练就了数据分析的技能，构建了网络应用程序来分析美国和墨西哥的博彩机器的表现。在涉足创业、互动媒体、记者等行业后，他搬到硅谷，在Ning和Linkedln从事构建分析型应用的工作。Russell现在是Data Syndrome的首席顾问，他帮助公司使用本书所介绍的原则和方法构建分析型产品。目录前言第Ⅰ部分准备工作第1章理论导论定义方法学敏捷数据科学宣言瀑布模型的问题研究与应用开发敏捷软件开发的问题最终质量：偿还技术债瀑布模型的拉力数据科学过程设置预期数据科学团队的角色认清机遇与挑战适应变化过程中的注意事项代码审核与结对编程敏捷开发的环境：提高生产效率用大幅打印实现想法第2章敏捷工具可伸缩性＝易用性敏捷数据科学之数据处理搭建本地环境配置要求配置Vagrant 下载数据搭建EC2环境下载数据下载并运行代码下载代码运行代码 Jupyter笔记本工具集概览敏捷开发工具栈的要求 Python 使用JSON行和Parquet序列化事件收集数据使用Spark进行数据处理使用MongoDB发布数据使用Elasticsearch搜索数据使用Apache Kafka分发流数据使用PySpark Streaming处理流数据使用scikit-learn与Spark MLlib进行机器学习使用Apache Airflow（孵化项目）进行调度反思我们的工作流程轻量级网络应用展示数据本章小结 …… 第Ⅱ部分攀登金字塔附录A 安装手册
随便看	新发展理念下中国金融机构社会责任立法问题研究汪汪队立大功拼音认读故事书神探汪汪队一体化推进专题教学与实践教学财务规划、绩效与分析 2020 2019中国宏观经济形势分析与预测年中报告理想树高考必刷题政治合订本第6版 2020 中国2018年度诗歌精选桥梁施工技术新思维德语建设工程计价中韩FTA时代:新经济合作方案探索建设工程技术与计量(土木建筑工程) 炮战新法与印象布局文学理论基于汇编与C语言的MCS-51单片机实践与学习指导中国古代文学古代汉语诗礼传家幼升小入学考试经典题拼音680题修订版幼升小入学考试经典题成语680例修订版幼儿好奇心小百科入园准备丁震妇产科护理学(中级)主管护师急救包愿所有等待，终不被辜负丁震护理学（中级）单科一次过（第2科）共用相关专业知识考点背诵及强化1000题信用联社财务会计（信息）部各岗位职责区委统战部干部重要事项报告制度师生大型活动安全及学生上下楼梯管理制度财政局“一抓双关”制度实施细则库伦旗人民法院工作实绩及量化管理考评办法 Gibabyte技嘉GA-7DX/GA-7DXC主板BIOS Gigabyte技嘉GA-7DXE主板BIOS Gigabyte技嘉GA-7DXR主板BIOS Gigabyte技嘉GA-7ZMMH主板BIOS 送小羊回家2 浦发信用卡电脑版 yoo视频电脑版网易新闻电脑版脉脉电脑版白描电脑版招商银行掌上生活电脑版子弹短信电脑版新浪财经电脑版顺丰速运电脑版百度知道电脑版 drop-leaf table droplet dropout dropper droppings dross drought drove drown drowning [BT下载][逆天至尊][第11-12集][WEB-MKV/0.60G][国语配音/中文字幕][4K-2160P][H265][流媒体][ParkTV] [BT下载][长乐曲][第32-33集][WEB-MP4/1.27G][国语配音/中文字幕][1080P][流媒体][ParkTV] [BT下载][长乐曲][第32-33集][WEB-MP4/3.89G][国语配音/中文字幕][4K-2160P][流媒体][ParkTV] [BT下载][雪迷宫][第20集][WEB-MKV/0.31G][国语配音/中文字幕][1080P][流媒体][ParkTV] [BT下载][魔法少女与恶曾是敌人。][第09-10集][WEB-MKV/1.08G][中文字幕][1080P][流媒体][ParkTV] [BT下载][弹子球游戏第二季][第04集][WEB-MKV/4.34G][简繁英字幕][1080P][流媒体][ZeroTV] [BT下载][弹子球游戏第二季][第04集][WEB-MKV/8.00G][简繁英字幕][4K-2160P][H265][流媒体][ZeroTV] [BT下载][弹子球游戏第二季][第04集][WEB-MKV/9.34G][简繁英字幕][4K-2160P][杜比视界版本][H265][流媒体] [BT下载][丹道至尊][第77集][WEB-MP4/0.19G][国语配音/中文字幕][1080P][流媒体][ZeroTV] [BT下载][倾世妖颜][第17-18集][WEB-MKV/1.34G][国语配音/中文字幕][4K-2160P][H265][流媒体][ParkTV] 超击突破加特林枪手有什么技能-超击突破加特林枪手技能介绍超击突破搜索队有什么技能-超击突破搜索队技能介绍超击突破喷射兵有什么技能-超击突破喷射兵技能介绍极限竞速：地平线4法拉利458怎么涂装-法拉利458涂装代码分享极限竞速：地平线4法拉利599xxe怎么获得-法拉利599xxe获得方法极限竞速：地平线4手柄震动在哪设置-手柄震动的设置方法极限竞速：地平线4方向盘怎么设置-方向盘的设置方法极限竞速：地平线4技术点数怎么获得-技术点数获得方法永劫无间神鹰雕像在哪-永劫无间神鹰雕像位置介绍永劫无间仙人掌怎么触发-永劫无间仙人掌触发方法