编辑推荐 【内容特点】 (1)全面讲解大数据采集与预处理的相关理论和实操 (2)注重实战,案例丰富,代码注释详尽,微课视频。 (3)精选3个行业案例精细讲解。 【资源特点】配套PPT、教案、教学大纲、习题答案。 【服务特点】作者提供QQ服务群等支持。 内容推荐 \t本书详细介绍大数据领域数据采集与预处理的相关理论和技术,全面讲解数据采集与预处理的流程及其在多个领域的应用。本书共8章,包括数据采集与预处理概述、数据采集与存储、数据采集进阶、数据清洗、数据规整与分组聚合、豆瓣电影排行榜数据抓取与预处理、使用Scrapy框架与Selenium采集股市每日点评数据并可视化、房产数据预处理。
\t本书可作为高等院校大数据、人工智能、计算机等专业的教材,也可供相关从业人员参考。
目录 第1章 数据采集与预处理概述 1.1数据采集简介 1.1.1数据采集工具 1.1.2爬虫的原理与分类 1.1.3网络爬虫实现的核心流程 1.1.4爬虫的应用场景 1.2数据预处理简介 1.2.1数据预处理的目的与意义 1.2.2数据预处理技术 1.2.3数据预处理工具 1.3 Python中关于数据采集与预处理的常用库 1.3.1请求库 1.3.2解析库 1.3.3数据存储库 1.3.4处理库 习题 第2章 数据采集与存储 …… |