![]()
编辑推荐 本书具有以下特色: 1.双色印刷,更好地呈现数据采集相关知识要点与各类解析、验证等工具的强大功能。 2.从爬虫基础到简单实现,从环境搭建到Scrapy与分布式爬虫,知识结构由浅入深,便于系统学习。 3.提供丰富案例与源码支持,引导读者边练边学,在实践中快速成长。 内容推荐 《Python网络爬虫从入门到进阶实战》从零基础入门学习者的角度出发,通过通俗易懂的语言、丰富多彩的实例,循序渐进地让读者在实践中学习Python网络爬虫知识,并提升自己的实际开发能力。本书主要介绍了爬虫基础知识、常用网络请求模块的使用(urllib3模块、Requests模块、高级网络请求模块)、数据解析与存储(re模块的正则表达式、XPath的使用、Beautiful Soup模块)、爬取动态渲染的数据、多线程爬虫、多进程爬虫、抓取App数据、识别验证码、Scrapy爬虫框架与Scrapy-Redis分布式爬虫等内容。本书知识讲解详细,侧重讲解知识使用场景,涉及的代码给出了详细的注释,可以使读者轻松领会Python网络爬虫程序开发的精髓,快速提高开发技能。本书适合作为Python网络爬虫程序开发入门者的自学用书,也适合作为高等院校相关专业的教学参考书,亦可供开发人员查阅、参考。 目录 第1篇爬虫基础篇 第1章认识爬虫 1.1网络爬虫概述 1.2网络爬虫的分类 1.3网络爬虫的基本原理 1.4爬虫环境搭建 本章知识思维导图 第2章爬虫基础知识 2.1HTTP基本原理 2.1.1HTTP协议 2.1.2HTTP与Web服务器 2.1.3浏览器中的请求和响应 2.2HTML语言 2.2.1什么是HTML 2.2.2了解HTML结构 2.2.3HTML的基本标签 2.3CSS层叠样式表 2.3.1CSS概述 2.3.2属性选择器 …… |