![]()
内容推荐 《零基础学Python网络爬虫》(升级版)从学习与应用的角度出发,帮助读者快速掌握网络爬虫的各项技能。全书包括初识网络爬虫、请求模块Urllib、请求模块requests、高级网络请求模块、正则表达式、XPath解析等。书中所有知识都结合具体实例进行讲解,设计的程序代码给出了详细的注释,可以使读者轻松领会Python网络爬虫程序开发的精髓,快速提高开发技能。 作者简介 明日科技,是一个拥有软件开发和项目实施方面的资深专家和学习型技术团队,利用积累的专业知识和经验,已开发出版了“软件开发视频大讲堂”“软件开发实战1200例”“软件开发实战宝典”“软件项目开发全程实录”等系列丛书,是国内畅销的编程图书品牌。 目录 第1章 初识网络爬虫 e学码:5个 1.1 网络爬虫概述 1.2 网络爬虫的分类 1.3 网络爬虫的基本原理 1.4 Windo下搭建开发环境 1.4.1 安装Anaconda 1.4.2 PyCharm的下载与安装 1.4.3 配置PyCharm 1.4.4 测试PyCharm 第2章 请求模块Urllib 精彩实例:22个 e学码:5个 2.1 Urllib简介 2.2 使用urlopen()方法发送请求 2.2.1 发送GET请求 实例2.1 演示常用的方法与属性 2.2.2 发送POST请求 实例2.2 发送POST请求 2.2.3 设置网络超时 实例2.3 处理网络超时 2.3 复杂的网络请求 2.3.1 设置请求头 实例2.4 设置请求头 2.3.2 Cookie的获取与设置 实例2.5 模拟登录 实例2.6 获取Cookie 实例2.7 保存Cookie文件 实例2.8 使用Cookie信息登录并获取登录后页面中的信息 2.3.3 设置理IP地址 实例2.9 设置理IP地址 2.4 异常处理 实例2.10 处理URLError异常 实例2.11 使用HTTPError类捕获异常 实例2.12 双重异常的捕获 2.5 解析 2.5.1 拆分URL 实例2.13 使用urlparse()方法拆分URL 实例2.14 使用urlsplit()方法拆分URL 2.5.2 组合URL 实例2.15 使用urlunparse()方法组合URL 实例2.16 使用urlunsplit()方法组合URL 2.5.3 连接URL 实例2.17 使用urljoin()方法连接URL 2.5.4 URL的编码与解码 实例2.18 使用urlencode()方法编码请求参数 实例2.19 使用quote()方法编码字符串参数 实例2.20 使用unquote()方法解码请求参数 2.5.5 URL参数的转换 实例2.21 使用parse_qs()方法将参数转换为字典类型 实例2.22 使用parse_qsl()方法将参数转换为元组所组成的列表 第3章 请求模块requests 精彩实例:13个 e学码:6个 3.1 请求方式 3.1.1 GET请求 实例3.1 实现不带参数的GET网络请求 …… 第4章 高级网络请求模块 第5章 正则表达式 第6章 XPath解析 第7章 解析数据的BeautifulSoup模块 第8章 多线程与多程爬虫 第9章 数据处理与存储 第10章 App抓包工具 第11章 识别验证码 第12章 Scrapy爬虫框架 第13章 爬取编程e学网视频 第14章 爬取某网站的数据 第15章 爬取北、上、广、深租房信息 |