网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 基于Python的Web大数据爬取实战指南/大数据科学研究丛书
分类
作者 夏换//杨秀璋//于小民
出版社 科学出版社
下载
简介
目录
第一部分 基础知识
第1章 概述
1.1 Web大数据爬取
1.2 各章概要
1.3 如何阅读本书
第2章 Python基础知识
2.1 Python语言简介
2.2 Python安装过程
2.3 Python基础知识
2.4 条件语句和循环语句
2.5 字符串操作
2.6 文件操作
2.7 局部变量、全局变量与导入块变量
2.8 多线程编程
第3章 HTML基础知识及DOM树结构
3.1 浏览器显示HTML源代码
3.2 HTML语法规则
3.3 HTMLDOM树型结构
3.4 XPath技术
第4章 XML基础知识
4.1 基础知识
4.2 XML文档示例
4.3 XML语法规则
4.4 XML基本用法
4.5 Python处理XML数据
第二部分 基于Python的数据爬取
第5章 Python网页爬虫的相关介绍
5.1 概述
5.2 正则表达式
5.3 Selenium
5.4 BeautifulSoup
5.5 Scrapy
5.6 数据存储技术
第6章 基于正则表达式的Web爬虫
6.1 正则表达式
6.2 常用的网页爬取正则表达式
6.3 Python爬虫常用函数
6.4 案例分析1:使用正则表达式获取新浪博客文章
6.5 案例分析2:使用正则表达式爬取百科知识
第7章 基于Selenium的Web爬虫
7.1 Selenium安装过程
7.2 Selenium常见元素定位方法和操作
7.3 案例分析1:Selenium爬取百科知识
7.4 案例分析2:Selenium爬取PubMed生物医学摘要信息
7.5 案例分析3:Selenium爬取图片
第8章 基于Selenium的自动登录爬虫
8.1 Python自动登录技术
8.2 新浪微博介绍
8.3 案例分析1:Selenium自动登录163邮箱
8.4 案例分析2:Selenium自动登录爬取新浪微博知识
第9章 基于BeautifulSoup的Web爬虫
9.1 概述及安装
9.2 BeautifulSoup具体用法
第10章 数据库存储技术
10.1 数据库存储的基本技术
10.2 MySQL数据库知识
10.3 Python数据库知识
10.4 案例分析:Selenium爬取数据并存储至数据库中
内容推荐
夏换、杨秀璋、于小民编著的《基于Python的Web大数据爬取实战指南/大数据科学研究丛书》主要研究基于Python的Web大数据爬取,采用Python语言实现。全书贯穿各种爬虫算法与案例进行讲解,是一本典型的实战指南。内容涵盖基础知识和数据爬取两大部分,涉及网络爬虫入门、Python基础、HTML基础、正则表达式、Selenium技术、网页自动登录和数据库存储等知识。本书结合实例详细讲解了Python网络爬虫的各种技术,抓取在线百科、技术博客、新浪微博、游迅网、生物医学网等的信息,构思合理,从基础知识到案例代码,由浅入深地将知识分享给读者。本书符合国家大数据发展战略,有利于推动各地区的大数据发展,为底层大数据挖掘技术做出贡献。
本书适合大数据、计算机科学、数据挖掘等专业的学生使用,也可以作为数据挖掘研究者或大数据抓取相关工作者的教科书或实践指南。
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/25 12:03:17