网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 大数据采集与爬虫
分类
作者
出版社 北京理工大学出版社
下载
简介
内容推荐
本书收集了大数据采集与爬虫的相关编程案例,分4个项目进行讲解,包括项目一爬虫与网页、项目二文本类网站的爬虫、项目三图片资源的爬虫、项目四Jupyter Notebook(anaconda3)爬虫编程基础,共讲解了28个编程案例。
项目一~项目三在Visual Studio Code软件环境下讲解,项目四在Jupyter Notebook(anaconda3)环境下讲解,编程语言为Python语言。
本书内容包括爬虫程序的工作原理,从网站爬取收集需要的代码、文字、图片等资源的技能,讲解内容以案例应用的形式呈现,并把技能应用与案例实现过程结合,以效果目标引领编程,同时,注重将理论知识贯穿于案例。本书在讲解技能应用技巧的实现过程中,帮助读者掌握大数据采集与爬虫技术,同时加深学生对相关专业理论知识点的认识与理解。
本书适合培养读者应用Python语言编写爬虫程序,实现爬虫功能。本书在讲解案例任务的实现过程中,通过代码的解读引导读者理解代码的功能,注意帮助读者提升Python语言的应用水平,能有效提高读者的专业学习能力。
目录
项目一 爬虫与网页
任务一 使用requests模块爬取网页状态
任务二 在浏览器中查看网页状态
任务三 爬取在IIS中发布的网页内容
任务四 爬取网页

标签的内容
任务五 爬取网页多个

标签的所有文本
任务六 根据标签类名爬取网页标签内容
任务七 用getall()方法爬取网页标签内容
任务八 爬取网页中所有超链接的网址
任务九 爬取网页中超链接目标的标题
任务十 爬取网页中所有标签
项目二 文本类网站的爬虫
任务一 爬取网页特定区域的内容
任务二 爬取网页两个特定区域的内容并分别保存于两个文件中
任务三 爬取网页招聘信息
任务四 爬取两个网页内容合并保存
任务五 从网页爬取商品销售信息并排序保存
任务六 爬取网站的小说文本

随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/1/31 13:37:45