本书收集了大数据采集与爬虫的相关编程案例,分4个项目进行讲解,包括项目一爬虫与网页、项目二文本类网站的爬虫、项目三图片资源的爬虫、项目四Jupyter Notebook(anaconda3)爬虫编程基础,共讲解了28个编程案例。
项目一~项目三在Visual Studio Code软件环境下讲解,项目四在Jupyter Notebook(anaconda3)环境下讲解,编程语言为Python语言。
本书内容包括爬虫程序的工作原理,从网站爬取收集需要的代码、文字、图片等资源的技能,讲解内容以案例应用的形式呈现,并把技能应用与案例实现过程结合,以效果目标引领编程,同时,注重将理论知识贯穿于案例。本书在讲解技能应用技巧的实现过程中,帮助读者掌握大数据采集与爬虫技术,同时加深学生对相关专业理论知识点的认识与理解。
本书适合培养读者应用Python语言编写爬虫程序,实现爬虫功能。本书在讲解案例任务的实现过程中,通过代码的解读引导读者理解代码的功能,注意帮助读者提升Python语言的应用水平,能有效提高读者的专业学习能力。