![]()
内容推荐 本书深入浅出地讲解了大数据爬虫技术。全书共6个项目,包括爬虫基础、Python爬虫、爬虫与数据存储、Scrapy框架、爬取动态网页以及爬虫与数据分析。每个项目列出了教学目标,指明了教与学的知识、技能、素养培养方向,并附带上机实训项目与操作指导,理论与实践相结合,实用性强,方便学生及时巩固技能,提升操作能力。 全书内容丰富、由浅入深、循序渐进、图文并茂、重点突出、通俗易懂,既可作为院校大数据专业的专业基础课,也可作为高等学校网络专业、人工智能专业以及软件技术专业的选修课,本书建议开课院校安排的课时为46学时。 目录 项目1 爬虫基础 教学目标 1.1 爬虫简介 1.2 爬虫基础 1.3 网页的请求和响应 1.4 Python的安装与使用 1.5 项目小结 1.6 实训 1.7 习题 项目2 Python爬虫 教学目标 2.1 urllib库 2.2 requests库 2.3 正则表达式 2.4 BeautifulSoup 2.5 Xpath 2.6 PyQuery 2.7 JsonPath 2.8 基础爬虫框架 2.9 项目小结 2.10 实训 2.11 习题 项目3 爬虫与数据存储 教学目标 3.1 文件格式 3.2 MySQL数据库 3.3 Redis数据库 3.4 OrientDB数据库 3.5 Python操作MySQL数据库 3.6 项目小结 3.7 实训 3.8 习题 项目4 Scrapy框架 教学目标 4.1 Scrapy框架简介 4.2 Spider 4.3 Scrapy的开发与实现 4.4 项目小结 4.5 实训 4.6 习题 项目5 爬取动态网页 教学目标 5.1 应用场景 5.2 动态网页特征 5.3 动态网页爬取 5.4 项目小结 5.5 实训 5.6 习题 项目6 爬虫与数据分析 教学目标 6.1 文本分析 6.2 数据清洗 6.3 Python爬虫排序算法 6.4 项目小结 6.5 实训 6.6 习题 参考文献 |