网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 网络数据爬取与分析实务(电子商务应用型专业系列教材)
分类
作者 李周平
出版社 上海交通大学出版社
下载
简介
内容推荐
李周平编著的《网络数据爬取与分析实务》按照网络数据爬取、数据清洗与处理、数据存储、数据分析的逻辑脉络,介绍了数据科学的相关知识。全书主要内容涉及理论、实战、工具三个层面。其中,理论层面主要介绍了网络爬虫,数据处理与存储,机器学习的相关概念、原理与算法;实战层面主要通过影评、二手房、招聘网站等实战项目,阐述了数据爬取、处理与存储的代码实现,并通过相关数据集的实例,介绍了机器学习算法的实现与效果评估;工具层面主要讲解了如何通过Python的Urllib、Request、BeaulifulSoup、Pandas、Scikit一learn等第三方工具包实现数据的爬取、处理与分析,以及通过SQLite这一轻量级数据库工具实现数据的存储。
本书可作为高校开设数据科学相关课程的教学用书,也可供数据科学相关方向初学者的学习参考。
作者简介
李周平,上海财经大学博士,网络与软件工程师,现任上海商学院信息与计算机学院教师。长期从事网络爬虫、数据挖掘、机器学习、自然语言处理、Python程序开发等方面的教学和培训工作,具有十余年的Python项目开发经验,获得多项软件专利。
目录
第1章 数据科学概述
1.1 什么是数据科学
1.1.1 数据科学的概念
1.1.2 数据科学的处理流程
1.2 数据分析师、数据工程师与数据科学家
1.2.1 数据分析师
1.2.2 数据工程师
1.2.3 数据科学家
第2章 Python语法基础
2.1 Python的程序结构
2.1.1 Python文件类型
2.1.2 包、模块、函数结构
2.2 Python编码规范
2.2.1 通过缩进规范编码的层次关系
2.2.2 代码注释
2.2.3 语句的分隔
2.2.4 变量赋值及作用范围
2.3 Python编程环境的搭建
2.3.1 Python的版本
2.3.2 Python集成开发工具
2.3.3 JupyterNotebook的使用
2.4 Python的数据结构
2.4.1 列表(List)
2.4.2 字典(Dictionarv)
2.4.3 元组(Tuple)
2.5 Python控制语句
2.5.1 条件选择语句
2.5.2 循环语句
2.5.3 异常处理语句
习题
第3章 使用Urllib库编写爬虫
3.1 网络爬虫概述
3.1.1 什么是网络爬虫
3.1.2 为什么要学习网络爬虫技术
3.1.3 聚焦爬虫的基本原理
3.2 使用Urllib.request模块编写爬虫
3.2.1 Urllib库简介
3.2.2 编写第一个爬虫程序
3.2.3 urlopen()函数超时设置
3.3 修改User-Agent属性模拟浏览器访问
3.3.1 认识HTTP协议的User-Agent属性
3.3.2 修改User-Agent属性的方法
3.4 HTTP协议详解
3.4.1 HTTP请求与应答过程
3.4.2 HTTP请求格式
3.5 模拟HTTP—GET方法的爬虫
3.6 模拟HTTP-POST方法的爬虫
3.6.1 Urllib.request.Request类
3.6.2 POST请求过程
3.6.3 爬虫模拟POST登录请求
习题
第4章 使用正则表达式提取数据
4.1 正则表达式原理
4.2 正则表达式语法
4.2.1 正则表达式的构成
4.2.2 贪婪与懒惰模式
4.3 re模块常用的函数
4.3.1 常用的匹配函数
第5章 使用BeautifulSoup库提取数据
第6章 爬虫项目实战
第7章 Pandas数据处理基础
第8章 Pandas数据处理常用方法
第9章 数据处理实战
第10章 SQLite数据库操作
第11章 机器学习概述
第12章 从线性回归到分类
第13章 分类模型及应用
第14章 分类模型的评估
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/2/22 19:36:28