本书介绍了基于Python的数据科学理论和实践相关内容。全书内容包括数据科学概论、Python基础、Python常用模块、基于Python的最优化等内容。本书以适用为目标,在简要介绍相关理论的基础上重点介绍如何通过Python进行数据分析、建模和问题解决。同时,本书还包含了大量的Python源代码,可以作为参考资料,具有很强的实用性。
本书既可作为高等院校管理类专业高年级本科生、研究生的教材,也可以作为管理实践相关人员的工具书。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据科学理论与实践--基于Python的实现 |
分类 | |
作者 | |
出版社 | 科学出版社 |
下载 | ![]() |
简介 | 内容推荐 本书介绍了基于Python的数据科学理论和实践相关内容。全书内容包括数据科学概论、Python基础、Python常用模块、基于Python的最优化等内容。本书以适用为目标,在简要介绍相关理论的基础上重点介绍如何通过Python进行数据分析、建模和问题解决。同时,本书还包含了大量的Python源代码,可以作为参考资料,具有很强的实用性。 本书既可作为高等院校管理类专业高年级本科生、研究生的教材,也可以作为管理实践相关人员的工具书。 作者简介 何曙光 天津大学管理与经济学部教授、博士生导师,工学博士,美国弗吉尼亚理工大学访问学者。研究领域为智能制造环境下的质量管理、大数据环境下的质保管理及质保数据分析、机器学习在质量工程中的应用、智能制造环境下的设备运维等。主持国家自然科学基金重点项目、面上项目多项,发表学术论文70余篇,出版学术专著1部。获天津青年科技奖、天津市科技进步奖、天津市社会科学优秀成果奖等。兼任中国现场统计研究会可靠性工程分会副理事长、天津市工业工程学会副理事长、天津市现场统计研究会副理事长等。 目录 前言 第1章 数据科学概论 1.1 数据与大数据 1.1.1 数据、信息和知识 1.1.2 大数据 1.2 数据科学及其工作流程概述 1.2.1 数据科学概述 1.2.2 数据科学工作流程 习题 第2章 Python基础 2.1 Python概述 2.1.1 计算机语言概述 2.1.2 Python语言简介 2.1.3 Python解释器及开发环境的安装 2.2 Python基础 2.2.1 Python基础语法 2.2.2 Python复杂数据类型 2.2.3 Python运算符 2.2.4 Python控制语句 2.3 函数和类的定义 2.3.1 Python函数的定义和调用 2.3.2 Python与面向对象编程 2.4 Python包 2.4.1 Python包的结构和导入 2.4.2 Python常用包简介 习题 第3章 Python常用模块 3.1 numpy与矩阵运算 3.1.1 numpy多维数组基础 3.1.2 数组索引 3.1.3 数组运算 3.1.4 numpy简单统计函数 3.2 基于pandas的数据操纵与管理 3.2.1 pandas基础 3.2.2 DataFrame的切片和计算 3.2.3 DataFrame数据运算 3.2.4 数据的合并 3.3 基于matplotlib和seaborn的数据可视化 3.3.1 matplotlib数据可视化概述 3.3.2 matplotlib数据可视化示例 3.3.3 seaborn数据可视化 3.4 基于sympy的符号计算 3.4.1 sympy基础 3.4.2 表达式操作 3.4.3 积分与微分 3.4.4 sympy方程求解 3.4.5 sympy与函数可视化 3.5 基于scipy的科学计算 3.5.1 scipy线性代数 3.5.2 数值积分 3.5.3 插值 习题 第4章 基于Python的最优化 4.1 最优化问题的形式化定义与分类 4.2 基于scipy的函数优化 4.2.1 无约束最优化 4.2.2 约束最优化 4.2.3 其他最优化算法 4.3 基于cvxpy的凸优化建模与求解 4.3.1 凸优化的基本概念 4.3.2 cvxpy及凸优化问题求解 4.3.3 凸优化问题实例 4.4 基于gurobipy的数学规划建模与求解 4.4.1 Gurobi简介 4.4.2 基于gurobipy求解数学规划的步骤 4.4.3 gurobipy建模与求解实例 4.4.4 gurobipy中的常用问题转换技巧 习题 第5章 基于Python的统计分析 5.1 scipy与统计分布 5.1.1 基于scipy的基本统计分布 5.1.2 主要离散分布简介 5.1.3 主要连续分布简介 5.1.4 抽样分布 5.1.5 基本统计分析 5.2 基于Python的分布参数估计 5.2.1 参数的点估计 5.2.2 参数的区间估计 5.2.3 存在截尾数据的韦布尔分布参数估计实例 5.3 假设检验 5.3.1 假设检验的基本概念 5.3.2 scipy中的假设检验 5.4 基于Python的统计模型 5.4.1 线性回归 5.4.2 广义线性模型 5.4.3 广义估计方程 5.4.4 广义加性模型 5.4.5 基于表达式的模型定义 习题 第6章 基于Python的机器学习 6.1 机器学习概述 6.1.1 机器学习及相关概念 6.1.2 机器学习的结构 6.1.3 基于Python的机器学习 6.1.4 sklearn基础 6.2 监督学习模型 6.2.1 分类模型 6.2.2 回归模型 6.2.3 集成方法 6.3 非监督学习算法 6.3.1 聚类 6.3.2 高斯混合模型 6.3.3 流形学习 6.3.4 信号成分分解 6.3.5 异常检测 6.4 机器学习模型选择和评估 6.4.1 模型选择与评估 6.4.2 超参数设置 6.4.3 特征选择 6.4.4 模型的保存和读取 习题 第7章 基于PyTorch的神经网络 7.1 神经网络 7.1.1 神经网络基本原理 7.1.2 激活函数 7.1.3 神经网络训练过程 7.2 基于PyTorch的神经网络建模 7.2.1 Torch简介 7.2.2 变量和自动求导机制autograd 7.3 PyTorch神经网络建模 7.4 基于PyTorch的神经网络示例 7.4.1 回归问题 7.4.2 分类问题 7.4.3 多项式拟合问题 习题 第8章 网络文本数据分析与实践 8.1 网络文本数据分析概述 8.1.1 网络数据分析的基本流程 8.1.2 网络数据分析主要应用场景 8.1.3 网络数据分析典型案例 8.2 Web应用构成要素及工作流程 8.2.1 网页构成要素 8.2.2 Web访问请求和响应过程 8.2.3 静态网页和动态网页 8.2.4 审查网页元素 8.3 基于Python的网络数据获取 8.3.1 User-Agent 8.3.2 基于urllib的网络数据获取 8.3.3 基于requests包的网络数据获取 8.4 网络数据解析 8.4.1 正则表达式 8.4.2 基于lxml的信息提取 8.4.3 Beautiful Soup 8.5 文本处理 8.5.1 数据预处理 8.5.2 中文分词 8.5.3 去除停用词 8.5.4 关键词分析 8.6 文本数据建模与分析 8.6.1 文本主题模型 8.6.2 情感分析模型 习 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。