网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python数据科学应用从入门到精通
分类
作者
出版社 清华大学出版社
下载
简介
内容推荐
随着数据存储、数据处理等大数据技术的快速发展,数据科学在各行各业得到广泛的应用。数据清洗、特征工程、数据可视化、数据挖掘与建模等已成为高校师生和职场人士迎接数字化浪潮、与时俱进提升专业技能的必修课程。本书将“Python课程学习”与“数据科学应用”有机结合,为数字化人才的培养助力。
全书共分13章,内容包括:第1章数据科学应用概述;第2章Python的入门基础知识;第3章数据清洗;第4~6章特征工程介绍,包括特征选择、特征处理和特征提取;第7章数据可视化应用;第8~13章介绍6种数据挖掘与建模的方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。
本书既适合作为经济学、管理学、统计学、金融学、社会学、医学、电子商务等相关专业的学生学习Python数据科学应用的专业教材或参考书,也适合作为企事业单位数字化人才培养的教科书与工具书。此外,还可以作为职场人士提升数据处理与分析挖掘能力,提高工作效能和绩效水平的自学Python数据科学应用的工具书。
作者简介
杨维忠,山东大学经济学硕士,CPA,十年商业银行工作经历,历任运营、风控、营销、内控等多个职位,擅长商务建模,精通SPSS、Stata、EViews,编著有《SPSS数据挖掘与案例分析应用实践》《Stata统计分析与实验指导》等近十本畅销书。
目录
第1章 数据科学应用概述
1.1 什么是数据清洗、特征工程、数据可视化、数据挖掘与建模
1.1.1 数据清洗的概念
1.1.2 特征工程的概念
1.1.3 数据可视化的概念
1.1.4 数据挖掘与建模的概念
1.2 为什么要开展数据清洗、特征工程、数据可视化和数据挖掘与建模
1.2.1 数据清洗、特征工程的重要性
1.2.2 数据可视化的重要性
1.2.3 数据挖掘与建模的重要性
1.3 为什么要将Python作为实现工具
1.4 数据清洗、特征工程、数据可视化和数据挖掘与建模的主要内容
1.4.1 数据清洗的主要内容
1.4.2 特征工程的主要内容
1.4.3 数据可视化的主要内容
1.4.4 数据挖掘与建模的主要内容
1.5 数据清洗、特征工程、数据可视化和数据挖掘与建模的应用场景
1.5.1 数据清洗、特征工程的应用场景
1.5.2 数据可视化的应用场景
1.5.3 数据挖掘与建模的应用场景
1.6 数据清洗、特征工程和数据可视化的注意事项
1.6.1 数据清洗、特征工程的注意事项
1.6.2 数据可视化的注意事项
1.7 数据挖掘与建模的注意事项
1.8 习题
第2章 Python入门基础
2.1 Python概述
2.2 Anaconda平台的下载与安装
2.2.1 Anaconda平台的下载
2.2.2 Anaconda平台的安装
2.2.3 Anaconda Prompt(Anaconda3)
2.2.4 Spyder(Anaconda3)的介绍及偏好设置
2.2.5 Spyder(Anaconda3)窗口介绍
2.3 Python的注释
2.4 基本输出函数—print()函数
2.5 基本输入函数—input()函数
2.6 Python的保留字与标识符
2.6.1 Python中的保留字
2.6.2 Python的标识符
2.7 Python的变量
2.8 Python的基本数据类型
2.9 Python的数据运算符
2.10 Python序列的概念及通用操作
2.10.1 索引
2.10.2 切片
2.10.3 相加
2.10.4 相乘
2.10.5 元素检查
2.10.6 与序列相关的内置函数
2.11 Python列表
2.11.1 列表的基本操作
2.11.2 列表元素的基本操作
2.12 Python元组
2.12.1 元组的基本操作
2.12.2 元组元素的基本操作
2.13 Python字典
2.13.1 字典的基本操作
2.13.2 字典元素的基本操作
2.14 Python集合
2.15 Python字符串
2.16 习题
第3章 数据清洗
3.1 Python数据清洗基础
3.1.1 Python函数与模块
3.1.2 numpy模块数组
3.1.3 pandas模块序列
3.1.4 pandas模块数据框
3.1.5 Python流程控制语句
3.2 Python数据读取、合并、写入
3.2.1 读取、合并、写入文本文件(CSV或者TXT)
3.2.2 读取、合并、写入Excel数据文件
3.2.3 读取、合并、写入Stata数据文件
3.2.4 读取、合并SPSS数据文件
3.3 Python数据检索
3.4 Python数据行列处理
3.4.1 删除变量列、样本行
3.4.2 更改变量的列名称、调整变量列顺序
3.4.3 改变列的数据格式
3.4.4 多列转换
3.4.5 数据百分比格式转换
3.5 Python数据缺失值处理
3.5.1 查看数据集中的缺失值
3.5.2 填充数据集中的缺失值
3.5.3 删除数据集中的缺失值
3.6 Python数据重复值处理
3.6.1 查看数据集中的重复值
3.6.2 删除数据集中的重复值
3.7 Python数据异常值处理
3.7.1 运用3δ准则检测异常值
3.7.2 绘制箱图检测异常值
3.7.3 删除异常值
3.7.4 3δ准则替换异常值
3.7.5 1%/99%分位数替换异常值
3.8 Python数据透视表、描述性分析和交叉表分析
3.8.1 数据透视表
3.8.2 描述性分析
3.8.3 交叉表分析
3.9 习题
第4章 特征选择
4.1 特征选择的概念、原则及方法
4.1.1 特征选择的概念
4.1.2 特征选择的原则
4.1.3 特征选择的方法
4.2 过滤法—去掉低方差的特征
4.3 过滤法—单变量特征选择
4.3.1 卡方检验
4.3.2 相关性分析
4.3.3 方差分析(F检验)
4.3.4 互信息
4.4 包裹法—递归特征消除
4.5 嵌入法
4.5.1 随机森林算法选择特征变量
4.5.2 提升法算法选择特征变量
4.5.3 Logistic回归算法选择特征变量
4.5.4 线性支持向量机算法选择特征变量
4.6 习题
第5章 特征处理
5.1 特征归一化、特征标准化、样本归一化
5.1.1 特征归一化
5.1.2 特征标准化
5.1.3 样本归一化
5.2 特征等宽分箱和等频分箱
5.3 特征决策树分箱
5.3.1 信息熵
5.3.2 信息增益
5.3.3 增益比率
5.3.4 基尼指数
5.3.5 变量重要性
5.3.6 特征决策树分箱的Python实现
5.4 特征卡方分箱
5.5 WOE(证据权重)和IV(信息价值)
5.5.1 WOE和IV的概念
5.5.2 W
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/1/19 17:00:35