网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 PYTHON数据分析
分类 教育考试-大中专教材-大学教材
作者 王俊
出版社 机械工业出版社
下载
简介
编辑推荐
本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy进行科学计算、使用Pandas处理数据、数据可视化、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。
内容推荐
本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用,帮助读者更好地运用Python解决数据分析中的实际问题。
本书适合作为高等院校工商管理类研究生、本科生的数据分析课程教材,还适合作为金融行业人员的参考资料。
目录
目 录
前言
第1章 数据分析导论 / 1
1.1 面向财经领域的数据分析 / 1
1.2 数据分析工作流程与案例赏析 / 2
1.2.1 数据分析的工作流程 / 2
1.2.2 数据分析的案例赏析 / 3
1.3 扩展阅读 / 6
1.3.1 大数据驱动的决策范式
转变 / 6
1.3.2 使用大语言模型做数据
分析 / 6
第2章 Python基础知识 / 8
2.1 数据类型 / 8
2.1.1 数值 / 9
2.1.2 字符串 / 10
2.1.3 列表 / 13
2.1.4 元组 / 15
2.1.5 集合 / 16
2.1.6 字典 / 16
2.2 运算法则 / 18
2.2.1 算术运算 / 18
2.2.2 逻辑运算 / 19
2.2.3 比较运算 / 19
2.3 条件语句 / 19
2.4 循环语句 / 20
2.4.1 while循环 / 20
2.4.2 for循环 / 21
2.5 终止语句 / 22
2.6 函数构造和参数 / 22
2.6.1 自定义函数 / 22
2.6.2 自定义函数的参数 / 23
2.6.3 局部和全局变量 / 25
2.6.4 Lambda函数 / 25
2.7 扩展阅读 / 25
2.7.1 应用ChatGLM开发聊天
机器人 / 25
2.7.2 使用ChatGPT辅助学习Python / 27
第3章 网络爬虫 / 29
3.1 网络爬虫概述 / 29
3.2 网页结构 / 31
3.2.1 服务器与本地交换机制 / 31
3.2.2 HTML / 31
3.3 获取网页内容 / 34
3.3.1 通过Requests发送请求 / 34
3.3.2 在URL中传递参数 / 35
3.3.3 添加Headers / 36
3.4 利用爬虫获取股吧评论数据 / 36
3.5 扩展阅读 / 39
3.5.1 常见的反爬机制与解决
方案 / 39
3.5.2 使用ChatGPT辅助开发
网络爬虫 / 40
第4章 正则表达式 / 42
4.1 初识正则表达式 / 42
4.1.1 什么是正则表达式 / 42
4.1.2 构建简单的正则表达式 / 43
4.2 正则表达式进阶 / 44
4.3 使用正则表达式解析HTML网页 / 48
4.4 扩展阅读 / 49
第5章 BeautifulSoup和JSON / 51
5.1 BeautifulSoup基本语法 / 51
5.1.1 创建BeautifulSoup对象 / 52
5.1.2 提取标签信息 / 53
5.2 使用BeautifulSoup解析HTML
网页 / 54
5.3 JSON / 56
5.3.1 JSON的特点 / 56
5.3.2 JSON的结构 / 56
5.3.3 JSON序列化与反序列化 / 57
5.3.4 解析在线API返回的JSON
数据 / 58
5.4 扩展阅读 / 58
第6章 词语切分 / 60
6.1 分词简介 / 60
6.1.1 优选匹配法分词 / 61
6.1.2 基于统计的分词 / 62
6.2 Jieba分词 / 64
6.2.1 Jieba分词简介 / 64
6.2.2 使用Jieba分词 / 66
6.3 读取文件并切词 / 69
6.4 下载网页数据并切词 / 71
6.5 扩展阅读 / 73
6.5.1 Jieba分词算法细节 / 73
6.5.2 使用大语言模型切词 / 73
第7章 自然语言处理简介 / 75
7.1 TF-IDF / 75
7.1.1 TF-IDF原理 / 76
7.1.2 TF-IDF案例 / 77
7.2 词袋法 / 78
7.3 情感分析 / 79
7.3.1 定义函数创建词袋 / 81
7.3.2 使用Python实现词袋法 / 82
7.4 扩展阅读 / 83
7.4.1 词嵌入 / 83
7.4.2 使用ChatGPT做文本
分析 / 83
第8章 使用NumPy进行科学
计算 / 85
8.1 创建数组 / 85
8.1.1 安装NumPy / 85
8.1.2 列表和数组 / 86
8.1.3 创建并探索NumPy数组 / 87
8.1.4 创建特殊NumPy数组 / 89
8.1.5 导入并查看titanic数据集 / 91
8.2 数组切片 / 93
8.2.1 索引和切片 / 93
8.2.2 数组切片和列表切片 / 94
8.2.3 数组拼接 / 95
8.3 数组计算 / 96
8.3.1 广播 / 97
8.3.2 数组的绝对值与均值 / 97
8.3.3 点积 / 97
8.4 词语相似度计算 / 99
8.5 手写数字案例 / 101
8.5.1 初步探索数据集 / 102
8.5.2 数据标准化 / 102
8.5.3 图像翻转 / 103
8.6 金融案例分析 / 104
8.6.1 读取文件 / 104
8.6.2 计算成交量加权平均
价格 / 105
8.6.3 计算优选值和最小值 / 105
8.6.4 计算极差 / 106
8.6.5 计算中位数 / 106
8.6.6 计算方差 / 106
8.7 扩展阅读 / 107
第9章 使用Pandas处理数据 / 109
9.1 序列和数据框 / 109
9.1.1 创建序列 / 109
9.1.2 创建数据框 / 111
9.1.3 使用Pandas读取和存储
数据 / 112
9.2 用Pandas处理数据 / 114
9.2.1 关于INVEST部门的投资
任务 / 114
9.2.2 查看数据 / 115
9.2.3 数据切片 / 116
9.2.4 数据类型转换 / 118
9.2.5 数据的增删改 / 120
9.3 用Pandas处理文本数据 / 123
9.3.1 在序列中处理文本数据 / 123
9.3.2 进一步清洗文本数据 / 131
9.3.3 更新评论日期 / 132
9.4 光线传媒股价数据分析 / 134
9.5 扩展阅读 / 137
9.5.1 混频数据 / 137
9.5.2 ChatGPT视角下的
Pandas / 139
第10章 数据可视化 / 141
10.1 数据可视化的基本步骤 / 141
10.2 Matplotlib可视化 / 142
10.3 Pandas可视化 / 145
10.3.1 参数列表 / 145
10.3.2 绘图 / 146
10.4 使用数据可视化探索人们的生活
规律 / 153
10.5 股票价格的数据可视化 / 155
10.6 扩展阅读 / 157
10.6.1 科研工作中常用的数据
可视化工具 / 157
10.6.2 使用生成模型辅助数据
可视化 / 160
10.6.3 ChatGPT视角下的Matplotlib / 162
第11章 认识MySQL / 163
11.1 数据库基础 / 163
11.1.1 表 / 164
11.1.2 列 / 164
11.1.3 数据类型 / 164
11.1.4 行 / 164
11.1.5 主键 / 165
11.1.6 SQL / 165
11.1.7 什么是MySQL / 165
11.1.8 MySQL的优势 / 165
11.2 数据库基本操作 / 166
11.2.1 检索数据:SELECT语句 / 166
11.2.2 过滤数据 / 167
11.2.3 插入数据 / 168
11.2.4 更新数据 / 168
11.2.5 删除数据 / 169
11.3 利用MySQL存取csv文件 / 169
11.4 使用Python和MySQL存取
数据 / 173
11.5 扩展阅读 / 175
11.5.1 什么是云数据库 / 175
11.5.2 ChatGPT视角下的
MySQL / 176
第12章 机器学习介绍 / 178
12.1 机器学习概述 / 178
12.1.1 语音助手例子 / 178
12.1.2 什么是机器学习 / 179
12.1.3 机器学习的分类 / 180
12.1.4 深入理解机器学习 / 183
12.2 模型评估与选择 / 184
12.2.1 模型选择的目的 / 184
12.2.2 评估指标 / 184
12.2.3 模型评估与选择的方法 / 188
12.2.4 最终模型 / 189
12.3 梯度下降 / 190
12.3.1 一维梯度下降 / 190
12.3.2 学习率 / 192
12.3.3 多维梯度下降 / 193
12.3.4 随机梯度下降 / 194
12.3.5 小批量梯度下降 / 194
12.4 建立并训练一个模型 / 194
12.4.1 研发投入与创新绩效的
关系 / 194
12.4.2 使用批量梯度下降求解 / 197
12.4.3 使用随机梯度下降求解 / 199
12.4.4 模型评估 / 200
12.5 扩展阅读 / 200
第13章 朴素贝叶斯模型的应用 / 202
13.1 朴素贝叶斯模型 / 202
13.1.1 贝叶斯公式 / 202
13.1.2 全概率和贝叶斯定理 / 204
13.1.3 模型介绍 / 204
13.2 结合Pandas和Jieba做训练数据
准备 / 207
13.2.1 下载数据 / 207
13.2.2 将函数应用到序列中 / 208
13.3 使用朴素贝叶斯做情感分析 / 208
13.3.1 文本的词袋表示 / 209
13.3.2 使用多项式朴素贝叶斯模型
做文本分类 / 210
13.3.3 使用Pipeline对象组合机器学习模型的各个步骤 / 212
13.3.4 应用交叉验证法评估并选择
模型 / 212
13.3.5 保存并下载模型以进行
预测 / 215
13.4 扩展阅读 / 216
第14章 支持向量机的应用 / 217
14.1 SVM原理简介 / 217
14.1.1 SVM支持向量 / 217
14.1.2 对偶问题 / 219
14.1.3 松弛变量 / 221
14.1.4 非线性SVM分类任务
(核函数) / 224
14.1.5 支持向量回归任务 / 225
14.1.6 SVM算法小结 / 227
14.2 支持向量机的Python代码
实现 / 228
14.2.1 SVM的Python实现基本
步骤 / 228
14.2.2 Scikit-Learn支持向量机
算法库小结 / 229
14.2.3 SVM算法库其他调参
要点 / 231
14.3 基于SVM的个人信贷违约预测 / 231
14.3.1 数据预览及预处理 / 232
14.3.2 特征工程 / 235
14.3.3 模型建立与参数调整 / 239
14.4 使用基于合页损失函数的SVM
进行情感分类 / 239
14.4.1 合页损失函数基本概念
介绍 / 240
14.4.2 导入数据 / 242
14.4.3 使用合页损失函数 / 243
14.4.4 使用测试数据做预测 / 243
14.5 扩展阅读 / 243
第15章 随机森林的应用 / 245
15.1 决策树与随机森林 / 245
15.1.1 决策树 / 245
15.1.2 随机森林 / 249
15.2 情感指标的获取与生成 / 250
15.2.1 获取每日情感分数 / 251
15.2.2 获取每日股评数量及意见
分歧指数 / 251
15.2.3 填充缺失值 / 252
15.2.4 生成累积滞后分数 / 252
15.3 数据拼接 / 255
15.3.1 百度指数 / 255
15.3.2 获取股票市场数据 / 256
15.3.3 合并数据集 / 257
15.4 用随机森林做金融市场价格波动
预测 / 258
15.4.1 数据准备 / 258
15.4.2 可视化混淆矩阵 / 258
15.4.3 训练决策树模型 / 259
15.4.4 训练随机森林模型 / 259
15.4.5 对比不同训练集的模型度量
指标AUC / 260
15.5 基于量化投资的模型评估指标 / 264
15.6 信用评分 / 266
15.6.1 背景 / 266
15.6.2 目标 / 266
15.6.3 数据准备 / 266
15.6.4 训练决策树模型 / 269
15.6.5 训练随机森林模型 / 269
15.7 拓展阅读 / 270
15.7.1 机器学习模型的公平性 / 270
15.7.2 ChatGPT视角下的随机
森林 / 271
第16章 深度学习 / 272
16.1 感知器与神经网络 / 272
16.1.1 感知器 / 272
16.1.2 神经网络 / 273
16.1.3 BP神经网络 / 274
16.2 深度学习中的基本模型 / 276
16.2.1 卷积神经网络 / 277
16.2.2 循环神经网络 / 281
16.2.3 长短期记忆神经网络 / 282
16.3 深度学习的发展方向 / 283
16.4 扩展阅读 / 283
16.4.1 人机融合预测系统 / 283
16.4.2 ChatGPT视角下的深度
学习 / 284
第17章 量化投资 / 286
17.1 量化投资概述 / 286
17.1.1 什么是量化投资以及量化策略开发流程 / 286
17.1.2 量化投资推荐的基础金融
理论 / 287
17.2 股息率选股策略 / 289
17.2.1 “一鸟在手胜过双鸟
在林” / 289
17.2.2 股息率策略研究与实践 / 289
17.2.3 获取月度交易日 / 290
17.2.4 获取股息率 / 293
17.2.5 筛选前30%的股票作为
组合 / 296
17.2.6 绩效可视化 / 298
17.3 PEG策略 / 300
17.3.1 PEG策略实现 / 301
17.3.2 策略可视化 / 302
17.4 股息率策略的回测平台代码实践 / 303
17.5 扩展阅读A / 304
17.5.1 回测环境 / 304
17.5.2 编译运行 / 304
17.5.3 策略回测 / 307
17.5.4 模拟交易 / 308
17.5.5 数据 / 308
17.5.6 运行频率 / 309
17.5.7 运行时间 / 309
17.5.8 佣金与印花税 / 309
17.5.9 滑点 / 309
17.5.10 拆分、合并与分红 / 309
17.6 扩展阅读B / 311
参考文献 / 313
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/27 8:20:30