网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python数据分析与挖掘实战
分类
作者 邓立国
出版社 清华大学出版社
下载
简介
内容推荐
本书涵盖数据分析与数据挖掘的基础知识、必备工具和有效实践方法,能让读者充分掌握数据分析与数据挖掘的基本技能。
本书共分为15章,主要内容包括大数据获取、数据预处理、探索性数据分析、用Sklearn估计器分类、主流数据分析库、大数据的数据库类型、数据仓库/商业智能、数据聚合与分组运算、数据挖掘工具、挖掘建模、模型评估、社会媒体挖掘、图挖掘分类、基于深度学习的验证码识别、基于深度学习的文本分类挖掘实现。
本书采用理论与实践相结合的方式,利用Python语言的强大功能,以最小的编程代价进行数据的提取、处理、分析和挖掘,既适合Python数据分析与数据挖掘初学者、大数据从业人员阅读,也适合高等院校和培训机构大数据与人工智能相关专业的师生教学参考。
目录
第1章 大数据采集
1.1 大数据分类
1.2 大数据采集方法
1.3 Python爬虫
1.3.1 审查元素
1.3.2 认识网页结构
1.3.3 认识robots.txt的文档
1.3.4 爬虫的基本原理
1.3.5 Python爬虫架构
1.3.6 用GET方式抓取数据
1.3.7 用POST方式抓取数据
1.3.8 用Beautiful Soup解析网页
1.3.9 Python爬虫案例
1.4 本章小结
第2章 数据预处理
2.1 数据清洗
2.1.1 缺失值处理
2.1.2 异常值处理
2.2 数据集成
2.3 数据转换
2.4 数据规约
2.5 Python主要数据预处理函数
2.6 本章小结
第3章 探索性数据分析
3.1 异常值分析
3.2 缺失值分析
3.3 分布分析
3.4 相关性分析
3.5 对比分析
3.6 统计量分析
3.7 周期性分析
3.8 贡献度分析
3.9 Python主要数据探索函数
3.10 本章小结
第4章 Sklearn估计器
4.1 Sklearn概述
4.2 使用Sklearn估计器分类
4.2.1 k近邻算法
4.2.2 管道机制
4.2.3 Sklearn比较分类器
4.3 本章小结
第5章 主流数据分析库
5.1 NumPy
5.2 Pandas
5.2.1 Pandas系列
5.2.2 Pandas数据帧
5.2.3 Pandas面板
5.3 SciPy
5.4 Matplotlib
5.5 本章小结
第6章 大数据:数据库类型
6.1 关系型数据库
6.2 关系型数据库与非关系型数据库的关系
6.3 SQLite
6.3.1 SQLite安装与配置
6.3.2 SQLite命令
6.3.3 SQLite语法
6.3.4 SQLite-Python
6.4 MySQL
6.4.1 MySQL安装
6.4.2 MySQL管理
6.4.3 MySQL PHP语法
6.4.4 PHP脚本连接MySQL
6.4.5 Python操作MySQL数据库
6.5 NoSQL数据库
6.5.1 NoSQL概述
6.5.2 列存储数据库
6.5.3 文档存储数据库
6.5.4 键值存储数据库
6.5.5 图存储数据库
6.5.6 对象存储数据库
6.5.7 XML数据库
6.6 本章小结
第7章 数据仓库/商业智能
7.1 数据仓库和商业智能简介
7.2 数据仓库架构
7.3 OLAP
7.4 数据集市
7.5 商业智能
7.6 本章小结
第8章 数据聚合与分组运算
8.1 GroupBy技术
8.1.1 通过函数进行分组
8.1.2 对分组进行迭代
8.1.3 选取一个或一组列
8.1.4 通过字典或Series进行分组
8.1.5 通过函数进行分组
8.1.6 根据索引级别分组
8.2 数据聚合
8.2.1 面向列的多函数应用
8.2.2 以无索引的方式返回聚合数据
8.2.3 分组级运算和转换
8.3 透视表和交叉表
8.4 本章小结
第9章 数据挖掘工具
9.1 数据挖掘工具分类
9.2 数据挖掘经典算法
9.3 免费数据挖掘工具
9.4 Git和GitHub项目数据挖掘工具
9.5 Python数据挖掘工具
9.5.1 Gensim
9.5.2 TensorFlow
9.5.3 Keras
9.6 本章小结
第10章 挖掘建模
10.1 数据挖掘建模的一般过程
10.2 分类与预测
10.3 聚类分析
10.4 关联分析
10.5 时序模式
10.6 离群点检测
10.7 本章小结
第11章 模型评估
11.1 验证
11.2 交叉验证
11.3 自助法
11.4 回归评估指标
11.5 分类评估指标
11.6 ROC曲线
11.7 本章小结
第12章 社会媒体挖掘
12.1 社会媒体与社会媒体数据
12.2 中国社会媒体核心用户数据分析
12.3 社会媒体挖掘技术与研究热点
12.4 社会媒体挖掘流程
12.5 Twitter情感分析
12.6 本章小结
第13章 图挖掘分类
13.1 图挖掘概述
13.2 图挖掘技术基础
13.3 网络度量
13.4 网络模型
13.5 图挖掘与知识推理
13.6 图挖掘算法简介
13.7 社区检测
13.7.1 模块度
13.7.2 社区发现算法
13.8 频繁子图挖掘算法gSpan的实现
13.9 基于networkx进行社交网络分析
13.10 本章小结
第14章 基于深度学习的验证码识别
14.1 获取图片验证码
14.2 验证码图片预处理
14.3 依赖TensorFlow的深度学习验证码识别
14.4 本章小结
第15章 基于深度学习的文本分类挖掘实现
15.1 文本分类概念
15.2 文本分类挖掘算法概述
15.3 基于传统机器学习的文本分类
15.4 基于深度学习的文本分类
15.4.1 FastText文本分类模型算法实现
15.4.2 TextCNN文本分类模型算法实现
15.4.3 Bert深度双向Transformer构建语言理解预训练模型
15.4.4 TextRNN文本分类
15.4.5 RCNN文本分类
15.4.6 Hierarchical Attention Network文本分类
15.4.7 seq2seq with attention文本分类
15.4.8 Transformer文本分类
15.4.9 Dynamic Memory Network文本分类
15.4.10 Recurrent Entity Network文本分类
15.4.11 Boosting文本分类
15.4.12
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/1/19 11:16:06