网站首页  软件下载  游戏下载  翻译软件  电子书下载  电影下载  电视剧下载  教程攻略

请输入您要查询的图书:

 

书名 Python数据科学实战/人工智能与大数据系列
分类
作者 (美)内森·乔治
出版社 电子工业出版社
下载
简介
内容推荐
数据科学如今已经深入到我们生活中的各个领域,行业从业者都应该懂得一些数据科学的知识。那么如何能够快速掌握这门流行的技术呢?通过系统地学习本书和动手实践,可以满足这个需求。本书共六个部分,用通俗的语言和生动的例子为读者展现数据科学的魅力。第一部分介绍了数据科学的基本知识,让读者可以轻松了解它的流程与原理。第二部分,通过几个例子为读者介绍如何处理各种数据,从电子表格到网络抓取,涵盖了工作中的常用数据处理方法。第三部分,使用通俗易懂的语言为读者介绍数据科学中使用到的统计学知识。第四部分,通过示例介绍机器学习技术,让读者可以根据以往的数据对未来进行预测。在本书的后两部分,为读者介绍如何对文本进行分析及制作生动的报告,并讨论了数据科学的未来发展趋势。
目录
第1部分 简介和基础知识
第1章 数据科学简介\t2
数据科学的起源\t2
顶级数据科学工具和技能\t5
GUI和平台\t9
云端工具\t10
统计方法和数学\t12
数据的收集、组织和准备\t12
软件开发\t13
业务理解与沟通\t13
数据科学及相关专业\t13
选择如何专业化\t16
数据科学项目方法论\t18
进一步阅读数据科学项目管理策略\t20
本章测试\t21
本章小结\t21
第2章 Python入门\t23
使用Anaconda安装并使用Python\t23
运行Python代码\t25
为什么使用命令行\t31
安装并使用代码文本编辑器—VS Code\t33
安装Python包和创建虚拟环境\t35
Python基础\t38
列表、元组、集合和字典\t45
循环和遍历\t49
布尔值和条件\t51
包和模块\t53
函数\t55
类\t57
多线程和多进程\t58
软件工程最佳实践\t59
开发技巧\t62
本章测试\t64
本章小结\t64
第2部分 处理数据
第3章 Python中的SQL和内置文件处理模块\t67
本章主要内容\t67
使用基础Python加载、读取和写入文件\t67
在Python中使用SQLAlchemy包\t85
本章测试\t87
本章小结\t88
第4章 使用Pandas和NumPy加载和整理数据\t89
对iTunes数据进行整理和分析\t89
使用Pandas进行探索性数据分析(EDA)和基本数据清理\t94
清洗数据\t104
使用GroupBy\t115
将DataFrame写入磁盘\t116
分析比特币价格数据\t117
了解NumPy基础知识\t119
本章测试\t122
本章小结\t122
第5章 探索性数据分析和可视化\t123
Python中的EDA和可视化库\t123
使用Seaborn和pandas执行EDA\t124
使用Python EDA包\t140
使用可视化最佳实践\t148
为共享及报告保存绘图\t157
使用Plotly进行绘图\t158
本章测试\t161
本章小结\t161
第6章 数据处理文档和电子表格\t163
解析和处理Word和PDF文档\t163
使用Excel文件读取和写入数据\t176
分析数据\t181
使用openpyxl处理Excel文件\t182
本章测试\t184
本章小结\t184
第7章 网页抓取\t186
了解互联网的结构\t187
执行简单的网页抓取\t189
从抓取的页面中解析HTML\t196
使用XPath、lxml和bs4从网页中提取数据\t199
从多个页面收集数据\t203
使用API收集数据\t205
使用API包装器\t207
网络抓取的道德规范及合法性\t212
本章测试\t213
本章小结\t214
第3部分 数据科学中的统计学
第8章 概率、分布和抽样\t216
概率基础\t216
分布\t223
从数据中采样\t234
本章测试\t237
本章小结\t238
第9章 数据科学的统计检验\t239
统计检验基础和样本比较检验\t239
其他统计检验\t248
本章测验\t251
本章小结\t251
第4部分 机器学习
第10章 为机器学习准备数据:特征选择、特征工程和降维\t253
机器学习的类型\t253
特征选择\t255
单变量统计特征选择\t260
特征工程\t270
数据的清洗和准备\t271
转换数值数据\t277
提取日期时间特征\t281
分箱(Binning)\t282
热独编码和标签编码\t283
降维\t287
本章测试\t291
本章小结\t292
第11章 机器学习分类\t293
机器学习分类算法\t293
逻辑回归的工作原理\t297
使用sklearn检查特征的重要性\t299
使用统计模型进行逻辑回归\t301
最大似然估计、优化器和逻辑回归算法\t304
正则化\t307
超参数和交叉验证\t308
大数据的逻辑回归(和其他模型)\t310
用于二元分类的朴素贝叶斯\t311
k-最近邻(KNN)\t313
多类分类\t315
选择正确的模型\t319
“没有免费的午餐”定理\t319
模型的计算复杂度\t320
本章测试\t321
本章小结\t321
第12章 评估机器学习分类模型和分类抽样\t322
使用指标评估分类算法的性能\t322
采样和平衡分类数据\t339
本章测试\t344
本章小结\t344
第13章 带有回归的机器学习\t345
线性回归\t345
评估回归模型\t354
线性回归假设\t358
大数据回归模型\t362
预测\t363
本章测试\t366
本章小结\t366
第14章 优化模型和使用AutoML\t368
使用搜索方法进行超参数优化\t368
使用ML模型优化特征数量\t377
使用PyCaret进行AutoML\t378
本章测试\t384
本章小结\t384
第15章 基于树的机器学习模型\t385
决策树\t385
随机森林\t390
基于树的方法的特征重要性\t395
增强树模型:AdaBoost、XGboost、LightGBM和CatBoost\t397
在GPU上训练增强模型\t404
LightGBM\t405
CatBoost\t408
使用提前停止的算法\t410
本章测试\t411
本章小结\t411
第16章 支持向量机(SVM)机器学习模型\t413
SVM是如何工作的\t414
使用SVM\t416
本章测试\t421
本章小结\t421
第5部分 文本分析和报告
第17章 使用机器学习进行聚类\t423
使用k-means聚类\t423
聚类指标\t424
优化k-means中的K\t425
检查聚类\t429
层次聚类\t433
DBSCAN\t436
其他无监督方法\t438
本章测试\t439
本章小结\t439
第18章 处理文本\t441
文本预处理\t441
基本的文本分析\t453
无监督学习\t463
监督学习\t467
本章测试\t474
本章小结\t474
第6部分 总结
第19章 讲述数据故事和自动报告及仪表板\t477
用数据讲故事\t477
自动报告和仪表板\t484
本章测试\t491
本章小结\t491
第20章 道德与隐私\t492
机器学习算法的道德\t492
偏见\t492
数据隐私\t495
将数据科学用于公
随便看

 

霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 101bt.net All Rights Reserved
更新时间:2025/3/1 20:09:09