Python数据科学实战/人工智能与大数据系列(美)内森·乔治电子工业出版社豆瓣PDF电子书bt网盘迅雷下载-霍普软件下载网

第1部分简介和基础知识
第1章数据科学简介\t2
数据科学的起源\t2
顶级数据科学工具和技能\t5
GUI和平台\t9
云端工具\t10
统计方法和数学\t12
数据的收集、组织和准备\t12
软件开发\t13
业务理解与沟通\t13
数据科学及相关专业\t13
选择如何专业化\t16
数据科学项目方法论\t18
进一步阅读数据科学项目管理策略\t20
本章测试\t21
本章小结\t21
第2章 Python入门\t23
使用Anaconda安装并使用Python\t23
运行Python代码\t25
为什么使用命令行\t31
安装并使用代码文本编辑器—VS Code\t33
安装Python包和创建虚拟环境\t35
Python基础\t38
列表、元组、集合和字典\t45
循环和遍历\t49
布尔值和条件\t51
包和模块\t53
函数\t55
类\t57
多线程和多进程\t58
软件工程最佳实践\t59
开发技巧\t62
本章测试\t64
本章小结\t64
第2部分处理数据
第3章 Python中的SQL和内置文件处理模块\t67
本章主要内容\t67
使用基础Python加载、读取和写入文件\t67
在Python中使用SQLAlchemy包\t85
本章测试\t87
本章小结\t88
第4章使用Pandas和NumPy加载和整理数据\t89
对iTunes数据进行整理和分析\t89
使用Pandas进行探索性数据分析（EDA）和基本数据清理\t94
清洗数据\t104
使用GroupBy\t115
将DataFrame写入磁盘\t116
分析比特币价格数据\t117
了解NumPy基础知识\t119
本章测试\t122
本章小结\t122
第5章探索性数据分析和可视化\t123
Python中的EDA和可视化库\t123
使用Seaborn和pandas执行EDA\t124
使用Python EDA包\t140
使用可视化最佳实践\t148
为共享及报告保存绘图\t157
使用Plotly进行绘图\t158
本章测试\t161
本章小结\t161
第6章数据处理文档和电子表格\t163
解析和处理Word和PDF文档\t163
使用Excel文件读取和写入数据\t176
分析数据\t181
使用openpyxl处理Excel文件\t182
本章测试\t184
本章小结\t184
第7章网页抓取\t186
了解互联网的结构\t187
执行简单的网页抓取\t189
从抓取的页面中解析HTML\t196
使用XPath、lxml和bs4从网页中提取数据\t199
从多个页面收集数据\t203
使用API收集数据\t205
使用API包装器\t207
网络抓取的道德规范及合法性\t212
本章测试\t213
本章小结\t214
第3部分数据科学中的统计学
第8章概率、分布和抽样\t216
概率基础\t216
分布\t223
从数据中采样\t234
本章测试\t237
本章小结\t238
第9章数据科学的统计检验\t239
统计检验基础和样本比较检验\t239
其他统计检验\t248
本章测验\t251
本章小结\t251
第4部分机器学习
第10章为机器学习准备数据：特征选择、特征工程和降维\t253
机器学习的类型\t253
特征选择\t255
单变量统计特征选择\t260
特征工程\t270
数据的清洗和准备\t271
转换数值数据\t277
提取日期时间特征\t281
分箱（Binning）\t282
热独编码和标签编码\t283
降维\t287
本章测试\t291
本章小结\t292
第11章机器学习分类\t293
机器学习分类算法\t293
逻辑回归的工作原理\t297
使用sklearn检查特征的重要性\t299
使用统计模型进行逻辑回归\t301
最大似然估计、优化器和逻辑回归算法\t304
正则化\t307
超参数和交叉验证\t308
大数据的逻辑回归（和其他模型）\t310
用于二元分类的朴素贝叶斯\t311
k-最近邻（KNN）\t313
多类分类\t315
选择正确的模型\t319
“没有免费的午餐”定理\t319
模型的计算复杂度\t320
本章测试\t321
本章小结\t321
第12章评估机器学习分类模型和分类抽样\t322
使用指标评估分类算法的性能\t322
采样和平衡分类数据\t339
本章测试\t344
本章小结\t344
第13章带有回归的机器学习\t345
线性回归\t345
评估回归模型\t354
线性回归假设\t358
大数据回归模型\t362
预测\t363
本章测试\t366
本章小结\t366
第14章优化模型和使用AutoML\t368
使用搜索方法进行超参数优化\t368
使用ML模型优化特征数量\t377
使用PyCaret进行AutoML\t378
本章测试\t384
本章小结\t384
第15章基于树的机器学习模型\t385
决策树\t385
随机森林\t390
基于树的方法的特征重要性\t395
增强树模型：AdaBoost、XGboost、LightGBM和CatBoost\t397
在GPU上训练增强模型\t404
LightGBM\t405
CatBoost\t408
使用提前停止的算法\t410
本章测试\t411
本章小结\t411
第16章支持向量机（SVM）机器学习模型\t413
SVM是如何工作的\t414
使用SVM\t416
本章测试\t421
本章小结\t421
第5部分文本分析和报告
第17章使用机器学习进行聚类\t423
使用k-means聚类\t423
聚类指标\t424
优化k-means中的K\t425
检查聚类\t429
层次聚类\t433
DBSCAN\t436
其他无监督方法\t438
本章测试\t439
本章小结\t439
第18章处理文本\t441
文本预处理\t441
基本的文本分析\t453
无监督学习\t463
监督学习\t467
本章测试\t474
本章小结\t474
第6部分总结
第19章讲述数据故事和自动报告及仪表板\t477
用数据讲故事\t477
自动报告和仪表板\t484
本章测试\t491
本章小结\t491
第20章道德与隐私\t492
机器学习算法的道德\t492
偏见\t492
数据隐私\t495
将数据科学用于公

书名	Python数据科学实战/人工智能与大数据系列
分类
作者	(美)内森·乔治
出版社	电子工业出版社
下载
简介	内容推荐数据科学如今已经深入到我们生活中的各个领域，行业从业者都应该懂得一些数据科学的知识。那么如何能够快速掌握这门流行的技术呢？通过系统地学习本书和动手实践，可以满足这个需求。本书共六个部分，用通俗的语言和生动的例子为读者展现数据科学的魅力。第一部分介绍了数据科学的基本知识，让读者可以轻松了解它的流程与原理。第二部分，通过几个例子为读者介绍如何处理各种数据，从电子表格到网络抓取，涵盖了工作中的常用数据处理方法。第三部分，使用通俗易懂的语言为读者介绍数据科学中使用到的统计学知识。第四部分，通过示例介绍机器学习技术，让读者可以根据以往的数据对未来进行预测。在本书的后两部分，为读者介绍如何对文本进行分析及制作生动的报告，并讨论了数据科学的未来发展趋势。目录第1部分简介和基础知识第1章数据科学简介\t2 数据科学的起源\t2 顶级数据科学工具和技能\t5 GUI和平台\t9 云端工具\t10 统计方法和数学\t12 数据的收集、组织和准备\t12 软件开发\t13 业务理解与沟通\t13 数据科学及相关专业\t13 选择如何专业化\t16 数据科学项目方法论\t18 进一步阅读数据科学项目管理策略\t20 本章测试\t21 本章小结\t21 第2章 Python入门\t23 使用Anaconda安装并使用Python\t23 运行Python代码\t25 为什么使用命令行\t31 安装并使用代码文本编辑器—VS Code\t33 安装Python包和创建虚拟环境\t35 Python基础\t38 列表、元组、集合和字典\t45 循环和遍历\t49 布尔值和条件\t51 包和模块\t53 函数\t55 类\t57 多线程和多进程\t58 软件工程最佳实践\t59 开发技巧\t62 本章测试\t64 本章小结\t64 第2部分处理数据第3章 Python中的SQL和内置文件处理模块\t67 本章主要内容\t67 使用基础Python加载、读取和写入文件\t67 在Python中使用SQLAlchemy包\t85 本章测试\t87 本章小结\t88 第4章使用Pandas和NumPy加载和整理数据\t89 对iTunes数据进行整理和分析\t89 使用Pandas进行探索性数据分析（EDA）和基本数据清理\t94 清洗数据\t104 使用GroupBy\t115 将DataFrame写入磁盘\t116 分析比特币价格数据\t117 了解NumPy基础知识\t119 本章测试\t122 本章小结\t122 第5章探索性数据分析和可视化\t123 Python中的EDA和可视化库\t123 使用Seaborn和pandas执行EDA\t124 使用Python EDA包\t140 使用可视化最佳实践\t148 为共享及报告保存绘图\t157 使用Plotly进行绘图\t158 本章测试\t161 本章小结\t161 第6章数据处理文档和电子表格\t163 解析和处理Word和PDF文档\t163 使用Excel文件读取和写入数据\t176 分析数据\t181 使用openpyxl处理Excel文件\t182 本章测试\t184 本章小结\t184 第7章网页抓取\t186 了解互联网的结构\t187 执行简单的网页抓取\t189 从抓取的页面中解析HTML\t196 使用XPath、lxml和bs4从网页中提取数据\t199 从多个页面收集数据\t203 使用API收集数据\t205 使用API包装器\t207 网络抓取的道德规范及合法性\t212 本章测试\t213 本章小结\t214 第3部分数据科学中的统计学第8章概率、分布和抽样\t216 概率基础\t216 分布\t223 从数据中采样\t234 本章测试\t237 本章小结\t238 第9章数据科学的统计检验\t239 统计检验基础和样本比较检验\t239 其他统计检验\t248 本章测验\t251 本章小结\t251 第4部分机器学习第10章为机器学习准备数据：特征选择、特征工程和降维\t253 机器学习的类型\t253 特征选择\t255 单变量统计特征选择\t260 特征工程\t270 数据的清洗和准备\t271 转换数值数据\t277 提取日期时间特征\t281 分箱（Binning）\t282 热独编码和标签编码\t283 降维\t287 本章测试\t291 本章小结\t292 第11章机器学习分类\t293 机器学习分类算法\t293 逻辑回归的工作原理\t297 使用sklearn检查特征的重要性\t299 使用统计模型进行逻辑回归\t301 最大似然估计、优化器和逻辑回归算法\t304 正则化\t307 超参数和交叉验证\t308 大数据的逻辑回归（和其他模型）\t310 用于二元分类的朴素贝叶斯\t311 k-最近邻（KNN）\t313 多类分类\t315 选择正确的模型\t319 “没有免费的午餐”定理\t319 模型的计算复杂度\t320 本章测试\t321 本章小结\t321 第12章评估机器学习分类模型和分类抽样\t322 使用指标评估分类算法的性能\t322 采样和平衡分类数据\t339 本章测试\t344 本章小结\t344 第13章带有回归的机器学习\t345 线性回归\t345 评估回归模型\t354 线性回归假设\t358 大数据回归模型\t362 预测\t363 本章测试\t366 本章小结\t366 第14章优化模型和使用AutoML\t368 使用搜索方法进行超参数优化\t368 使用ML模型优化特征数量\t377 使用PyCaret进行AutoML\t378 本章测试\t384 本章小结\t384 第15章基于树的机器学习模型\t385 决策树\t385 随机森林\t390 基于树的方法的特征重要性\t395 增强树模型：AdaBoost、XGboost、LightGBM和CatBoost\t397 在GPU上训练增强模型\t404 LightGBM\t405 CatBoost\t408 使用提前停止的算法\t410 本章测试\t411 本章小结\t411 第16章支持向量机（SVM）机器学习模型\t413 SVM是如何工作的\t414 使用SVM\t416 本章测试\t421 本章小结\t421 第5部分文本分析和报告第17章使用机器学习进行聚类\t423 使用k-means聚类\t423 聚类指标\t424 优化k-means中的K\t425 检查聚类\t429 层次聚类\t433 DBSCAN\t436 其他无监督方法\t438 本章测试\t439 本章小结\t439 第18章处理文本\t441 文本预处理\t441 基本的文本分析\t453 无监督学习\t463 监督学习\t467 本章测试\t474 本章小结\t474 第6部分总结第19章讲述数据故事和自动报告及仪表板\t477 用数据讲故事\t477 自动报告和仪表板\t484 本章测试\t491 本章小结\t491 第20章道德与隐私\t492 机器学习算法的道德\t492 偏见\t492 数据隐私\t495 将数据科学用于公
随便看	评《第二春》不能握的手李老爷莹玉生平大事录（0 – 22 岁）浅草妖姬评《网恋这盘菜》盗魂夺魄我在落叶纷飞的季节静静等你为小央子不平篇评《[火影]我的鼬弟弟（不远之彼）》 [火影]红莲冰朔孩子王的古代之旅我找你找了好久不爱儿童不宜小宇宙淍叶网游之沧澜online 评《[EVA]人之初，性本恶》第一百零八页寂寞却与谁人道？做你的主 HP-游戏？游戏！柠檬红茶为小央子不平篇评《正太别烦我！》 KSA-Kanxue Security Access v2.64 ultimate vocal remover5 v2.56 Ultimate Vocal Remover GUI v5.4.0 Soft4Boost Any Audio Grabber vAny 拼多多评论采集 V2.49 KSA-Kanxue Security Access v2.64 ultimate vocal remover5 v2.56 Ultimate Vocal Remover GUI v5.4.0 Soft4Boost Any Audio Grabber vAny 拼多多评论采集 V2.49 武林群侠传入谷前完美存档 v3.0 围攻死飞自行车存档 v1.0 围攻高空轰炸机存档 v1.0 上古卷轴5美女存档 v5.0 围攻超实用越野车底盘存档 v1.0 侠客风云传存档修正工具 v2.0 像素骑士团小秘书辅助工具 v3.0 御天降魔传MOD开发工具 v1.0 巫师3百果园全清纯净存档 v1.0 蝙蝠侠阿甘骑士周目全收集存档 v1.0 tabular tabulate tachograph tachometer tacit taciturn tack tackle tacky taco [BT下载][云中居三子][第06集][WEB-MP4/0.18G][国语配音/中文字幕][1080P][流媒体][ZeroTV] 剧集 2024 大陆动画连载 [BT下载][你也有今天][第28集][WEB-MKV/2.22G][国语配音/中文字幕][1080P][流媒体][ZeroTV] 剧集 2024 大陆剧情连载 [BT下载][千年情劫][第21集][WEB-MP4/0.13G][国语配音/中文字幕][1080P][H265][流媒体][ZeroTV] 剧集 2024 大陆爱情连载 [BT下载][千年情劫][第21集][WEB-MKV/0.30G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] 剧集 2024 大陆爱情连载 [BT下载][南来北往][第01-04集][WEB-MKV/11.99G][国语配音/中文字幕][4K-2160P][60帧率][HDR版本][H265][流媒剧集 2024 大陆剧情连载 [BT下载][喜卷常乐城][第12集][WEB-MP4/0.17G][国语配音/中文字幕][1080P][H265][流媒体][ZeroTV] 剧集 2024 大陆剧情连载 [BT下载][喜卷常乐城][第12集][WEB-MKV/0.51G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] 剧集 2024 大陆剧情连载 [BT下载][在暴雪时分][第09-10集][WEB-MKV/2.61G][国语配音/中文字幕][4K-2160P][H265][流媒体][BlackTV] 剧集 2024 大陆剧情连载 [BT下载][大唐狄公案][第01-04集][WEB-MP4/5.46G][国语配音/中文字幕][4K-2160P][H265][流媒体][ZeroTV] 剧集 2024 大陆悬疑连载 [BT下载][大唐狄公案][第01-04集][WEB-MKV/1.36G][国语配音/中文字幕][1080P][流媒体][BlackTV] 剧集 2024 大陆悬疑连载更强的SSD！傲腾增强型SSD看下：顺序读取达2400MB/s 解决安卓手机三大痛点小米10即将登场：90Hz/全新散热设计科创板迎来第一家小米生态链企业石头科技上市用户失望：微软推迟Windows 10 20H1可选更新选项！ MathType打出带圆圈的点的操作方法 MathType恢复出厂设置的详细教程万兴优转将IOS刻录进DVD的详细教程万兴优转压缩视频的操作流程小新Pro 13今日开售：标压R5+8+512仅售4299 iOS 13.4首个公测版放出：一大波更新降临