网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | Python数据科学实战/人工智能与大数据系列 |
分类 | |
作者 | (美)内森·乔治 |
出版社 | 电子工业出版社 |
下载 | ![]() |
简介 | 内容推荐 数据科学如今已经深入到我们生活中的各个领域,行业从业者都应该懂得一些数据科学的知识。那么如何能够快速掌握这门流行的技术呢?通过系统地学习本书和动手实践,可以满足这个需求。本书共六个部分,用通俗的语言和生动的例子为读者展现数据科学的魅力。第一部分介绍了数据科学的基本知识,让读者可以轻松了解它的流程与原理。第二部分,通过几个例子为读者介绍如何处理各种数据,从电子表格到网络抓取,涵盖了工作中的常用数据处理方法。第三部分,使用通俗易懂的语言为读者介绍数据科学中使用到的统计学知识。第四部分,通过示例介绍机器学习技术,让读者可以根据以往的数据对未来进行预测。在本书的后两部分,为读者介绍如何对文本进行分析及制作生动的报告,并讨论了数据科学的未来发展趋势。 目录 第1部分 简介和基础知识 第1章 数据科学简介\t2 数据科学的起源\t2 顶级数据科学工具和技能\t5 GUI和平台\t9 云端工具\t10 统计方法和数学\t12 数据的收集、组织和准备\t12 软件开发\t13 业务理解与沟通\t13 数据科学及相关专业\t13 选择如何专业化\t16 数据科学项目方法论\t18 进一步阅读数据科学项目管理策略\t20 本章测试\t21 本章小结\t21 第2章 Python入门\t23 使用Anaconda安装并使用Python\t23 运行Python代码\t25 为什么使用命令行\t31 安装并使用代码文本编辑器—VS Code\t33 安装Python包和创建虚拟环境\t35 Python基础\t38 列表、元组、集合和字典\t45 循环和遍历\t49 布尔值和条件\t51 包和模块\t53 函数\t55 类\t57 多线程和多进程\t58 软件工程最佳实践\t59 开发技巧\t62 本章测试\t64 本章小结\t64 第2部分 处理数据 第3章 Python中的SQL和内置文件处理模块\t67 本章主要内容\t67 使用基础Python加载、读取和写入文件\t67 在Python中使用SQLAlchemy包\t85 本章测试\t87 本章小结\t88 第4章 使用Pandas和NumPy加载和整理数据\t89 对iTunes数据进行整理和分析\t89 使用Pandas进行探索性数据分析(EDA)和基本数据清理\t94 清洗数据\t104 使用GroupBy\t115 将DataFrame写入磁盘\t116 分析比特币价格数据\t117 了解NumPy基础知识\t119 本章测试\t122 本章小结\t122 第5章 探索性数据分析和可视化\t123 Python中的EDA和可视化库\t123 使用Seaborn和pandas执行EDA\t124 使用Python EDA包\t140 使用可视化最佳实践\t148 为共享及报告保存绘图\t157 使用Plotly进行绘图\t158 本章测试\t161 本章小结\t161 第6章 数据处理文档和电子表格\t163 解析和处理Word和PDF文档\t163 使用Excel文件读取和写入数据\t176 分析数据\t181 使用openpyxl处理Excel文件\t182 本章测试\t184 本章小结\t184 第7章 网页抓取\t186 了解互联网的结构\t187 执行简单的网页抓取\t189 从抓取的页面中解析HTML\t196 使用XPath、lxml和bs4从网页中提取数据\t199 从多个页面收集数据\t203 使用API收集数据\t205 使用API包装器\t207 网络抓取的道德规范及合法性\t212 本章测试\t213 本章小结\t214 第3部分 数据科学中的统计学 第8章 概率、分布和抽样\t216 概率基础\t216 分布\t223 从数据中采样\t234 本章测试\t237 本章小结\t238 第9章 数据科学的统计检验\t239 统计检验基础和样本比较检验\t239 其他统计检验\t248 本章测验\t251 本章小结\t251 第4部分 机器学习 第10章 为机器学习准备数据:特征选择、特征工程和降维\t253 机器学习的类型\t253 特征选择\t255 单变量统计特征选择\t260 特征工程\t270 数据的清洗和准备\t271 转换数值数据\t277 提取日期时间特征\t281 分箱(Binning)\t282 热独编码和标签编码\t283 降维\t287 本章测试\t291 本章小结\t292 第11章 机器学习分类\t293 机器学习分类算法\t293 逻辑回归的工作原理\t297 使用sklearn检查特征的重要性\t299 使用统计模型进行逻辑回归\t301 最大似然估计、优化器和逻辑回归算法\t304 正则化\t307 超参数和交叉验证\t308 大数据的逻辑回归(和其他模型)\t310 用于二元分类的朴素贝叶斯\t311 k-最近邻(KNN)\t313 多类分类\t315 选择正确的模型\t319 “没有免费的午餐”定理\t319 模型的计算复杂度\t320 本章测试\t321 本章小结\t321 第12章 评估机器学习分类模型和分类抽样\t322 使用指标评估分类算法的性能\t322 采样和平衡分类数据\t339 本章测试\t344 本章小结\t344 第13章 带有回归的机器学习\t345 线性回归\t345 评估回归模型\t354 线性回归假设\t358 大数据回归模型\t362 预测\t363 本章测试\t366 本章小结\t366 第14章 优化模型和使用AutoML\t368 使用搜索方法进行超参数优化\t368 使用ML模型优化特征数量\t377 使用PyCaret进行AutoML\t378 本章测试\t384 本章小结\t384 第15章 基于树的机器学习模型\t385 决策树\t385 随机森林\t390 基于树的方法的特征重要性\t395 增强树模型:AdaBoost、XGboost、LightGBM和CatBoost\t397 在GPU上训练增强模型\t404 LightGBM\t405 CatBoost\t408 使用提前停止的算法\t410 本章测试\t411 本章小结\t411 第16章 支持向量机(SVM)机器学习模型\t413 SVM是如何工作的\t414 使用SVM\t416 本章测试\t421 本章小结\t421 第5部分 文本分析和报告 第17章 使用机器学习进行聚类\t423 使用k-means聚类\t423 聚类指标\t424 优化k-means中的K\t425 检查聚类\t429 层次聚类\t433 DBSCAN\t436 其他无监督方法\t438 本章测试\t439 本章小结\t439 第18章 处理文本\t441 文本预处理\t441 基本的文本分析\t453 无监督学习\t463 监督学习\t467 本章测试\t474 本章小结\t474 第6部分 总结 第19章 讲述数据故事和自动报告及仪表板\t477 用数据讲故事\t477 自动报告和仪表板\t484 本章测试\t491 本章小结\t491 第20章 道德与隐私\t492 机器学习算法的道德\t492 偏见\t492 数据隐私\t495 将数据科学用于公 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。