![]()
内容推荐 本书基于Python语言环境,从零开始讲解数据科学工作,讲述数据科学工作所需的技能与诀窍,并带领读者熟悉数据科学的核心知识:数学与统计学。作者借助大量具有现实意义的实例详细展示了什么是数据科学,介绍了从事数据科学工作需要用到的库,如NumPy、scikit-learn、pandas等,还在每章末尾推荐了很多学习资源,帮助你进一步巩固本书所学。新版基于Python 3.6,重写了所有示例和代码,并根据数据科学近几年的发展,新增了关于深度学习、统计学和自然语言处理等主题,让图书内容与时俱进。 本书适合有志于成为数据科学工作者以及想了解数据科学的读者阅读。 作者简介 高蓉,讲师,任教于杭州电子科技大学经济学院金融系。博士和硕士毕业于南开大学经济学院金融系,本科毕业于南开大学数学学院计算数学专业。研究领域包括资产定价、金融工程、计量经济应用、数据科学应用。 目录 第2版前言 第1版前言 第1章 导论 1.1 数据的崛起 1.2 什么是数据科学 1.3 激励假设:DataSciencester 1.3.1 寻找关键联系人 1.3.2 你可能知道的数据科学家 1.3.3 工资和工作年限 1.3.4 付费账户 1.3.5 感兴趣的主题 1.3.6 展望 第2章 Python速成 2.1 Python之禅 2.2 获取Python 2.3 虚拟环境 2.4 空白格式 2.5 模块 2.6 函数 2.7 字符串 2.8 异常 2.9 列表 2.10 元组 2.11 字典 2.12 计数器 2.13 集 2.14 控制流 2.15 真和假 2.16 排序 2.17 列表解析 2.18 自动化测试和断言 2.19 面向对象编程 2.20 迭代器和生成器 2.21 随机性 2.22 正则表达式 2.23 函数式编程 2.24 压缩和参数拆分 2.25 args和kwargs 2.26 类型注释 2.27 欢迎来到DataSciencester 2.28 进一步探索 第3章 数据可视化 3.1 matplotlib 3.2 条形图 3.3 线图 3.4 散点图 3.5 延伸学习 第4章 线性代数 4.1 向量 4.2 矩阵 4.3 延伸学习 第5章 统计学 5.1 描述单个数据集 5.1.1 中心倾向 5.1.2 离散度 5.2 相关 5.3 辛普森悖论 5.4 相关系数的其他注意事项 5.5 相关与因果 5.6 延伸学习 第6章 概率 第7章 假设和推论 第8章 梯度下降 第9章 获取数据 第10章 数据工作 第11章 机器学习 第12章 k最近邻法 第13章 朴素贝叶斯算法 第14章 简单线性回归 第15章 多元回归 第16章 逻辑回归 第17章 决策树 第18章 神经网络 第19章 深度学习 第20章 聚类分析 第21章 自然语言处理 第22章 网络分析 第23章 推荐系统 第24章 数据库与SQL 第25章 MapReduce 第26章 数据伦理 第27章 数据科学前瞻 关于作者 关于封面 |