网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据科学概论(数字教材版)/数据科学与大数据技术丛书 |
分类 | |
作者 | |
出版社 | 中国人民大学出版社 |
下载 | ![]() |
简介 | 内容推荐 作为问题导向、数据驱动的交叉学科,数据科学要求研究者具备扎实的知识储备、高效的编程能力以及广阔的研究视野。本书尝试以概论的形式对数据科学的缘起、内涵、技术、工具、原则、方法、平台、产品、应用等展开讨论,帮助读者建立完整的知识体系与专业逻辑。全书划分为四个部分:第一部分是绪论,鸟瞰数据科学的概念、历史与应用;第二部分是基础技能,涵盖编程工具、数学基础与统计原则;第三部分是分析方法,遵从从探索性到验证性的数据分析思路,阐释数据可视化方法,讲解面向结构化数据的机器学习与人工智能模型,并讨论非结构化数据的分析技术;第四部分是数据应用,从业界视角介绍数据库、大数据平台、可重复研究的理念与实践,并以互联网、零售、金融、医疗健康四个行业为例展开实战讨论。 作者简介 李舰,统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。 目录 第1章 绪论 1.1 数据科学的概念 1.1.1 数据科学的研究对象 1.1.2 常见的数据科学方法 1.2 数据科学的发展变迁 1.2.1 数据科学的前身:统计学 1.2.2 当代统计学:数据科学 1.3 数据科学的应用领域 1.3.1 互联网行业 1.3.2 零售行业 1.3.3 金融行业 1.3.4 医疗健康行业 第2章 数据科学的编程工具 2.1 R简介 2.1.1 安装和设置 2.1.2 基础操作 2.1.3 数据结构 2.1.4 基础语法 2.2 Python和数据科学 2.2.1 安装和使用 2.2.2 数据结构 2.2.3 基础语法 2.3 Julia简介 2.3.1 安装和使用 2.3.2 编程基础 第3章 数据科学的数学基础 3.1 线性代数 3.1.1 向量基础 3.1.2 矩阵运算 3.2 概率论和数理统计 3.2.1 随机变量和分布 3.2.2 数理统计简介 3.3 最优化方法 3.3.1 非线性规划 3.3.2 线性规划 第4章 数据科学的统计原则 4.1 可重复原则 4.1.1 数据的扰动 4.1.2 模型的扰动 4.2 可预测原则 4.2.1 可预测性 4.2.2 交叉验证 4.3 可计算原则 4.3.1 大数据时代的数据特征 4.3.2 大规模数据的处理方法 4.3.3 高维/超高维数据的处理方法 第5章 数据可视化 5.1 基础统计图形 5.1.1 图形设备 5.1.2 基础作图 5.1.3 ggplot绘图语言 5.2 可视化与数据分析 5.2.1 单变量的分布 5.2.2 两变量的关系 5.2.3 多变量的关系 5.3 现代数据可视化方法 5.3.1 动态统计图形 5.3.2 交互式工具 第6章 数据挖掘和机器学习 6.1 从海量数据到大数据 6.1.1 海量数据与数据挖掘 6.1.2 大数据与机器学习 6.2 无监督学习 6.2.1 主成分分析 6.2.2 聚类分析 6.3 有监督学习 6.3.1 回归分析 6.3.2 分类问题和分类性能评估 6.3.3 常用分类模型 第7章 人工智能 7.1 人工智能简史 7.1.1 人工智能的发展历史 7.1.2 从神经网络到深度学习 7.2 神经网络简介 7.2.1 神经网络模型 7.2.2 感知机的学习 7.2.3 BP算法 7.3 深度学习基础 7.3.1 常见深度学习框架 7.3.2 MXNet简介 7.3.3 深度学习实战 第8章 非结构化数据分析 8.1 图像分析 8.1.1 图像处理基础 8.1.2 卷积神经网络 8.1.3 图像分类示例 8.2 文本分析 8.2.1 文本数据的处理 8.2.2 文本分类示例 8.2.3 句法分析 8.3 音频分析 8.3.1 音频数据的处理 8.3.2 音频特征的提取 第9章 数据库和数据仓库 9.1 数据结构简介 9.1.1 数据的测量尺度 9.1.2 数据的基础类型 9.1.3 数据的逻辑结构 9.2 数据库和SQL 9.2.1 数据库基础介绍 9.2.2 常见的数据库产品 9.2.3 SQL语句简介 9.3 数据仓库和商业智能 9.3.1 数据仓库基础介绍 9.3.2 数据仓库的多维模型 9.3.3 BI分析简介 第10章 大数据平台 10.1 大数据和云计算 10.1.1 大数据技术的发展变迁 10.1.2 云计算简介 10.2 并行计算框架 10.2.1 并行计算简介 10.2.2 共享内存和GPU计算 10.2.3 MPI并行 10.3 分布式存储与Hadoop 10.3.1 容器和Docker 10.3.2 Hadoop和MapReduce 10.3.3 Spark简介 第11章 可重复研究与产品化 11.1 分析报告与数据产品简介 11.1.1 自动化报告的常见框架 11.1.2 数据产品简介 11.2 可重复研究 11.2.1 knitr的应用 11.2.2 Jupyter的应用 11.3 数据产品的设计与开发 11.3.1 Shiny基础 11.3.2 动态交互的数据产品 第12章 数据科学的行业应用 12.1 互联网行业 12.1.1 互联网行业的数据 12.1.2 互联网行业的数据科学应用 12.1.3 分析示例 12.2 零售行业 12.2.1 零售行业的数据 12.2.2 零售行业的数据科学应用 12.2.3 分析示例 12.3 金融行业 12.3.1 金融行业的数据 12.3.2 金融行业的数据科学应用 12.3.3 分析示例 12.4 医疗健康行业 12.4.1 医疗健康行业的数据 12.4.2 医疗健康行业的数据科学应用 12.4.3 分析示例 参考文献 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。