内容全面,重点突出。不但涵盖数据科学的主要内容,而且从数据挖掘的视角着重强调了数据分析的基本方法。
理论系统,实践丰富。系统地介绍了数据科学紧密相关的基础理论和方法,并且配以丰富的实例进行讲解。
模块设计,灵活组合。本书分为基础理论、分析方法、高级主题3个模块,内容由浅入深。
深入浅出,可读性强。在讲解数据科学最相关的内容和最基本的概念时,配以实例介绍本质含义,力争概念通俗易懂,便于上手。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 数据科学导论(数据科学与大数据技术面向新工科专业建设计算机系列教材) |
分类 | |
作者 | |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 内容推荐 内容全面,重点突出。不但涵盖数据科学的主要内容,而且从数据挖掘的视角着重强调了数据分析的基本方法。 理论系统,实践丰富。系统地介绍了数据科学紧密相关的基础理论和方法,并且配以丰富的实例进行讲解。 模块设计,灵活组合。本书分为基础理论、分析方法、高级主题3个模块,内容由浅入深。 深入浅出,可读性强。在讲解数据科学最相关的内容和最基本的概念时,配以实例介绍本质含义,力争概念通俗易懂,便于上手。 作者简介 石川,北京邮电大学教授、博士生导师。长期从事计算机专业基础课程教学工作,参与多项教改项目。主要研究方向为数据挖掘和机器掌习,发表高水平学术论文100余篇,中英文专著3部,成果应用于项尖IT企业。研究成果获得省部级奖励3项,本人获得北京市高等学校青年英才和师德先锋等称号。 目录 第1章 数据科学概论 1.1 数据和大数据 1.1.1 数据 1.1.2 数据化进程 1.1.3 大数据 1.2 数据科学理论基础 1.2.1 数据科学发展历程 1.2.2 数据科学的概念 1.2.3 数据科学的主要内容 1.3 数据科学应用实践 1.3.1 数据科学家 1.3.2 数据科学工作流程 1.3.3 数据科学实践案例 1.4 小结 1.4.1 本章总结 1.4.2 扩展阅读材料 1.5 习题 1.6 参考资料 第2章 数学基础 2.1 线性代数 2.1.1 向量 2.1.2 矩阵 2.1.3 矩阵导数 2.1.4 实例:利用SVD进行评分预测 2.2 概率统计 2.2.1 随机事件与概率 2.2.2 条件概率与事件独立性 2.2.3 随机变量及其数字特征 2.2.4 数理统计 2.2.5 信息论 2.2.6 实例:利用朴素贝叶斯算法进行文本分类 2.3 优化理论 2.3.1 基本概念 2.3.2 优化问题的一般形式 2.3.3 优化方法 2.3.4 实例:SVM分类器 2.4 图论基础 2.4.1 图的定义 2.4.2 图的概念 2.4.3 图的矩阵表示 2.4.4 拉普拉斯矩阵与谱 2.4.5 实例:谱聚类算法 2.5 小结 2.5.1 本章总结 2.5.2 扩展阅读材料 2.6 习题 2.7 参考资料 第3章 Python语言初步 3.1 Python语言概述 3.1.1 Python语言简介 3.1.2 Python语言环境搭建 3.2 Python的基本用法 3.2.1 列表与元组 3.2.2 字符串 3.2.3 字典 3.2.4 条件与循环语句 3.2.5 函数 3.2.6 文件 3.2.7 综合实例 3.3 重要库的使用方法与案例 3.3.1 NumPy 3.3.2 Pandas 3.3.3 SciPy 3.3.4 Matplotlib 3.4 小结 3.4.1 本章总结 3.4.2 扩展阅读材料 3.5 习题 3.6 参考资料 第4章 数据预处理 4.1 数据预处理概述 4.1.1 数据预处理的意义与目标 4.1.2 背景知识 4.1.3 数据可视化实例 4.2 数据清洗 4.2.1 缺失值处理 4.2.2 噪声平滑 4.2.3 异常值的检测与处理 4.3 数据集成 4.3.1 实体识别问题 4.3.2 检测和解决数据值冲突 4.3.3 冗余数据与相关分析 4.3.4 元组重复 4.4 数据归约 4.4.1 数据归约策略 4.4.2 维归约 4.4.3 数量归约 4.5 数据变换 4.5.1 数据变换策略 4.5.2 规范化 4.5.3 离散化 4.5.4 标称数据的概念分层生成 4.6 数据预处理实践 4.7 小结 4.7.1 本章总结 4.7.2 扩展阅读材料 4.8 习题 4.9 参考资料 第5章 分析方法初步 5.1 机器学习基础 5.1.1 何为机器学习 5.1.2 基本术语 5.1.3 模型评估与性能度量 5.1.4 发展历程 5.2 Sklearn库基本使用 5.2.1 Sklearn库简介 5.2.2 基本使用介绍 5.3 回归 5.3.1 线性回归 5.3.2 Logistic回归 5.3.3 其他回归模型 5.4 分类 5.4.1 决策树 5.4.2 K近邻算法 5.4.3 朴素贝叶斯 5.4.4 支持向量机 5.5 聚类 5.5.1 概述 5.5.2 原型聚类 5.5.3 密度聚类 5.5.4 层次聚类 5.6 神经网络 5.6.1 神经元模型 5.6.2 感知机与多层神经网络 5.6.3 误差逆传播算法 5.6.4 深度学习 5.7 集成学习 5.7.1 概述 5.7.2 序列化方法 5.7.3 并行化方法 5.8 小结 5.8.1 本章总结 5.8.2 扩展阅读材料 5.9 习题 5.10 参考资料 第6章 数据科学实践 6.1 数据分析流程 6.1.1 数据挖掘目标 6.1.2 数据采样 6.1.3 数据预处理 6.1.4 数据探索 6.1.5 数据建模 6.1.6 数据分析工具 6.2 案例1——Kaggle Titanic生存预测 6.2.1 数据挖掘目标 6.2.2 数据导入和预处理 6.2.3 数据探索 6.2.4 模型构建 6.3 案例2——客户价值分析 6.3.1 数据挖掘目标 6.3.2 数据导入和预处理 6.3.3 数据探索 6.3.4 模型构建 6.4 案例3——时间序列预测 6.4.1 数据挖掘目标 6.4.2 数据导入 6.4.3 数据探索 6.4.4 模型构建 6.5 案例4——价格预测挑战 6.5.1 数据挖掘目标 6.5.2 数据导入和预处理 6.5.3 数据探索和模型构建 6.6 小结 6.6.1 本章总结 6.6.2 扩展阅读材料 6.7 习题 6.8 参考资料 第7章 数据科学的重要研究领域 7.1 文本分析 7.1.1 文本分析简介 7.1.2 文本分析的任务与方法 7.1.3 知识图谱 7.1.4 文本分析的应用 7.2 图像视频分析 7.2.1 图像视频分析简介 7.2.2 图像分析的任务与方法 7.2.3 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。