本书试图较全面地介绍大数据技术的基本原理和方法,包括以统计模型为主的各类数据模型以及它们的计算方法,同时还将介绍这些方法在一些领域(如人工智能)中的应用。
本书可作为高等院校从事大数据及相关专业或对它们有兴趣的本科生、研究生、教师的参考书或教材;也可供从事数据科学、人工智能研究与开发的科技人员阅读、参考。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 大数据教程--数据分析原理和方法 |
分类 | |
作者 | 林正炎//张朋//梁克维//庞天晓 |
出版社 | 科学出版社 |
下载 | ![]() |
简介 | 内容推荐 本书试图较全面地介绍大数据技术的基本原理和方法,包括以统计模型为主的各类数据模型以及它们的计算方法,同时还将介绍这些方法在一些领域(如人工智能)中的应用。 本书可作为高等院校从事大数据及相关专业或对它们有兴趣的本科生、研究生、教师的参考书或教材;也可供从事数据科学、人工智能研究与开发的科技人员阅读、参考。 目录 前言 第1章 引言 1.1 什么是大数据 1.1.1 大数据概论 1.1.2 大数据的特点 1.1.3 大数据带来的利益 1.1.4 大数据的类型 1.2 数据分析过程 1.3 专业领域知识 1.3.1 统计学 1.3.2 数据挖掘 1.3.3 机器学习 1.3.4 人工智能 1.3.5 数学 1.4 数据科学家做什么? 1.4.1 学术界 1.4.2 工业界 第2章 大数据的预处理、存储和计算 2.1 数据的预处理 2.1.1 数据源 2.1.2 数据格式 2.1.3 数据形式 2.2 数据清洗 2.2.1 数据清洗的系统框架 2.2.2 待清洗数据的主要类型 2.2.3 数据检测算法和清洗算法 2.2.4 数据清洗评估 2.3 云存储和云计算* 习题2 第3章 数据可视化 3.1 基本原理 3.2 实现过程 3.3 可视化工具 3.4 数据可视化方法 第4章 回归与分类(一) 4.1 线性回归 4.1.1 模型介绍 4.1.2 参数估计 4.1.3 假设检验 4.1.4 模型评价与诊断 4.1.5 预测 4.2 线性回归的推广* 4.2.1 多项式回归 4.2.2 样条回归 4.2.3 局部回归 4.2.4 广义加性模型 4.2.5 回归性能的度量 4.3 时间序列分析 4.3.1 AR(p)模型 4.3.2 MA(q)模型 4.3.3 ARMA(p,q)模型 4.4 逻辑斯谛回归 4.5 判别分类 4.5.1 线性判别分析 4.5.2 二次判别分析 4.6 k最近邻分类 习题4 第5章 回归与分类(二) 5.1 决策树 5.1.1 回归树 5.1.2 分类树 5.1.3 决策树的优缺点 5.2 Bagging分类 5.3 随机森林分类 5.4 AdaBoost分类 5.5 支持向量机分类 5.5.1 最大间隔分类器 5.5.2 支持向量分类器 5.5.3 支持向量机 5.5.4 多分类的支持向量机 习题5 第6章 聚类及相关数据分析 6.1 聚类分析 6.1.1 距离的定义 6.1.2 系统聚类法 6.1.3 K{均值聚类 6.2 文本分析 6.2.1 基本概念 6.2.2 处理过程和任务 6.2.3 特征处理 6.2.4 文本表示模型 6.2.5 文本分类与文本聚类 6.2.6 应用实例 6.2.7 分布式文本挖掘 6.3 网络图形描述和模型* 6.3.1 图的基本概念 6.3.2 复杂网络的统计特征 6.3.3 小世界现象 6.3.4 模型介绍 6.4 网络数据分析和图形模型 6.4.1 网络数据概述 6.4.2 网络数据收集 6.4.3 网络数据分析 6.5 关联规则和推荐系统 6.5.1 关联规则 6.5.2 推荐系统 6.5.3 基于内容的推荐系统设计过程 习题6 第7章 高维统计中的变量选择 7.1 经典降维方法 7.1.1 主成分分析 7.1.2 因子分析 7.2 Lasso模型及其变形 7.2.1 Lasso基本方法 7.2.2 Lasso方法的拓展 7.2.3 其他降维方法 7.3 流形降维方法* 7.3.1 核主成分分析 7.3.2 局部线性嵌入 7.3.3 多维缩放 7.3.4 Isomap 7.4 非负矩阵分解* 7.4.1 基本原理 7.4.2 NMF的求解方法 7.4.3 应用 7.5 自编码器 7.5.1 基本原理 7.5.2 可视化自编码器 7.6 t-SNE 7.6.1 算法 7.6.2 应用 7.7 正则化方法 7.7.1 多项式拟合 7.7.2 过拟合和欠拟合 7.7.3 L2正则 7.7.4 L1正则 7.7.5 缩减参数的选取 习题7 第8章 最大期望算法(EM算法) 8.1 预备知识 8.2 算法描述 8.3 算法导出* 8.4 EM算法的应用 8.4.1 简单实例——抛投硬币实验 8.4.2 男女生身高实例——混合高斯模型 习题8 第9章 贝叶斯方法 9.1 引论 9.2 贝叶斯统计推断 9.2.1 一个例子 9.2.2 确定先验分布 9.2.3 点估计 9.2.4 区间估计 9.2.5 假设检验 9.3 贝叶斯方法在变量选择中的应用 9.3.1 贝叶斯模型选择 9.3.2 采样 9.3.3 贝叶斯变量选择 习题9 第10章 隐马尔可夫模型 10.1 隐马尔可夫模型的基本概念 10.1.1 马尔可夫链 10.1.2 隐马尔可夫模型 10.1.3 观测序列的生成过程 10.1.4 隐马尔可夫模型的三个基本问题 10.2 概率计算算法 10.2.1 前向算法 10.2.2 后向算法 10.2.3 一些概率与期望值的计算 10.3 学习算法 10.3.1 监督学习方法 10.3.2 Baum-Welch算法 10.3.3 Baum-Welch模型参数估计 10.4 预测算法 10.4.1 近似算法 10.4.2 维特比算法 习题10 第11章 神经网络与深度学习 11.1 引言 11.2 神经网络 11.2.1 简介 11.2.2 神经元 11.2.3 感知器 11.2.4 神经网络模型 11.2.5 激活函数 11.2.6 代价函数 11.2.7 梯度下 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。