![]()
内容推荐 胡欢武编著的《机器学习基础(从入门到求职)》是一本机器学习算法方面的理论+实践读物,主要包含机器学习基础理论、回归模型、分类模型、聚类模型、降维模型和深度学习模型六大部分。机器学习基础理论部分包含第1、2章,主要介绍机器学习的理论基础和工程实践基础。第3章是回归模型部分,主要包括模型的建立、学习策略的确定和优化算法的求解过程,最后结合三种常见的线性回归模型实现了一个房价预测的案例。第4至11章详细介绍了几种常见的分类模型,包括朴素贝叶斯模型、K近邻模型、决策树模型、Logistic回归模型、支持向量机模型、随机森林模型、AdaBoost模型和提升树模型,每一个模型都给出了较为详细的推导过程和实际应用案例。第12章系统介绍了五种常见的聚类模型,包括K-Means聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类,每一个模型的原理、优缺点和工程应用实践都给出了较为详细的说明。第13章系统介绍了四种常用的降维方式,包括奇异值分解、主成分分析、线性判别分析和局部线性嵌入,同样给出了详细的理论推导和分析。最后两章分别是词向量模型和深度神经网络模型,其中,词向量模型详细介绍了Word2Vec和Doc2Vec模型的原理推导和应用;深度神经网络模型系统介绍了深度学习相关的各类基础知识。 本书适合对人工智能和机器学习感兴趣的学生、求职者和已工作人士,以及想要使用机器学习这一工具的跨行业者(有最基本的高等数学、线性代数、概率基础即可),具体判别方法建议您阅读本书的前言。 目录 第1章 机器学习概述 1.1 机器学习介绍 1.1.1 机器学习的特点 1.1.2 机器学习的对象 1.1.3 机器学习的应用 1.2 机器学习分类 1.2.1 按任务类型分类 1.2.2 按学习方式分类 1.2.3 生成模型与判别模型 1.3 机器学习方法三要素 1.3.1 模型 1.3.2 策略 1.3.3 算法 1.3.4 小结 第2章 机器学习工程实践 2.1 模型评估指标 2.1.1 回归模型的评估指标 2.1.2 分类模型的评估指标 2.1.3 聚类模型的评估指标 2.1.4 常用距离公式 2.2 模型复杂度度量 2.2.1 偏差与方差 2.2.2 过拟合与正则化 2.3 特征工程与模型调优 2.3.1 数据挖掘项目流程 2.3.2 特征工程 2.3.3 模型选择与模型调优 第3章 线性回归 3.1 问题引入 3.2 线性回归模型 3.2.1 模型建立 3.2.2 策略确定 3.2.3 算法求解 3.2.4 线性回归模型流程 3.3 线性回归的scikit-learn实现 3.3.1 普通线性回归 3.3.2 Lasso回归 3.3.3 岭回归 3.3.4 ElasticNet回归 3.4 线性回归实例 3.5 小结 第4章 朴素贝叶斯 4.1 概述 4.2 相关原理 4.2.1 朴素贝叶斯基本原理 4.2.2 原理的进一步阐述 4.2.3 后验概率最大化的含义 4.2.4 拉普拉斯平滑 4.3 朴素贝叶斯的三种形式及scikit-learn实现 4.3.1 高斯型 4.3.2 多项式型 4.3.3 伯努利型 4.4 中文文本分类项目 4.4.1 项目简介 4.4.2 项目过程 4.4.3 完整程序实现 4.5 小结 第5章 K近邻 5.1 概述 5.2 K近邻分类原理 5.2.1 K值的选择 5.2.2 距离度量 5.2.3 分类决策规则 5.2.4 K近邻分类算法过程 5.3 K近邻回归原理 5.3.1 回归决策规则 5.3.2 K近邻回归算法过程 5.4 搜索优化——KD树 5.4.1 构造KD树 5.4.2 搜索KD树 5.5 K近邻的scikit-learn实现 5.5.1 K近邻分类 5.5.2 K近邻回归 5.6 K近邻应用实例 5.7 小结 第6章 决策树 6.1 概述 6.2 特征选择 6.2.1 信息增益 6.2.2 信息增益比 6.2.3 基尼指数 6.3 决策树生成 6.3.1 ID3决策树 6.3.2 C4.5决策树 6.3.3 CART决策树 6.4 决策树剪枝 6.5 决策树的scikit-learn实现 6.6 决策树应用于文本分类 6.7 小结 第7章 Logistic回归 7.1 Logistic回归概述 7.2 Logistic回归原理 7.2.1 Logistic回归模型 7.2.2 Logistic回归学习策略 7.2.3 Logistic回归优化算法 7.3 多项Logistic回归 7.4 Logistic回归的scikit-learn实现 7.5 Logistic回归实例 7.6 小结 第8章 支持向量机 8.1 感知机 8.1.1 感知机模型 8.1.2 感知机学习策略 8.1.3 感知机优化算法 8.1.4 感知机模型整体流程 8.1.5 小结 8.2 硬间隔支持向量机 8.2.1 引入 8.2.2 推导 8.3 软间隔支持向量机 8.4 合页损失函数 8.5 非线性支持向量机 8.6 SVM的scikit-learn实现 8.6.1 线性SVM 8.6.2 非线性SVM 8.7 SVM实例 8.8 小结 第9章 随机森林 9.1 Bagging 9.2 随机森林概念 9.3 RF的推广——extra trees 9.4 RF的scikit-learn实现 9.5 RF的scikit-learn使用实例 9.5.1 程序 9.5.2 结果及分析 9.5.3 扩展 9.6 小结 第10章 AdaBoost 10.1 AdaBoost的结构 10.1.1 AdaBoost的工作过程 10.1.2 AdaBoost多分类问题 10.1.3 AdaBoost回归问题 10.2 AdaBoost的原理 10.3 AdaBoost的scikit-learn实现 10.4 AdaBoost应用实例 10.5 AdaBoost模型的优缺点 第11章 提升树 11.1 提升树的定义 11.2 梯度提升树 11.2.1 梯度提升树的原理推导 11.2.2 GBDT和GBRT模型的处理过程 11.2.3 梯度提升模型的scikit-learn实现 11.2.4 梯度提升模型的scikit-learn使用实例 11.2.5 GBDT模型的优缺点 11.3 XGBoost 11.3.1 XGBoost的原理 11.3.2 XGBoost调参 11.3.3 XGBoost与GBDT的比较 第12章 聚类 12.1 聚类问题介绍 12.2 K-Means聚类 12.2.1 K-Means聚类过程和原理 12.2.2 K-Means算法优化 12.2.3 小结 12.2.4 K-Means应用实例 12.3 层次聚类 12.3.1 层次聚类的过程和原理 12.3.2 小结 12.3.3 层次聚类应用实例 12.4 密度聚类算法 12.4.1 密度聚类算法过程和原理 12.4.2 密度聚类小结 12.4.3 密度聚类应用实例 12.5 谱聚类 12.5.1 谱聚类的过程和原理 12.5.2 谱聚类小结 12.5.3 |