网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | Python机器学习 基于PyTorch和Scikit-Learn |
分类 | 教育考试-考试-计算机类 |
作者 | (美)塞巴斯蒂安·拉施卡,(美)刘玉溪,(美)瓦希德·米尔贾利利 |
出版社 | 机械工业出版社 |
下载 | |
简介 | 编辑推荐 本书是一本在PyTorch环境下学习机器学习和深度学习的综合指南,可以作为初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。 本书讲解清晰、示例生动,深入介绍了机器学习方法的基础知识,不仅提供了构建机器学习模型的说明,而且提供了构建机器学习模型和解决实际问题的基本准则。 本书添加了基于PyTorch的深度学习内容,介绍了新版Scikit-Learn。本书涵盖了多种用于文本和图像分类的机器学习与深度学习方法,介绍了用于生成新数据的生成对抗网络(GAN)和用于训练智能体的强化学习。最后,本书还介绍了深度学习的新动态,包括图神经网络和用于自然语言处理(NLP)的大型transformer。 无论是机器学习入门新手,还是计划跟踪机器学习进展的研发人员,都可以将本书作为使用Python进行机器学习的不二之选。 内容推荐 本书深入介绍了机器学习领域的基本概念和方法,除介绍了Python机器学习库和用机器学习库搭建神经网络模型的方法外,还介绍了机器学习算法的数学理论、工作原理、使用方法、实现细节以及如何避免机器学习算法实现过程中的常见问题。本书涵盖了多种用于文本和图像分类的机器学习与深度学习方法,以及用于生成新数据的生成对抗网络(GAN)和用于训练智能体的强化学习,还介绍了深度学习的新动态,包括图神经网络和用于自然语言处理(NLP)的大型transformer。本书讲解清晰,示例生动,理论和实践部分相对平衡,既可以作为机器学习领域初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。 目录 译者序 序 前言 作者简介 审校者简介 第1章赋予计算机从数据中学习的能力1 1.1将数据转化为知识的智能系统1 1.2三种机器学习类型2 1.2.1用于预测未来的监督学习2 1.2.2解决交互问题的强化学习4 1.2.3发现数据中隐藏规律的无监督学习 5 1.3基本术语与符号6 1.3.1本书中使用的符号和约定6 1.3.2机器学习术语8 1.4构建机器学习系统的路线图8 1.4.1数据预处理——让数据可用8 1.4.2训练和选择预测模型9 1.4.3使用未见过的数据对模型进行评估10 1.5使用Python实现机器学习算法10 1.5.1从Python Package Index中安装Python和其他软件包10 1.5.2使用Anaconda Python软件包管理器11 1.5.3科学计算、数据科学和机器学习软件包12 1.6本章小结13 第2章训练简单的机器学习分类算法14 2.1人工神经元——机器学习早期历史一瞥14 2.1.1人工神经元的定义15 2.1.2感知机学习规则16 2.2使用Python实现感知机学习算法19 2.2.1面向对象的感知机API19 2.2.2使用鸢尾花数据集训练感知机22 2.3自适应线性神经元与算法收敛27 2.3.1使用梯度下降法最小化损失函数28 2.3.2在Python中实现Adaline30 2.3.3通过特征缩放改进梯度下降34 2.3.4大规模机器学习与随机梯度下降36 2.4本章小结41 第3章Scikit-Learn机器学习分类算法之旅42 3.1分类算法的选择42 3.2学习Scikit-Learn的第一步——训练感知机43 3.3用逻辑回归算法建模分类概率48 3.3.1逻辑回归与条件概率48 3.3.2用逻辑损失函数更新模型权重51 3.3.3从Adaline的代码实现到逻辑回归的代码实现53 3.3.4用Scikit-Learn训练逻辑回归模型56 3.3.5使用正则化避免模型过拟合59 3.4基于优选分类间隔的支持向量机62 3.4.1理解优选分类间隔62 3.4.2使用松弛变量解决非线性可分问题62 3.4.3Scikit-Learn中另外一种实现64 3.5使用核支持向量机求解非线性问题64 3.5.1处理线性不可分数据的核方法64 3.5.2使用核方法在高维空间中寻找分离超平面66 3.6决策树学习69 3.6.1优选化信息增益70 3.6.2构建决策树73 3.6.3多棵决策树组成随机森林76 3.7基于惰性学习策略的k近邻算法78 3.8本章小结81 第4章构建良好的训练数据集——数据预处理83 4.1处理缺失值83 4.1.1识别表格数据中的缺失值83 4.1.2删除含有缺失值的样本或特征85 4.1.3填补缺失值85 4.1.4Scikit-Learn的估计器86 4.2处理类别数据87 4.2.1用pandas实现类别数据编码88 4.2.2映射有序特征88 4.2.3类别标签编码89 4.2.4标称特征的独热编码90 4.3将数据集划分为训练数据集和测试数据集93 4.4使特征具有相同的尺度95 4.5选择有意义的特征97 4.5.1用L1和L2正则化对模型复杂度进行惩罚98 4.5.2L2正则化的几何解释98 4.5.3L1正则化与稀疏解99 4.5.4序贯特征选择算法102 4.6用随机森林评估特征重要性107 4.7本章小结109 第5章通过降维方法压缩数据110 5.1无监督降维的主成分分析方法110 5.1.1主成分分析的主要步骤110 5.1.2提取主成分的步骤112 5.1.3总方差和被解释的方差114 5.1.4特征变换115 5.1.5用Scikit-Learn实现主成分分析118 5.1.6评估特征的贡献120 5.2监督数据压缩的线性判别分析方法122 5.2.1主成分分析与线性判别分析122 5.2.2线性判别分析基本原理123 5.2.3计算散布矩阵124 5.2.4为新特征子空间选择线性判别式126 5.2.5将样本投影到新的特征空间128 5.2.6用Scikit-Learn实现线性判别分析128 5.3非线性降维和可视化130 5.3.1非线性降维的不足130 5.3.2使用t-SNE可视化数据131 5.4本章小结135 第6章模型评估和超参数调优的很好实践136 6.1使用pipeline方法简化工作流程136 6.1.1加载威斯康星乳腺癌数据集136 6.1.2在pipeline中集成转换器和估计器138 6.2使用k折交叉验证评估模型性能140 6.2.1holdout交叉验证140 6.2.2k折交叉验证140 6.3用学习曲线和验证曲线调试算法144 6.3.1使用学习曲线解决偏差和方差问题144 6.3.2使用验证曲线解决过拟合和欠拟合问题146 6.4通过网格搜索微调机器学习模型148 …… |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。