![]()
内容推荐 本书首先介绍数据科学,然后指导读者安装和搭建数据分析编程环境所需的软件包。在机器学习中,主要学习3项技术:监督学习、无监督学习和强化学习。我们也会用到基本的分类与回归技术,如支持向量机、决策树以及逻辑回归等。在前面章节的学习中,读者将学习到Python语言中用于处理大型数据集的基本函数、数据结构,用于矩阵计算的NumPy包和Pandas包,如何使用Matplotlib绘制自定义图表,以及应用Boosting算法XGBoost(特别梯度提升)进行预测分析等。在后面的章节中,将会学习用于图像识别的卷积神经网络(CNN)、深度学习算法。读者将掌握如何向神经网络馈入人类语言、让模型处理复杂的文本信息以及构建人类语言处理系统进行结果预测等。学习完本书,读者可以掌握和使用很多新的数据科学算法,并且有信心使用本课程以外的工具或库进行操作。 目录 第1章 数据科学和数据预处理导论 1.1引言 1.2Python库 1.3构建机器学习模型的路线图 1.4数据表示方式. 练习1:加载样本数据集,创建特征矩阵和目标矩阵 1.5数据清洗 练习2:删除缺失数据 练习3:填补缺失数据 练习4:查找并删除数据中的异常值 1.6数据整合 练习5:整合数据 1.7数据转换 练习6:用数字替换分类数据 练习7:使用标签编码方法将分类数据转换为数值数据 …… |