![]()
内容推荐 本书以掌握Python语言基础为前提,由浅入深、全面系统地讲解了机器学习的相关知识及技能,内容注重实用性和可操作性,在介绍机器学习理论知识的基础上,结合具体的实战实例,给出了详细的代码及实现步骤。全书共9个项目,分别介绍了数据分析基础、机器学习项目实战流程、探索性数据分析与特征工程、常见机器学习算法及框架、交叉验证与超参数调优,并结合主流机器学习技术框架Scikit-leam,展开了信用违约分类预测、社交媒体评论分类预测、共享单车用量需求回归预测、信用卡客户忠诚度回归预测的项目实战。 本书以机器学习的知识体系为基础,以实战案例为载体,采用理论与实践相结合的模式编写而成。既可以作为职业院校和应用型本科院校人工智能、大数据、计算机等相关专业的教材,也可以作为从事人工智能相关工作的广大科研人员、工程技术人员的自学用书。 目录 项目1 数据分析基础 任务1 开发环境的搭建 1.1.1 数据分析相关库 1.1.2 Anaconda的安装和使用 1.1.3 Jupyter Notebook的使用 任务2 NumPy的应用 1.2.1 数组对象的创建 1.2.2 数组的索引和切片 任务3 Pandas的应用 1.3.1 Series对象的创建 1.3.2 Series对象的索引和切片 1.3.3 Series对象的常用属性 任务4 数据可视化 1.4.1 安装和导入 1.4.2 绘图的流程 任务5 Pandas、NumPy库的数据操作 1.5.1 数据读入 1.5.2 数据选择 1.5.3 缺失值填充 1.5.4 数据透视表绘制 1.5.5 数据集合并 1.5.6 独热编码 项目2 机器学习项目实战流程 任务1 知识准备 2.1.1 问题定义 2.1.2 数据准备 2.1.3 模型训练 2.1.4 模型评估 2.1.5 模型部署 2.1.6 模型监控与更新 2.1.7 小结 任务2 使用Scikit-learn框架完成基本的机器学习项目 2.2.1 Estimator 2.2.2 Metrics 2.2.3 小结 任务3 实战:泰坦尼克号事件生存预测 2.3.1 问题定义 2.3.2 数据准备 2.3.3 模型训练 2.3.4 模型评估 2.3.5 小结 项目3 探索性数据分析与特征工程 任务1 知识准备 3.1.1 探索性数据分析 3.1.2 特征工程 3.1.3 特征抽取 3.1.4 特征转换 3.1.5 特征选择 3.1.6 小结 任务2 实战:基于决策树的泰坦尼克号事件生存预测 3.2.1 问题定义 3.2.2 数据准备 3.2.3 模型训练 3.2.4 模型评估 3.2.5 数据保存 3.2.6 小结 项目4 常见机器学习算法及框架 任务1 知识准备 4.1.1 损失函数、代价函数与目标函数 4.1.2 逻辑回归与神经网络 4.1.3 决策树与随机森林 任务2 基于集成学习思想的算法 任务3 Python环境下XGBoost的安装及使用 任务4 Python环境下LightGBM的安装及使用 项目5 交叉验证与超参数调优 任务1 知识准备 5.1.1 机器学习算法中的参数与超参数 5.1.2 超参数调优方法 5.1.3 GBM算法的超参数调优 任务2 随机森林超参数调优 5.2.1 RF框架的参数意义 5.2.2 RF决策树的参数含义 任务3 实战:GBM算法超参数调优 5.3.1 问题定义 5.3.2 数据准备 5.3.3 小结 项目6 信用违约分类预测 任务1 信用违约分类建模 6.1.1 问题定义 6.1.2 数据准备 6.1.3 模型训练 6.1.4 模型评估 6.1.5 小结 任务2 实战:处理不平衡样本来优化模型 6.2.1 数据准备 6.2.2 小结 项目7 社交媒体评论分类预测 任务1 社交媒体评论分类建模 7.1.1 问题定义 7.1.2 数据准备 7.1.3 模型训练 7.1.4 模型评估 7.1.5 小结 任务2 实战:使用不同文本特征提取方法来优化模型 7.2.1 问题定义 7.2.2 数据准备 7.2.3 基于TF-IDF特征的模型训练与评估 7.2.4 TSNE、LDA降维操作及TSNE可视化 7.2.5 基于LDA方法对TF-IDF特征降维处理后的模型训练与评估 7.2.6 基于词向量方法的模型训练与评估 7.2.7 小结 项目8 共享单车用量需求回归预测 任务1 共享单车用量需求回归建模 8.1.1 问题定义 8.1.2 数据准备 8.1.3 模型训练 8.1.4 模型评估 8.1.5 小结 任务2 实战:使用特征选择及离散化方法来优化模型 8.2.1 问题定义 8.2.2 数据准备 8.2.3 模型训练 8.2.4 模型评估 8.2.5 小结 项目9 信用卡客户忠诚度回归预测 任务1 信用卡客户忠诚度回归建模 9.1.1 问题定义 9.1.2 数据准备 9.1.3 模型训练 9.1.4 模型评估 9.1.5 小结 任务2 实战:增加数据源抽取特征来优化模型 9.2.1 问题定义 9.2.2 数据准备 9.2.3 模型训练 9.2.4 模型评估 9.2.5 小结 附录A 课后习题及参考答案 项目1 习题及参考答案 项目2 习题及参考答案 项目3 习题及参考答案 项目4 习题及参考答案 项目5 习题及参考答案 项目6 习题及参考答案 项目7 习题及参考答案 项目8 习题及参考答案 项目9 习题及参考答案 |