![]()
编辑推荐 (1)作者背景资深:4位作者都是在金融领域有10~20年数据挖掘和算法建模经验的资深专家,技术功底深厚,业务经验丰富。(2)金融业务驱动:以真实的业务场景和案例为驱动,涵盖金融业务经营的全流程,告别纯理论和不接地气。(3)9大模板:针对决策类、识别类、优化分析类3大主题,9大模板:客户价值预测、营销响应预测、细分画像、交叉销售、申请反欺诈、违规行为识别、预测、运筹优化、流程挖掘。(4)数据建模闭环:涵盖分析框架、模型算法、模型评估、模型监控、算法工程化等完整的数据建模闭环。 内容推荐 这是一本贯穿金融业务经营全流程,以业务为驱动的金融数据挖掘与建模著作,涵盖分析框架、模型算法、模型评估、模型监控、算法工程化等整个数据建模的闭环。本书的4位作者都是在金融领域有有多年工作经验的大数据专家,不仅技术功底深厚、业务经验丰富,而且对金融行业从业者的需求痛点和图书市场的供给情况有深入了解,他们通过精心策划和写作,让本书内容独树一帜:涵盖金融业务经营全流程,全部以业务驱动,包含大量针对具体场景的实战案例。本书针对决策类、识别类、优化分析类3大主题,9大模板:客户价值预测、营销响应预测、细分画像、交叉销售、申请反欺诈、违规行为识别、预测、运筹优化、流程挖掘,详细讲解了每个模板算法原理、评估方法、优化方法和应用案例等,内容上极力做到准确、明晰、直观与实用。此外,本书还对数据科学项目中比较容易被忽视的内容做了补充,包括模型评估、模型监控、算法工程化,能指导读者构建易读、高效、健壮的数据科学工程。本书坚持理论与实践相结合,通过图形、示例、公式帮助读者快速掌握算法与优化理论的同时,还打造了一套可轻松适配各种分析场景与需求的工具模板,力图帮助读者从理论快速跨越到实践。 目录 前言 第1章金融建模综述1 1.1企业中数据分析的层级1 1.2操作层面的数据分析对象与成果4 1.3数据挖掘方法分类介绍4 1.3.1预测性——有监督学习5 1.3.2描述性——无监督学习10 1.4数据挖掘方法论12 1.5数据挖掘建模框架的3个原则14 1.6利用SASEM创建数据挖掘项目16 1.6.1创建数据挖掘项目16 1.6.2给项目添加逻辑库和数据集20 1.6.3SASEM项目的系统文档介绍26 第2章决策类模型28 2.1客户价值预测28 2.1.1线性回归模型概述28 2.1.2Python案例:线性回归建模33 2.1.3多元线性回归的变量筛选40 2.1.4Python案例:多元线性回归变量筛选43 2.1.5模型假设检验44 2.1.6残差分析48 2.1.7强影响点分析49 2.1.8Python案例:线性回归调优实战50 2.1.9线性回归的完整流程小结59 2.1.10正则化61 2.1.11Python案例:岭回归与Lasso回归实战65 2.2营销响应预测70 2.2.1使用逻辑回归预测用户响应率70 2.2.2比较逻辑回归与线性回归70 2.2.3图解逻辑回归71 2.2.4逻辑回归算法概述73 2.2.5分类模型的评估75 2.2.6分类变量的处理79 2.2.7Python案例:逻辑回归建模实战80 2.2.8SASEM案例:贷款违约预测实战88 2.2.9逻辑回归建模小结104 2.3细分画像104 2.3.1主成分分析105 2.3.2因子分析116 2.3.3变量聚类127 2.3.4样本聚类1——层次聚类130 2.3.5样本聚类2——K-Means聚类136 2.4交叉销售165 2.4.1关联规则165 2.4.2序列模式185 第3章识别类模型195 3.1申请反欺诈195 3.1.1决策树195 3.1.2组合算法228 3.1.3近邻域法253 3.1.4朴素贝叶斯257 3.1.5支持向量机263 3.1.6神经网络276 3.2违规行为识别294 3.2.1孤立森林296 3.2.2局部异常因子304 第4章优化分析类模型308 4.1预测技术308 4.1.1效应分解法309 4.1.2基于动力模型的ARIMA317 4.1.3基于深度学习的LSTM333 4.2运筹优化341 4.2.1线性规划342 4.2.2整数规划344 4.2.3非线性规划347 4.3流程挖掘348 4.3.1业务流程挖掘的总体理念348 4.3.2流程发现352 4.3.3流程监控353 4.3.4流程遵循354 4.3.5Python案例:利用pm4py实现流程挖掘355 第5章模型评估与模型监控363 5.1模型评估363 5.1.1混淆矩阵363 5.1.2ROC曲线363 5.1.3KS统计量365 5.1.4洛伦兹曲线与基尼系数366 5.2模型监控368 5.2.1前端监控——业务指标368 5.2.2前端监控——评分分布稳定性368 5.2.3前端监控——特征分布稳定性370 5.2.4后端监控——评分正确性371 5.2.5后端监控——变量有效性372 第6章算法工程化374 6.1构建合理的项目工程结构374 6.1.1为什么要构建合理的项目工程结构374 6.1.2什么是一个数据科学项目应有的结构375 6.2如何编写规范的数据工程代码378 6.2.1代码可读性379 6.2.2数据处理性能381 附录SASEM节点说明386 |