前言
篇智能风控背景
章金融科技介绍
1.1金融科技的前世今生
1.2金融科技正深刻地改变和塑造着金融业态
1.3新兴科技不断强化金融科技的应用能力
1.4金融风险控制面临着的挑战
1.5智能风控和评分卡
1.6评分卡模型的开发流程
第2章机器学习介绍
2.1机器学习的概念
2.2机器学习的分类
2.2.1有监督学习
2.2.2无监督学习
2.2.3强化学习
2.3机器学习与人工智能的关系
2.4机器学习与数学的关系
2.5机器学习与深度学习
第3章评分卡模型介绍
3.1申请评分卡
3.1.1数据获取
3.1.2好坏样本定义
3.1.3观察期与表现期确定
3.1.4样本分层
3.1.5数据清洗与预处理
3.1.6特征工程
3.1.7模型训练与优化
3.2行为评分卡
3.2.1数据获取
3.2.2时间窗口
3.2.3特征工程
3.3催收评分卡
3.3.1催收评分卡分类
3.3.2催收策略
3.4反欺诈模型
3.4.1欺诈风险与信用风险比较
3.4.2欺诈模型好坏样本定义
3.4.3欺诈主体分析
3.4.4反欺诈方法介绍
第2篇评分卡理论与实战基础
第4章数据清洗与预处理
4.1数据集成
4.2数据清洗
4.3探索性数据分析
4.4Python代码实践
4.4.1数据集成
4.4.2数据清洗
4.4.3探索性数据分析
第5章变量编码方法
5.1无监督编码
5.1.1One-hot编码
5.1.2Dummyvariable编码
5.1.3Label编码
5.2有监督编码
5.2.1WOE编码
5.2.2WOE编码与One-hot编码比较
5.3Python代码实践
5.3.1One-hot编码
5.3.2Dummyvariable编码
5.3.3Label编码
5.3.4WOE编码
第6章变量分箱方法
6.1变量分箱流程
6.2优Chi-merge卡方分箱方法
6.3Best-KS分箱方法
6.4优IV分箱方法
6.5基于树的优分箱方法
6.6Python代码实践
6.6.1优Chi-merge分箱
6.6.2优IV分箱
6.6.3基于树的分箱
第7章变量选择
7.1过滤法变量选择
7.2包装法变量选择
7.3嵌入法变量选择
7.4Python代码实践
7.4.1过滤法变量选择
7.4.2包装法变量选择
7.4.3嵌入法变量选择
第8章Logistic回归模型
8.1Logistic回归模型原理
8.2过拟合与欠拟合
8.3Python代码实践
第9章模型的评估指标
9.1正负样本的选择
9.2标准评估指标
9.3概率密度评估指标
9.4概率分布评估指标
9.5Python代码实践
0章评分卡分数转化
10.1由概率到分数的转换
10.2变量的分值计算
10.3评分卡性能评估
10.4Python代码实践
1章模型在线监控
11.1稳定性监控
11.2单调性监控
11.3性能监控指标
11.4Python代码实践
第3篇评分卡理论与实战进阶
2章样本不均衡处理
12.1数据层下采样样本不均衡的处理方法
12.1.1随机下采样方法
12.1.2样本邻域选择的下采样方法
12.1.3样本邻域清理的下采样方法
12.1.4Bagging集成的下采样方法
12.1.5Boosting集成的下采样方法
12.2数据层上采样样本不均衡的处理方法
12.2.1随机上采样方法
12.2.2SMOTE样本生成方法
12.2.3Borderline-SMOTE样本生成方法
12.3算法层样本不均衡的处理方法
12.4模型评估层样本不均衡的处理方法
12.5Python代码实践
12.5.1数据层下采样样本不均衡处理代码实现
12.5.2数据层上采样样本不均衡处理代码实现
3章特征工程进阶
13.1数据层特征工程
13.2算法层特征工程
13.2.1基于树模型的特征生成
13.2.2FM特征交
13.3Python代码实践
13.3.1数据层特征工程代码实现
13.3.2算法层特征工程代码实现
4章决策树模型
14.1决策树模型的原理
14.2决策树学习
14.3决策树与过拟合
14.4Python代码实践
5章神经网络模型
15.1神经元模型
15.2神经网络的网络结构
15.3神经网络的学习策略
15.4Python代码实践
6章支持向量机模型
16.1感知器模型
16.1.1感知器模型的原理
16.1.2感知器与支持向量机模型
16.2线性可分支持向量机
16.3线性支持向量机
16.4非线性支持向量机
16.5感知器相关模型比较
16.6Python代码实践
16.6.1线性支持向量机模型代码实现
16.6.2非线性支持向量机模型代码实现
7章集成学习
17.1Bagging与Boosting对比
17.2RandomForest模型原理
17.3Adaboost模型原理
17.4GBDT模型原理
17.5Xgboost模型原理
17.6Python代码实践
17.6.1RandomForest模型
17.6.2Adaboost模型
17.6.3GBDT模型
17.6.4Xgboost模型
8章模型融合
18.1Blending方法原理
18.2Stacking方法原理
18.3Python代码实践
18.3.1Blending模型融合代码实现
18.3.2Stacking模型融合代码实现
第4篇LendingClub数据集实战
9章完整的模型开发实现
19.1数据源介绍
19.2数据的获取与预处理
19.2.1数据准备
19.2.2好坏样本定义
19.2.3数据清洗与预处理
19.3特征工程
19.3.1简单的特征工程
19.3.2变量分箱与编码
19.3.3变量选择
19.4模型构建与评估
19.4.1模型构建与优化
19.4.2模型评估
19.5评分卡生成
附录A主要符号表
附录B开发环境简介
参考文献