1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 天池金融风控-贷款违约预测

天池金融风控-贷款违约预测

时间:2020-01-05 16:35:08

相关推荐

天池金融风控-贷款违约预测

比赛链接:/competition/entrance/531830/introduction

因为这是一个金融风控专题的数据挖掘实战,在开始之前先引入一些预备知识。

1.预备知识

1.1预测指标

本次竞赛用AUC作为评价指标,AUC为ROC曲线下与坐标轴围成的面积大小。

分类算法常见的评估指标

1、混淆矩阵(confused matrix)

1.若一个实例为正类,预测也为正类,则为真正类TP(True Positive)

2.若一个实例为正类,预测也为负类,则为假负类FN(False Negative)

3.若一个实例为负类,预测也为正类,则为假正类FP(False Positive)

4.若一个实例为负类,预测也为负类,则为真负类TN(True Negative)

2、准确率(accuracy):不适用于样本不均衡的情况

3、精确率(Precision):也被称为查准率,

4、召回率(Recall):

5、F1-Score:精确率和召回率是相互影响的两个指标,如果精确率上升(下降)则召回率下降(上升)。若要兼顾二者的话,引入了

6、P-R曲线(Precision-Recall Curve):描述精确率和召回率变化的曲线

7、ROC(Receiver Operating characteristic)

引入假正率FPR 和真正率TPR 。ROC曲线就是以FPR为x轴,TPR为y轴的曲线。

8、AUC(Area under Curve):ROC曲线下与坐标轴围成的面积。

金融风控预测类常见的评估指标如下:

K-S曲线(Kolmogorov-Smirnov),K-S曲线与ROC曲线类似,不同在于:

ROC曲线将真正例率和假正例率作为横纵轴,而K-S曲线将真正例率和假正例率都作为纵轴,横轴则由选定的阈值来充当。

KS不同代表的不同情况,一般情况KS值越大,模型的区分能力越强,但是也不是越大模型效果就越好,如果KS过大,模型可能存在异常,所以当KS值过高可能需要检查模型是否过拟合。以下为KS值对应的模型情况,但此对应不是唯一的,只代表大致趋势。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。