Skip to content

风险评分优化 #540

@cfkstat

Description

@cfkstat

风险评分卡的开发,我们通常需要找到一个Logistic回归模型满足如下条件认为是最优的(给定变量入模数量,限制条件最优):

  1. 给定一个训练集(train)和验证集(test),训练和验证是不同时点的贷款数据最终的风险表现(客户是否逾期)。
  2. Score1 = AUC_train - if(abs(AUC_train-AUC_test) >= 0.015, abs(AUC_train-AUC_test), 0.5*abs(AUC_train-AUC_test))
  3. Score2 = KS_train- if(abs(KS_train-KS_test) >= 0.03, abs(KS_train-KS_test), 0.5*abs(KS_train-KS_test))
    评分1和评分2都可以作为一个评价函数,这里要test测试集上不参与模型训练的,所以交叉验证是不能用的,test只能用来评价模型函数。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions