1. 程式人生 > >評分卡製作過程

評分卡製作過程

1、明確目的,要用評分卡去對什麼打分

2、對資料進行分析

  • 對每一個變數進行分析。例如分析其缺失率,分析其缺失的原因,尤其是在多個變數缺失率相同的情況下,是否由於其他變數取某值而造成無法避免的缺失,如果是這樣需要針對該種情況單獨建模。例如申請借款時,企業(法人)使用者通常不會填寫“職業”、“工資”、“工作年限”等資訊。所以這些資訊通常為空,所以要考慮為企業(法人)使用者單獨建立評分卡模型;
  • 明確哪些量構成自變數,即哪些量是“在樣本拿到手之後就可以看到的”,哪些量是“在等待一段時間後才能獲取”。例如待客訂單的申請人填寫的資訊、貸款金額和使用期限資訊、個人歷史信用資訊等屬於樣本拿到手之後就能獲取的資訊,而訂單有沒有賣出、降了幾次價之後才賣出、從上線到賣出的時間間隔等屬於在等待一段時間之後才能獲取的資訊,在等待一段時間之後才能獲取的資訊共同決定了樣本應該打標為0還是1

3、缺失值處理。計算缺失率,對於缺失率低的變數,如果該變數有值的樣本與其他變數相館較高,足以建立一個模型進行預測,則可建立模型進行預測;否則可根據情況,用眾數、均值填充,或者單獨賦一個值;

4、構造衍生變數。根據已知變數和實際情況構造對因變數可能有影響的衍生變數。構造衍生變數的時候,注意原始變數的資料型別和單位。

5、將樣本分為訓練樣本、測試樣本和跨期樣本,用訓練樣本進行訓練。

6、評分。評分的目的是為了便於對樣本進行排序。如果樣本量很大,則也應該給評分找一個較大的取值範圍。反之亦然。

7、對於分型別變數,需要首先統計每個類別中“壞”樣本所佔的比重,然後根據比重對類別進行排序。