建模常用的自定義函式(ks,auc等）

阿新 • • 發佈：2020-09-03

1.統計拆分訓練集測試集之後的分佈

def summary(data_train, data_test, y):
    '''
    函式目標：統計資料拆分訓練集和測試集之後的分佈（如樣本數量，壞賬率之類的）
    變數：
    data_train:訓練集（包括label）
    data_test:測試集（包括label),如果label是單獨的，需要先合併，但是也可以直接（data_train, data_test = train_test_split()
    y:label的columns_name
    返回值：
    一個df
    '''

    summary  
= pd.DataFrame(
        {
            '樣本數': [len(data_train), len(data_test)],
            '壞賬數': [data_train[y].sum(), data_test[y].sum()],
            '壞賬率': [
                round(data_train[y].mean(), 4),
                round(data_test[y].mean(), 4)
                ],
        },
        index 
=['訓練集', '測試集']
    )[['樣本數', '壞賬數', '壞賬率']]
    summary.index.name = '資料集'
    return summary

2.計算ks

def ks(self, data, y):
    '''
    目標：計算出分類模型的ks值
    變數：
    self:模型fit(x,y)，如（self=tree.fit(x,y))
    data:一般是訓練集（不包括label）或者是測試集（也是不包括label）
    y:label的column_name 
    返回：訓練集（或者測試集）的ks值

     
'''

    p = self.predict(data)
    fpr, tpr, p_threshold = metrics.roc_curve(data[y], p,
                                              drop_intermediate=False,
                                              pos_label=1)
    df = pd.DataFrame({'fpr': fpr, 'tpr': tpr, 'p': p_threshold})
    df.loc[0, 'p'] = max(p)

    ks = (df['tpr'] - df['fpr']).max()

    return ks

3.計算auc

建模常用的自定義函式(ks,auc等）

1.統計拆分訓練集測試集之後的分佈 def summary(data_train, data_test, y): \'\'\' 函式目標：統計資料拆分訓練集和測試集之後的分佈（如樣本數量，壞賬率之類的）

常用自定義函式

做網路程式時, 經常用到記憶體之間的相互複製轉換函式.於是寫下了下面一些函式

Mysql自定義函式（CREATE FUNCTION）

在使用 MySQL 的過程中，MySQL 自帶的函式可能完成不了我們的業務需求，這時候就需要自定義函式。自定義函式是一種與儲存過程十分相似的過程式資料庫物件。它與儲存過程一樣，都是由 SQL 語句和過程式語句組成的程

新增 Hive 自定義函式

使用 Java 編寫好 UDF 或 UDAF 函式後，Hive 要如何使用這些自定義函式呢？ 1 在 HDFS 上建立存放 jar 包的目錄

Java自定義函式呼叫方法解析

這篇文章主要介紹了java自定義函式呼叫方法解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

MySQL通過自定義函式實現遞迴查詢父級ID或者子級ID

背景: 在MySQL中如果是有限的層次，比如我們事先如果可以確定這個樹的最大深度,那麼所有節點為根的樹的深度均不會超過樹的最大深度，則我們可以直接通過left join來實現。

MySQL自定義函式和儲存過程示例詳解

前言本文主要給大家介紹的是關於MySQL自定義函式和儲存過程的相關內容，分享出來供大家參考學習，下面話不多說了，來一起看看詳細的介紹吧

MySQL自定義函式簡單用法示例

本文例項講述了MySQL自定義函式用法。分享給大家供大家參考，具體如下：先來一個簡單的，建立一個函式將\'2009-06-23 00:00:00\'這樣格式的datetime時間轉化為\'2009年6月23日0時0分0秒\'這樣的格式：

MYSQL自定義函式判斷是否正整數的例項程式碼

可以寫一個函式：主要是使用正則來判斷。另外輸入字元是空的話，使用\"-\"來替換。

關於MySQL的儲存函式(自定義函式)的定義和使用方法詳解

儲存函式什麼是儲存函式: 封裝一段sql程式碼，完成一種特定的功能，返回結果。

Python pandas自定義函式的使用方法示例

本文例項講述了Python pandas自定義函式的使用方法。分享給大家供大家參考，具體如下：

sqarkSQL中的UDF使用者自定義函式理解及應用

sqarkSQL中的UDF使用者自定義函式理解及應用 sqarksql不是萬能的有一些功能無法實現所以我們需要自定義函式

ASP中Server.HTMLEncode用法(附自定義函式)

Server.HTMLEncode定義和用法 HTMLEncode 方法對一段指定的字串應用 HTML 編碼。主要是為了安全考慮。

mysql自定義函式原理與用法例項分析

本文例項講述了mysql自定義函式原理與用法。分享給大家供大家參考，具體如下：

Python 跨.py檔案呼叫自定義函式說明

0 前言 os.chdir() ：用於改變當前python工作的目錄到指定的路徑 sys.path：是python搜尋模組的一個路徑集，為list，自定義的包可以把存放路徑加進去，之後直接呼叫包名就行了。

python自定義函式def的應用詳解

這裡是三歲，來和大家嘮嘮自定義函式，這一個神奇的東西，帶大家白話玩轉自定義函式

Javaweb EL自定義函式開發及程式碼例項

1.什麼是EL自定義函式 EL自定義函式是在EL表示式中呼叫的某個java類的靜態方法，這個靜態方法需在web應用程式中進行配置才可以被EL表示式呼叫。

python 3 基礎之自定義函式

函式 1、什麼是函式函式是組織好的，可重複使用的，用來實現單一，或相關聯功能的程式碼段。

Jmeter自定義函式base64加密實現過程解析

新建一個類繼承AbstractFunction，重寫以下方法： execute setParameters getReferenceKey getArgumentDesc

Python之自定義函式

函式 1、定義函式在Python中定義一個函式要使用def語句，一次寫出函式名、括號、括號中的的引數和冒號，然後在縮排塊中編寫函式體，函式的返回值用return返回。如下所示：