1. 程式人生 > >python 擴充套件庫 interval

python 擴充套件庫 interval

在做評分卡分箱操作時會涉及區間處理,一開始用pd.qcut()做均勻分箱,會返回相應的分箱區間,區間的型別是pandas自帶的區間格式型別,這都沒有問題,但在後面進行分箱調整時,需要進行區間的相加,也就是把一些多餘的箱子的區間和其附近的箱子的區間彙總成為一個更大的區間,本質上就是並集處理,這時候發現問題了,因為pandas自帶的區間型別根本不支援加法、並集、連線等處理,才發現這是一個開發的並不完善的class。因此決定啟用pandas的區間類,而使用可以支援簡單區間操作的類,就這樣找到了interval庫。這個庫的操作很簡單,也支援基本的區間操作,可以滿足我的使用。pandas區間類轉化到interval區間類的操作也很簡單,只需要把pandas區間類用left和right屬性提取出兩端的數值,然後填充到interval區間類中即可。