1. 程式人生 > 實用技巧 >P2P信貸平臺業務資料分析 -- python資料分析

P2P信貸平臺業務資料分析 -- python資料分析

python資料分析------pandas,numpy

先解決幾個問題:

1、python的虛擬環境建立

如果有虛擬環境,點選選擇"show all",進入後選擇對應的虛擬環境即可,如果沒有虛擬環境,選擇Add,建立一個新的虛擬環境

選擇Virtualenv Environment 繼續選擇New environment

注意:

在Location選擇你建立虛擬環境的目錄

在Base interpreter 選擇你安裝的pythonJDK的目錄

點選ok即可

下面正式進入今天的正題:

1、先來檢視一下資料資訊

1 LC = pd.read_csv('D:\Date\Date_file\ppdai_3_23\LC.csv
') 2 LP = pd.read_csv('D:\Date\Date_file\ppdai_3_23\LP.csv') 3 4 LP.info()
5 LC.info()

可以看到一些資料的資訊,例如:欄位名,型別,資料量等

2、使用者畫像分析

性別分析:

 1 #性別分析
 2 male = LC[LC['性別'] == '']
 3 female = LC[LC['性別'] == '']
 4 
 5 sex = (male,female)
 6 sex_data = (male['借款金額'].sum(),female['借款金額'].sum())
 7 sex_idx = ('
man','woman') 8 # plt.figure(figsize=(15,6)) 9 plt.subplot(1,3,1) 10 plt.pie(sex_data,labels=sex_idx,autopct='%.1f%%') 11 plt.show() 12 13 #新老客戶分析 14 new = LC[LC['是否首標'] == ''] 15 old = LC[LC['是否首標'] == ''] 16 newold_data = (new['借款金額'].sum(),old['借款金額'].sum()) 17 new_idx = ('NewCustomers','OldCustomers
') 18 plt.subplot(1,3,2) 19 plt.pie(newold_data,labels=new_idx,autopct='%.1f%%') 20 plt.show()

3、借款金額分析

每日分析

 1 #分析每日貸款金額的走勢
 2 loan = LC[['借款成功日期', '借款金額']].copy()
 3 loan['借款日期'] = pd.to_datetime(loan['借款成功日期'])
 4 loan1 = loan.pivot_table(index='借款日期', aggfunc='sum').copy()
 5 plt.figure(figsize=(15, 6))
 6 plt.subplot(1,2,1)
 7 plt.plot(loan1)
 8 plt.xlabel('date')
 9 plt.ylabel('Loan amount')
10 plt.title('Daily amount fluctuation')

每月分析

 1 #分析每月貸款金額的走勢
 2 loan['借款成功月份'] = [datetime.strftime(x, '%Y-%m') for x in loan['借款日期']]
 3 loan2 = loan.pivot_table(index='借款成功月份', aggfunc='sum').copy()
 4 plt.subplot(1,2,2)
 5 plt.plot(loan2)
 6 plt.xlabel('date')
 7 plt.xticks(['2015-01','2015-07','2016-01','2016-07','2017-01'])
 8 plt.ylabel('Loan amount')
 9 plt.title('Monthly amount fluctuation')
10 plt.show()

以上是實操內容的一部分,其他部分後續更新

附詳細資料報告地址:

https://www.kesci.com/mw/project/5c96eab88408c1002b453be3/content