P2P信貸平臺業務資料分析 -- python資料分析
阿新 • • 發佈:2020-12-10
python資料分析------pandas,numpy
先解決幾個問題:
1、python的虛擬環境建立
如果有虛擬環境,點選選擇"show all",進入後選擇對應的虛擬環境即可,如果沒有虛擬環境,選擇Add,建立一個新的虛擬環境
選擇Virtualenv Environment 繼續選擇New environment
注意:
在Location選擇你建立虛擬環境的目錄
在Base interpreter 選擇你安裝的pythonJDK的目錄
點選ok即可
下面正式進入今天的正題:
1、先來檢視一下資料資訊
1 LC = pd.read_csv('D:\Date\Date_file\ppdai_3_23\LC.csv') 2 LP = pd.read_csv('D:\Date\Date_file\ppdai_3_23\LP.csv') 3 4 LP.info()
5 LC.info()
可以看到一些資料的資訊,例如:欄位名,型別,資料量等
2、使用者畫像分析
性別分析:
1 #性別分析 2 male = LC[LC['性別'] == '男'] 3 female = LC[LC['性別'] == '女'] 4 5 sex = (male,female) 6 sex_data = (male['借款金額'].sum(),female['借款金額'].sum()) 7 sex_idx = ('man','woman') 8 # plt.figure(figsize=(15,6)) 9 plt.subplot(1,3,1) 10 plt.pie(sex_data,labels=sex_idx,autopct='%.1f%%') 11 plt.show() 12 13 #新老客戶分析 14 new = LC[LC['是否首標'] == '是'] 15 old = LC[LC['是否首標'] == '否'] 16 newold_data = (new['借款金額'].sum(),old['借款金額'].sum()) 17 new_idx = ('NewCustomers','OldCustomers') 18 plt.subplot(1,3,2) 19 plt.pie(newold_data,labels=new_idx,autopct='%.1f%%') 20 plt.show()
3、借款金額分析
每日分析
1 #分析每日貸款金額的走勢 2 loan = LC[['借款成功日期', '借款金額']].copy() 3 loan['借款日期'] = pd.to_datetime(loan['借款成功日期']) 4 loan1 = loan.pivot_table(index='借款日期', aggfunc='sum').copy() 5 plt.figure(figsize=(15, 6)) 6 plt.subplot(1,2,1) 7 plt.plot(loan1) 8 plt.xlabel('date') 9 plt.ylabel('Loan amount') 10 plt.title('Daily amount fluctuation')
每月分析
1 #分析每月貸款金額的走勢 2 loan['借款成功月份'] = [datetime.strftime(x, '%Y-%m') for x in loan['借款日期']] 3 loan2 = loan.pivot_table(index='借款成功月份', aggfunc='sum').copy() 4 plt.subplot(1,2,2) 5 plt.plot(loan2) 6 plt.xlabel('date') 7 plt.xticks(['2015-01','2015-07','2016-01','2016-07','2017-01']) 8 plt.ylabel('Loan amount') 9 plt.title('Monthly amount fluctuation') 10 plt.show()
以上是實操內容的一部分,其他部分後續更新
附詳細資料報告地址:
https://www.kesci.com/mw/project/5c96eab88408c1002b453be3/content