1. 程式人生 > >Pandas.cut函式用法及原始碼

Pandas.cut函式用法及原始碼

Python資料分析博文彙總

資料分組:根據資料分析物件的特徵,按照一定的數值指標,把資料分析物件劃分為不同的區間部分來進行研究,以揭示其內在的聯絡和規律性。

函式用法:cut(series, bins, right=True, labels=NULL), right=True表示分組右邊閉合,right=False表示分組左邊閉合,

labels表示分組的自定義標籤。

import pandas;
from pandas import read_csv;
df = read_csv("E:\\pythonlearning\\datacode\\firstpart\\4\\4.15\\data.csv", sep='|');
bins = [min(df.cost)-1, 20, 40, 60, 80, 100, max(df.cost)+1];
labels = ['20以下', '20到40', '40到60', '60到80', '80到100', '100以上'];
pandas.cut(df.cost, bins)#預設右邊閉合
df1=pandas.cut(df.cost, bins, right=False)#左邊閉合
df1=pandas.cut(df.cost, bins, right=False, labels=labels)
df['New']=df1

執行前三行得:


執行四、五、六行得:


執行四、五、七行得:


執行第八行得:


原始碼:https://download.csdn.net/download/w_weiying/10427108

相關推薦

Pandas.cut函式用法原始碼

Python資料分析博文彙總資料分組:根據資料分析物件的特徵,按照一定的數值指標,把資料分析物件劃分為不同的區間部分來進行研究,以揭示其內在的聯絡和規律性。函式用法:cut(series, bins, right=True, labels=NULL), right=True表

Python連續資料離散化處理和pandas.cut函式用法

連續資料離散化場景: 資料分析和統計的預處理階段,經常的會碰到年齡、消費等連續型數值,我們希望將數值進行離散化分段統計,提高資料區分度,那麼下面介紹一個簡單使用的pandas中的 cut() 方法 函式用法: **cut(series, bins, right=True, lab

Numpy.random.randint()函式用法原始碼

Python資料分析博文彙總隨機抽樣:隨機從資料中,按照一定的行數或者比例抽取資料函式用法:numpy.random.randint(start, end, num)import numpy; from pandas import read_csv; import panda

Java中compareTo用法原始碼解析

最近遇到一個問題,在日期比較的時候,很麻煩,因為日期比較沒有大於等於,只有大於或者小於,這就導致在比較時間的時候特別麻煩,而且還要由string轉成date格式才能比較,下面是我使用compareTo比較時間字串的程式碼: String putStartTime = Date

C++有元函式用法程式碼演示

有元函式有三種用法: A:有元函式是普通函式 B:有元函式為類中的成員函式 C:有元類 下面一一介紹。 A:有元函式是普通函式 #include "stdafx.h" #include <stdio.h>  #include <iostream> 

matlab 中 mvnrnd 函式用法舉例

使用matlab來實現: mu = [2 3]; SIGMA = [1 0; 0 2]; r = mvnrnd(mu,SIGMA,100); plot(r(:,1),r(:,2),'r+'); hold on; mu = [7 8]; SIGMA = [ 1 0; 0 2]; r2 = mvnrnd(mu,S

TP框架的簡稱函式用法意義

cookie  /** * Cookie 設定、獲取、刪除 * @param string $name cookie名稱 * @param mixed $value cookie值 * @param mixed $options cookie引數 * @return m

python學習番外篇之print輸出函式用法原理總結

print輸出函式用法及原理總結:        在python2.x中,print作為關鍵字使用,輸出用print語句輸出,例如,x=5 ; print x ,但在python3.x中,print則成為了一個函式,輸出用print()函式輸出,例如:x=5 ; print(

strcpy,strncpy,memcpy,memmove,memset函式用法實現

轉自:http://blog.csdn.net/piaojun_pj/article/details/5945926一.函式介紹:1、memcpy函式原型:extern void *memcpy(void *dest, const void *src, size_t coun

建構函式用法this關鍵字的記憶體圖解

一.類和物件的概述 類:描述生活中的一類事物,是一類事物所具有的共性內容。比如人類,動物類,車類。 物件:基於這個類的實體(例項),比如人類中的某一個具體的人,張三就是一個具體的物件,一個具體例項。

pandas.cut函式說明

1,功能:將資料進行離散化 pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False) 引數說明: x    : 進行劃分的一維陣列      bins

pandas cut函式快速自定義分類

資料如圖所示生成未下單間隔列df['未下單間隔']=df.最近下單時間.map(lambda x :\                          round((pd.to_datetime('2018-04-08')-pd.to_datetime(x[:10])).t

Spring原始碼分析之IOC的三種常見用法原始碼實現(二)

Spring原始碼分析之IOC的三種常見用法及原始碼實現(二) 回顧上文 我們研究的是 AnnotationConfigApplicationContext annotationConfigApplication = new AnnotationConfigApplicationContext

HashSet 的常見用法對應原始碼介紹

1、介紹 HashSet是一個沒有重複元素的集合,無序的,他事通過HashMap實現的,所以他也是執行緒不安全的。接下來介紹使用。 2、使用 1、構造方法 HashSet<Integer> hashSet = new HashSet<>(); Ha

atoi函式用法用C語言實現ato

庫函式原型: #inclue <stdlib.h> int atoi(const char *nptr); 用法:將字串裡的數字字元轉化為整形數。返回整形值。 注意:轉化時跳過前面的空格字元,直到遇上數字或正負符號才開始做轉換,而再遇到非數字或字串結束時('/0')才結束

25 驅動裝置申請原始碼實現裝置檔案建立一體函式(miscdevice)

驅動裝置申請及原始碼實現裝置檔案建立一體函式(miscdevice) miscdevice是字元裝置驅動的簡化版本,方便實現一個簡單的字元裝置驅動。 只適用於沒有同類型的裝置驅動,也就是一個驅動只對應一個硬體。 相關變數及函式: #include <lin

MySQL函式大全用法

1、字串函式ascii(str)   返回字串str的第一個字元的ascii值(str是空串時返回0)  mysql> select ascii('2');    -> 50  mysql> select ascii(

MySQL常用函式總結用法

1、字串函式ascii(str)   返回字串str的第一個字元的ascii值(str是空串時返回0)  mysql> select ascii('2');    -> 50  mysql> select ascii(2);&nbs

Pandas apply函式同時對多列進行操作groupby函式

DataFrame.apply(func, axis=0, broadcast=None, raw=False, reduce=None, result_type=None, args=(), **kwds): 其中axis=0對行操作;axis=1代表對列操作 def

C++ 字串的分割函式split 用法

之前在C#中總用到字串的分割,使用系統函式即可,比如: string a = "This is a test"; string[] strArray = a.Split(' '); 在C++中string沒有直接的分割函式,可以利用C的stroke函式封裝一個分割方法: vector<