numpy和pandas的常用操作
阿新 • • 發佈:2018-11-09
一、numpy:
1、np.zero
np.zeros(5) 1行5列 結果:array([ 0., 0., 0., 0., 0.])
np.zeros((2, 1)) 2行1列 結果:array([[ 0.], [ 0.]])
2、矩陣乘法
np.dot
np.multiply
二、pandas
1、 讀取csv檔案
引數:
names,自定義列名
keep_default_na=False,沒有資料的條目就會被識別為’null’,而不是Nan(用Nan後面的資料處理中如果進行了比較操作會報錯,就需要設定一下這個屬性)
pdData = pd.read_csv(path, header=None, names=['Exam 1', 'Exam 2', 'Admitted'])
2、判斷是否為空
如果列為Nan的形式:
ss=data[data['Date_received'].notnull()]#返回不為空的
ss=data[data['Date_received'].isnull()]#返回為空的
如果列為'null'的形式(讀取csv時加入了keep_default_na=False屬性)
ss=data[data['Date_received']!='null']#返回不為空的
ss=data[data['Date_received']=='null']#返回為空的
3、插入一列
pdData.insert(0, ‘Ones’, 1) #在第0列插入1,列名為’Ones’