[2] day 02
阿新 • • 發佈:2018-12-14
1. df.memory_usage()
將返回每列佔用多少
要包含索引,請傳遞index=True
所以要獲得整體記憶體消耗:
2. numpy.iinfo
3. shift函式
https://blog.csdn.net/qq_18433441/article/details/56665931
axis=1,左右平移
4. np.where
5. expm1(x) := exp(x) - 1
6. df.isnull().values.any()
df.isnull().any() 按照每列判斷,列中含有Ture則返回ture,列中全為False則返回False。即:會判斷哪些”列”存在缺失值
any()作用:對每列,取或操作。False|Ture=Ture
all()作用:對每列,取與操作。False|Ture=False
7. train_df[columns_to_use].values
type(train_df[columns_to_use]) 為pandas.core.frame.DataFrame
type(train_df[columns_to_use].values) 為numpy.ndarray
8. train_df[columns_to_use].values.flatten()
flatten() 返回一個摺疊成 一維 的陣列。但是該函式只能適用於numpy物件,即array或者mat,普通的list列表是不行的。
9.