pandas 提取某幾列_Pandas使用筆記隨筆

阿新 • • 發佈：2021-01-01

'''pandas使用規則'''
import pandas as pd
import numpy as np
'''series'''
#有兩個引數index與values，如果不定義index的話預設從0開始
s1=pd.Series([1,3,5,7,9],index=('a','b','c','d','e'))
#給series新增元素
s1['f']=11
print(s1)

#%%
#numpy隨機數
num=0
while(num<5):
    np.random.seed(1)#seed是固定了隨機數相同，裡面的數字隨便設
    print(np.random.random())
    num+=1
#%%
    #pandas隨機數序列
suijishu=pd.Series(np.random.random(5))
print(suijishu)
#%%
'''
pandas元素提取切片
'''
#head(),tail(),take()
s1.head(2)
s1.tail(2)#沒有引數的時候是預設檢視前5個與後5個
'''s1.take(['c','d','a'])'''#無法提取？？？
'''print(s1.take([2,1,0]))'''
#%%
#利用位置標籤提取元素
#可以用位置索引
print(s1[2])
#可以用標籤索引
print(s1['d'])
print(s1[[2,3,4]])
print(s1[['b','e']])
#切片
print(s1[2:3])#不包括3，第四項
print(s1['c':'d'])#包括最後一項d
#%%
'''時間序列'''
from datetime import datetime
import pandas as pd

date=datetime(2016,1,1)
date=pd.Timestamp(date)
print(date)

ts=pd.Series(1,index=[date])
print(ts)

#to_datetime()將series的index轉換為datetimeindex
dates=['2016-01-01','2016-01-02','2016-01-03']
ts=pd.Series([1,2,3],index=pd.to_datetime(dates))
print(ts)

print(ts[0])
print(ts.index[0])
print(ts.values[0])

#%%
'''滯後'''
print(ts.shift(1))
print(ts.shift(-1))
#%%
'''高低頻時間資料轉換'''
#resample()修改資料的頻率，resample（資料的頻率，轉換的方法）
rts=ts.resample('M',how='first')#M是每月最後一天，MS是每月第一天
print(rts)
#%%
'''Dataframe物件'''
#有三個引數（資料、index、columns）
import pandas as pd
import numpy as np
dates=['2016-01-01','2016-01-02','2016-01-03','2016-01-04','2016-01-05','2016-01-06']
dates=pd.to_datetime(dates)
df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('abcd'))
print(df)

#%%
'''讀取csv檔案'''
pd.read_csv('D:/shuju.csv',encoding='GB18030',header=0,sep=',')
#header=0是指第0行的資料用來做列名，header=None是指沒有列名
#name是個指定各列變數名，如果header=0那麼可以讓name=None
#sep是指逗號作為分隔符
#encoding='GB18030'是由於csv中有中文
#%%
'''檢視dataframe物件'''
print(df)

print(df.head(3))
print(df.tail(2))
print(df.columns)
print(df.index)
print(df.values)
print(df.describe())#對df中的資料進行描述性統計
#%%
'''dataframe物件的索引與切片'''
print(df[1:3])#取行數，第2，3行，沒有第4行
print(df['a'])#取這一列，其實就是一個series
print(df[['a','b']])#提取多列，需要兩個中括號
print(df[df['a']>0])#取a列中大於0的
#%%
'''loc與iloc的使用
loc是標籤切片索引，iloc是位置索引
df.loc[row_indexer,column_indexer]'''
df.loc[:,'a']
df.loc[:,'a':'c']#提取多列
df.loc[dates[0:2],'a':'c']#要加index的名稱dates，不能用df.loc[[0:2]]
df.loc[dates[0],'a']#只提取一個標量
df.at[dates[0],'a']#只提取一個標量,同上
df.loc[df.loc[:,'a']>0]#提取a列大於0的行

'''df.iloc[row_indexer,column_indexer]'''
df.iloc[2]#取第3行
df.iloc[:,2]#取第3列
df.iloc[[1,4],[2,3]]#取某幾行與某幾列
df.iloc[1:4,1:3]#切片 第2行到第4行，因為最後一行不取，第2列到第3列，第4列不取
df.iloc[3,3]#取特定的值
df.iat[3,3]#same
df.loc[:,df.iloc[3]>0]#取第4行大於0的所有列，注意前面不能用iloc？？？

'''dataframe的操作'''
df.T
#DataFrame.sort(columns=None,axis=0,ascending=True),其中axis=0為預設值，按照index行對資料進行排序，當axis取1時按照列的名字進行排序。不適用與python3
df.sort_index(ascending=False)#ascending=false是降序，=true是升序
#df.sort_values(ascending=True)#？？？

df.rank(axis=0)#預設都是升序，返回的是排名次序,axis=0是每列中的資料進行排序
df.rank(axis=1,ascending=False)#axis=1是指每行的資料新型排序
#%%
'''增加行或者列'''
s2=pd.Series([1,2,3,4,5,6],index=pd.date_range('20160102',periods=6))
print(s2)
df['E']=s2
print(df)#增加一列自動匹配行號

#合併操作---橫向
df=df[list('abcd')]
df1=pd.concat([df,s2],axis=1)
print(df1)

#%%
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'f']})    
print(df)
#如果是一個序列或者陣列，
#那麼判斷該位置的值，是否在整個序列或者陣列中
df.isin([1, 3, 12, 'a'])    
#%%
df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 4, 7]})
#如果是一個dirt，
#那麼就會首先判斷對應的index是否存在，
#如果存在，那麼就會判斷對應的位置，在該列是否存在
df.isin({'A': [1, 3], 'B': [4, 7, 12]})#判斷in，並且是字典形勢的
~df.isin({'A': [1, 3], 'B': [4, 7, 12]})#~判斷not in
#%%
df = pd.DataFrame([[1,2,3],[1,3,4],[2,4,3]],index = ['one','two','three'],columns = ['A','B','C'])  
print(df)
mask = df['A'].isin([1]) #括號中必須為list  
print(mask)
print(df[mask])#生成一個dataframe只選擇A列中值為1的行留下來，也可以寫成df1=df[df['A'],isin([1])],df1是一個dataframe

#%%
import pandas as pd  
df = pd.DataFrame([[1,2,3],[2,3,4],[2,4,3],[1,3,7]],  
                  index = ['one','two','three','four'],columns = ['A','B','C'])  
print(df)  
df.sort_values(by=['A','B'],ascending=[0,1],inplace=True)#A為主排序，B為次排序，ascending是反轉的意思，0是true，1是false
print(df) 

#%%
'''list使用規則'''
list = [ 'abcd', 786 , 2.23, 'runoob', 70.2 ]
tinylist = [123, 'runoob']
print (list)            # 輸出完整列表
print (list[0])         # 輸出列表第一個元素
print (list[1:3])       # 從第二個開始輸出到第三個元素
print (list[2:])        # 輸出從第三個元素開始的所有元素
print (tinylist * 2)    # 輸出兩次列表
print (list + tinylist) # 連線列表
list.append('acd')#append 追加元素到末尾
list.insert(1,'jack')#在1處插入jack
list.pop()#刪除list末尾元素,pop(i)刪除指定元素
list[1]='jenny'#直接替換在1處的元素
#list元素也可以是另一個list
#%%
'''dict使用規則
使用鍵-值（key-value）儲存'''
d={'Michael': 95, 'Bob': 75, 'Tracy': 85}
print(d['Michael'])#查詢key對應的value
d['Jack']=65#通過key放入值，一個key只可以存一個值
print(d)
print('thomas' in d)#檢驗thomas是否在key中
d.pop('Bob')#刪除一個key對應的value也會刪除
#%%
'''Dataframe修改列名'''
Df.rename(columns={'A':'a','B':'b','C':'c'},inplace=True)
#%%
'''獲取dataframe 的行數，列數'''
df.shape[0]#行數
df.shape[1]#列數
#%%
'''寫入csv'''
increase_df.to_csv("C:/Users/fei/Desktop/increase.csv",index=False,sep=',')

pandas 提取某幾列_Pandas使用筆記隨筆

技術標籤：pandas 提取某幾列 \'\'\'pandas使用規則\'\'\' import pandas as pd import numpy as np

Python 取numpy陣列的某幾行某幾列方法

直接分析，如原矩陣如下（1）：（1）我們要擷取的矩陣（取其一三行，和三四列資料構成矩陣）為如下（2）：

python 用 read_csv讀取資料集時刪除某幾列元素

技術標籤：pythonpython 首先用把所有的資料讀進來並轉換成列表的形式。讀進來的資料格式為列表套列表。

help-excel統計某幾列之和/以行為單位並存入列表

import xlrd import numpy as np import matplotlib.pyplot as plt import pandas as pd \'\'\' # 設定行名稱，第11行為欄位名稱

pandas按行按列遍歷Dataframe的幾種方式

遍歷資料有以下三種方法：簡單對上面三種方法進行說明： iterrows(): 按行遍歷，將DataFrame的每一行迭代為(index,Series)對，可以通過row[name]對元素進行訪問。

使用Java Stream，提取集合中的某一列/按條件過濾集合/求和/最大值/最小值/平均值

不得不說，使用Java Stream操作集合實在是太好用了，不過最近在觀察生產環境錯誤日誌時，發現偶爾會出現以下2個異常：

pandas按照列的值排序(某一列或者多列)

按照某一列排序 d = {\'A\': [3,6,7,9],\'B\': [2,5,8,0]} df = pd.DataFrame(data=d) print(\'排序前:\\n\',df)

python 如何提取多個excel表中的某行/列資料做合併

技術標籤：Pythonpython大資料首先把所有要提取資料的excel放置到同一個目錄資料夾下

11.pandas獲取EXCEL某一行某一列資料，組合成二維陣列，再寫入excel

1def openxls(self): 2\'\'\'獲取第一個sheet的資料\'\'\' 3df = pd.read_excel(self.filepath, sheet_name=0)

linux中awk命令連續提取檔案的前幾列、中間若干列，後幾列資料

1、測試資料 root@PC1:/home/test2# ls a.txt root@PC1:/home/test2# cat a.txt 01 02 03 04 05 06 07 08 09 10

用Linq從一個集合選取幾列得到一個新的集合(可改列名)

用Linq從一個集合選取幾列得到一個新的集合-可改列名以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Mysql將一個表中的某一列資料複製到另一個表中某一列裡的方法

mysql複製表中的一列到另一個表中有時候，我們需要複製某個欄位一整列的資料到另外一個新的欄位中，這很簡單，SQL可以這麼寫：

如何更改 pandas dataframe 中兩列的位置

如何更改 pandas dataframe 中兩列的位置：把其中的某列移到第一列的位置。原來的 df 是：

修改Pandas的行或列的名字(重新命名)

pandas.DataFrame.rename 使用函式：DataFrame.rename(mapper=None,index=None,columns=None,axis=None,copy=True,inplace=False,level=None)

Python實現隨機取一個矩陣陣列的某幾行

廢話不多說了，直接上程式碼吧！ import numpy as np array = np.array([0,0]) for i in range(10):

python資料處理之如何選取csv檔案中某幾行的資料

前言有些人看到這個問題覺得不是問題，是嘛，不就是df.col[]函式嘛，其實忽略了一個重點，那就是我們要省去把csv檔案全部讀取這個過程，因為如果在面臨億萬級別的大規模資料，得到的結果就是boom，boom，boom。

C#中獲取DataTable某一列的值轉換為集合

1、直接使用 List<int> lstID = (from d in dt.AsEnumerable() select d.Field<int>(\"ID\")).ToList();

Python 實現將某一列設定為str型別

方法一：讀取檔案時設定程式碼如下： Data = pd.read_excel(level_path,sheet_name=0,encoding=\'gbk\',dtype={\'時間\': \'str\'})

ElementUI的el-table怎樣隱藏某一列

場景使用el-table進行資料的展示時，某些列不需要展示，但是需要其存在。比如查詢資料時要獲取物件的ID屬性，在展示時不需要展示ID這一列，

Easyui datagrid 行編輯時某一列失去焦點時觸發事件（列型別為combobox）

//datagrid初始化 $(\'#dg\').datagrid({ nowrap: false, striped: true, border: false, collapsible: false, //是否可摺疊的

pandas 提取某幾列_Pandas使用筆記隨筆

相關推薦