Pandas庫初步學習筆記【Ⅰ】

阿新 • • 發佈：2018-12-09

Pandas庫初步學習筆記

DataFrame中橫行叫index,豎行叫columns。

class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)[source]

pandas以類似字典的方式來獲取某一列的值，比如df[‘A’]，這會得到df的A列，其中’A’相當於key。如果我們對某一行感興趣呢？這個時候有兩種方法，一種是loc方法，另一種方法是iloc方法。loc是指location的意思，iloc中的i是指integer。前者按照索引即index選取，後者按照位置進行選取,二三行程式碼返回結果相同。
```
s = pd.Series(np.array(['I','Love','Data']),index=list('ABC'))
s.iloc[0] # 按照位置選取
s.loc['A']# 按照索引選取
s.iloc[0,0] # 選取第一行的第一個元素
```

一些常用的操作

df.dropna() # 移除資料框 DataFrame 中包含空值的行
df.dropna(axis=1) # 移除資料框 DataFrame 中包含空值的列
df.fillna(x) # 將資料框 DataFrame 中的所有空值替換為 x
s.replace(1,'one') # 將陣列(Series)中的所有1替換為'one' 

s.replace([1,3],['one','three']) # 將陣列(Series)中所有的1替換為'one', 所有的3替換為'three'
s.astype(float) # 將陣列(Series)的格式轉化為浮點數
df.rename(columns=lambda x: x + 2) # 將全體列的名字加上2
df.rename(columns={'old_name': 'new_ name'}) # 將選擇的列重新命名
df[(df[col] > 0.5) & (df[col] < 0.7)] # 選取資料框df中對應行的數值大於0.5，並且小於0.7的全部列，作用是篩選出某幾行。

在進行排序時，只能根據某一行或者某一列大小關係為基準進行排序，如果有多行或多列，則表示優先順序。
```
df = pd.DataFrame(np.random.rand(10,5),columns=list('ABCDE'))
df.sort_values(['A','E'],ascending=[True,False])#按照A列的升序進行排列
```
利用groupby對資料進行分組操作，返回值是DataFrameGroupBy型別，只有在呼叫的時候才會進行計算，不能用values展示

apply函式用來利用各種函式對資料框進行各種操作。

df = pd.DataFrame(np.random.rand(10,5),columns=list('ABCDE'))   
df.apply(np.mean)#對各列進行求平均操作
df.apply(np.max,axis=1) # 對資料框df的每一行求最大值

資料的連線(join)和組合(combine),預設是加入行，可以通過控制index和axis來控制連線的模式，預設的值為NaN。

df1.append(df2)#在資料框df2的末尾新增資料框df1，其中df1和df2的列數應該相等
pd.concat([df1, df2],axis=1) # 在資料框df1的列最後新增資料框df2,其中df1和df2的行數應該相等

第二行程式碼示例

通過apply函式利用numpy的函式可以對dataframe進行陣列相關的操作。有些操作dataframe也自帶。
```
df.apply(np.mean) # 對資料框df的每一列求平均值
df.mean() # 得到資料框df中每一列的平均值
```

Pandas庫初步學習筆記【Ⅰ】

Pandas庫初步學習筆記 DataFrame中橫行叫index,豎行叫columns。 class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

python pandas庫的學習筆記一pandas的資料結構

要使用pandas，首先要熟悉他的兩個主要的資料結構：Series和DataFrame。一、Series Series 是一種類似於一維陣列的物件，由一組資料（各種numpy資料型別）以及一組與之相關的資料標籤（即索引）組成。僅由一組資料即可產生最簡單的Series

【Python爬蟲學習筆記2】urllib庫的基本使用

代理服務 cor proc 技術 origin car windows tpc -c urllib庫是python內置的實現HTTP請求的基本庫，通過它可以模擬瀏覽器的行為，向指定的服務器發送一個請求，並保存服務器返回的數據。 urlopen函數函數原型：urlopen(

【複雜網路】複雜網路分析庫NetworkX學習筆記（4）：統計指標計算

無論是實際網路還是對模型網路進行分析，都離不開對網路拓撲統計指標的計算。反映網路結構與動力學特性的統計指標有很多，Costa等的Characterization of Complex Networks: A Survey of measurements一文對此有全面的綜述，本文僅介紹一些常用的統計指

【Python學習筆記2】turtle庫繪相簿使用

5.in[‘C’,’c’]保留字，二元關係操作，符合右側即為真， 6.print（“這裡輸入文字：%.2fF”%f）表示二位小數的浮點數，%f表示輸出的是f的值。 7.迴圈 for i in range (10): 執行 8.

【機器學習筆記29】Pandas常用方法備註（補充）

""" 1. Series 是Pandas兩種基本資料結構之一，表徵一維資料 """ so = pd.Series(range(0, 10)) print(so[0:2]) print(so.head(2)) print(so.tail(2)) print(s

【canvas學習筆記一】基本認識

基本認識設置 supported eight -c 失真 ont 之前上下 <canvas>標簽定義了一塊畫布，畫布可以在網頁中繪制2D和3D圖象，現在先學習如何繪制2D圖象，繪制3D圖象屬於WebGL的內容（也就是網頁版的OpenGL，3D圖形接口）。屬

通過編譯函數庫來學習GCC【轉】

說了代碼段必須 () com 意義同進程變量主程轉自：http://blog.csdn.net/u012365926/article/details/51446295 基本概念什麽是庫在windows平臺和linux平臺下都大量存在著庫。本質上

TDD學習筆記【六】一Unit Test - Stub, Mock, Fake 簡介

-i moc load customers eight foreach 存在執行 repo 這篇文章簡介一下，如何通過 mock framework，來輔助我們更便利地模擬目標對象的依賴對象，而不必手工敲堆只為了這次測試而存在的輔助類型。而模擬目標對象的部分，常見的有

Spring Cloud學習筆記【篇一：分布式配置中心 Spring Colud Config】

16px gin war imp web項目 tps conf name request 一、簡介 Spring Cloud Config提供了在分布式系統的外部配置的客戶端支持。通過配置服務（Config Server）來為所有的環境和應用提供外部配置的集中管理。這些概念

Docker學習筆記【三】安裝Redis

art port 再次 dock 使用 contain bash Go red 項目中使用到Redis，平常都是別人搭建的，今天試著在Google Cloud Platform 上搭建一個學習環境。 1.使用 docker pull redis 從docker hub中下載

system generator學習筆記【01】

分享基本功 hle ima 安裝分享圖片 use 內容整理 blank 作者：桂。時間：2018-05-18 18:26:50 鏈接：http://www.cnblogs.com/xingshansi/p/9045914.html 前言學習使用s

響應式布局學習筆記【1】----基礎知識

網頁設計 water com 文章 tar 屏幕分辨率優點 light gin 本篇文章主要解決：什麽是響應式布局？有什麽優點和缺點？一什麽是響應式布局？伊桑·馬科特（Ethan Marcotte）在2010年首先提出了響應式網頁設計（RWD,Responsive

【多線程學習筆記整理】001_多線程技能

current string exception 引入 ktr cpu implement interrupt 構造一.線程和進程的區別　　首先我們引入百科上對進程的解釋　　　　進程粗暴一點的理解可以理解為一個程序，每個進程都有自己的內存空間，用戶每啟動一個進程，操

【Python爬蟲學習筆記10】多線程中的生產者消費者模式

其中因此問題共享 and 生產者消費者模式共享問題由於接下來在多線程編程中，最經典的模式是生產者消費者模式。其中，生產者是專門用來生產數據的線程，它把數據存放在一個中間變量中；而消費者則從這個中間變量取出數據進行消費。由於生產者和消費者共享中間變量，這些變量大

Grunt學習筆記【3】---- filter詳解

add 行處理 class 一個特殊 col filter詳解很多 https 本文主要講配置任務中的filter，包括使用默認fs.Stats方法名和自定義過濾函數。通過設置filter屬性可以實現一些特殊處理邏輯。例如：要清理某個文件夾下的所有空文件夾，這時使用c

【mysql學習筆記整理】

結束 ant 出現次數 varchar 移動 desc cal direct 指定 /*mysql學習筆記整理*/ /*常用的數據庫操作對象*/ #庫的操作#創建#數據庫的創建USE mysql;CREATE DATABASE db_x;#刪除#刪除數據庫DROP

Tomcat學習筆記【1】--- WEB服務器、JavaEE、Tomcat背景

javascrip http .cn 目的 java log 進行瀏覽器靜態資源本文主要講學習Tomcat需要知道的基礎知識。一 Web服務器 Web服務器可以解析HTTP協議。當Web服務器接收到一個HTTP請求,會返回一個HTTP響應,例如送回一個HTML頁面。

Python學習筆記【Supervisor】：使用Supervisor監控Tornado程序

Linux常見應用服務配置模式nginx和supervisor：採用主配置檔案+專案配置檔案安裝（如果使用pip安裝注意看是否需要指定使用python2版本）第一步：在Linux中使用apt-get 指令安裝 sudo apt-get install supervisor

Python學習筆記【Nginx】：Nginx使用與完全解除安裝

安裝與啟動nginx 第一步：通過指令安裝包 sudo apt install nginx sudo apt install nginx 第二步：安裝成功後檢視相關配置檔案 ls /etc/nginx/ 在這裡主要是 conf.d

Pandas庫初步學習筆記【Ⅰ】

Pandas庫初步學習筆記

相關推薦