pandas_cookbook學習（二）

阿新 • • 發佈：2018-11-14

選擇資料

dataframes

> df = pd.DataFrame(
   ....:      {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df
	AAA	BBB	CCC
0	4	10	100
1	5	20	50
2	6	30	-30
3	7	40	-50

#設定兩個“或”條件篩選資料
> df[(df.AAA > 5) | (df.index.isin([0, 2]))]
	AAA	BBB	CCC
0	4	10	100
2	6	30	-30
3	7	40	-50

#使用~表示“非”，注意書寫是全非還是部分非 

#下面是一個部分非的例子
> df[~(df.AAA > 5) & (df.index.isin([0, 2, 4]))]
	AAA	BBB	CCC
0	4	10	100

df.loc的方法已經比較熟練，不再贅述。

面板資料

# 可能會報錯：panel將在未來的版本里棄用。不影響使用
# 三個時間序列資料組成了面板資料
> rng = pd.date_range('1/1/2013',periods=100,freq='D')
> data = np.random.randn(100, 4)
> cols = ['A','B','C','D']
> df1, 
 df2, df3 = pd.DataFrame(data, rng, cols), pd.DataFrame(data, rng, cols), pd.DataFrame(data, rng, cols)
> pf = pd.Panel({'df1':df1,'df2':df2,'df3':df3});pf
<class 'pandas.core.panel.Panel'>
Dimensions: 3 (items) x 100 (major_axis) x 4 (minor_axis)
Items axis: df1 to df3
Major_axis axis: 2013-01 
-01 00:00:00 to 2013-04-10 00:00:00
Minor_axis axis: A to D

> pf.loc[:,:,'F'] = pd.DataFrame(data, rng, cols);pf
<class 'pandas.core.panel.Panel'>
Dimensions: 3 (items) x 100 (major_axis) x 5 (minor_axis)
Items axis: df1 to df3
Major_axis axis: 2013-01-01 00:00:00 to 2013-04-10 00:00:00
Minor_axis axis: A to F

> pf['df3']
	A	B	C	D	F
2013-01-01	-0.321314	-1.264130	-0.701352	-0.097620	NaN
2013-01-02	-0.798209	0.767679	0.073943	-1.692146	NaN
2013-01-03	0.927847	0.555940	0.590923	0.350158	NaN
2013-01-04	-0.042397	-1.003914	0.952686	-0.911484	NaN

生成新列

> df = pd.DataFrame(
   ....:      {'AAA' : [1,2,1,3], 'BBB' : [1,1,2,2], 'CCC' : [2,1,3,1]}); df
AAA	BBB	CCC
0	1	1	2
1	2	1	1
2	1	2	3
3	3	2	1

> source_cols = df.columns
> new_cols = [str(x) + "_cat" for x in source_cols]
> categories = {1 : 'Alpha', 2 : 'Beta', 3 : 'Charlie' }
> df[new_cols] = df[source_cols].applymap(categories.get);df
	AAA	BBB	CCC	AAA_cat	BBB_cat	CCC_cat
0	1	1	2	Alpha	Alpha	Beta
1	2	1	1	Beta	Alpha	Alpha
2	1	2	3	Alpha	Beta	Charlie
3	3	2	1	Charlie	Beta	Alpha

> df = pd.DataFrame(
   ....:      {'AAA' : [1,1,1,2,2,2,3,3], 'BBB' : [2,1,3,4,5,1,2,3]}); df
	AAA	BBB
0	1	2
1	1	1
2	1	3
3	2	4
4	2	5
5	2	1
6	3	2
7	3	3

#按AAA分組並找出每組中對應BBB的最小值的索引值
> df.loc[df.groupby("AAA")["BBB"].idxmin()]
	AAA	BBB
1	1	1
5	2	1
6	3	2
#另一種方法：
> df.sort_values(by="BBB").groupby("AAA", as_index=False).first()
	AAA	BBB
0	1	1
1	2	1
2	3	2

pandas_cookbook學習（二）

選擇資料 dataframes > df = pd.DataFrame( ....: {'AAA' : [4,5,6,7], 'BBB' : [10,20,30,40],'CCC' : [100,50,-30,-50]}); df AAA BBB CCC

爬蟲庫之BeautifulSoup學習（二）

不必要 baidu html left 官方 blank 正則文本處理比較 BeautifulSoup官方介紹文檔：https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html 四大對象種

cocos2dx 3.1從零學習（二）——菜單、場景切換、場景傳值

天空 ptr select 特效 new 要點綁定使用 water 回想一下上一篇的內容，我們已經學會了創建一個新的場景scene，加入sprite和label到層中。掌握了定時事件schedule。我們能夠順利的寫出打飛機的主場景框架。上一篇的內容我練習了七個新

redis學習（二）——String數據類型

字符串類型創建復雜度 back nbsp 命令時間復雜度 value con 一、概述字符串類型是Redis中最為基礎的數據存儲類型，它在Redis中是二進制安全的，這便意味著該類型可以接受任何格式的數據，如JPEG圖像數據或Json對象描述信息等。在R

Linux 網卡驅動學習（二）（網絡驅動接口小結）

-a key 頻率網絡上網 ren 網絡設備 ews 入口【摘要】前文我們分析了一個虛擬硬件的網絡驅動樣例。從中我們看到了網絡設備的一些接口。事實上網絡設備驅動和塊設備驅動的功能比較相似，都是發送和接收數據包（數據請求）。當然它們實際是有非常多不同

ext2文件系統學習（二）—— 目錄磁盤結構

echo free 文件格式 htm file 目錄結構 bitmap 點號 name 創建鏡像、mount等操作和上一篇一樣，測試目錄結構如下：一些文件系統信息如下： Block size: 1024 Inodes per group: 1

RabbitMQ學習（二）工作隊列

lose borde 阻塞 lpad mes getc actor 使用處理 1.工作隊列（Work Queue）又叫任務隊列（Task Queue）指將任務分發個多個消費者。 2.實際操作：這裏使用一個生產者產生多條數據提供給3個消費者

JAVA學習（二） String使用equals方法和==分別比較的是什麽？（轉）

找到基礎上 stirng print 大小 obj lis 分配 ret String使用的equals方法和==的區別 equals方法和==的區別首先大家知道，String既可以作為一個對象來使用，又可以作為一個基本類型來使用。這裏指的作為一個基本類型來使用只是

CSS學習（二）

種類 round align 圖片單獨 tom -s 中控 vertical 列表在HTML中，有兩種類型的列表：無序列表 - 列表項標記用特殊圖形（如小黑點、小方框等）有序列表 - 列表項的標記有數字或字母使用CSS，可以列出進一步的樣式，

Struts2學習（二）運行Action中方法的三種方式

tracking 利用 content con return -m i++ var itl 1.運行execute()方法一般的能夠直接在action中書寫execute,調用action時會自己主動運行此方法 2.配置method方法在s

python 命令行參數學習（二）

Coding odi increase logs 說明 code des urn 數學照著例子看看打打，碼了就會。寫了個命令行參數調用進行運算的腳本。參考文章鏈接：http://www.jianshu.com/p/a50aead61319 #-*-coding:utf

【轉】JMeter學習（二）錄制腳本

使用 get 運行喜歡錄制完成帶來免費 sdn title ---------------------------------------------------------------------------------------------------- 環境

算法學習（二）

要求 print 位數 div 輸入數據 class bsp arrays 變量 1.Sum of digits 說明：1.第一行包含要處理的值的數量;　　　2.然後N行將會描述這些數字的值應該是由3個整數A、B、C來計算的;　　　3.對於每一種情況，你需要將A乘以B，然後

SpringMVC源代碼學習（二）FrameworkServlet內處理請求的流程

重新 tex events ... resp star 方便沒有 isp 以下內容基於書：《看透SpringMVC-源代碼分析與實踐》基本照搬。。。用於自己查閱備忘。先看一眼DispatcherServlet繼承樹我們知道servlet處理方法都是通過HttpSer

Linux學習（二）之內核、系統調用、庫

all mic linu windows系統文件 .dll 執行 lin win 　　這篇博客主要介紹Linux中幾個常見的概念　　　　Kernal：內核：我們知道計算機的硬件包括：cpu、內存、外存等等系統想要統一資源分配就需要用到內核！內核是將計算機的硬件資源抽

JS學習（二）

round 進入跳過 color ole back ++ 代碼 define JS中的循環結構【循環結構的執行步驟】 1、聲明循環變量； 2、判斷循環條件； 3、執行循環體操作； 4、更新循環變量；然後，循環執行2~4，知道條件不成立

linux學習（二）——湯哥的推薦書籍

最終對比 2.6 win 程序開發經驗專業 linux 操作面試題目成為一名精通 Linux程序設計的高級程序員一直是不少朋友孜孜以求的目標。根據中華英才網統計數據，北京地區 Linux 程序員月薪平均為 Windows程序員的 1.8 倍、Java 程序員

Unity3D學習（二）：使用JSON進行對象數據的存儲讀取

進行存儲路徑新的 del jpg cati spa 全局變量 .net 前言前段時間完成了自己的小遊戲Konster的制作,今天重新又看了下代碼。原先對關卡解鎖數據的存儲時用了Unity自帶的PlayerPref（字典式存儲數據）。讀取關卡數據的代碼： voi

Spring Boot學習（二）

div 自動 blog release width spring figure 學習 toc 基於Spring Boot創建的maven項目 1、application.properties或者application.yml：全局配置文件作用：主要用來配置數據庫連接、日

設計模式學習（二）“觀察者模式” （C#）

original pan 學習筆記 pri 接口 program date contain 兩個《深入淺出設計模式》學習筆記第二章需求：開發一套氣象監測應用，如圖：氣象站，目前有三種裝置，溫度、濕度和氣壓感應裝置。 WeatherData對象追蹤氣象站的數據，並更

pandas_cookbook學習（二）

選擇資料

dataframes

面板資料

生成新列

相關推薦