DataFrame的一些常用運算

阿新 • • 發佈：2021-10-11

DataFrame的算術運算

當物件相加時，如果存在某個索引對不相同，則返回結果的索引將是索引對的並集。這個特性類似於資料庫操作中，對索引標籤的自動外連線（outer join），不重疊的位置將出現NA值

In [4]: df1 = pd.DataFrame(np.arange(9.).reshape((3, 3)),columns=list('bcd'), index=['Ohio', 'Texas'
   ...: , 'Colorado'])

In [5]: df2 = pd.DataFrame(np.arange(12.).reshape((4, 3)),columns=list('bde'), index=['Utah', 'Ohio'
   ...: , 'Texas', 'Oregon'])

In [6]: df1
Out[6]: 
            b    c    d
Ohio      0.0  1.0  2.0
Texas     3.0  4.0  5.0
Colorado  6.0  7.0  8.0

In [7]: df2
Out[7]: 
          b     d     e
Utah    0.0   1.0   2.0
Ohio    3.0   4.0   5.0
Texas   6.0   7.0   8.0
Oregon  9.0  10.0  11.0

In [8]: df1 + df2
Out[8]: 
            b   c     d   e
Colorado  NaN NaN   NaN NaN
Ohio      3.0 NaN   6.0 NaN
Oregon    NaN NaN   NaN NaN
Texas     9.0 NaN  12.0 NaN
Utah      NaN NaN   NaN NaN

按行或列索引進行字典型排序，可以使用sort_index，返回一個新的、排序好的物件。注意sort_index排序的是索引，而不是內容

In [15]: obj = pd.DataFrame(np.arange(8).reshape((2, 4)), index=['three', 'one
    ...: '], columns=['d', 'a', 'b', 'c'])

In [16]: obj
Out[16]: 
       d  a  b  c
three  0  1  2  3
one    4  5  6  7

In [17]: obj.sort_index()
Out[17]: 
       d  a  b  c
one    4  5  6  7
three  0  1  2  3

In [18]: obj.sort_index(axis=1)
Out[18]: 
       a  b  c  d
three  1  2  3  0
one    5  6  7  4

按內容來排序列，使用sort_values，需要使用by來指定按哪一列排序

In [20]: obj.sort_values(by='b')
Out[20]: 
       d  a  b  c
three  0  1  2  3
one    4  5  6  7

In [21]: obj.sort_values(by='b', ascending=False)
Out[21]: 
       d  a  b  c
one    4  5  6  7
three  0  1  2  3

DataFrame的交併補集

In [3]: data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'], 'year':
   ...:  [2000, 2001, 2002, 2001, 2002], 'pop': [1.5, 1.7, 3.6, 2.4, 3.9]}

In [4]: data
Out[4]: 
{'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
 'year': [2000, 2001, 2002, 2001, 2002],
 'pop': [1.5, 1.7, 3.6, 2.4, 3.9]}

In [5]: df1 = pd.DataFrame(data)

In [6]: df1
Out[6]: 
    state  year  pop
0    Ohio  2000  1.5
1    Ohio  2001  1.7
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Nevada  2002  3.9

In [11]: data1 = {'state': ['Ohio1', 'Ohio1', 'Ohio', 'Nevada1', 'Nevada1'], 'year': [2000, 2021
    ...: , 2022, 2021, 2002], 'pop': [1.5, 1.7, 3.6, 2.4, 3.9]}

In [12]: df2 = pd.DataFrame(data1)
  
In [14]: df2
Out[14]: 
     state  year  pop
0    Ohio1  2000  1.5
1    Ohio1  2021  1.7
2     Ohio  2022  3.6
3  Nevada1  2021  2.4
4  Nevada1  2002  3.9

交集

In [22]: pd.merge(df1, df2, how='inner')
Out[22]: 
  state  year  pop
0  Ohio  2002  3.6

並集

In [16]: pd.merge(df1, df2, how='outer')
Out[16]: 
     state  year  pop
0     Ohio  2000  1.5
1     Ohio  2001  1.7
2     Ohio  2002  3.6
3   Nevada  2001  2.4
4   Nevada  2002  3.9
5    Ohio1  2000  1.5
6    Ohio1  2021  1.7
7     Ohio  2022  3.6
8  Nevada1  2021  2.4
9  Nevada1  2002  3.9

DataFrame的布林索引

從某一列中找到值大於2的項

In [23]: df1
Out[23]: 
    state  year  pop
0    Ohio  2000  1.5
1    Ohio  2001  1.7
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Nevada  2002  3.9

In [24]: df1[df1['pop'] > 2]
Out[24]: 
    state  year  pop
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Nevada  2002  3.9

# 可以使用邏輯運算
In [27]: df1[(df1['pop'] > 2) & (df1['year'] > 2001)]
Out[27]: 
    state  year  pop
2    Ohio  2002  3.6
4  Nevada  2002  3.9

時來天地皆同力，運去英雄不自由。

DataFrame的一些常用運算

DataFrame的算術運算當物件相加時，如果存在某個索引對不相同，則返回結果的索引將是索引對的並集。這個特性類似於資料庫操作中，對索引標籤的自動外連線（outer join），不重疊的位置將出現NA值

oracle中的一些常用函式及示例

前言學習oracle也有一段時間了，發現oracle中的函式好多，對於做後臺的程式猿來說，大把大把的時間還要學習很多其他的新東西，再把這些函式也都記住是不太現實的，所以總結了一下oracle中的一些常用函式及示例，一是

JS操作Fckeditor的一些常用方法(獲取、插入等)

javascript獲取和設定FCKeditor內容利用Javascript取和設FCKeditor值也是非常容易的，如下：

Linux下如何退出vim的一些常用命令總結

1、儲存並退出 linux下安裝好了vim以及gcc後，我們開始新建一個c檔案，例如： vim test.c

linux下啟用組播轉發的方法與一些常用狀態檢查命令

總所周知,Linux 伺服器是可以作為一臺路由器使用,不僅僅是可以轉發單播資料包,同事也可以轉發組播資料包.但是多數同學卻不知道如何配置.本文將介紹將Linux配置成組播轉發路由器的方法做一個分享.

記錄一些常用的知識點吧

1、js前端頁面獲取後臺返回的list集合 var topupList = ViewBag.TopupList; function TopupPage(pageIndex){

VScode的一些常用快捷鍵

複製 ctrl+c —— 複製當前行 ctrl+shift+u —— 向上複製行 ctrl+shift+d —— 向下複製行

關於樹狀結構資料的一些常用處理,比如找所有父級和子級，一維陣列轉無限級樹狀結構

樹狀結構資料在日常開發是最經常遇到的資料，比如一些後臺管理系統左側選單就是一個樹狀結構的資料，這些資料的特點有，可以無限的子節點，父級與子級一般會存在上級關係，比如子級的屬性會有父級的唯一標識id,我這裡

JS中使用正則表示式封裝的一些常用的格式驗證的方法-是否外部url、是否小寫、郵箱格式、是否字元、是否陣列

場景在vue頁面中需要對一些變數或者屬性進行判斷等。所以講這些js方法抽離出來一個公共的驗證的方法。

UINavigationController 層級關係及一些常用設定

UINavigationController一直是iOS開發中最常用的控制元件之一，但是一般就是工程開始時對其做一些統一的處理。後期操作就比較少了。導致雖然其很常用但是我們的熟悉程度卻不是很高。今天就來記錄一下我們常用的這個控

一些常用但是不好記的css樣式

設定滾動條樣式 /*定義滾動條寬高及背景，寬高分別對應橫豎滾動條的尺寸*/ ::-webkit-scrollbar {

一些常用的ngx_http_core_module介紹

alias path alias path: 路徑別名,，文件對映的另一種機制；僅能用於location上下文 Syntax:alias path;

Liunx一些常用的命令

通過systemctl管理服務 systemd這個啟動服務的機制,主要是通過名為systemctl的指令來處理

連結串列問題一些常用的套路與方法

概述連結串列問題應該是資料結構中比較基礎的一類問題，但同時也是在面試中常考的一類問題。但是圍繞連結串列問題的一些基本方法或者處理思想，也無外乎那幾類，因此本文嘗試對連結串列常用的一些方法或者套路進行總

Windows cmd開啟方式和一些常用doc命令：cd、刪除建立資料夾等

cmd開啟方式開始+系統+命令提示符 win鍵+R 輸入cmd開啟控制檯（推薦使用）在任意的資料夾下面，按住shift鍵+滑鼠右鍵點選,在此處開啟cmd

MySQL一些常用的高階SQL語句（集合）

MySQL一些常用的高階SQL語句一、按關鍵字排序二、對結果進行分組三、限制結果條目

寫了一些常用的Swagger註解和其引數tags就可以省略屬性名

一初識 Swagger 跳過鋪墊，請直接翻越到第二大點 ~ (一) 先談談前後端分離在最早的 JavaWeb 時代的時候，如果想要返回一個頁面，你需要一行一行的去 print，如果遇到變數，還需要自己進行字串的拼接

Oracle - 分享一些常用函式

1. 判斷函式 --當欄位或欄位的運算的值等於值1時返回返回值1，當欄位或欄位的運算的值等於值二時返回返回值2...當條件都不滿足時返回預設值

關於繼承的一些特性介紹和一些常用API

今日內容 Arrays類 Math類三大特性-繼承 super關鍵字 Arrays類　　java.util.Arrays中的類，此類主要是用來運算元組，裡面提供了很多api方法，如：【排序】和【搜尋】功能。所有的方法均為靜態方法，呼叫起來非常

golang一些常用的靜態檢查工具詳解

一、背景俗話說，工欲善其事，必先利其器。go 作為一個對基礎功能封裝非常好的語言，對編碼體驗，如何更高效地寫出高效能程式碼，都是考慮非常好的。因此，如何能夠寫出更美觀、更安全的golang程式碼，也是我們需要

DataFrame的一些常用運算

DataFrame的算術運算

DataFrame的交併補集

DataFrame的布林索引

相關推薦