Pandas筆記（三）

阿新 • • 發佈：2022-02-05

本文介紹資料的分組groupby和排列sort，
資料以上一篇所介紹的wine資料為例

groupby

參考：https://zhuanlan.zhihu.com/p/101284491
以taster_twitter_handle建立一個分組並按照每個taster_twitter_handle的名稱建立一個統計個數的Series：

group_by_taster_twitter_handle = reviews.groupby('taster_twitter_handle')
reviews_written = group_by_taster_twitter_handle.taster_twitter_handle.count()
print(reviews_written)

以price建立分組並按照從小到大排序，值為其評分

best_rating_per_price = reviews.groupby('price')['points'].max().sort_index()

建立一個基於country和variety的複合分組：

country_variety = reviews.groupby(['country', 'variety'])

agg聚合資料：
將資料按照variety分組並建立基於points資料的最小，最大列：

price_extremes = reviews.groupby('variety').price.agg([min,max])

結果：

              min    max
variety                 
Abouriou     15.0   75.0
Agiorgitiko  10.0   66.0
Aglianico     6.0  180.0
Aidani       27.0   27.0
Airen         8.0   10.0
...           ...    ...
Zinfandel     5.0  100.0
Zlahtina     13.0   16.0
Zweigelt      9.0   70.0
Çalkarası    19.0   19.0
Žilavka      15.0   15.0
[707 rows x 2 columns]

sort

參考：https://www.yiibai.com/pandas/python_pandas_sorting.html
Pandas有兩種排序方式，它們分別是按標籤sort_index和按實際值sort_values
sort_index
使用sort_index()方法，通過傳遞axis引數和排序順序，可以對DataFrame進行排序。預設情況下，按照升序對行標籤進行排序。通過傳遞axis引數值為0或1，可以對列標籤進行排序。預設情況下，axis = 0，逐行排列。

import pandas as pd
import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])
sorted_df=unsorted_df.sort_index(axis=1)
print (sorted_df)

sort_values
像索引排序一樣，sort_values()是按值排序的方法。它接受一個by引數，它將使用要與其排序值的DataFrame的列名稱。

import pandas as pd
import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})
sorted_df = unsorted_df.sort_values(by='col1')

sort_values()提供了從mergeesort，heapsort和quicksort中選擇演算法的一個配置。Mergesort是唯一穩定的演算法。

import pandas as pd
import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})
sorted_df = unsorted_df.sort_values(by='col1' ,kind='mergesort')

Pandas筆記（三）

本文介紹資料的分組groupby和排列sort，資料以上一篇所介紹的wine資料為例 groupby

伯陽的網路筆記（三）：HTTP/2

因為疫情期間在外當志願者，晚上回家無聊翻翻網路知識，權當記錄了。初始動筆：2019-02-06

MySQL高階學習筆記（三）：Mysql邏輯架構介紹、mysql儲存引擎詳解

Mysql邏輯架構介紹總體概覽和其它資料庫相比，MySQL有點與眾不同，它的架構可以在多種不同場景中應用併發揮良好作用。主要體現在儲存引擎的架構上，外掛式的儲存引擎架構將查詢處理和其它的系統任務以及資料的儲存提

Spark學習筆記（三）-Spark Streaming

Spark Streaming支援實時資料流的可擴充套件（scalable）、高吞吐（high-throughput）、容錯（fault-tolerant）的流處理（stream processing）。

Java 學習筆記（三）之 ThreadLocal、InheritableThreadLocal、TransmittableThreadLocal

一、初識服務程式是由程序構成，程序是由無數個執行緒構成，執行緒是一組程式碼片段組成。在Java的多執行緒程式設計中，為保證多個執行緒對共享變數的安全訪問，通常會使用synchronized來保證同一時刻只有一個執行緒

從零開始學Electron筆記（三）

在之前的文章我們介紹了一下Electron的選單建立和事件繫結，其中提到了一個remote模組，接下來我們繼續說一下Electron的這個remote模組。

Python socket學習筆記（三）

之前都是客戶端對伺服器的單執行緒操作。接下來學習 SocketServer 多執行緒 SockServer

ROS中階筆記（三）：機器人模擬—ArbotiX+rviz功能模擬

ROS中階筆記（三）：機器人模擬—ArbotiX+rviz功能模擬目錄01 機器人URDF模型優化—xacro模型檔案1.1 xacro模型檔案1.2 xacro使用方法1.3 模型顯示02 ArbotiX+rviz功能模擬2.1 Arboti簡介2.2 安裝Arbotix2.3 配置Ar

Consul 學習筆記（三）之高可靠性

一. 背景在生產環境中，後臺服務眾多，當選擇使用 consul 做服務治理的時候，所有服務註冊到consul 上，若consul 掛掉，會影響整個平臺的業務執行，為了保證業務的穩定性，需要consul 不宕機持續對外提供服務，因此

OpenWAF學習筆記（三）—— 呼叫API時403？

OpenWAF安裝及SQL注入防護測試成功之後，簡單瞭解API的用法，GitHub上說明在這 --> openwaf_api

kafka學習筆記（三）kafka的使用技巧

概述上一篇隨筆主要介紹了kafka的基本使用包括叢集引數，生產者基本使用，consumer基本使用，現在來介紹一下kafka的使用技巧。

Spark權威指南讀書筆記（三）處理不同的資料型別

Spark權威指南讀書筆記（三）處理不同的資料型別一、轉換成Spark型別使用lit函式將原始型別轉換為Spark型別

Linux 核心學習筆記（三）——資料結構與中斷

目錄Kernel Data StructuresLinked listsQueuesMapsBinary treesAlgorithmic Complexitytime ComplexityInterrupts and Interrupt Handlers

微服務分散式電商專案學習筆記（三）---- docker介紹安裝以及使用docker安裝軟體（2020/7/1）

其實在介紹docker的使用和安裝之前應該還要介紹虛擬機器的安裝與配置，以及虛擬網路的配置，但是我使用的是vmware，而視訊課使用的是vagrant，這一塊我簡看的，因此沒有過多的介紹，至於vmware的安裝配置和虛擬網路

Spring 學習筆記（三）：Spring Bean

1 Bean配置 Spring可以看做是一個管理Bean的工廠，開發者需要將Bean配置在XML或者Properties配置檔案中。實際開發中常使用XML的格式，其中<bean>中的屬性或子元素如下：

FFmpeg開發筆記（三）：ffmpeg介紹、windows編譯以及開發環境搭建

前言本篇章是對之前windows環境的補充，之前windows的是無需進行編譯的，此篇使用原始碼進行編譯，版本就使用3.4.8。

HTML學習筆記（三）HTML基礎

認識HTML HTML（英文Hyper Text Markup Language的縮寫）中文譯為“超文字標籤語言”，是一種用於建立網頁的標記語言。

SDL開發筆記（三）：使用SDL渲染視窗顏色和圖片

若該文為原創文章，未經允許不得轉載原博主部落格地址：https://blog.csdn.net/qq21497936原博主部落格導航：https://blog.csdn.net/qq21497936/article/details/102478062本文章部落格地址：https://blog.csdn.net

kafka學習筆記（三）----quick start

（一）啟動kafka環境　　kafka要求jdk1.8以上，並且啟動kafka之前需要啟動zookeeper，這裡直接使用kafka自帶的zookeeper，但是官方說不久後kafka將不再需要zookeeper。

Python語言程式設計學習筆記（三）

第十四章元組、集合和字典整章內容： [x] 建立元組。 [x] 使用元組作為固定列表來防止新增、刪除或替換元素。

Pandas筆記（三）

groupby

sort

相關推薦