Pandas_stack和pivot實現資料透視

阿新 • • 發佈：2022-03-08

"""
將列式資料變成二維交叉形式，便於分析，叫做重塑或者透視
1）經過統計得到多維度指標資料
2）使用unstack實現資料二維透視
3）使用pivot簡化透視
4）stack，unstack，pivot的語法
"""

import pandas as pd
import numpy as np

df = pd.read_csv(
    'data/ratings.csv',
    sep=',',
    engine='python',
    names='UserID,MovieID,Rating,Timestamp'.split(',')
)
df.head()
#   UserID  MovieID  Rating  Timestamp
# 0       1        1     4.0  964982703
# 1       1        3     4.0  964984247
# 2       2        6     4.0  964982224
# 3       2       47     5.0  964983815
# 4       1       50     5.0  964982931
# timestamp為秒 所以unit為s 這一列資料轉換為datetime格式
df['pdate'] = pd.to_datetime(df['Timestamp'], unit='s')
df.head()
#    UserID  MovieID  Rating  Timestamp               pdate
# 0       1        1     4.0  964982703 2000-07-30 18:45:03
# 1       1        3     4.0  964984247 2000-07-30 19:10:47
# 2       2        6     4.0  964982224 2000-07-30 18:37:04
# 3       2       47     5.0  964983815 2000-07-30 19:03:35
# 4       1       50     5.0  964982931 2000-07-30 18:48:51
df.dtypes
# UserID                int64
# MovieID               int64
# Rating              float64
# Timestamp             int64
# pdate        datetime64[ns]
# dtype: object

# 1)實現資料統計 dt為時間型別
df_group = df.groupby([df['pdate'].dt.month, 'Rating'])['UserID'].agg(pv=np.sum)
df_group.head(20)
# pdate為月份
#               pv
# pdate Rating
# 7     4.0      4
#       5.0      3
# 檢視按月份，不同評分的次數趨勢，是不行的。
# 需要將資料變換成每個評分是一列才可以實現的

# 2）使用unsack實現資料二維透視
# 目的：畫圖對比按照月份的不同評分的數量趨勢
df_stack = df_group.unstack()
#         pv
# Rating 4.0 5.0
# pdate
# 7        4   3
# unstack和stack是互逆操作
df_stack.stack().head()
#              pv
# pdate Rating
# 7     4.0      4
#       5.0      3

# 3）使用pivot簡化透視
df_group.head()
#               pv
# pdate Rating
# 7     4.0      4
#       5.0      3
df_reset = df_group.reset_index()
df_reset
#    pdate  Rating  pv
# 0      7     4.0   4
# 1      7     5.0   3
df_pivot = df_reset.pivot('pdate', 'Rating', 'pv')
df_pivot
# Rating  4.0  5.0
# pdate
# 7         4    3
# pivot方法相當於對df使用set_index建立分層索引，然後呼叫unstack

# 4）stack，unstack， pivot的語法
# stack:DataFrame.stack(level=-1, dropna=True),將column變成
# index，類似把橫放的書籍變成豎放，level=-1代表多層索引的最內層，
# 可以通過==0，1，2指定多層索引的對應層

Pandas_stack和pivot實現資料透視

\"\"\" 將列式資料變成二維交叉形式，便於分析，叫做重塑或者透視 1）經過統計得到多維度指標資料

python 用pandas實現資料透視表功能

透視表是一種可以對資料動態排布並且分類彙總的表格格式。對於熟練使用 excel 的夥伴來說，一定很是親切！

【R】【資料處理】如何用R實現資料透視表的操作？（二）

R將整潔資料定義為：每個變數的資料儲存在自身的列中，每個觀測值的資料儲存在其自身的行中。

pandas實現excel中的資料透視表和Vlookup函式功能程式碼

在孩子王實習中做的一個小工作，方便整理資料。目前這幾行程式碼是實現了一個數據透視表和匹配的功能,但是將做好的結果寫入了不同的excel中,如何實現將結果連續儲存到同一個Excel的同一個工作表中? 還需要探索

Python3和pyqt5實現控制元件資料動態顯示方式

最近筆者在做一個pyqt5的介面，由於在日常生活中，一些實際運用的場合都需要對資料進行實時的重新整理，例如對某個數值的監控，水溫，室溫的監控等等，都需要實時的重新整理控制元件顯示的資料。

python rsa實現資料加密和解密、簽名加密和驗籤功能

本篇文章主要說明python庫rsa生成金鑰對，資料的加密解密，api介面的簽名和驗籤，如有抄襲，請留言聯絡我。

Yii 實現資料加密和解密的示例程式碼

在Yii中又很多的資料我們不能夠以明文進行儲存和展示,例如密碼和一些比較重要的檔案資訊，這時候我們都需要我們對這些資訊進行加密

java實現資料夾解壓和壓縮

本文例項為大家分享了java實現資料夾解壓和壓縮的具體程式碼，供大家參考，具體內容如下

如何基於python3和Vue實現AES資料加密

高階加密標準(AES,Advanced Encryption Standard)為最常見的對稱加密演算法(微信小程式加密傳輸就是用這個加密演算法的)。對稱加密演算法也就是加密和解密用相同的金鑰，具有以下幾個特點：

mysql查詢每小時資料和上小時資料的差值實現思路詳解

一、前言需求是獲取某個時間範圍內每小時資料和上小時資料的差值以及比率。本來以為會是一個很簡單的sql，結果思考兩分鐘發現並不簡單，網上也沒找到參考的方案，那就只能自己慢慢分析了。

elk蒐集日誌，實現logstash根據message中結構不同動態建立索引並擴充套件功能，區分message中json和非json資料簡單方式

蒐集日誌，但是框架本身也會列印很多日誌是字串的。我們自己希望的日誌用json，但是又需要json欄位可以擴充套件，logstash收集日誌後都放在了message欄位中，我們自定義列印的是json串,spring列印的是string，為此我

一篇文章教會你建立vue專案和使用vue.js實現資料增刪改查

【一、專案背景】在管理員的一些後臺頁面裡，資料列表中都會對這些資料進行增刪改查的操作，例如管理員新增商品、修改商品價格、刪除商品、查詢商品，我們應該關注這些資料的操作和處理。

線性模型和CNN實現MNIST資料集手寫數字辨識

用CNN實現 #1 import torch import torch.nn as nn import torch.nn.functional as F #用來製作Dataloader

基於JQuery和DWR實現非同步資料傳遞

後臺我用DWR進行非同步資料傳遞：程式碼很簡單，就是返回一個數組，如果需求不同可以自己修改：

重塑和資料透視表

通過旋轉DataFrame物件進行重塑資料通常以所謂的“堆疊”或“記錄”格式儲存：

使用node和express+mongodb實現資料增刪改功能

使用node和express+mongodb實現資料增刪改功能：https://www.cnblogs.com/zhoulifeng/p/10197816.html

Java實現傳送網路請求和處理json資料

Java傳送Http請求是一個複雜操作，我們可以寫成一個方法。我們可以編寫一個HttpUtil.java，示例如下：

Element UI 封裝Table --> 實現動態建立表頭和單元格資料（無需寫死表頭和單元格資料）

背景：實現一個通用化表格元件，根據資料驅動動態建立表頭和行資料以及單元格

計分器（ViewModel、Databinding實現資料的儲存和控制元件操作）

Android中的ViewModel是一個可以用來儲存UI相關的資料的類。ViewModel的生命週期會比建立它的Activity、Fragment的生命週期長。

基於影象處理和tensorflow實現GTA5的車輛自動駕駛——第九節獲取影象資料

程式碼已放到碼雲 https://gitee.com/photographer_adam/Based-on-image-processing-and-tensorflow-to-realize-GTA5-vehicle-automatic-driving

Pandas_stack和pivot實現資料透視

相關推薦