Pandas系列教程（5）Pandas資料統計函式

阿新 • • 發佈：2020-10-21

Pandas資料統計函式

1、讀取csv資料

import pandas as pd

file_path = "../../datas/files/beijing_tianqi_2018.csv"
df = pd.read_csv(file_path)

# 替換溫度的字尾℃, 並轉為int32（修改列）
df.loc[:, 'bWendu'] = df.loc[:, 'bWendu'].str.replace('℃', '').astype('int32')
df.loc[:, 'yWendu'] = df.loc[:, 'yWendu'].str.replace('℃', '').astype(' 
int32')

print(df.head(3))

2、彙總類統計

import pandas as pd

file_path = "../../datas/files/beijing_tianqi_2018.csv"
df = pd.read_csv(file_path)

# 替換溫度的字尾℃, 並轉為int32（修改列）
df.loc[:, 'bWendu'] = df.loc[:, 'bWendu'].str.replace('℃', '').astype('int32')
df.loc[:, 'yWendu'] = df.loc[:, 'yWendu'].str.replace('℃ 
', '').astype('int32')

# 列印前三行
print('*' * 25, '列印前三行的資料', '*' * 25)
print(df.head(3))

# 提取所有數字列統計結果
print('*' * 25, '提取所有數字列統計結果', '*' * 25)
print(df.describe())

# 檢視單個Series的資料
print('*' * 25, '檢視單個Series的資料', '*' * 25)
print(df['bWendu'].mean())
# 最高溫
print(df['bWendu'].max())
# 最低溫
print(df[' 
yWendu'].min())

3、唯一去重和按值計數

import pandas as pd

file_path = "../../datas/files/beijing_tianqi_2018.csv"
df = pd.read_csv(file_path)

# 替換溫度的字尾℃, 並轉為int32（修改列）
df.loc[:, 'bWendu'] = df.loc[:, 'bWendu'].str.replace('℃', '').astype('int32')
df.loc[:, 'yWendu'] = df.loc[:, 'yWendu'].str.replace('℃', '').astype('int32')

# ---------------------- 1 唯一去重性 ------------------------- #
# 一般不用於數值列，而是列舉，分類列
print('*' * 25, '唯一去重性', '*' * 25)
print(df['fengxiang'].unique())
print(df['tianqi'].unique())
print(df['fengli'].unique())

# ---------------------- 2 按值計數 ------------------------- #
print('*' * 25, '按值計數', '*' * 25)
print(df['fengxiang'].value_counts())
print(df['tianqi'].value_counts())
print(df['fengli'].value_counts())

4、相關係數和協方差

用途（超級厲害）：

兩支股票，是不是同漲同跌？程度多大？正相關還是負相關？
產品銷量的波動，跟那些因素正相關，負相關，程度有多大？

來自知乎，對於兩個變數X,Y

協方差：衡量同向反向程度，如果協方差為正，說明X,Y同向變化。協方差越大說明同向程度越高；如果協方差為負，說明X,Y反向運動，協方差越小說明反向程度越高。
相關係數：衡量相似程度，當他們的相關係數為1時，說明兩個變數變化是的正向相似度最大，當相關係數為-1時，說明兩個變數的反向相似度最大

import pandas as pd

file_path = "../../datas/files/beijing_tianqi_2018.csv"
df = pd.read_csv(file_path)

# 替換溫度的字尾℃, 並轉為int32（修改列）
df.loc[:, 'bWendu'] = df.loc[:, 'bWendu'].str.replace('℃', '').astype('int32')
df.loc[:, 'yWendu'] = df.loc[:, 'yWendu'].str.replace('℃', '').astype('int32')

# 協方差矩陣
print('*' * 25, '協方差矩陣', '*' * 25)
print(df.cov())

# 相關係數矩陣
print('*' * 25, '相關係數矩陣', '*' * 25)
print(df.corr())

# 單獨檢視空氣質量和最高溫度的相關係數
print('*' * 25, '單獨檢視空氣質量和最高溫度的相關係數', '*' * 25)
print(df['aqi'].corr(df['bWendu']))
print(df['aqi'].corr(df['yWendu']))

# 空氣質量和溫度差的相關係數
print('*' * 25, '空氣質量和溫度差的相關係數', '*' * 25)
print(df['aqi'].corr(df['yWendu'] - df['bWendu']))

Pandas系列教程（5）Pandas資料統計函式

Pandas資料統計函式 1、讀取csv資料 import pandas as pd file_path = \"../../datas/files/beijing_tianqi_2018.csv\"

Pandas系列教程（1）Pandas資料讀取

1. 下載安裝pandas pip install pandas pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple

Pandas系列教程（2）Pandas資料結構

Pandas資料結構 DataFrame: 二維陣列，整個表格，多行多列 Series: 一維資料，一行或一列

Pandas系列教程（4）Pandas新增資料列

Pandas新增資料列在進行資料分析時，經常需要按照一定的條件建立新的資料列，然後進行進一步分析

Pandas系列教程（3）Pandas資料查詢

Pandas資料查詢 pandas 查詢資料的幾種方法 df.loc方法，根據行，列的標籤值查詢 df.iloc方法，根據行，列的數字位置查詢

Pandas系列教程（8）pandas資料排序

pandas資料排序 1. Series的排序： Series.sort_values(ascending=True, inplace=Flase) 引數說明：

Pandas系列教程（6）Pandas缺失值處理

Pandas缺失值處理 Pandas使用這些函式處理缺失值： isnull和notnull: 檢測是否是空值，可用於df和Series

Pandas系列教程（7）Pandas的SettingWithCopyWarning

Pandas的SettingWithCopyWarning 1、讀取資料 import pandas as pd file_path = \"../datas/files/beijing_tianqi_2018.csv\"

Pandas系列教程（10）Pandas的axis引數

Pandas的axis引數 1、axis = 0 或者 axis = \'index\' 如果是單行操作，就是指某一行如果是聚合操作，指的就是跨行corss rows

Pandas系列教程（9）Pandas字串處理

Pandas字串處理前面我們已經使用了字串處理函式：　　df[\'bWendu\'].try.replace(\'℃\', \'\').astype(\'int32\')

Pandas系列教程（11）Pandas的索引index

Pandas的索引index 把資料儲存於普通的column列也能用於資料查詢，那使用index有什麼好處？

WINFORM許可權系統開發系列教程（八）角色管理模組

實現過程 1 角色列表頁和資訊頁面佈局 2 功能實現分析載入所有角色列表新增 --角色資訊頁面許可權分配--入口--角色選單設定頁面

Java NIO系列教程（六） Selector

Selector（選擇器）是Java NIO中能夠檢測一到多個NIO通道，並能夠知曉通道是否為諸如讀寫事件做好準備的元件。這樣，一個單獨的執行緒可以管理多個channel，從而管理多個網路連線。

Java NIO系列教程（十）client和server 示例

//客戶但package com.example.demo.nio;import java.io.IOException;import java.net.InetSocketAddress;import java.nio.ByteBuffer;import java.nio.channels.SelectionKey;import java.nio.channels.Selector;imp