Python資料分析：pandas 類庫及常用方法

阿新 • • 發佈：2020-07-16

定義：pandas是基於NumPy陣列構建的，使資料預處理、清洗、分析工作變得更快更簡單。pandas是專門為處理表格和混雜資料設計的，而NumPy更適合處理統一的數值陣列資料。

import pandas as pd

資料結構：Series | DataFrame。

Series：pd.Series(list,index=[ ]) 類似於一維陣列的得物件，是由一組資料+一列索引組成。可以使用切片，運算等操作，類似於ndarray。

DataFrame：pd.DataFrame(data,columns = [ ],index = [ ]) 是一個表格形的資料型別。常用型別。axis = 1 列 axis = 0 行

資料轉換：

1：pd.DataFrame(Series) 可以把Series結構變為DataFrame。

2：DataFrame.values 可以把DataFrame結構變為一個numpy 的ndarray。也可以通過索引或者列名獲得一個Series。df['列名'] 或者 df.列名。

常用方法：

1，df.reset_index(drop=True) 重置索引，會建立一個新物件。預設保留原來索引，加上drop=True刪除原來索引。

2，df.set_index() 設定一列索引。

3，df.drop() 刪除指定行值或列值（axis = 1 列 axis = 0 行，預設為行）。

df.drop(index=df[df[" 
價格"].isnull()].index, inplace=True) # 例如：刪除價格為空的所有行

4，del df['列'] 刪除一列值。

5，df.dropna() 刪除指定的行或者列為空的值。

6，df.drop_duplicated() 刪除重複值，可指定列，指定保留第一行，或者最後一行。

7，df.loc['行','列'] 通過標籤定位資料，df.iloc[:] 通過索引定位資料。

8，df.sort_values('列',axis=0, ascending=True) 排序。Series不需要引數列，ascending預設True升序。

9，df.describe() 快速列出資料的概要，多個維度的彙總統計。

10，df.info() 索引，資料型別，記憶體資訊等。

11，df.unique() 返回一個Series裡面唯一值組成的陣列。

12，df.sum() 計算一列的和。

13，df.count() 計算非NaN值的總量。

14，df.mean() 計算一列的平均值。

15，df.median() 計算一列的中位數。

16，df.mode() 計算一列的眾數。

17，df.var() 計算一列的方差。

18，df.std() 計算一列的標準差。

19，df.min() 計算一列的最小值。

20，df.max() 計算一列的最大值。

21，df.value_counts() 計算一列中資料出現的頻率。

22，df.groupby() 分組。

23，df.head() 取出資料的前幾行。

24，df.tail() 取出資料的後幾行。

25，read_csv()，read_excel()，read_sql()，read_json()，read_html() 等.... pandas提供的讀取資料方法。

26，to_excel() 寫入excel檔案，可以用pd.ExcelWriter()申明物件儲存多個sheet。

27，pd.contact() ，pd.append() 行資料合併拼接，只在axis = 0上操作。

28，pd.merge() 資料關聯操作，類sql,可以設定關聯方向：left, right,inner,outer。 join()類merge，但是隻能在索引關聯。

29，pd.rename(columns={'原名':'修改名'}, inplace = True) 修改列名。

30，df['列'].fillna(0) 把一列裡面為空的賦值為0.

31，df['列'].astype(int) 轉換一列資料型別。

32，df.agg() 指定列或者行上一個或者多個操作資料聚合。

...後續陸續加入

Python資料分析：pandas 類庫及常用方法

定義：pandas是基於NumPy陣列構建的，使資料預處理、清洗、分析工作變得更快更簡單。pandas是專門為處理表格和混雜資料設計的，而NumPy更適合處理統一的數值陣列資料。

python資料分析：流量資料化運營（下）——基於自動K值得KMeans廣告效果聚類分析

案例背景某企業由於投放的廣告渠道比較多，需要對其做廣告效果分析以實現有針對性的廣告效果測量和優化工作。跟以應用為目的的案例不同的是，由於本案例是一個分析型案例，該過程的輸出其實是不固定的，因此需要跟業

Python資料分析模組pandas用法詳解

本文例項講述了Python資料分析模組pandas用法。分享給大家供大家參考，具體如下：

基於Python資料分析之pandas統計分析

pandas模組為我們提供了非常多的描述性統計分析的指標函式，如總和、均值、最小值、最大值等，我們來具體看看這些函式：

2-python資料分析-基於pandas的資料清洗、DataFrame的級聯與合併操作

基於pandas的資料清洗處理丟失資料有兩種丟失資料： None np.nan(NaN) 兩種丟失資料的區別

python資料分析：資料索引——最關鍵的操作

前言資料索引是資料分析中最關鍵的操作。在資料分析中經常需要選取固定的行列，在Excel中可以使用滑鼠進行點選，但是敲命令的時候，例如python和R中不方便使用滑鼠，這就需要靈活掌握資料的索引。如果資料索引不能

Python資料分析：統計函式繪製簡單圖形

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料分析：用Matplotlib視覺化建立套圖

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料分析：視覺化圖表註釋設定

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料分析：如何繪製柱形圖，繪製柱形圖的方法

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。( 想要學習Python？Python學習交流群：1039649593，滿足你的需求，資料都已經上傳群檔案流，

python資料分析：多元線性迴歸

技術標籤：資料分析python 多元線性迴歸，即多個變數對目標值的影響（Y=aX1+bX2+cX3…+z）；接下來分析下“店鋪面積”和“距離最近的車站”對便利店“月營業額”的影響，並預測店鋪的月營業額。資料準備如下：

Python資料分析：美國警察槍擊案EDA分析

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

小渣渣學習筆記 python資料分析（pandas）待續。。

chapter1 ：Pandas DataFrame 基礎知識 2021.6.22 一、載入資料集 #read_csv 函式載入csv檔案（head取前5條）

Python資料分析：股價相關性

好久沒發部落格了，今天來發一篇分析股價相關度的。╮ ( ╯ ▽ ╰ ) ╭ 為什麼要分析股價相關度呢，我們來引入一個概念——配對交易

python資料分析（pandas入門）

1、pandas資料結構之DataFrame DataFrame生成方式：1、從另一個DataFrame建立。2、從具有二維形狀的NumPy陣列或陣列的複合結構生成。3、使用Series建立。4、從CSV之類檔案生成。下面介紹DataFrame的簡單用法：

python資料分析包 - pandas - dataframe

1. dataframe 　　DataFrame是一個表格型的資料結構，相當於是一個二維陣列，含有一組有序的列。他可以被看做是由Series組成的字典，並且共用一個索引。

Python資料分析模組 | pandas做資料分析(三):統計相關函式

計算操作 1、pandas.series.value_counts Series.value_counts(normalize=False,sort=True,ascending=False, bins=None, dropna=True)

Python資料分析模組 | pandas做資料分析(二):常用預處理操作

在資料分析和機器學習的一些任務裡面,對於資料集的某些列或者行丟棄，以及資料集之間的合併操作是非常常見的.

Python資料分析模組 | pandas做資料分析(一):基本資料物件

pandas有兩個最主要的資料結構，分別是Series和DataFrame，所以一開始的任務就是好好熟悉一下這兩個資料結構。

資料分析：聚類

1. 聚類的基本概念 1.1 定義聚類是資料探勘中的概念，就是按照某個特定標準(如距離)把一個數據集分割成不同的類或簇，使得同一個簇內的資料物件的相似性儘可能大，同時不在同一個簇中的資料物件的差異性也儘可能地大

Python資料分析：pandas 類庫及常用方法

相關推薦