非常全面的Pandas入門教程

阿新 • • 發佈：2020-09-03

原始文章

pandas是基於NumPy的一種資料分析工具，在機器學習任務中，我們首先需要對資料進行清洗和編輯等工作，pandas庫大大簡化了我們的工作量，熟練並掌握pandas常規用法是正確構建機器學習模型的第一步。

mylist = list('abcedfghijklmnopqrstuvwxyz')   # 列表
myarr = np.arange(26)                          # 陣列
mydict = dict(zip(mylist, myarr))             # 字典

# 構建方法
    ser1 = pd.Series(mylist)
    ser2 = pd.Series(myarr)
    ser3 = pd.Series(mydict)
    print(ser3.head())                 # 
 列印前5個數據
    
    #>  a    0
        b    1
        c    2
        d    4
        e    3
        dtype:int64

如何使series的索引列轉化為dataframe的列

mylist = list('abcedfghijklmnopqrstuvwxyz')
myarr = np.arange(26)
mydict = dict(zip(mylist, myarr))
ser = pd.Series(mydict)

# series轉換為dataframe
df = ser.to_frame()
# 索引列轉換為dataframe的列

df.reset_index(inplace=True)
print(df.head())

#>      index  0
    0     a  0
    1     b  1
    2     c  2
    3     e  3
    4     d  4

如何結合多個series組成dataframe

# 構建series1
ser1 = pd.Series(list('abcedfghijklmnopqrstuvwxyz')) 
# 構建series2
ser2 = pd.Series(np.arange(26))

# 方法1，axis=1表示列拼接，0表示行拼接
df = pd.concat([ser1, ser2], axis=1)

# 與方法1相比，方法2設定了列名

    df = pd.DataFrame({'col1': ser1, 'col2': ser2})
    print(df.head())
    
    #>      col1  col2
        0    a     0
        1    b     1
        2    c     2
        3    e     3
        4    d     4

如何命名列索引的名稱

ser = pd.Series(list('abcedfghijklmnopqrstuvwxyz'))

\# 命名索引列名稱
ser.name = 'alphabets'
\# 顯示前5行資料

ser.head()

#>    0    a
    1    b
    2    c
    3    e
    4    d
    Name: alphabets, dtype: object

如何獲得series物件A中不包含series物件B的元素

ser1 = pd.Series([1, 2, 3, 4, 5])
ser2 = pd.Series([4, 5, 6, 7, 8])

\# 返回ser1不包含ser2的布林型series
ser3=~ser1.isin(ser2)
\# 獲取ser不包含ser2的元素

ser1[ser3]

#>    0    1
    1    2
    2    3
    dtype: int64

如何獲得seriesA和seriesB不相同的項

ser1 = pd.Series([1, 2, 3, 4, 5])
ser2 = pd.Series([4, 5, 6, 7, 8])

\# 求ser1和ser2的並集
ser_u = pd.Series(np.union1d(ser1, ser2))
# 求ser1和ser2的交集
ser_i = pd.Series(np.intersect1d(ser1, ser2))
\# ser_i在ser_u的補集就是ser1和ser2不相同的項

ser_u[~ser_u.isin(ser_i)]

#>    0    1
    1    2
    2    3
    5    6
    6    7
    7    8
    dtype: int64

非常全面的Pandas入門教程

原始文章 pandas是基於NumPy的一種資料分析工具，在機器學習任務中，我們首先需要對資料進行清洗和編輯等工作，pandas庫大大簡化了我們的工作量，熟練並掌握pandas常規用法是正確構建機器學習模型的第一步。

Pandas入門教程

大家好，我是皮皮。其實這個pandas教程，卷的很嚴重了，才哥，小P等人寫了很多的文章，這篇文章是粉絲【古月星辰】投稿，自己學習過程中整理的一些基礎資料，整理成文，這裡發出來給大家一起學習。

mongodb中非常好用的Aggregate入門教程

前言 aggregate 翻譯過來是聚合的意思，但是在實際的使用的它的體驗特別像linux中的管道，每個管道處理完之後再把結果交個下一個管道，你的資料就像水流，最後通過各個管道你能夠得到你想要的資料

2. 無門檻學會資料型別與輸入、輸出函式，滾雪球學 Python python 入門教程非常詳細

python 入門教程，python 入門教程，python 入門教程，python 入門教程，python 入門教2. 無門檻學會資料型別與輸入、輸出函式，滾雪球學 Python python 入門教程非常詳細

寫給Java程式設計師的TypeScript入門教程（二）

本文內容承接本系列的上一篇《寫給Java程式設計師的TypeScript入門教程（一）》。上一篇介紹了本系列教程的背景，並進行了開發環境的搭建。本系列的教學思路是通過專案實戰來學習TypeScript，選取了一個簡單的雲服務

寫給後端的Docker初級入門教程:實現高效率自動化部署

在上一篇文章面向後端的Docker初級入門教程：DockerFile 命令詳解中，我們比較詳細的講解了docker映象構建指令碼DockerFile的使用和命令，DockerFile的出現讓構建Docker映象的過程更加直觀和高效，但是，和我之前大

寫給後端的Nginx初級入門教程:Nginx原理初探

在上一篇文章寫給後端的Nginx初級入門教程:配置高可用叢集中，我們使用keepalived實現了我們Nginx伺服器的高可用配置，防止因為Nginx伺服器掛掉而導致整個應用掛掉的這種情況的發生。而Nginx作為當下最受歡迎的web伺

CMake學習筆記（一）基本概念介紹、入門教程及CLion安裝配置

什麼是構建系統在軟體開發中，構建系統（build system）是用來從原始碼生成使用者可以使用的目標的自動化工具。目標可以包括庫、可執行檔案、或者生成的指令碼等等。

寫給後端的Hadoop初級入門教程：概念篇

前言： Hello大家好，我是韓數。距離我們上一個系列寫給後端的Nginx初級入門教程已經過去整整25天了，中間穿插了兩篇區塊鏈相關的文章，其實吧，這二十來天我一直在憋大招，那就是這個最新的系列寫給後端的Hadoop初級

WebMagic 實現爬蟲入門教程

本示例實現某電影網站最新片源名稱列表及詳情頁下載地址的抓取。 webmagic是一個開源的Java垂直爬蟲框架，目標是簡化爬蟲的開發流程，讓開發者專注於邏輯功能的開發。

Shiro入門教程

Shiro是一個強大的簡單易用的Java安全框架，主要用來更便捷的認證，授權，加密，會話管理。Shiro首要的和最重要的目標就是容易使用並且容易理解。

寫給後端的Docker初級入門教程：基礎篇

前言: 之前很早就對Docker有所耳聞，但是礙於時間(就是懶得學)的關係，就一直沒有開始行動，直到最近這個學期課比較少，實在不知道該幹啥了，算了，學習吧。所以就開始了我漫長Docker學習之旅。當然，寫這篇筆記的時

寫給後端的Nginx初級入門教程:基礎篇

Nginx是什麼？ Nginx (\"engine x\") 是一個高效能的 HTTP 和反向代理伺服器,特點是佔有記憶體少，併發能力強，事實上 nginx 的併發能力確實在同型別的網頁伺服器中表現較好，有報告表明能支援高達 50,000 個併發連

面向後端的Docker初級入門教程：實戰篇

前言在之前的兩篇文章中，我們在面向初學者的Docker學習教程：基礎篇中通過

寫給後端的Docker初級入門教程：DockerFile 命令詳解

在上一篇文章寫給後端的Docker初級入門教程：實戰篇最後我們有提到用DockerFile來構建和定製屬於我們自己的映象，因為時間和篇幅問題，上一篇文章對DockerFile只做了一個簡單的介紹和使用，並沒有對DockerFile具體的

docker入門教程這一篇就夠了

作為軟體開發者，平常最痛恨的應該就是環境配置問題了吧。比如說，我要在一臺新電腦(新環境)上安裝tomcat跑一個javaweb應用，因為tomcat是java程式碼編寫的，所以首先我要安裝一個java執行時環境(JRE)，配置JAVA_H

寫給後端的Nginx初級入門教程:實戰篇

在上一篇的文章寫給後端的Nginx初級入門教程:基礎篇中，我們主要說了Nginx是什麼，能做什麼，以及Nginx最重要的四個基本概念，分別是正向代理,反向代理，負載均衡，以及動靜分離。

寫給後端的Nginx初級入門教程:配置高可用叢集

在上一篇寫給後端的Nginx初級入門教程:實戰篇文章中我們從實際的程式碼出發，比較粗略地講解了Nginx配置檔案的結構，以及常用的功能比如複雜均衡，反向代理，動靜分離的簡單配置，事情到這裡就結束了嗎，當然沒有，就

Log4j新手快速入門教程

簡介 Log4J是 Apache 的一個開源專案（官網http://jakarta.apache.org/log4j），通過在專案中使用 Log4J，我們可以控制日誌資訊輸出到控制檯、檔案、GUI 元件、甚至是資料庫中。我們可以控制每一條日誌的輸出格式，

neo4j安裝配置入門教程

注：網上找了許多教程，發現都不太適合0基礎的使用者，所以就自己寫了一下。

非常全面的Pandas入門教程

原始文章

目錄

1. 如何安裝Pandas

2. 如何匯入pandas庫和查詢相應的版本資訊

3. pandas資料型別

4. series教程

如何命名列索引的名稱

非常全面的Pandas入門教程

Pandas入門教程

mongodb中非常好用的Aggregate入門教程

2. 無門檻學會資料型別與輸入、輸出函式，滾雪球學 Python python 入門教程非常詳細

寫給Java程式設計師的TypeScript入門教程（二）

寫給後端的Docker初級入門教程:實現高效率自動化部署

寫給後端的Nginx初級入門教程:Nginx原理初探

CMake學習筆記（一）基本概念介紹、入門教程及CLion安裝配置

寫給後端的Hadoop初級入門教程：概念篇

WebMagic 實現爬蟲入門教程

Shiro入門教程

寫給後端的Docker初級入門教程：基礎篇

寫給後端的Nginx初級入門教程:基礎篇

面向後端的Docker初級入門教程：實戰篇

寫給後端的Docker初級入門教程：DockerFile 命令詳解

docker入門教程這一篇就夠了

寫給後端的Nginx初級入門教程:實戰篇

寫給後端的Nginx初級入門教程:配置高可用叢集

Log4j新手快速入門教程

neo4j安裝配置入門教程

非常全面的Pandas入門教程

目錄

1. 如何安裝Pandas

2. 如何匯入pandas庫和查詢相應的版本資訊

3. pandas資料型別

4. series教程

如何命名列索引的名稱

相關推薦