pandas---Series基礎使用

阿新 • • 發佈：2019-02-02

匯入pandas

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

pandas基本資料結構

pandas中主要有兩種資料結構，分別是：Series和DataFrame。
Series:一種類似於一維陣列的物件，是由一組資料（各種NumPy資料型別）以及一組與之相關的資料標籤（即索引）組成。僅有一組資料也可以產生簡單的Series物件。注意：Series中的索引值是可以重複的。
DataFrame:一個表格型的資料結構，包含有一組有序的列，每列可以是不同的值型別（數值，字串，布林型等），DataFrame即有行索引也有列索引，可以被看做是由Series組成的字典。

Series的建立方式

通過一維陣列去建立

arr = np.array([1,2,3,4])
ser1 = Series(arr)
ser1.values #獲得值組成的一維陣列
ser1.index #獲得索引值的描述，start,stop,step
ser1.index=['a', 'b','c','d'] #更改索引值
ser1['b'] # 索引形式獲取某值
ser1[1] # 下標形式獲取某值

直接建立series陣列

ser2 = Series([99,100,98,10],index=['a', 'b','c','d'])
ser22 = Series(data=[89 
,87,86],dtype=np.float64,index=[u'數學',u'語文',u'英語'])

通過字典形式建立

dict1 = {'a':1,'b':2,'c':3,'d':4}
ser3 = Series(dict1) # 字典的鍵對應ser的索引，字典的值對應ser的資料

注意：

     1. 索引可以建立時賦值，也可以後期賦值
     2. 索引可以重複，下標不能重複
     3. 字典本身鍵和值有對應關係，字典的鍵不能重複

Series值的獲取

Series值的獲取主要有以下兩種方式：
1.通過方括號+索引的方式讀取對應的索引的資料，有可能返回多條資料
2. 通過方括號+下標

的方式讀取對應的下標值的資料，下標值取值的範圍為：[0,len(Series.values)];另外下標值也可以是負數，表示從右往左獲取資料
Series獲取多個值的方式樂視NumPy中的ndarray的切片操作，通過方括號+下標值/索引值+冒號（：）的形式來擷取series物件中的一部分資料
注意：
在獲取多個值的時候，
通過下標形式加冒號獲取，和切片一樣是左閉右開區間，
通過索引值加冒號獲取，是獲取一個完全閉合區間值

Series的運算

NumPy中的陣列運算，在Series中都保留了，均可以使用，並且Series進行陣列運算的時候，索引與值之間的對映關係不會發生改變。
注意：其實在操作Series的時候，基本上可以把Series看出NumPy中的ndarray陣列來進行操作。ndarray陣列的絕大多數操作都可以應用到Series上。

ser3+1
ser3-100
ser3*100
ser3/100
ser3%100
ser3//100
np.abs(ser3) ## numpy中的通用函式在Series中是支援的

Series缺失值檢測

定義新的索引值時，對於不存在的索引和存在的索引的預設補齊操作

ss = Series({'a':1,'b':2,'c':3,'d':4,'e':5})
ss_index = ['a','bb','cc','d','e','f','g','h','i']
ss_new = Series(ss,index=ss_index)

a     1.0
bb    NaN
cc    NaN
d     4.0
e     5.0
f     NaN
g     NaN
h     NaN
i     NaN
dtype: float64

注意：自動對齊：鍵值關係不會發生改變。如果鍵無法對應，返回NaN值填充

對陣列中的NaN值過濾


##過濾NaN值

pd.isnull(ss_new) #返回布林值的陣列，NaN 返回True
pd.notnull(ss_new) #返回布林值的陣列 Not NaN 返回True
ss_new[pd.notnull(ss_new)]

注意：pandas中的isnull和notnull兩個函式可以用於在Series中檢測缺失值，這兩個函式的返回值時一個布林型別的Series

兩個預設補齊的陣列相互操作時，按照索引對應關係進行操作
```
s1 = Series([1,2,3],index=['a','b','c'])
s2 = Series([10,20,30],index=['b','a','c','d'])
s1 + s2
```
注意：按照索引的形式找到與之相匹配的資料進行對應操作

Series別名

name屬性

s1.name=u'價格' ## 資料名稱標籤
s1.index.name=u'產品' ## 索引名稱標籤

本文來自北風網的學習總結

pandas---Series基礎使用

匯入pandas import numpy as np import pandas as pd from pandas import Series,DataFrame pandas基本資料結構 pandas中主要有兩種資料結構，分別是：Serie

pandas Series KeyError: -1

start pac sed except call hide cti con img 前幾天寫分析方法，遇到的一個錯誤：具體我已經在stackoverflow 裏面得到了詳細的解答，下面我把問題和解決辦法總結一下，方便日後的回顧問題： sql = "selec

【pandas】pandas.Series.str.split()---字符串分割

span code utf color display adding play split strong 原創博文，轉載請註明出處！本文代碼的github地址例子： 1 # -*- coding: utf-8 -*- 2 # 創建dataframe 3 i

pandas數組(pandas Series)-(3)向量化運算

索引 PE 4.0 bsp 進行 index索引 float dex 返回這篇介紹下有index索引的pandas Series是如何進行向量化運算的: 1. index索引數組相同: s1 = pd.Series([1, 2, 3, 4], index=[‘a‘, ‘

pandas數組(pandas Series)-(4)NaN的處理

() 充值 ML line value apple tps nbsp fill 上一篇pandas數組(pandas Series)-(3)向量化運算裏說到,將兩個 pandas Series 進行向量化運算的時候,如果某個 key 索引只在其中一個 Series 裏出現,

pandas Series

從實際意義上說pandas的DataFrame結構是一個矩陣，但是他又不是矩陣， DataFrame 和Series，Series其實是DataFrame的一列資料，多個Series組成了一個DateFrame結構；通過Series可以給一列中的某一個值指定一個索引：如： series_

pandas.Series()的幾種建立方法

前些日子的數學建模，最近的kaggle比賽，再到現在做的一個小專案，發現pandas真是一個好東西，可惜之前不太會用，需要用的時候就去上網搜，效率極其低下，現在把這一部分知識過一遍，以便日後使用。今天的主題：pandas.Series()的幾種建立方法。 import numpy a

python庫--pandas--Series.str--字串處理

python內建字串處理方法 S: Series　　I: Index 方法返回值引數說明 .capitalize() S/I 將Series/Index中的字串大

Python pandas.Series.str

1. replace Series.str.replace(pat, repl, n=-1, case=None, flags=0, regex=True) Parameters: pat&nbs

Python 資料分析與展示筆記4 -- Pandas 庫基礎

Python 資料分析與展示筆記4 – Pandas 庫基礎 Python 資料分析與展示系列筆記是筆者學習、實踐Python 資料分析與展示的相關筆記課程連結： Python 資料分析與展示參考文件： Numpy 官方文件（英文） Numpy 官方文件（中文） P

pandas.series.str.split()語法理解

一直對.str不能理解，那麼先在文件中找到。 PS:值得注意的是在construtor的class裡面才能查到str 發現本質是屬於類下的一個函式，猜想是強制轉化的函式（python是強型別語言）讓人不解，繼續開啟source 原來是一個類。所以Series.str更

Pandas Series轉換為DataFrame

說明雖然Series有一個to_frame()方法，但是當Series的index也需要轉變為DataFrame的一列時，這個方法轉換會有一點問題。所以，下面我採用將Series物件轉換為list物件，然後將list物件轉換為DataFrame物件。例項這

Pandas入門基礎（二）：DataFrame的行、列與資料型別

建立DataFrame資料： data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 20

Python:Pandas:DataFrame基礎（3）

接著上一篇文章，我們介紹使用iloc方法讀取資料框的操作 1、提取第四行資料 print(data.iloc[3]) 輸出結果如下： 2、返回4-5行，1-2列資料 print(data.iloc[3:5, 0:2]) #注意：區間仍然

Python:Pandas:DataFrame基礎（2）

我們接著上一篇的文章繼續介紹 1、讀取某一列的資料，假如我們要選擇“維修毛利”這一列的資料進行操作 print(data[u'維修毛利']) 輸出結果如下： 2、使用陣列的切片操作，但是注意了，切片得到的是行資料 print(data[1

Python資料分析入門之pandas總結基礎

一. Series Series: pandas的長槍(資料表中的一列或一行,觀測向量,一維陣列...) Series1 = pd.Series(np.random.randn(4)) print Series1,type(Series1) print Seri

Pandas資料基礎（索引、排序、連線、去重、分箱、異常處理）

使用pandas，首先匯入包： from pandas import Series, DataFrame import pandas as pd 123123 一、建立Series，DataFrame 1，建立Series a，通過列表建立 obj = Series([4, 7,

pandas Series DataFrame 丟棄指定軸上的項(三)

1.0 刪除Series項 from pandas import Series,DataFrame import numpy as np import pandas as pd obj=Seri

pandas | DataFrame基礎運算以及空值填充

本文始發於個人公眾號：**TechFlow**，原創不易，求個關注今天是pandas資料處理專題的第四篇文章，我們一起來聊聊DataFrame中的索引。上一篇文章當中我們介紹了DataFrame資料結構當中一些常用的索引的使用方法，比如iloc、loc以及邏輯索引等等。今天的文章我們來看看DataF

pandas基礎: Series和DataFrame的簡單介紹

維數索引一維數組找不到數組 nbsp 單獨 dex 默認一、pandas 是什麽 pandas 是基於 NumPy 的一個 Python 數據分析包，主要目的是為了數據分析。它提供了大量高級的數據結構和對數據處理的方法。 pand

pandas---Series基礎使用

匯入pandas

pandas基本資料結構

Series的建立方式

Series值的獲取

Series的運算

Series缺失值檢測

Series別名

相關推薦