Pandas 三大物件

阿新 • • 發佈：2018-12-18

1.pandas的Series物件

pandas的Series物件是一個帶索引資料構成的一維陣列。可以用一個數組建立Series物件

import pandas as pd

data=pd.Series([0.25,0.5,0.75,1.0])
print(data)
# output:0    0.25
#        1    0.50
#        2    0.75
#        3    1.00
#       dtype: float64

在上面的執行結果中，Series物件將一組資料和一組索引繫結在一起，我們可以通過values屬性和index屬性獲取資料。

data.values
#output；[0.25 0.5  0.75 1.  ]

data.index
#output:RangeIndex(start=0, stop=4, step=1)

另外，資料可以通過python的中括號索引標籤獲取：

data[1]
#output:0.5
data[:3]
#output:1    0.50
#       2    0.75
#       dtype: float64

1.1 Series是通用的Numpy陣列

從上面的例子看出來，Numpy的一維陣列和Series物件基本可以等價交換，但是兩者的本質差異是存在於索引：Numpy陣列是通過隱式定義的整數索引獲取數值，而pandas的Series物件是用一種顯式定義的索引與數值關聯。

顯式索引的定義讓Series物件擁有了更強的定義。例如：索引不再僅僅是整數，還可以是任意想要的型別。

data=pd.Series([0.25,0.5,0.75,1.0],index=['a','b','c','d'])
print(data)
print(data['a'])
#output:a    0.25
#       b    0.50
#       c    0.75
#       d    1.00
#       dtype: float64
#       0.25

注意：也可以使用不連續或不按順序的索引。

data=pd.Series([0.25,0.5,0.75,1.0],index=[2,5,3,7])

1.2 Series是特殊的字典

Series物件看成是一種特殊的Python字典。字典是一種將任意鍵對映到一組任意值的資料結構，而Series物件其實是一組型別鍵對映到一組型別值的資料結構。

import pandas as pd
population_dict={'California':38332521,'Texas':26448193,'New York':19651127,'Florida':19552860,'Illinois':12882135}
population=pd.Series(population_dict)
print(population)
#output:California    38332521
#       Texas         26448193
#       New York      19651127
#       Florida       19552860
#       Illinois      12882135
#       dtype: int64

上面對陣列的操作仍然可以對這個Series物件適用。如切片操作，取值等。

1.3 建立Series物件

一般的建立方式：pd.Series(data,,index=index)

a)data可以是列表或者Numpy，這時index預設值為整數序列

z=pd.Series([2,4,6])
print(z)
#output:0    2
#       1    4
#       2    6
#       dtype: int64

b)data也可以是一個標量，建立Series物件時會重複填充到每個索引上：

z=pd.Series(5,index=[100,200,300])
print(z)
#output:100    5
#       200    5
#       300    5
#       dtype: int64

c)data還可以是一個字典，index預設是排序的字典鍵：

z=pd.Series({2:'a',1:'b',3:'c'},index=[3,2])
print(z)
#output:3    c
#       2    a
#       dtype: object

#出現這樣的原因是：Series物件只會保留顯式定義的鍵值對。

2.pandas的DataFrame物件

2.1 DataFrame是通用的Numpy陣列

可以將DataFrame看作是一種既有靈活的行索引，又有靈活的列名的二維陣列。它的行和列都可以通過索引獲取

同時，可以將DataFrame看成是有序‘排列’的若干Series物件

#建立基本的DataFrame,採用Series物件來解決。
import pandas as pd

population_dict={'California':38332521,'Texas':26448193,'New York':19651127,'Florida':19552860,'Illinois':12882135}
population=pd.Series(population_dict)
area_dict={'California':423967,'Texas':170312,'New York':141297,'Florida':170312,'Illinois':149995}
area=pd.Series(area_dict)
#用一個字典建立一個包含這些資訊的二維陣列：
states=pd.DataFrame({'population':population,'area':area})
print(states)

#output:            population    area
#       California    38332521  423967
#       Texas         26448193  170312
#       New York      19651127  141297
#       Florida       19552860  170312
#       Illinois      12882135  149995

#檢視行索引標籤(index 屬性)
states.index
#output：Index(['California', 'Texas', 'New York', 'Florida', 'Illinois'], dtype='object')
#返回的是Index物件

#檢視列索引標籤
states.columns
#output:Index(['population', 'area'], dtype='object')

2.2 DataFrame是特殊的字典

我們可以把DataFrame看成是特殊的字典。字典是一個鍵對映一個值，而DataFrame是一列對映一個Series的資料。

# 通過‘area’列屬性獲取包含於area列的所有資料
print(states['area'])
#output:California    423967
#       Texas         170312
#       New York      141297
#       Florida       170312
#       Illinois      149995
#       Name: area, dtype: int64

2.3 建立DataFrame物件

a)通過單個Series物件建立

#DataFrame 是一組Series物件的集合，可以使用單個Series建立一個單列的DataFrame
pd.DataFrame(population,columns=['populations'])
#output              populations
#       California     38332521
#       Texas          26448193
#       New York       19651127
#       Florida        19552860
#       Illinois       12882135

b)通過字典列表建立

任何元素是字典的列表都可以變成DataFrame.用一個簡單的列表綜合來建立一些資料：

data=[{'a':i,'b':2*i}for i in range(3)]
z=pd.DataFrame(data,index=list('ABC'))
print(z)
#output:   a  b
#       A  0  0
#       B  1  2
#       C  2  4

當字典中有些鍵不存在時，Pandas也會使用缺失值（NaN）(not a number)來表示：

data=[{'a':1,'b':2},{'b':3,'c':4}]
z=pd.DataFrame(data)
print(z)
#output:     a  b    c
#       0  1.0  2  NaN
#       1  NaN  3  4.0

c)通過Series物件字典建立

見最開始的示例中DataFrame的建立方式。

d)通過Numpy二維陣列建立

假如有一個二維陣列，就可以建立一個可以指定行列索引值的DataFrame.如果不指定行列索引值，那麼行列預設都是整數索引值：

data=np.random.rand(3,2)
z=pd.DataFrame(data,columns=['foo','bar'],index=['a','b','c'])
print(z)
#output:        foo       bar
#       a  0.679849  0.791610
#       b  0.438278  0.331297
#       c  0.998745  0.861642

e)通過Numpy結構化陣列建立

首先是介紹來自於官網的結構化陣列：

Structured type, two fields: the first field contains an unsigned int, the second an int32:
>> np.dtype([('f1', np.uint), ('f2', np.int32)])
#output:dtype([('f1', '<u4'), ('f2', '<i4')])

通過結構化陣列建立DataFrame：

A=np.zeros(3,dtype=[('A','i8'),('b','f8')])
print(A)
#output:[(0, 0.) (0, 0.) (0, 0.)]
z=pd.DataFrame(A)
print(z)
#output：   A    B
#        0  0  0.0
#        1  0  0.0
#        2  0  0.0

3.pandas的Index物件

先簡單的建立Index物件陣列

import pandas as pd

index=pd.Index([2,3,5,7,11])
print(index)

#output:Int64Index([2, 3, 5, 7, 11], dtype='int64')

3.1 將Index看做不可變陣列

Index物件的許多操作都類似於陣列，可以採用Python標準的取值方法獲取數值，也可以通過切片獲取數值：

index[1]
#output:3

#通過切片獲取數值
# 每隔一個值取一個，一下子看蒙了
print(index[::2])

但是，Index物件裡面的值是不可更改的，如果這樣：index[0]=1會報錯，這就是不可修改的含義。

3.2 將Index看做有序集合

Index物件遵循Python標準庫的集合（set）資料結構的許多習慣用法，包括並集、交集、差集等。

indA=pd.Index([1,3,5,7,9])
indB=pd.Index([2,3,5,7,11])

# 交集
print(indA&indB)
# 並集
print(indA|indB)
# 異或
print(indA^indB)

#output:Int64Index([3, 5, 7], dtype='int64')
#       Int64Index([1, 2, 3, 5, 7, 9, 11], dtype='int64')
#       Int64Index([1, 2, 9, 11], dtype='int64')

Pandas 三大物件

1.pandas的Series物件 pandas的Series物件是一個帶索引資料構成的一維陣列。可以用一個數組建立Series物件 import pandas as pd data=pd.Series([0.25,0.5,0.75,1.0]) print(data)

Pandas GroupBy物件

建立GroupBy物件 GroupBy物件可以通過pandas.DataFrame.groupby(), pandas.Series.groupby()來建立。 DataFrame.groupby(by=None, axis=0, level=None, as_ind

如何獲得 Pandas dataframe 物件的行數

You can use the .shape property or just len(DataFrame.index). However, there are notable performance differences ( len(DataFrame.i

Pandas GroupBy物件索引與迭代

import pandas as pd df = pd.DataFrame({'性別' : ['男', '女', '男', '女', '男', '女', '男', '男'],

servlet的三大作用域物件和jsp的九大內建物件及其四大作用域物件

servlet的三大作用域物件： request（HttpServletRequest） session（HttpSession）： application（ServletContext）：tomcat啟動時建立，tomcat關閉時銷燬，整個web的生命週期只有一個

全面解析PHP面向物件的三大特徵

PHP面向物件的三大特徵：繼承，封裝，多型一.繼承 1、如何實現繼承？給子類使用extends關鍵字，讓子類繼承父類； class Student extends Person{} 2、實現繼承的注意事項？ ① 子類只能繼承父類的非私有屬性。 ②子類繼承父類後，相當於將父類的屬性和方法co

面向物件的三大特性：封裝、繼承、多型

1.封裝將一些資訊放入類內部（private），不允許外部程式直接訪問，如果需要使用這些資訊則需要通過該類提供的方法來實現對資料資訊的操作和訪問。 2.繼承（extends）將已經存在的一個類A的屬性作為自己的屬性，並新增其他新的屬性或修改原來的方法使之符合新的需求所產生

關於面對物件過程中的三大架構以及資料訪問層（實體類、資料操作類）

關於面對物件過程中的三大架構以及資料訪問層（實體類、資料操作類）面向物件開發專案三層架構：介面層、業務邏輯層、資料訪問層資料訪問層，分為實體類和資料訪問類在專案的下面新增一個App_Code資料夾把所有的類放在App_Code這個資料夾下邊。

Java面向物件三大特性-封裝、繼承、多型

在講Java面向三大特性之前，我們先了解一下訪問修飾符的訪問範圍：（1）：private：同類中具有訪問許可權。（2）：protected：本類和同包以及不同包的子類才具有訪問許可權。（3）：public：統一工程中都具有訪問許可權。（4）：預設本類和同包範圍內具有訪問許可權。一、Ja

面向物件的思想、面向物件的三大特性，五大原則

面向物件的思想、面向物件的三大特性，五大原則面向物件就是：比如說，我想買一個電腦，我會告訴另一個人去給我買一個電腦，他就會坐車去電子商城去給我買電腦，買完電腦又給我坐車帶回來交給我手中。這買電腦的期間的事情，電腦的牌子、價格、效能、跑去買、再帶回來，我都不用管不用去自己做。我只坐在這裡

類，物件，面向物件以及三大特徵

一、類和物件面向物件程式設計中兩個重要的概念：類和物件 1、簡單來說：物件的抽象化是類，類的具體化就是物件。類是一種抽象的概念，是對現實生活中事物的描述，類是對某一批物件的抽象，它不是實際存在的事物。物件是一個實際存在的實體，從這個意義上講，萬物都是物件。我們日常所說的人，都是人

03 -3 pandas 層次化索引（隱式構造，顯示構造）、多層列索引、多層索引物件的索引與切片操作（Series的操作，DataFrame的操作）

pandas層次化索引多級索引包括: 多級行索引和多級列索引 1. 建立多層行索引 1) 隱式構造最常見的方法是給DataFrame建構函式的index引數傳遞兩個或更多的陣列 Series也可以建立多層索引 import numpy as np

面向物件的三大基石之二“繼承“

1.在繼承的概念上，父類就是最基本的類，相當於做一個模板，父類一定要做的一般化，這樣才有利於子類的擴充套件。 2.子類可以繼承父類的屬性和方法，還可以擴展出自己的屬性和方法。 3.在繼承關係中，父類和子類需要滿足is-a的關係 4.繼承可以防止子

面對物件的三大基石之一“封裝”

封裝就是把屬性私有化，提供公有的方法訪問這些屬性，在這些公有方法中實現對屬性的控制。封裝的四種控制級別：1.public公共的，最高訪問級別

pandas中read_csv()方法和DataFrame物件的to_csv()

pandas中read_csv()方法和DataFrame物件的to_csv()方法的使用介紹安裝pandas pip3 install pandas to_csv() 官方呼叫介紹介紹：將DataFrame寫入逗號分隔值csv檔案

Pandas Cookbook -- 09合併Pandas物件及資料庫

合併Pandas物件及資料庫簡書大神SeanCheney的譯作，我作了些格式調整和文章目錄結構的變化，更適合自己閱讀，以後翻閱是更加方便自己查詢吧 import pandas as pd import numpy as np DataFrame插入讀取names資料集 names = pd.re

面向物件設計三大原則

面向物件設計三大原則--->OO設計原則---->設計模式 (封裝變化點，對介面進行程式設計，多使用組合而不是繼承) 該三大原則應該算是OO的基礎，很多OO設計原則和設計模式都是在此三大原則上面衍生髮展而來。所以對於學習設計模式的人，瞭解這三大原則顯然是非常必要的。 &n

Servlet三大域物件的應用

javaweb開發中就不能不談Servlet三大域物件的應用（request、session、application（ServletContext））。 1. request request是表示一個請求，只要發出一個請求就會建立一個request，它的作用域：僅在當前請求中有效。用處：常用於伺服

面嚮物件語言的三大特徵

面嚮物件語言的三大特徵是：封裝繼承多型最近感覺，總結一下這個問題還是挺有必要的，所以轉發了此篇文章的部分段落。封裝封裝是面向物件的特徵之一，是物件和類概念的主要特性。封裝，也就是把客觀事物封裝成抽象的類，並且類可以把自己的資料和方法只讓可信的

面向物件三大特徵之繼承

面向物件的三大特徵包含：封裝、繼承、多型。現簡單介紹一下——繼承。繼承有以下幾種方式： 1、例項繼承　　（也稱：冒充繼承,經典繼承）（例項屬性和例項方法）通過call和apply，來繼承，具體語法如下 fn.call(物件，引數一，引數二,……) fn.apply(物件，[]) fn.a

Pandas 三大物件

相關推薦