Python之Pandas(1)
阿新 • • 發佈:2018-12-03
import numpy as np import pandas as pd In [2]: #Series:一維陣列,與Numpy中的一維array類似。二者與Python基本的資料結構List也很相近,其區別是:List中的元素可以是不同的資料型別,而Array和Series中則只允許儲存相同的資料型別,這樣可以更有效的使用記憶體,提高運算效率。 #Time- Series:以時間為索引的Series。 #DataFrame:二維的表格型資料結構。很多功能與R中的data.frame類似。可以將DataFrame理解為Series的容器。以下的內容主要以DataFrame為主。 #Panel :三維的陣列,可以理解為DataFrame的容器。 In [9]: #series 是帶有標籤的一維陣列,可以儲存任何的資料型別 #Series 就如同列表一樣,一系列資料,每個資料對應一個索引值。 #Series 就是“豎起來”的 list: rng = np.random.RandomState(1) ar = rng.rand(5) print(ar) s = pd.Series(rng.rand(5)) print(s) #index 檢視series的索引,型別是RangeIndex print(s.index) #values 是series的值,型別是ndarray print(s.values) #series 相對於陣列多了一個標籤,類似字典,字典的key就是index,value就是陣列 [4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01 1.46755891e-01] 0 0.092339 1 0.186260 2 0.345561 3 0.396767 4 0.538817 dtype: float64 RangeIndex(start=0, stop=5, step=1) [0.09233859 0.18626021 0.34556073 0.39676747 0.53881673] In [15]: rng = np.random.RandomState(1) ar = rng.rand(5) s = pd.Series(ar) s.rename("Kobe") a 99 b 66 c 77 dtype: int64 Out[15]: 0 0.417022 1 0.720324 2 0.000114 3 0.302333 4 0.146756 Name: Kobe, dtype: float64 In [19]: #字典建立Series s1 = pd.Series({"Jack":90,"Rose":80,"Tom":70},name = "homework") print(s1) Jack 90 Rose 80 Tom 70 Name: homework, dtype: int64 In [21]: #index建立Series #series的建立 s = pd.Series([99,66,77],index = ['a','b','c'],name = "homework") print(s) a 99 b 66 c 77 Name: homework, dtype: int64
import numpy as np import pandas as pd In [2]: #Series:一維陣列,與Numpy中的一維array類似。二者與Python基本的資料結構List也很相近,其區別是:List中的元素可以是不同的資料型別,而Array和Series中則只允許儲存相同的資料型別,這樣可以更有效的使用記憶體,提高運算效率。 #Time- Series:以時間為索引的Series。 #DataFrame:二維的表格型資料結構。很多功能與R中的data.frame類似。可以將DataFrame理解為Series的容器。以下的內容主要以DataFrame為主。 #Panel :三維的陣列,可以理解為DataFrame的容器。 In [9]: #series 是帶有標籤的一維陣列,可以儲存任何的資料型別 #Series 就如同列表一樣,一系列資料,每個資料對應一個索引值。 #Series 就是“豎起來”的 list: rng = np.random.RandomState(1) ar = rng.rand(5) print(ar) s = pd.Series(rng.rand(5)) print(s) #index 檢視series的索引,型別是RangeIndex print(s.index) #values 是series的值,型別是ndarray print(s.values) #series 相對於陣列多了一個標籤,類似字典,字典的key就是index,value就是陣列 [4.17022005e-01 7.20324493e-01 1.14374817e-04 3.02332573e-01 1.46755891e-01] 0 0.092339 1 0.186260 2 0.345561 3 0.396767 4 0.538817 dtype: float64 RangeIndex(start=0, stop=5, step=1) [0.09233859 0.18626021 0.34556073 0.39676747 0.53881673] In [15]: rng = np.random.RandomState(1) ar = rng.rand(5) s = pd.Series(ar) s.rename("Kobe") a 99 b 66 c 77 dtype: int64 Out[15]: 0 0.417022 1 0.720324 2 0.000114 3 0.302333 4 0.146756 Name: Kobe, dtype: float64 In [19]: #字典建立Series s1 = pd.Series({"Jack":90,"Rose":80,"Tom":70},name = "homework") print(s1) Jack 90 Rose 80 Tom 70 Name: homework, dtype: int64 In [21]: #index建立Series #series的建立 s = pd.Series([99,66,77],index = ['a','b','c'],name = "homework") print(s) a 99 b 66 c 77 Name: homework, dtype: int64