pandas學習與使用2

阿新 • • 發佈：2018-12-12

繼續學習pandas庫，上一節主要介紹了Series，這一節主要是DataFrame結構的用法。執行環境python2.7

#!usr/bin/python3
# coding:utf-8
# pandas 使用DataFrame

import numpy as np
import pandas as pd

dates = pd.date_range('20171231', periods=6)
print "dates:\n", dates

#                    a         b         c         d
# 2017-12-31  0.544078  0.389521  0.097052  0.942329
# 2018-01-01  0.474514  0.456605  0.750682  0.683513
# 2018-01-02  0.537973  0.230534  0.216569  0.015208
# 2018-01-03  0.320855  0.295421  0.342874  0.808681
# 2018-01-04  0.649339  0.678842  0.390282  0.692622
# 2018-01-05  0.041877  0.197155  0.384499  0.301309
# index 為縱向座標的，column為橫向座標

df = pd.DataFrame(np.random.rand(6, 4), index=dates, columns=['a', 'b', 'c', 'd'])
print "df:\n", df
print "dtypes:\n", df.dtypes
print "columns:\n", df.columns
print "values:\n", df.values
# describe是DataFrame的詳細資訊，包括count、mena、std等值
print "describe:\n", df.describe()

#               a         b         c         d
# count  6.000000  6.000000  6.000000  6.000000
# mean   0.428106  0.374680  0.363660  0.573944
# std    0.217850  0.177776  0.220942  0.347394
# min    0.041877  0.197155  0.097052  0.015208
# 25%    0.359270  0.246756  0.248145  0.396860
# 50%    0.506243  0.342471  0.363687  0.688067
# 75%    0.542552  0.439834  0.388836  0.779666
# max    0.649339  0.678842  0.750682  0.942329
print "轉置：\n", df.T

# 按照索引排序 ascending=False 倒序列
print "按照索引排序:\n", df.sort_index(axis=1, ascending=False)
# 按照值排序
print "按照值排序:\n", df.sort_values(by='a')
print "______________________"

df1 = pd.DataFrame(np.arange(12).reshape((3, 4)))
print "df1:\n", df1
print "df1.dtypes:\n", df1.dtypes

df2 = pd.DataFrame({'A': 1, 'B': pd.Timestamp('20180101'), 'C': pd.Series(1, index=list(range(4)), dtype=float)})
print "df2:\n", df2

# DataFrame的構造
# pd.DataFrame() 引數： 1、二維array； 2、Series 列表； 3、value為Series的字典；

# 1、二維array
s1 = np.array([1, 2, 3, 4])
s2 = np.array([5, 6, 7, 8])
dataframe1 = pd.DataFrame([s1, s2])
print "dataframe1:\n", dataframe1

# 2、Series 列表
s1 = pd.Series(np.array([1, 2, 3, 4]))
s2 = pd.Series(np.array([5, 6, 7, 8]))
dataframe2 = pd.DataFrame([s1, s2])
print "dataframe2:\n", dataframe2

# 3、value為Series的字典
s1 = pd.Series(np.array([1, 2, 3, 4]))
s2 = pd.Series(np.array([5, 6, 7, 8]))
dataframe3 = pd.DataFrame({"a": s1, "b": s2});
print "dataframe3:\n", dataframe3

# DataFrame的屬性
print "dataframe3的columns的值：\n", dataframe3.columns
print "dataframe3的形狀：\n", dataframe3.shape
print "dataframe3的index的值：\n", list(dataframe3.index)
print "dataframe3的value的值：\n", dataframe3.values

# DataFrame的if-then操作
# df.ix[條件，then操作區域]
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8], "C": [1, 1, 1, 1]})
print "修改前：\n", df
# if(df.A > 2),"B"=-1
df.ix[df.A > 2, 'B'] = -1
print "修改後：\n", df

# 使用numpy.where
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8], "C": [1, 1, 1, 1]})
# np.where(條件，then，else)
df["then"] = np.where(df.A < 3, 1, 0)
print "修改後：\n", df

# 直接取值df.[]
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8], "C": [1, 1, 1, 1]})
df = df[df.A >= 2]
print "df[df.A >= 2]:\n", df

# 使用.loc[]
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8], "C": [1, 1, 1, 1]})
df = df.loc[df.A > 2]
print "df.loc[df.A > 2]:\n", df

df = pd.DataFrame({'animal': 'cat dog cat fish dog cat cat'.split(),
                   'size': list('SSMMMLL'),
                   'weight': [8, 10, 11, 1, 20, 12, 12],
                   'adult': [False] * 5 + [True] * 2})
print "df:\n", df

pandas學習與使用2

繼續學習pandas庫，上一節主要介紹了Series，這一節主要是DataFrame結構的用法。執行環境python2.7 #!usr/bin/python3 # coding:utf-8 # pandas 使用DataFrame import numpy as np i

pandas學習與使用1

學習了numpy之後，開始繼續學習pandas。以下是pandas基本的一些語法及其使用方法，這一節主要是pandas中的Series結構。執行環境python2.7 #!/usr/bin/python # -*- coding: UTF-8 -*- import pa

learn numpy & pandas 學習筆記2

import numpy as np # A = np.array([1,1,1]) #A是一個序列，並不是個矩陣 # B = np.array([2,2,2]) # print(A) # print(B) # print(np.vstack((A

pandas學習與使用3

這一節主要是從DataFrame中進行資料的篩選，對之前兩節內容的綜合應用。執行環境python2.7 #!usr/bin/python3 # coding:utf-8 import pandas as pd import numpy as np dates = pd.

Jmeter學習筆記2-原件作用域與執行順序

校驗 height sse proc tro 有效收集技術分享控制 1.元件的作用域（1）配置元件（config elements）:會影響其作用範圍內的所有元件。（2）前置處理程序（per-processors）：在其作用範圍內的每一個sampler元件之

機器學習與量化交易-2-3

.cn img -1 bsp 9.png ges 量化 ima image 機器學習與量化交易-2-3

Pandas基礎學習與Spark Python初探

入學 init sparkconf sch 時間 com inux mas 取數摘要：pandas是一個強大的Python數據分析工具包，pandas的兩個主要數據結構Series（一維）和DataFrame（二維）處理了金融，統計，社會中的絕大多數典型用例科學，以及許多

Pandas快速入門（深度學習入門2）

Java學習筆記2（輸入與隨機數簡單介紹）

args image public 數據類型 system double next class gpo 輸入： import java.util.Scanner; public class ScannerDemo{ 　　public static void main(Str

Hadoop學習系列(2.Hadoop框架介紹與搜索技術體系介紹)

消息監控系統 mapreduce spa 文件系統 sql 平時偽分布式自己第一天2.Hadoop框架介紹與搜索技術體系介紹1.大數據典型特性與分布式開發難點2.Hadoop框架介紹與搜索技術體系介紹3.Hadoop版本與特性介紹4.Hadoop核心模塊之HDFS分

數據分析學習筆記2-----pandas

ear 序列解釋它的轉換嵌套 class 不同的而不是要使用pandas，你首先就得熟悉它的兩個主要數據結構：Series和DataFrame。 1.Series Series是一種類似於一維數組的對象，它由一組數據（各種NumPy數據類型）以及一組與之相關的數

mysql學習與提高2：mysql儲存引擎

目錄儲存引擎有哪些儲存引擎如何檢視儲存引擎 InnoDB MyISAM MyISAM 與InnoDB比較總結儲存引擎什麼是儲存引擎呢？儲存引擎說白了就是如何儲存資料、如何為儲存的資料建立索引和如何更新、查詢資料等技術的實現方法。有哪些儲

Pandas學習2 --- 資料型別Series、DataFrame

Pandas的資料型別 Series(一維資料結構) Dataframe Series --- 帶標籤的一維陣列常用的初始化方法：可迭代物件 np陣列字典物件標量一、Series 1. Series初始化匯入 import pan

JVM記憶體分配與回收學習（2）

1、垃圾收集器什麼時候開始回收？（1）新生代有一個Eden區和兩個survivor區（From survivor 和To Survivor），每次使用Eden和其中一個Survivor（From Survivor），建立物件時，首先會將物件放入Eden區，如果放不下就會引發一次發生在新生代

Pandas入門學習（2）

文章目錄 Pandas 基本功能 1、Series 基本屬性 axes 示例 empty 示例 ndim 示例 size 示例 values 示例 head() 和 tail()

《鳥哥的linux私房菜》學習筆記2-檔案與目錄管理與查閱（思維導圖）

1、常見處理目錄的命令：cd，pwd，mkdir，rmdir 2、檔案與目錄的管理：ls（https://blog.csdn.net/weixin_42610712/article/details/83032052），cp，rm，mv，touch 3、檔案內容查閱——cat 4、檔案內容

機器學習與深度學習系列連載：第二部分深度學習（十四）迴圈神經網路 2（Gated RNN - LSTM ）

迴圈神經網路 2（Gated RNN - LSTM ） simple RNN 具有梯度消失或者梯度爆炸的特點，所以，在實際應用中，帶有門限的RNN模型變種（Gated RNN）起著至關重要的作用，下面我們來進行介紹： LSTM (Long Short-term Memory )

機器學習與深度學習系列連載：第二部分深度學習（十一）卷積神經網路 2 Why CNN for Image？

卷積神經網路 2 Why CNN 為什麼處理圖片要用CNN？原因是：一個神經元無法看到整張圖片能夠聯絡到小的區域，並且引數更少圖片壓縮畫素不改變圖片內容 1. CNN 的特點卷積：一些卷積核遠遠小於圖片大小；同樣的pat

Python學習（2）—— 運算子與基本資料型別

運算子與基本資料型別運算子有以下五種：算數運算：比較運算：邏輯運算：賦值運算：成員運算：以上圖片轉載來自：http://www.cnblogs.com/wupeiqi/ 。基本資料型別認識數字 (in

ARM體系結構與程式設計學習筆記2

1：ARM指令分類 1：ARM指令集可以分為跳轉指令，資料處理指令，程式狀態暫存器（PSR）傳輸指令，load/Store指令，協處理指令和異常中斷產生指令 2：ARM指令集字長為固定的32位，一條典型的ARM指令編碼格式如下 opcode：指令助記符；如ADD表示演算法加操作指令 c

pandas學習與使用2

相關推薦