pandas系列之 DataFrame 行列資料篩選

阿新 • • 發佈：2019-02-01

一、對DataFrame的認知
DataFrame的本質是行(index)列(column)索引+多列資料。

為了簡化理解，我們不妨換個思路…

現實中，為了簡化對一件事物的描述，我們會選擇幾個特徵。
例如，從（性別、身高、學歷、職業、愛好..）等角度去刻畫一個人，這些“角度”即為“特徵”。

這裡寫圖片描述

其中，不同的行表示不同的記錄；列代表特徵，不同記錄因各個特徵之間的差異而不同。

DataFrame預設索引是序號（0，1，2…），可以理解成位置索引。一般我們用id標識不同記錄，不會改變index。但為了理解不同特徵（列）含義，我們往往會重新指定column。

一些簡易但不算嚴謹的理解是：
行列

行 – index – 記錄（一般沿用預設索引）
列 – column – 特徵（自定義索引）
索引
預設索引 – 序號 – 位置 – 方便索引但理解不易
自定義索引 – 特徵名稱 – 屬性 – 便於理解

二、對dataframe進行行列資料篩選

import pandas as pd,numpy as np
from pandas import DataFrame
df = DataFrame(np.arange(20).reshape((4,5)),column = list('abcde'))

這裡寫圖片描述

1.df[]&df. 選取列資料

df.a
df[[‘a’,’b’]]

2.df.loc[[index],[colunm]] 通過標籤選擇資料

不對行進行篩選時，[index]處填 : (不能為空)，即df.loc[:,’a’]表示選取a列全部資料。
df.loc[0,’a’]
df.loc[0:1,[‘a’,’b’]]
df.loc[[0,2],[‘a’,’c’]]

這裡寫圖片描述

3.df.iloc[[index],[colunm]] 通過位置選擇資料

不對行進行篩選時，同df.loc[]，即[index]處不能為空。
df.iloc[0,0]
df.iloc[0:1,1:3]
df.iloc[[0,2],[1,3]]

這裡寫圖片描述

4.df.ix[[index],[column]] 通過標籤or位置選擇資料

df.ix[]混合了標籤和位置選擇。需要注意的是，[index]和[column]的框內需要指定同一類的選擇。
df.ix[[0:1],[‘a’,3]]報錯

pandas系列之 DataFrame 行列資料篩選

一、對DataFrame的認知 DataFrame的本質是行(index)列(column)索引+多列資料。為了簡化理解，我們不妨換個思路… 現實中，為了簡化對一件事物的描述，我們會選擇幾個特徵。例如，從（性別、身高、學歷、職業、愛好..）等角度去刻

pandas庫之DataFrame基本操作

轉自：http://www.jianshu.com/p/75f915cc5147 這一部分主要學習pandas中Series和DataFrame基本操作。

【pandas】[3] DataFrame通過資料型別選擇子資料框

DataFrame.select_dtypes(include=None, exclude=None) Return a subset of the DataFrame’s columns based on the column dtypes. Parameters:

教老婆學Java 系列之奇妙的資料結構二

奇妙的資料結構（容器）二陣列與集合問題：如何將多個數組放入到一個集合中。如何將多個人陣列放入到一個集合中，沒有重複的資料。 package Day03; import java.lang.reflect.Array; import java.util.A

axis2系列之返回json資料

2：下載DynamicResponseHandler(wso2dynamic-response-1.5.mar)模組，複製到webservice專案中的WEB-INF/modules中，記住要把wso2dynamic-response-1.5.mar加到modules

玩轉大資料系列之二：資料分析與處理

經過了資料採集和同步之後，就可以在阿里雲上進行資料分析和處理，來玩轉您的資料了。本文向您介紹在阿里雲大資料各產品中，以及各產品之間怎樣來完成您的資料處理和資料分析。 MaxCompute 基於MaxCompute的大資料計算（MaxCompute + RDS）使用MaxCompute分析IP

玩轉大資料系列之三：資料報表與展示

經過了資料採集與資料同步、資料分析和處理，我們應該考慮將處理好的資料做成報表或者大屏展示給老闆們看，以便老闆們可以更加精準地做出戰略決策，為業務的發展指明方向。提到資料報表，不得不說說Quick BI。Quick BI提供海量資料實時線上分析服務，支援拖拽式操作、提供了豐富的視覺化效果，可以幫助您輕鬆自如

Thinking in SQL系列之六：資料探勘Apriori關聯分析再現啤酒尿布神話

原創：牛超 2017-03-19 Mail：[email protected] 說起資料探勘機器學習，印象中很早就聽說過關於啤酒尿布的神話，這個問題經常出現在資料倉庫相關的文章中，由此可見啤酒尿布問題對資料探勘領域影響的深遠端度。先看看它的成因：“啤酒

【Python學習筆記】Pandas庫之DataFrame

數字 .sh image sum() 新增選擇輸出上線工作區 1 簡介 DataFrame是Python中Pandas庫中的一種數據結構，它類似excel，是一種二維表。或許說它可能有點像matlab的矩陣，但是matlab的矩陣只能放數值型值（當然ma

Thinking in SQL系列之五：資料探勘K均值聚類演算法與城市分級

原創：牛超 2017-02-21 Mail：[email protected] 引言：前一篇文章開始不再介紹簡單演算法，而是轉到資料探勘之旅。感謝CSDN將我前一篇機器學習C4.5決策樹演算法的博文推送到了首頁，也非常榮幸能夠得到雲和恩墨的蓋老師的

MsChart教程系列之例項操作資料繫結(交叉表)應用

在.NET 3.5下可以使用免費圖表控制元件MsChart，是微軟出品的，需要安裝到VS2008環境中使用。這工具給圖形統計和報表圖形顯示提供了很好的解決辦法，下面我們一起來分享這強大的圖形工具吧。推薦第一篇：本文中基本上只會寫出最簡單常用的功能,複雜的資料操作請參考微

Thinking in SQL系列之四：資料探勘C4.5決策樹演算法

原創：牛超 2017-02-11 Mail：[email protected] C4.5是一系列用在機器學習和資料探勘的分類問題中的演算法。它的目標是監督學習：給定一個數據集，其中的每一個元組都能用一組屬性值來描述，每一個元組屬於一個互斥的類別中的某一

Pandas庫之DataFrame

1 簡介 DataFrame是Python中Pandas庫中的一種資料結構，它

Redis系列之----Redis的資料型別及使用場景

Redis是一個開源的、高效能的、基於鍵值對的快取與儲存系統，能夠提供多種不同的鍵值資料型別來適應不同場景下的快取和儲存需求。 Redis中所有的資料都儲存在記憶體中，因此讀寫速度非常快，相比基於資料庫的磁碟讀寫具有非常明顯的優勢，但是，由於Redis是儲存在記憶體中的，儲存資料的大小會受到記憶體

pandas 獲得行列數，shuffle 函式sample() ，重建索引，DataFrame資料篩選——loc，iloc，at，iat

#pandas獲取資料行數和列數，並非是用len或者length的，而是用shape： Count_Row=df.shape[0] #gives number of row count Count_Col=df.shape[1] #gives number of col count pandas資

pandas 學習彙總8 - Series系列，DataFrame資料幀新增刪除（行列）( tcy)

新增刪除 2018/12/3 1.函式： s1.append(to_append, ignore_index=False, verify_integrity=False) #更多序列連線 df.append(other, ignore_index=False, verify_in

Pandas使用DataFrame進行資料分析比賽進階之路（二）：日期資料處理：按日期篩選、顯示及統計資料

首先，表格的資料格式如下： 1、獲取某年某月資料 data_train = pd.read_csv('data/train.csv') # 將資料型別轉換為日期型別 data_train[

Spark實戰(4) DataFrame基礎之資料篩選

文章目錄 filter寫法一 filter寫法二條件符號獲取結果 filter寫法一 from pyspark.sql import SparkSession spark = SparkSession.builder.app

pandas資料結構之Dataframe

Dataframe DataFrame是一個【表格型】的資料結構，可以看做是【由Series組成的字典】（多個series共用同一個索引）。DataFrame由按一定順序排列的多列資料組成。設計初衷是將Series的使用場景從一維拓展到多維。DataFrame既有行索引，也有列索引。行索引：ind

pandas之DataFrame資料框

DataFrame資料框 1.建立資料框 df = DataFrame({ 'age':[21,22,23], 'name':['zhangYafei','LiuGeliang','KangYue'] },index=['fir

pandas系列之 DataFrame 行列資料篩選

相關推薦