pandas_cookbook學習（七）

阿新 • • 發佈：2018-11-14

根據索引值將每一組資料滯後一項：

In [112]: df = pd.DataFrame(
   .....:    {u'line_race': [10, 10, 8, 10, 10, 8],
   .....:     u'beyer': [99, 102, 103, 103, 88, 100]},
   .....:     index=[u'Last Gunfighter', u'Last Gunfighter', u'Last Gunfighter',
   .....:            u'Paynter', u'Paynter', u'Paynter']); df
   .. 
...: 
Out[112]: 
                 line_race  beyer
Last Gunfighter         10     99
Last Gunfighter         10    102
Last Gunfighter          8    103
Paynter                 10    103
Paynter                 10     88
Paynter                  8    100

#level=0的意思是將索引分開
In [113]: df['beyer_shifted'] = df.groupby( 
level=0)['beyer'].shift(1)

In [114]: df
Out[114]: 
                 line_race  beyer  beyer_shifted
Last Gunfighter         10     99            NaN
Last Gunfighter         10    102           99.0
Last Gunfighter          8    103          102.0
Paynter                 10    103            NaN
Paynter                 10 
     88          103.0
Paynter                  8    100           88.0

獲得每一組資料的最大值

In [115]: df = pd.DataFrame({'host':['other','other','that','this','this'],
   .....:                    'service':['mail','web','mail','mail','web'],
   .....:                    'no':[1, 2, 1, 2, 1]}).set_index(['host', 'service'])
   .....: 

In [116]: mask = df.groupby(level=0).agg('idxmax')

In [117]: df_count = df.loc[mask['no']].reset_index()

In [118]: df_count
Out[118]: 
    host service  no
0  other     web   2
1   that    mail   1
2   this    mail   2

In [119]: df = pd.DataFrame([0, 1, 0, 1, 1, 1, 0, 1, 1], columns=['A'])

In [120]: df.A.groupby((df.A != df.A.shift()).cumsum()).groups
Out[120]: 
{1: Int64Index([0], dtype='int64'),
 2: Int64Index([1], dtype='int64'),
 3: Int64Index([2], dtype='int64'),
 4: Int64Index([3, 4, 5], dtype='int64'),
 5: Int64Index([6], dtype='int64'),
 6: Int64Index([7, 8], dtype='int64')}

In [121]: df.A.groupby((df.A != df.A.shift()).cumsum()).cumsum()
Out[121]: 
0    0
1    1
2    0
3    1
4    2
5    3
6    0
7    1
8    2
Name: A, dtype: int64

pandas_cookbook學習（七）

根據索引值將每一組資料滯後一項： In [112]: df = pd.DataFrame( .....: {u'line_race': [10, 10, 8, 10, 10, 8], .....: u'beyer': [99, 102, 103, 103,

JAVA學習（七）：方法重載與方法重寫、thiskeyword和superkeyword

格式 hello new 初始 per 而且方法重寫學習方式方法重載與方法重寫、thiskeyword和superkeyword 1、方法重載重載可以使具有同樣名稱但不同數目和類型參數的類傳遞給方法。註：一是重載方法的參數列表必須與被重載的方法不同

Guice 學習（七）常量和屬性的註入（ Constant and Property Inject）

-a ret roc build ann class google mes ota 1、常量註入方式 package com.guice.ConstantInjectDemo; import com.google.inject.Binder; i

Python學習（七）

偏移量學習所有 ecs tables column 信息詳細 rom 一、MySQL基礎 show databases; 查看所有數據庫 use db_name; 用那個數據庫 show tables; 查看數據庫下的所有表 decs table_name;

python學習（七）列表/字典合並、布爾型、交換變量值、列表轉換字符串連接和分割

for post type abcde 列表 str 根據指定學習 1、列表合並 a=[] b=[12,23] a.insert(0,‘sdv‘)#在指定位置增加元素 a.append(‘we‘)#增加元素 a.extend(b) #合並列表 print(a) a

機器學習（七）—Adaboost 和梯度提升樹GBDT

獲得決策樹 info gin 否則它的均方差但是 ont 1、Adaboost算法原理，優缺點：　　理論上任何學習器都可以用於Adaboost.但一般來說，使用最廣泛的Adaboost弱學習器是決策樹和神經網絡。對於決策樹，Adaboost分類用了CART分類樹，

操作系統學習（七）、保護機制概述

長度發的之間軟件開發軟件內存空間工作尋找超級用戶保護機制是可靠運行多任務環境所必須的。它可以用於保護各個任務免受互相之間的幹擾。在軟件開發的任何階段都可以使用段級和頁級保護來協助尋找和檢測設計問題和錯誤。當程序對錯誤內存空間執行了一次非期望的引用，保護機制

mysql的學習（七）-自定義函數和流程控制

returns spa 會員返回類型 mysq -- create decimal DELIMITER // (設置結束符其實我也不太明白為啥要這樣記住就行把) CREATE FUNCTION ym_date(mydate DATE) （創建函數

C++語言學習（七）——友元

ons 封裝性 int turn 安全性語句機制 int() sin C++語言學習（七）——友元一、友元簡介 1、友元簡介面向對象編程的類的設計機制實現了數據的隱藏與封裝，類的成員變量一般定義為私有成員，成員函數一般定義為公有的，是類與外部的通信接口。在實踐中，類

FFMpeg學習（七）代碼結構分析

form 圖片 mage iba hls format 9.png 屬於 gin libavformat下的hls.c和mpegts.c實際上是同一個級別的，同屬於demuxer。只不過實際使用的hls協議是先解協議（hls.c）後解封裝（mpegts.c），這裏的協議和

深度學習（七）object detection

ali 深度學習深度 p s 安防系統 eat reference res sea 目標檢測（object detection）的基本思路：檢測（detection）+ 定位（localization）目標檢測在很多場景有用，如無人駕駛和安防系統。傳統方法　　

GO語言學習（七）Go 語言變量

數據指定需要內容 load 默認值操作符此外 alt Go 語言變量變量來源於數學，是計算機語言中能儲存計算結果或能表示值抽象概念。變量可以通過變量名訪問。 Go 語言變量名由字母、數字、下劃線組成，其中首個字母不能為數字。聲明變量的一般形式是使用 va

MyBatis學習（七）

ppi before 多個使用 day col util == and 本課程對應視頻教程：http://edu.51cto.com/sd/3ec2c 1、高級查詢 MyBatis作為一個ORM框架，也對sql的高級查詢做了支持，這裏以用戶，訂單，訂單詳情，商品為例講解

機器學習之numpy和matplotlib學習（七）

今天我們來學習第三種畫子圖的方法。主要使用到的模組是matplotlib.gridspec 學習過程請參考程式碼裡面的註釋：全部程式碼如下： #!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : SundayC

多執行緒學習（七）

問題 1.賣票系統（如果每個執行緒執行的程式碼相同，可以使用同一個Runnable物件，這個Runnable物件中有那個共享資料）解決 public class MultiThreadShareDataStudy { public static void main(String

servlet學習（七）ServletContext

一、問題 session可以解決同一個使用者之間不同請求的資料共享問題，那麼不同使用者之間的需要資料共享怎麼辦？二、解決使用ServletContext物件三、原理 ServletContext物件是由伺服器進行建立的，也就是說一個專案裡面只有一個ServletContex

機器學習（七）白化whitening

轉自：https://blog.csdn.net/hjimce/article/details/50864602 原文地址：http://blog.csdn.net/hjimce/article/details/50864602 作者：hjimce 一、相關理論

PE檔案格式學習（七）：安全表

1.介紹如果一個應用程式有數字簽名，那麼它的安全表就不會為空。它位於異常表的後面。 2.安全表解析通過資料目錄表裡提供的RVA，我們轉換成offset，找到了安全表的位置，如下：安全表的結構體如下： typedef struct _WIN_CERTIFIC

Python學習（七）：生成器表示式（expr for iner_var in iterable if cond_expr）

列表解析：[expr for iter_var in iterable if cond_expr] 生成器表示式：(expr for iter_var in iterable if cond_expr) J = 'aadsjnk' S = 'asadasbxjs

pandas_cookbook學習（九）——apply

Apply應用函式： In [135]: df = pd.DataFrame(data={'A' : [[2,4,8,16],[100,200],[10,20,30]], 'B' : [['a','b','c'],['jj','kk'],['ccc']]},index=['I','I

pandas_cookbook學習（七）

相關推薦