2018.03.27 pandas duplicated 和 replace 使用

阿新 • • 發佈：2018-03-27

rep 原來 object dataframe 布爾 -- series style das

 1 #.duplicated / .replace 
 2 import numpy as np
 3 import pandas as pd
 4 s = pd.Series([1,1,1,1,1,2,3,3,3,4,4,5,6,6])
 5 print(s)
 6 print(s.duplicated())#True表示重復 得到布爾型
 7 print(s[s.duplicated() == False])#
 8 #通過布爾類型的判斷來得到不重復的值
 9 
10 s_re = s.drop_duplicates()#直接去除重復值
11 #inplace=True 表示直接修改原來的值  

12 print(s_re)
13 print(‘------‘)
14 
15 #DataFrame測試
16 df = pd.DataFrame({‘key1‘:[‘a‘,‘a‘,3,4,5],
17                    ‘key2‘:[‘a‘,‘a‘,‘b‘,‘b‘,‘c‘]})
18 print(df)
19 print(‘---------------------‘)
20 print(df.duplicated())
21 print(‘---------------------‘)
22 print(df.drop_duplicates())

結果：

0     1
1     1
2     1
3     1
4     1
5     2
6     3
7     3
8     3
9     4
10    4
11    5
12    6
13    6
dtype: int64
0     False
1      True
2      True
3      True
4      True
5     False
6     False
7      True
8      True
9     False
10     True
11    False
12    False
13     True
dtype: bool
0     1
5     2
6     3
9     4
11    5
12    6
dtype: int64
0     1
5     2
6     3
9     4
11    5
12    6
dtype: int64
------
  key1 key2
0    a    a
1    a    a
2    3    b
3    4    b
4    5    c
---------------------
0    False
1     True
2    False
3    False
4    False
dtype: bool
---------------------
  key1 key2
0    a    a
2    3    b
3    4    b
4    5    c

1 #.replace()
2 s = pd.Series(list(‘aaabbbcdd‘))
3 print(s)
4 print(s.replace(‘a‘,np.nan))
5 print(s.replace([‘a‘,‘d‘],np.nan))
6 print(s.replace({‘a‘:‘Hello‘,‘d‘:‘World‘}))

結果：

0    a
1    a
2    a
3    b
4    b
5    b
6    c
7    d
8    d
dtype: object
0    NaN
1    NaN
2    NaN
3      b
4      b
5      b
6      c
7      d
8      d
dtype: object
0    NaN
1    NaN
2    NaN
3      b
4      b
5      b
6      c
7    NaN
8    NaN
dtype: object
0    Hello
1    Hello
2    Hello
3        b
4        b
5        b
6        c
7    World
8    World
dtype: object

2018.03.27 pandas duplicated 和 replace 使用

rep 原來 object dataframe 布爾 -- series style das 1 #.duplicated / .replace 2 import numpy as np 3 import pandas as pd 4 s = pd.Series

VSCode Windows下VSCode編譯除錯c/c++更新launch和tasks 2018.03.27

新的launch.json // Available variables which can be used inside of strings. // ${workspaceRoot}: the root folder of the team // ${f

2018-03-27

Linux命令一、環境變量PATH環境變量位置：/etc/profile臨時增加環境變量的目錄：PATH=$PATH:/tmp/ 二、cp 命令cp命令是cp –i 命令的別名cp /etc/passwd /tmp/1.txtcp –r /tmp/wang/ /tmp/linux !$上一條命令的最後一個參數

2018-03-27 Spring之旅

代碼一個更多不同的不同環境松耦合總結 ron 最近一直陷入一個誤區，老是找一些網上關於SSM速成等視頻學習，然後盲目的跟著‘復制‘代碼，當時跟著視頻敲完代碼，實現了某些功能後，感覺自己對Spring等一些框架已經有了足夠的了解(其實只是知其然，不知其所以然

20172319 2018.03.27-04.05 《Java程序設計》第4周學習總結

距離正在編寫內容其他安全性 b16 排查 rabl 20172319 2018.03.27-04.05 《Java程序設計》第4周學習總結教材學習內容總結第四章編寫類類與對象的回顧：對象是有狀態的，狀態由對象的屬性值確定。屬性由類中的聲明的變量所定義。對

【VSCode】Windows下VSCode編譯調試c/c++【更新 2018.03.27】

記錄 root ret 保存 nload word res base install ———————

2018/03/07 每日一學PHP 之常量defind 和 const區別

報錯問題條件語句 const 識別是否定義運行 fin 　　什麽是常量？　　　　如字面理解的，在腳本執行期間不可改變的的量。　　定義一個常量應該註意的事項？　　　　1：常量默認大小寫敏感，錯誤的大小寫不會被識別為常量。　　　　2：常量只能是標量數據，也可

2018.03.26 Python-Pandas 字符串常用方法

末尾 OS std afr ext index bsp 3.2 data 　　import numpy as np　　import pandas as pd 1 #字符串常用方法 - strip 2 s = pd.Series([‘ jack ‘,‘jill‘,‘ j

2018.03.29 python-pandas 數據透視pivot table / 交叉表crosstab

none 交叉篩選 OS func pos bsp class ros 1 #透視表 pivot table 2 #pd.pivot_table(data,values=None,index=None,columns=None, 3 import numpy as

Windows核心編程之核心總結（第二章字符和字符串處理）（2018.5.27）

Windows核心編程之核心總結學習目標第二章是學習字符和字符串處理，為了更好理解這一章的內容，我自行添加了其他輔助性內容：存儲模式（大端存儲和小端存儲）、字符編碼方案（一看就懂）。以下是這一章的學習目標：1.大端存儲和小端存儲2.字符編碼方案3.ANSI和Unicode字符、字符串，Windows自定義數

pandas中的map和replace操作

map可以做一個對映，對於操作大型的dataframe來說就非常方便了，而且也不容易出錯。replace的作用是替換，這個很好理解。 import numpy as np import pandas as pd from pandas import Series, DataFrame

RISC-V雙週簡報0x12：看看AI和RISC-V碰撞出的火花(2018-03-02)

RISC-V 雙週簡報 (2018-03-02) 要點新聞： RISC-V @ Embedded World GreenWaves的GAP8引發關注 RV新聞 Embedded World上的RISC-V 今年在德國舉辦的Embedded World上RI

2018-03-24 第六章：挖掘頻繁模式、關聯和相關性：基本概念

6.3 模式評估方法大部分關聯規則挖掘演算法都使用支援度-置信度框架。儘管最小支援度和置信度閥值有助於排除大量無趣規則的探查，但仍然會產生一些使用者不感興趣的規則。強規則不一定是有趣的，甚至會誤導。如：假設有10000個事務中，資料顯示6000個顧客事務包含計算機遊戲，7500個事務包含錄影，而4

cool-2018-03-10-windows下實現mysql5.6讀寫分離、主從複製和一主多從

mysql壓縮包移步下載：mysql5.6--主從資料庫的安裝第一步：複製mysql到自定義目錄中，我現在放的是 E:\cool\mysql，資料庫叫3380第二步：刪除3380\logs目錄下的所有日誌檔案第三步驟: 刪除3380\datas所有的log檔案（注意不是所有

十七週四次課 2018.03.05 expect指令碼同步檔案、expect指令碼指定host和要同步的檔案、構建檔案分發系統、批量遠端執行命令

20.31 expect指令碼同步檔案在一臺機器上把檔案同步到另外一臺機器上去。建立檔案，然後把上面的程式碼貼上進去，把尾號132的遠端機器的12.txt同步到本機的/tmp/目錄下第一次登入問提示是否登入，第二次就可以直接輸密碼登入了。表示expect結束了，

【資料庫】【SQL高階】*MySQL資料庫之“函式和操作符”（數值函式部分#常用#：方便查閱使用）#資料庫SQL知識彙總#（四）-2018.11.27- #轉載#

四、數值函式 4.1 算數操作符 DIV整數除法。類似於 FLOOR()，然而使用BIGINT 演算法也是可靠的。 4.2 數學函式若發生錯誤，所有數學函式會返回 NULL 。 ABS(X)：返回X 的絕對值。該函式支援使用BIGINT值。

[03] 類的結構和創建對象

是否 ava 字節 ati 成員變量 ++ 調用構造 syn span 1、類的結構和定義先回顧一下，類的基本概念：類定義了對象共同的屬性和行為（即方法）具體的某個對象需要通過類來進行申明那麽顯而易見地，類中應該包含的東西就有，屬性、方法，另外，既然對象要通過類來聲明，那麽

translate和replace的區別

blog 為什麽 rac sea lac 2個規則數據庫問題今天在oracle數據庫中看到replace和translate的嵌套就有點蒙了，於是就上網看了一下，感覺豁然開朗：今天遇到的問題如下： replace(TRANSLATE(a.deal_msg,‘0

.Net轉Java.03.受查異常和非受查異常

控制 cli 編譯 time 語法 ring rest body div 轉到Java以後發現一個很妖的事情，為啥有些方法後邊有個 throws XXXXException 比如下面的代碼 @Override public <T> Re

數字貨幣量化分析報告[2018-01-27]

數字 salt san 3.5 clas gas 更多 read avt 【分析時間】2018-01-27 09:13【數據來源】OKEX【報告內容】1 BTC短期 2.7短中 -2.0中期 -3.02 LTC短期 -0.4短中 -1.0中期

2018.03.27 pandas duplicated 和 replace 使用

相關推薦