python 去重方法
阿新 • • 發佈:2018-12-03
待補充:https://www.cnblogs.com/zknublx/p/6042295.html
一、使用集合直接去重
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids = list(set(ids))
處理起來比較簡單,使用了集合方法set進行處理,不過結果不會保留之前的順序。
二、列表法
ids = [1,2,3,3,4,2,3,4,5,6,1]
news_ids = []
for id in ids:
if id not in news_ids:
news_ids.append(id)
print news_ids
思路看起來比較清晰簡單 ,也可以保持之前的排列順序。
三、字典法
字典中的鍵不能相同,可以使用字典的這一特性達到去重的效果
可以使用python字典的fromkeys()函式來為一個序列去重,用法如下:
newList = {}.fromkeys(oldList).keys() # 只需這一步就達到了去重的目的
四、pandas模組去重
pandas模組的drop_duplicates()方法可以實現csv的去重。
import pandas as pd
dataframe = pd.read_csv(r"csv_file", header=0)
datalist = dataframe.drop_duplicates()
datalist.to_csv("file")