1. 程式人生 > 實用技巧 >python 補一個集合set之間的運算

python 補一個集合set之間的運算

看到下面這個程式碼,不知道這個是什麼意思:

data=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],
                   ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],
                   ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
                   ['stop', 'posting', 'stupid', '
worthless', 'garbage'], ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'], ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']] def createVocabList(dataSet): #建立詞庫 這裡就是直接把所有詞去重後,當作詞庫 vocabSet = set([]) for document in dataSet: vocabSet
= vocabSet | set(document) #set 丨 set 是什麼意思 return list(vocabSet) createVocabList(data)

一、首先了解一下什麼是集合

集合(set)是一個無序的不重複元素序列

可以使用大括號{ }或者set()函式建立集合,注意:建立一個空集合必須用set()而不是{ },因為{ }是用來建立一個空字典

#格式如下
parame = {value01,value02,...}

#或者
set(value)

二、集合之前的運算

#set()之後都沒有重複值
a = set('abracadabra')   #
{'a', 'b', 'c', 'd', 'r'} b = set('alacazam') #{'a', 'c', 'l', 'm', 'z'} #a-b集合a中包含而集合b中不包含的元素 a-b # {'b', 'd', 'r'} # |或的意思,並集的意思,集合a或b中包含的所有元素 a|b #{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'} # &且,交集,集合a和b中都包含了的元素 a&b #{'a', 'c'} # ^,不同時包含於a和b的元素 ,a有b沒有,或者b有a沒有 a^b #{'b', 'd', 'l', 'm', 'r', 'z'}

三、集合的基本操作

1.新增元素

1.1 s.add(x)將一個元素 x 新增到集合 s 中,如果元素已存在,則不進行任何操作,引數不能是list

thisset = set(("Google", "Runoob", "Taobao"))
thisset.add("Facebook")

#{'Taobao', 'Facebook', 'Google', 'Runoob'}

1.2 s.update(x) :可以新增多個元素,且引數可以是list , tuple , dict 等

thisset = set(("Google", "Runoob", "Taobao"))
thisset.update({1,3})  #{1, 3, 'Google', 'Taobao', 'Runoob'}

thisset.update([1,4],[5,6])  
#{1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'}

二者的區別

thisset = set(("Google", "Runoob", "Taobao"))
thisset.update("Facebook")

#{'F', 'Google', 'Runoob', 'Taobao', 'a', 'b', 'c', 'e', 'k', 'o'}

2.移除元素

1 s.remove( x )  將元素 x 從集合 s 中移除,如果元素不存在,則會發生錯誤。
2 s.discard( x )  是移除集合中的元素,且如果元素不存在,不會發生錯誤
3 s.pop()  設定隨機刪除集合中的一個元素

例子:

#處理pop 有結果返回,其他的都沒有結果返回

thisset = set(("Google", "Runoob", "Taobao"))
thisset.remove("Taobao")
print(thisset)  #{'Google', 'Runoob'}
thisset.remove("Facebook")   # 不存在會發生錯誤


thisset = set(("Google", "Runoob", "Taobao"))
thisset.discard("Facebook")  # 不存在不會發生錯誤

thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
thisset.pop()  #'Google'

3.計算集合元素的個數

thisset = set(("Google", "Runoob", "Taobao"))
len(thisset)   # 3

4.清空集合

thisset = set(("Google", "Runoob", "Taobao"))
thisset.clear()
print(thisset)
#set()

5.判斷元素在集合中是否存在

#x in s ,判斷元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。
thisset = set(("Google", "Runoob", "Taobao"))
 "Runoob" in thisset  #True
"Facebook" in thisset  #False

附錄是集合的完整內建方法

方法描述
add() 為集合新增元素
clear() 移除集合中的所有元素
copy() 拷貝一個集合
difference() 返回多個集合的差集
difference_update() 移除集合中的元素,該元素在指定的集合也存在。
discard() 刪除集合中指定的元素
intersection() 返回集合的交集
intersection_update() 返回集合的交集。
isdisjoint() 判斷兩個集合是否包含相同的元素,如果沒有返回 True,否則返回 False。
issubset() 判斷指定集合是否為該方法引數集合的子集。
issuperset() 判斷該方法的引數集合是否為指定集合的子集
pop() 隨機移除元素
remove() 移除指定元素
symmetric_difference() 返回兩個集合中不重複的元素集合。
symmetric_difference_update() 移除當前集合中在另外一個指定集合相同的元素,並將另外一個指定集合中不同的元素插入到當前集合中。
union() 返回兩個集合的並集
update() 給集合新增元素