python 補一個集合set之間的運算
阿新 • • 發佈:2020-08-07
看到下面這個程式碼,不知道這個是什麼意思:
data=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'], ['stop', 'posting', 'stupid', 'worthless', 'garbage'], ['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'], ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']] def createVocabList(dataSet): #建立詞庫 這裡就是直接把所有詞去重後,當作詞庫 vocabSet = set([]) for document in dataSet: vocabSet= vocabSet | set(document) #set 丨 set 是什麼意思 return list(vocabSet) createVocabList(data)
一、首先了解一下什麼是集合
集合(set)是一個無序的不重複元素序列
可以使用大括號{ }或者set()函式建立集合,注意:建立一個空集合必須用set()而不是{ },因為{ }是用來建立一個空字典
#格式如下 parame = {value01,value02,...} #或者 set(value)
二、集合之前的運算
#set()之後都沒有重複值 a = set('abracadabra') #{'a', 'b', 'c', 'd', 'r'} b = set('alacazam') #{'a', 'c', 'l', 'm', 'z'} #a-b集合a中包含而集合b中不包含的元素 a-b # {'b', 'd', 'r'} # |或的意思,並集的意思,集合a或b中包含的所有元素 a|b #{'a', 'b', 'c', 'd', 'l', 'm', 'r', 'z'} # &且,交集,集合a和b中都包含了的元素 a&b #{'a', 'c'} # ^,不同時包含於a和b的元素 ,a有b沒有,或者b有a沒有 a^b #{'b', 'd', 'l', 'm', 'r', 'z'}
三、集合的基本操作
1.新增元素
1.1 s.add(x)將一個元素 x 新增到集合 s 中,如果元素已存在,則不進行任何操作,引數不能是list
thisset = set(("Google", "Runoob", "Taobao")) thisset.add("Facebook") #{'Taobao', 'Facebook', 'Google', 'Runoob'}
1.2 s.update(x) :可以新增多個元素,且引數可以是list , tuple , dict 等
thisset = set(("Google", "Runoob", "Taobao")) thisset.update({1,3}) #{1, 3, 'Google', 'Taobao', 'Runoob'} thisset.update([1,4],[5,6]) #{1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'}
二者的區別
thisset = set(("Google", "Runoob", "Taobao")) thisset.update("Facebook") #{'F', 'Google', 'Runoob', 'Taobao', 'a', 'b', 'c', 'e', 'k', 'o'}
2.移除元素
1 s.remove( x ) 將元素 x 從集合 s 中移除,如果元素不存在,則會發生錯誤。 2 s.discard( x ) 是移除集合中的元素,且如果元素不存在,不會發生錯誤 3 s.pop() 設定隨機刪除集合中的一個元素
例子:
#處理pop 有結果返回,其他的都沒有結果返回 thisset = set(("Google", "Runoob", "Taobao")) thisset.remove("Taobao") print(thisset) #{'Google', 'Runoob'} thisset.remove("Facebook") # 不存在會發生錯誤 thisset = set(("Google", "Runoob", "Taobao")) thisset.discard("Facebook") # 不存在不會發生錯誤 thisset = set(("Google", "Runoob", "Taobao", "Facebook")) thisset.pop() #'Google'
3.計算集合元素的個數
thisset = set(("Google", "Runoob", "Taobao")) len(thisset) # 3
4.清空集合
thisset = set(("Google", "Runoob", "Taobao")) thisset.clear() print(thisset) #set()
5.判斷元素在集合中是否存在
#x in s ,判斷元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。 thisset = set(("Google", "Runoob", "Taobao")) "Runoob" in thisset #True "Facebook" in thisset #False
附錄是集合的完整內建方法
方法 | 描述 |
---|---|
add() | 為集合新增元素 |
clear() | 移除集合中的所有元素 |
copy() | 拷貝一個集合 |
difference() | 返回多個集合的差集 |
difference_update() | 移除集合中的元素,該元素在指定的集合也存在。 |
discard() | 刪除集合中指定的元素 |
intersection() | 返回集合的交集 |
intersection_update() | 返回集合的交集。 |
isdisjoint() | 判斷兩個集合是否包含相同的元素,如果沒有返回 True,否則返回 False。 |
issubset() | 判斷指定集合是否為該方法引數集合的子集。 |
issuperset() | 判斷該方法的引數集合是否為指定集合的子集 |
pop() | 隨機移除元素 |
remove() | 移除指定元素 |
symmetric_difference() | 返回兩個集合中不重複的元素集合。 |
symmetric_difference_update() | 移除當前集合中在另外一個指定集合相同的元素,並將另外一個指定集合中不同的元素插入到當前集合中。 |
union() | 返回兩個集合的並集 |
update() | 給集合新增元素 |