1. 程式人生 > >10 Python 數據類型—集合

10 Python 數據類型—集合

python img 序列 bae db2 star gif slicing enc

  在Python set是基本數據類型的一種集合類型,它有可變集合(set())和不可變集合(frozenset)兩種。創建集合set集合set添加集合刪除交集並集差集的操作都是非常實用的方法。

  1. python的set和其他語言類似, 是一個無序不重復元素集, 基本功能包括關系測試和消除重復元素. 集合對象還支持union(聯合), intersection(交), difference(差)和sysmmetric difference(對稱差集)等數學運算.
  2. sets 支持 x in set, len(set),和 for x in set。作為一個無序的集合,sets不記錄元素位置或者插入點。因此,sets不支持 indexing, slicing, 或其它類序列(sequence-like)的操作。
技術分享
1 x = set(spam)
2 y = set([h,a,m])
3 z = {1, 4, 5, 3, 7, 8}
4 print(x, y, z)
5 
6 {a, m, s, p} {a, h, m} {1, 3, 4, 5, 7, 8}
集合 技術分享
 1 x = set(spam)
 2 y = set([h,a,m])
 3 z = {1, 4, 5, 3, 7, 8}
 4 print(x, y, z)
 5 print(x & y)  # 交集
 6 
 7 {m, a}
 8 print(x | y)  #
並集 9 10 {p, s, m, h, a} 11 print(x - y) 12 print(y - x) # 差集 13 14 {p, s} 15 {h}
交集,並集, 差集

  集合是無序的,不重復的數據集合,它裏面的元素是可哈希的(不可變類型),但是集合本身是不可哈希(所以集合做不了字典的鍵)的。以下是集合最重要的兩點:

    去重,把一個列表變成集合,就自動去重了。

    關系測試,測試兩組數據之前的交集、差集、並集等關系

1,集合的創建

技術分享
1 set1 = set({1,2,barry})
2 set2 = {1,2,barry
} 3 print(set1,set2) # {1, 2, ‘barry‘} {1, 2, ‘barry‘}
View Code

2,集合的增

技術分享
 1 set1 = {alex,wusir,ritian,egon,barry}
 2 set1.add(景女神)
 3 print(set1)
 4 
 5 #update:叠代著增加
 6 set1.update(A)
 7 print(set1)
 8 set1.update(老師)
 9 print(set1)
10 set1.update([1,2,3])
11 print(set1)
View Code

3,集合的刪

技術分享
 1 set1 = {alex,wusir,ritian,egon,barry}
 2 
 3 set1.remove(alex)  # 刪除一個元素
 4 print(set1)
 5 
 6 set1.pop()  # 隨機刪除一個元素
 7 print(set1)
 8 
 9 set1.clear()  # 清空集合
10 print(set1)
11 
12 del set1  # 刪除集合
13 print(set1)
View Code

4,集合的其他操作:

  4.1 交集。(& 或者 intersection)

技術分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 & set2)  # {4, 5}
4 print(set1.intersection(set2))  # {4, 5}
View Code

  4.2 並集。(| 或者 union)

技術分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 | set2)  # {1, 2, 3, 4, 5, 6, 7}
4 
5 print(set2.union(set1))  # {1, 2, 3, 4, 5, 6, 7}
View Code

  4.3 差集。(- 或者 difference)

技術分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 - set2)  # {1, 2, 3}
4 print(set1.difference(set2))  # {1, 2, 3}
View Code

  4.4反交集。 (^ 或者 symmetric_difference)

技術分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 ^ set2)  # {1, 2, 3, 6, 7, 8}
4 print(set1.symmetric_difference(set2))  # {1, 2, 3, 6, 7, 8}
View Code

  4.5子集與超集

技術分享
1 set1 = {1,2,3}
2 set2 = {1,2,3,4,5,6}
3 
4 print(set1 < set2)
5 print(set1.issubset(set2))  # 這兩個相同,都是說明set1是set2子集。
6 
7 print(set2 > set1)
8 print(set2.issuperset(set1))  # 這兩個相同,都是說明set2是set1超集。
View Code

5,frozenset不可變集合,讓集合變成不可變類型。

技術分享
1 s = frozenset(barry)
2 print(s,type(s))  # frozenset({‘a‘, ‘y‘, ‘b‘, ‘r‘}) <class ‘frozenset‘>
View Code

二,深淺copy

  1,先看賦值運算。

技術分享
 1 l1 = [1,2,3,[barry,alex]]
 2 l2 = l1
 3 
 4 l1[0] = 111
 5 print(l1)  # [111, 2, 3, [‘barry‘, ‘alex‘]]
 6 print(l2)  # [111, 2, 3, [‘barry‘, ‘alex‘]]
 7 
 8 l1[3][0] = wusir
 9 print(l1)  # [111, 2, 3, [‘wusir‘, ‘alex‘]]
10 print(l2)  # [111, 2, 3, [‘wusir‘, ‘alex‘]]
View Code

    對於賦值運算來說,l1與l2指向的是同一個內存地址,所以他們是完全一樣的。

  2,淺拷貝copy。

技術分享
 1 l1 = [1,2,3,[barry,alex]]
 2 
 3 l2 = l1.copy()
 4 print(l1,id(l1))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2380296895816
 5 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2380296895048
 6 
 7 l1[1] = 222
 8 print(l1,id(l1))  # [1, 222, 3, [‘barry‘, ‘alex‘]] 2593038941128
 9 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2593038941896
10 
11  
12 l1[3][0] = wusir
13 print(l1,id(l1[3]))  # [1, 2, 3, [‘wusir‘, ‘alex‘]] 1732315659016
14 print(l2,id(l2[3]))  # [1, 2, 3, [‘wusir‘, ‘alex‘]] 1732315659016
View Code

    對於淺copy來說,第一層創建的是新的內存地址,而從第二層開始,指向的都是同一個內存地址,所以,對於第二層以及更深的層數來說,保持一致性。

  3,深拷貝deepcopy。

技術分享
 1 import copy
 2 l1 = [1,2,3,[barry,alex]]
 3 l2 = copy.deepcopy(l1)
 4 
 5 print(l1,id(l1))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167816
 6 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167048
 7 
 8 l1[1] = 222
 9 print(l1,id(l1))  # [1, 222, 3, [‘barry‘, ‘alex‘]] 2915377167816
10 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167048
11 
12 l1[3][0] = wusir
13 print(l1,id(l1[3]))  # [1, 222, 3, [‘wusir‘, ‘alex‘]] 2915377167240
14 print(l2,id(l2[3]))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167304
View Code

    對於深copy來說,兩個是完全獨立的,改變任意一個的任何元素(無論多少層),另一個絕對不改變。

10 Python 數據類型—集合