Python中字典的近親——集合
1.集合可以實現去重的功能;
2.集合可以實現關系測試:交集,差集,並集,是否子集,是否沒有交集
以一個應用場景來引出集合:
現在IPV4下用一個32位無符號整數來表示,一般用點分方式來顯示,點將IP地址分成4個部
分,每個部分為8位,表示成一個無符號整數(因此不需要用正號出現),如10.137.17.1,
是我們非常熟悉的IP地址,一個IP地址串中沒有空格出現(因為要表示成一個32數字)。
現在需要你用程序來判斷IP是否合法。
(1)輸入描述:輸入一個ip地址
(2)輸出描述:返回判斷的結果YES or NO
示例1
1.輸入: 10.138.15.1
2.輸出: YES
#!/usr/bin/env python
#172.25.254.1
ip = raw_input(‘ip:‘)
#["172"."25"."254"."1"]
ip = ip.split(‘.‘)
#一次判斷每一部分是否合法;
for i in ip:
if 0<=int(i)<=255:
print ‘YES‘
break
else:
print ‘NO‘
場景1: li = [‘a‘, ‘b‘]
場景2: 社聯要統計所有加入社團的學生?
li1 = [‘a‘, ‘b‘, ‘c‘] li2 = [‘a‘, ‘c‘]
all = []
for i in li1: for j in li2:
set(li1 + li2) set(li1.extend(li2))
一.集合set的定義
1.集合是不重復的數據結構;
(1)花括號裏面為空,是字典類型;
In [1]: s = {}
In [2]: type(s)
Out[2]: dict
(2)定義集合的第一種方式;
In [3]: s = {1, 2, 3, 1, 2}
In [4]: type(s)
Out[4]: set
In [5]: print s
set([1, 2, 3])
2.工廠方法定義集合時,括號裏面是可叠代的對象, eg: 數值類型不可以;
(1)定義集合的第二種方式:定義一個空集合
In [6]: s = set()
In [7]: type(s)
Out[7]: set
(2)定義集合
*字符串
In [8]: s = set(‘hello‘)
In [9]: print s
set([‘h‘, ‘e‘, ‘l‘, ‘o‘])
*字典
In [11]: s = set({‘a‘:1, ‘b‘:2, ‘c‘:3})
In [12]: print s
set([‘a‘, ‘c‘, ‘b‘])
*元組
In [13]: s = set((1, 2, 3, 4))
In [14]: print s
set([1, 2, 3, 4])
*列表
In [15]: s = set([1, 2, 3])
In [16]: print s
set([1, 2, 3])
二.應用:實現列表去重
1,轉換為集合數據類型:set(列表)
2.字典的fromkeys方法實現;
(1)實現列表去重
In [22]: li = [1, 2, 3, 4, 2, 3]
In [23]: s = set(li)
In [24]: li = list(s)
In [25]: print s
set([1, 2, 3, 4])
In [26]: print li
[1, 2, 3, 4]
(2)fromkeys方法實現列表去重
In [28]: li = [1, 2, 3, 4, 2, 3]
In [29]: d = {}.fromkeys(li)
In [30]: print d.keys()
[1, 2, 3, 4]
三.集合的特征
1.集合是無序的, 不重復的數據類型;
2.因此不支持索引,也不支持切片;也不支持重復;也不支持連接;
3.支持成員操作符;
4.支持for循環;
(1)成員操作符:
In [31]: s = {1, 2, 3, 4, 1, 2}
In [32]: 1 in s
Out[32]: True
In [33]: 1 not in s
Out[33]: False
(2)集合支持for循環,是可叠代的:
In [34]: for i in s:
....: print i
....:
1
2
3
4
四.集合的增三改查
1.增
In [35]: s = {1, 2, 3, 4, 1, 2}
In [36]: s.add(8)
In [37]: s.add(1)
In [38]: print s
set([8, 1, 2, 3, 4])
In [39]: s1 = {‘a‘, ‘b‘, ‘c‘}
In [40]: s.update(s1)
In [41]: print s
set([‘a‘, 1, 2, 3, 4, 8, ‘c‘, ‘b‘])
2.改
3.查
關系測試操作
In [45]: s1 = {1, 2, 3, 4}
In [46]: s2 = {1, 2, 3, 5}
#交集
In [47]: s1 & s2
Out[47]: {1, 2, 3}
#並集
In [48]: s1 | s2
Out[48]: {1, 2, 3, 4, 5}
#差集
In [49]: s1 - s2
Out[49]: {4}
In [50]: s2 - s1
Out[50]: {5}
#對等差分
In [51]: s1 ^ s2
Out[51]: {4, 5}
#交集
In [52]: s1.intersection(s2)
Out[52]: {1, 2, 3}
#並集
In [53]: s1.union(s2)
Out[53]: {1, 2, 3, 4, 5}
#差集
In [54]: s1.difference(s2)
Out[54]: {4}
In [55]: s2.difference(s1)
Out[55]: {5}
#對等差分
In [56]: s1.symmetric_difference(s2)
Out[56]: {4, 5}
In [67]: s1 = {1, 2, 3, 4}
In [68]: s2 = {1, 2, 3}
#s2是否s1子集
In [69]: s2.issubset(s1)
Out[69]: True
#s1是否是s2的父集
In [71]: s1.issuperset(s2)
Out[71]: True
#是否沒有交集
In [72]: s1.isdisjoint(s2)
Out[72]: False
4.刪
In [73]: s = {1, ‘a‘, ‘hello‘, 45,}
(1)s.pop() #隨機刪除一個,返回一個對象
In [74]: s.pop()
Out[74]: ‘a‘
(2)s.remove #刪除指定元素,是set成員則刪除,不是成員報錯
In [75]: s.remove(1)
In [76]: print s
set([45, ‘hello‘])
In [77]: s.remove(‘b’)
File "<ipython-input-77-fe0f6997b18b>", line 1
s.remove(‘b’)
^
SyntaxError: invalid syntax
In [78]: print s
set([45, ‘hello‘])
(3)s.discard() #刪除指定元素,是成員刪除,不是成員什麽都不做
In [79]: s.discard(45)
In [80]: s.discard(‘b‘)
In [81]: print s
set([‘hello‘])
(4)s.clear() #清空集合元素
In [82]: s.clear()
In [83]: s
Out[83]: set()
應用:
(華為機試題)題目描述
明明想在學校中請一些同學一起做一項問卷調查,為了實驗的客觀性, 他先用計算機生成了N個1到1000
之間的隨機整數(N≤1000), N是用戶輸入的,對於 其中重復的數字,只保留一個,把其余相同的數去
掉,不同的數對應 著不同的學生的學號。然後再把這些數從小到大排序,按照排好的順 序去找同學做調
查。請你協助明明完成“去重”與“排序”的工作;
提示:
生成隨機數,
import random
random.randint(1,1000)
列表的去重
#!/usr/bin/env python
#coding:utf-8
import random
s = set()
N = input(‘輸入一個數:‘)
for i in range (N) :
s.add(random.randint(1,1000))
#sorted是內置方法用來排序;
print sorted(s)
#li = list(s)
#li.sort()
#print li
總結
可變數據類型: 列表, 字典, 集合
不可變數據類型: 數值類型, 字符串, 元組
可變數據類型實現某個功能, 直接改變可變的數據類型;
不可變數據類型實現某個功能,需要將結果賦值給另外一個變量;
是否實現for循環
可叠代數據類型: str, list, tuple, dict, set
不可叠代數據類型:數值類型
是否支持索引,切片, 重復和連接特性
有序的數據類型: str, list, tuple
無序的數據類型: dict, set
Python中字典的近親——集合