第二篇 Python資料型別、字元編碼、檔案處理
一、引子
1、什麼是資料?
x=10,10是我們要儲存的資料
2、為何資料要分不同的型別
資料是用來表示狀態的,不同的狀態就應該用不同的型別的資料去表示
3、資料型別的分類
數字(×××,長×××,浮點型,複數)
字串 (在介紹字元編碼時介紹位元組bytes型別)
列表
元組
字典
集合
4 按照以下幾個點展開資料型別的學習
1)基本使用
(1)用途
(2)定義方式
(3)常用操作+內建的方法
2)該型別總結
(1)存一個值or存多個值
只能存一個值
可以存多個值,值都可以是什麼型別
(2)有序or無序
(3)可變or不可變
!!!可變:值變,id不變。可變==不可hash
!!!不可變:值變,id就變。不可變==可hash
二、數字
1、整型int
作用:年紀,等級,×××號,qq號等整型數字相關
定義:age=10 #本質age=int(10)
2、浮點型float
作用:薪資,身高,體重,體質引數等浮點數相關
定義:alary=3000.3 #本質salary=float(3000.3)
3、二進位制,十進位制,八進位制,十六進位制
參考連結:http://blog.51cto.com/10630401/2049374
4、其他數字型別(瞭解)
1)長××× 在python2中(python3中沒有長×××的概念) num=2L
2)複數 x=1-2j
5、數字型別小結
1)存一個值
2)有序
3)!!!不可變:值變,id就變。不可變==可hash
三、字串
1、作用:名字,性別,國籍,地址等描述資訊
2、定義:在單引號\雙引號\三引號內,由一串字元組成
name='egon'
3、常用操作+內建的方法:
1)優先掌握的操作:
(1)按索引取值(正向取+反向取):只能取(不可修改,取出的字元還是字串型別,空格也佔一個索引)
str[開頭的索引值:結尾的索引值:步長]
(2)切片(顧頭不顧尾,步長)
(3)長度len (等同於呼叫這個方法str.__len__())
(4)成員運算in和not in(結果是布林值)
(5)移除空白strip(只能移除字串左右兩端的空白格)
日常用法:password=input('>>: ').strip()
(6)切分split
預設是空格符做切割符號,不指定切割次數的話,整個字串都會切
rsplit是按照倒序的方式切割
(7)迴圈
逐個取出字串中的字元、range(頭,尾,步長)
2)需要掌握的操作
(1)strip,lstrip,rstrip
strip預設是移除空白,非空格的需要指定;lstrip是移除左邊的;rstrip是移除右邊的;
(2)lower,upper
lower是把字串中的大寫字母轉換成小寫,upper是小寫換成大寫
(3)startswith,endswith
判斷字串是否是以什麼開頭或者結尾,結果是布林值
(4)format的三種玩法
佔位符是{}
print('this is {} this is a {}'.format('test','pen'))
(5)split,rsplit
(6)join
只有在列表內的元素全是字串型別,才能用join拼接
用split切割完以後是一個列表,每個元素都是字串,可以採用join拼接
info='root:x:0:0' l=info.split(':') print(l) print(':'.join(l))
(7)replace
(8)isdigit
3)其他操作(瞭解即可)
(1)find,rfind,index,rindex,count
(2)center,ljust,rjust,zfill
(3)expandtabs
(4)captalize,swapcase,title
(5)is數字系列
(6)is其他
4、字串型別小結
1)存一個值
2)有序
3) !!!不可變:值變,id就變。不可變==可hash
四、列表
1、作用:多個裝備,多個愛好,多門課程,多個女朋友等
2、定義:[]內可以有多個任意型別的值,逗號分隔
變數l= list('字串')
l=list('hello')
print(l)
['h', 'e', 'l', 'l', 'o']
3、常用操作+內建方法
1)優先掌握的操作:
(1)按索引存取值(正向存取+反向存取):即可存也可以取
(2)切片(顧頭不顧尾,步長)
(3)長度
(4)成員運算in和not in
(5)追加append (會追加在最後一個索引的後邊)
(6)刪除:直接刪除del、remove;刪除並拿到結果pop;
del list[索引]
list.remove('列表中的元素')
list.pop(索引) 能打印出刪除的那個元素
(7)迴圈
迴圈取出列表中的元素
l1=['a','b','c','d'] for i in range(len(l1)): print(l1[i])
2)需要掌握的操作:
(1)insert(插到哪個索引值前面,插入的值)
(2)clear() python2 沒有這個方法
(3)copy() python2 沒有這個方法
(4)count() 統計列表中的某個元素的次數
(5)extend() 列表的拼接擴充套件,(裡面可以寫另一個列表名或者一個字串)
(6)index(元素) 查詢某個元素的索引值
(7)reverse() 把列表顛倒過來
(8)sort() 排序 預設的是從小到大;list.sort(reverse=True)可以實現從大到小
3)其他操作(瞭解即可)
4、列表型別總結
1)可以存多個值,值都可以是任意型別
2)有序
3)!!!可變:值變,id不變。可變==不可hash
五、元組
1、作用:存多個值,對比列表來說,元組不可變(是可以當做字典的key的),主要是用來讀
2、定義:與列表型別比,只不過[]換成()
變數名=tuple(字串)
age=tuple('hello')
print(age,type(age)
3、常用操作+內建方法
1)優先掌握的操作:
(1)按索引取值(正向取+反向取):只能取
(2)切片(顧頭不顧尾,步長)
(3)長度
(4)成員運算in和not in
(5)迴圈
2)需要掌握的操作
(1)index
(2)count
4、元組型別總結
1)可以存多個值,值都可以是任意型別
2)有序
3)!!!不可變:值變,id就變。不可變==可hash
六、字典
1、作用:存多個值,key-value存取,取值速度快
2、定義:key必須是不可變型別,value可以是任意型別
info={'name':'egon','age':18,'sex':'male'} #本質info=dict({....})
或info=dict(name='egon',age=18,sex='male')
或info=dict([['name','egon'],('age',18)])
或{}.fromkeys(('name','age','sex'),None)
3、常用操作+內建方法
1)優先掌握的操作:
(1)按key存取值:可存可取
(2)長度len (統計鍵值對的個數)
(3)成員運算in和not in (結果是布林值)
(4)刪除
d.pop('a') #輸出的是刪除的key對應的value值
d.popitem() #輸出的是刪除的key對應的key:value鍵值對
(5)鍵keys(),值values(),鍵值對items()
(6)迴圈
info = dict(name='egon', age=18, sex='male') for key in info: print(info[key]) for items in info: print(items)
4、字典型別總結
1)可以存多個值,值都可以是任意型別
2)無序
3)!!!不可變:值變,id就變。不可變==可hash
七、集合 set
1、作用:去重,關係運算
2、定義:可以包含多個元素,用逗號分割
s=set({元素需為不可變型別})
集合的元素遵循三個原則:
1、每個元素必須是不可變型別(可hash,可作為字典的key)
2、沒有重複的元素
3、無序
PS:注意集合的目的是將不同的值存放到一起,不同的集合間用來做關係運算,無需糾結於集合中單個值
3、常用操作+內建的方法:
1)優先掌握的操作:
(1)長度len
(2)成員運算in和not in
(3)|合集 intersection
(4)&交集 union
(5)-差集 symmetric_difference
(6)^對稱差集 difference
(7)==
(8)父集:>,>= issuperset
(9)子集:<,<= issubset
(10)迴圈
2)瞭解的操作:
(1)集合1.difference_update(集合2)
s1.difference_update(s2) #s1=s1.difference(s2)
(2)集合1.pop() 預設刪除的是集合的最後一個元素
(3)集合1.add() 預設新增的元素是到集合的最後面
(4)刪除集合元素
discard() 刪除的元素不存在不會報錯
remove() 刪除的元素不存在則報錯
(5)集合1.isdisjoint(集合2) 兩個集合沒有共同部分時,返回值為True
(6)集合.update({}) 一次可以增加多個元素
4、集合型別小結
1)存多個值
2)無序
3) !!!不可變:值變,id就變。不可變==可hash
八、資料型別總結!!!!!
1、按儲存空間的佔用分(從低到高)
數字
字串
集合:無序,即無序存索引相關資訊
元組:有序,需要存索引相關資訊,不可變
列表:有序,需要存索引相關資訊,可變,需要處理資料的增刪改
字典:無序,需要存key與value對映的相關資訊,可變,需要處理資料的增刪改
2、按存值個數區分
標量/原子型別: 數字,字串
容器型別:列表,元組,字典
3、按可變不可變區分
可變:列表,字典
不可變: 數字,字串,元組
4、按訪問順序區分
直接訪問:數字
順序訪問(序列型別):字串,列表,元組
key值訪問(對映型別):字典
九、字元編碼
http://blog.51cto.com/10630401/2050540
十、檔案處理
http://blog.51cto.com/10630401/2050716