Python爬蟲入門 | 3 爬蟲必備Python知識
好啦,正式開始我們的第三節課《爬蟲必備Python知識》吧!啦啦哩啦啦,都看黑板~
- 字符串(string)
1.1 輸入字符串
編寫字符串時,既可以用單引號( ‘ )也可以用雙引號( " ):
對於帶有換行符的多行字符串,可以使用三重引號(即 ‘‘‘ 或 """ ):
1.2 訪問字符串中的值
Python訪問子字符串,可以使用方括號來截取字符串,如下實例:
以上實例執行結果:
1.3 字符串的修改
Python中已存在的字符串本身不可以改變:
報錯:
但可以對已存在的字符串進行修改,然後賦值給另一個變量:
以上實例執行結果:
1.4 Python對象轉為字符串
許多Python對象都可以用str函數轉換為字符串:
以上實例執行結果:
1.5 字符串當做序列類型處理
由於字符串其實是一串字符序列,因此可以被當做某種序列類型(如列表、元組等)進行處理:
以上實例執行結果:
1.6 Python轉義字符
當需要在字符中使用特殊字符時,Python用反斜杠()轉義字符,如下表:
1.7 字符串運算符
下表實例變量 a 值為字符串 "Hello",b 變量值為 "Python":
1.8 字符串常用方法
- 元組(tuple)
2.1 元組的創建
元組(tuple)是一種一維的、定長的、不可變的Python對象序列。元組創建很簡單,只需要在括號中添加元素,並使用逗號隔開即可:
創建空元組:
元組中只包含一個元素時,需要在元素後面添加逗號:
通過調用tuple,任何序列或叠代器都可以被轉化為元組:
結果為:
2.2 訪問元組
元組可以使用下標索引來訪問元組中的值,如下實例:
以上實例輸出結果:
2.3 修改元組
元組中的元素值是不允許修改的,但我們可以對元組進行連接組合,如下實例:
結果為:
2.4 元組運算符
與字符串一樣,元組之間可以使用 + 號和 * 號進行運算。這就意味著他們可以組合和復制,運算後會生成一個新的元組。
2.5 元組索引與截取
因為元組也是一個序列,所以我們可以訪問元組中的指定位置的元素,也可以截取索引中的一段元素,如下所示:
元組:
2.6 元組內置函數
- 列表(list)
3.1 列表的創建
跟元組相比,列表(list)是變長的,而且其內容也是可以修改的。它可以通過方括號([ ])或者list函數進行定義:
結果為:
對已經定義的列表中的內容進行修改:
結果為:
3.2 訪問列表中的值
使用下標索引來訪問列表中的值,同樣也可以使用方括號的形式截取字符,如下所示:
結果為:
3.3 更新列表
可以對列表的數據項進行修改或更新,也可以使用append()方法來添加列表項,如下所示:
結果為:
3.4 刪除列表元素
可以使用 del 語句來刪除列表的的元素,如下實例:
結果為:
3.5 判斷列表中是否存在某個值
通過 in 關鍵字,可以判斷列表中是否含有某個值:
結果為:
3.6 列表腳本操作符
列表對 + 和 的操作符與字符串相似。+ 號用於組合列表, 號用於重復列表。
3.7 列表截取
Python的列表截取與字符串操作類型,如下所示:
3.8 列表內置函數&方法
- 字典(dict)
4.1 字典的創建
字典是另一種可變容器模型,且可存儲任意類型對象。
字典的每個鍵值(key=>value)對用冒號( : )分割,每個對之間用逗號( , )分割,整個字典包括在花括號( {} )中 ,格式如下所示:
鍵必須是唯一的,但值則不必。值可以取任何數據類型,但鍵必須是不可變的,如字符串、數字或元組。
一個簡單的字典實例:
也可如此創建字典:
4.2 訪問字典裏的值
把相應的鍵放入方括弧,如下實例:
以上實例輸出結果:
如果用字典裏沒有的鍵訪問數據,會輸出錯誤如下:
以上實例輸出結果:
4.3 修改字典
向字典添加新內容的方法是增加新的鍵/值對,修改或刪除已有鍵/值對如下實例:
以上實例輸出結果:
4.4 刪除字典元素
del 能刪單一的元素也能刪除字典,clear 可以清空字典。del刪除字典和clear清空字典的區別在於,前者是將字典整個刪除了,字典不復存在,而後者是清空字典中的內容,留下了一個“空殼子”。
4.5 字典內置函數&方法
- 條件控制
5.1 條件控制流程
Python條件語句是通過一條或多條語句的執行結果(True或者False)來決定執行的代碼塊。可以通過下圖來簡單了解條件語句的執行過程:
5.2 if 語句
Python中if語句的一般形式如下所示:
如果"condition_1"為True,將執行 "statement_block_1"塊語句
如果"condition_1"為False,將判斷 "condition_2"
如果"condition_2"為True,將執行 "statement_block_2"塊語句
如果"condition_2"為False,將執行"statement_block_3"塊語句
註意:
1.每個條件後面要使用冒號(:),表示接下來是滿足條件後要執行的語句塊。
2.使用縮進來劃分語句塊,相同縮進數的語句在一起組成一個語句塊。
3.在Python中沒有switch – case語句。
舉一個 if 實例:
執行程序,輸入狗狗的年齡:
程序運行結果:
輸入enter後退出程序。
5.3 常用操作運算符
5.4 if 嵌套
在嵌套 if 語句中,可以把 if...elif...else結構放在另外一個 if...elif...else 結構中。
舉一個 if 嵌套實例:
輸入語句及結果如下:
- 循環語句
6.1 循環語句流程
Python中的循環語句有 for 和 while。Python循環語句的控制結構圖如下所示:
6.2 while 循環
Python中while語句的一般形式:
同樣需要註意冒號和縮進。以下實例使用了 while 來計算 1 到 100 的總和:
執行結果如下:
執行以上腳本,輸出結果如下:
6.3 for 語句
for 循環的一般格式如下:
for 實例中使用 break 語句,break 語句用於跳出當前循環體:
結果如下:
除了在 for 和 while 的循環體中使用 break 語句來跳出循環,我們還可以使用 continue 語句,continue語句被用來告訴Python跳過當前循環塊中的剩余語句,然後繼續進行下一輪循環。
代碼塊如下:
結果如下:
好了,這節課就到這裏!
Python爬蟲入門 | 3 爬蟲必備Python知識