1. 程式人生 > >Spider Note4 基礎知識點總結

Spider Note4 基礎知識點總結

個人筆記,無其他意圖

文章目錄

基礎知識點的學習

列表推導式

幫助我們快速生成包含一堆資料的列表

  • 舉例
[i+10 for i in range(10)]	# --->[10, 11, 12, ..., 19]
["10月{}日".format(i) for i in range(1,10)]		
'''
上述命令結果--->["10月1日", "10月2日", ..., "10月9日"]
'''
# format:字串格式化的一種方法 "stubborn{}vegeta".format(1/'1'/[1]/{1}) #/表示或者 "stubborn{}vegeta{}".format(1,2)

字典推導式

幫助我們快速生成包含一堆資料的字典

  • 舉例
{i+10:i for i in range(10)}	#--->{10:0, 11:1, ..., 19:9}
{"a{}.format(i)":10 for i in range(3)}	#--->{"a0":10, "a1":10, ...}

三元運算子

參照下例,如果if後面的條件成立,就把if前面的值賦給a

,否則把else後面的值賦給a

a = 10 if 4>3 else 20	#a=10
a = 10 if 4<3 else 20  #a=20

寫爬蟲的討論

url

  • 知道url地址的規律和總的頁碼數,構造url地址的列表
  • start_url

傳送請求,獲取響應

  • requests

返回資料

  • 返回json字串:json模組
  • 返回的是html字串:lxml模組配合xpath提取資料

儲存