1. 程式人生 > 其它 >爬蟲概念\HTTP協議\加密方式

爬蟲概念\HTTP協議\加密方式

1. 爬蟲的概念 :通過編寫程式碼, 來自動控制瀏覽器來抓去資料

2. 爬蟲協議: robots.txt 協議 , 該協議裡面註明了哪些資訊允許爬蟲 , 哪些不允許 , 違反改協議的爬蟲行為可判定為惡意爬蟲 , 有承擔法律責任的風險

3. HTTP協議 : 是伺服器端和客戶端進行資訊傳遞的一種協議 , 只有雙方遵循該相同的協議才能進行資料傳輸

常用請求頭: - User-Agent: 請求載體的資訊(一般為所使用的瀏覽器相關資訊);

       - Connection: 請求完畢後, 是否保持連線的

 常用相應頭: - Content-Type: 伺服器相應客戶端的資料型別

4. HTTPS協議: 安全的超文字傳輸協議

5. 加密方式: - 對稱金鑰加密: 客戶端傳送請求時對請求資料進行加密, 然後將密文和金鑰一起傳送給伺服器, 伺服器拿到金鑰後對密文進行解密

      - 非對稱金鑰加密: 伺服器自己定義一種加密方式, 並將此加密方式(公鑰)告訴客戶端, 客戶端拿到公鑰後在傳送請求時利用公鑰進行加密

      - 證書加密: 伺服器將公鑰交給第三方機構(證書機構)進行數字化簽名, 證書機構再將帶數字簽名的公鑰傳送給客戶端, 客戶端再利用此公鑰進行加密