Python簡單爬蟲

阿新 • • 發佈：2021-08-04

本部落格主要用來記錄一下學習過程中所使用的程式碼：
我們以豆瓣電影網為例子，來爬取上面的資料：
連結：豆瓣電影

import requests
url="https://movie.douban.com/"
resp=requests.get(url)
resp.encoding="utf-8"
#print(resp.text)
f=open("douban.html","w")
f.write(resp.text)
print("over")

以上是一個非常基本並且簡單的爬取網頁原始碼的爬蟲。
但是我們可以發現爬取下來在douban.html中是沒有任何東西的，所以這個時候我們大概率是被監測到不是人工在進行網頁的訪問，而是自動化程式，這個時候就需要我們進行偽裝一下，最基礎的偽裝就是User Agent的偽裝，檢視我們自己的UA需要使用瀏覽器自帶的抓包工具，按下F12，然後在Network選項中重新重新整理網頁，在抓獲的包中，我們就能夠獲得我們想要的UA資訊

import requests
url="https://movie.douban.com/"
#反爬可以在這裡加一個頭
dic={# 這裡dic代表的時請求頭，是一個字典變數
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.62"
}
#然後下面的請求改一下就可以了
resp=requests.get(url,headers=dic)
#resp=requests.get(url)
resp.encoding="utf-8"# windows系統必須加這個否則讀取中文的時候可能會出現亂碼的情況
#print(resp.text)
f=open("douban.html","w",encoding="utf-8")#windows系統一定要寫encoding="utf-8"
f.write(resp.text)
print("over")

這個時候我們加入了這些以後，可以發現我們可以正常爬取東西了。

Python簡單爬蟲

python 簡單爬蟲

Python簡單爬蟲

python使用chrome driver做簡單爬蟲--轉載於簡書

用python寫爬蟲簡單嗎

最近剛學了python的爬蟲，那今天就寫個簡單的，一目瞭然

Python爬蟲：編寫簡單爬蟲之新手入門

用python簡單實現mysql資料同步到ElasticSearch的教程

python簡單實現操作Mysql資料庫

如何獲取Python簡單for迴圈索引

python網路爬蟲 CrawlSpider使用詳解

python網路爬蟲 Scrapy中selenium用法詳解

python併發爬蟲實用工具tomorrow實用解析

python urllib爬蟲模組使用解析

Python3簡單爬蟲抓取網頁圖片程式碼例項

Python簡單實現區域生長方式

Python 簡單計算要求形狀面積的例項

Python簡單連線MongoDB資料庫的方法

Python反爬蟲偽裝瀏覽器進行爬蟲

Python網路爬蟲資訊提取mooc程式碼例項

python簡單的三元一次方程求解例項

Python簡單爬蟲

相關推薦