【Python爬蟲】：爬取（谷歌/百度/搜狗）的搜尋結果

阿新 • • 發佈：2021-01-11

步驟如下：
1.首先匯入爬蟲的package：requests

2.使用UA偽裝進行反反爬蟲，將爬蟲偽裝成一個瀏覽器進行上網

3.通過尋找，找到到谷歌搜尋時請求的url。

假設我們在谷歌瀏覽器當中輸入：不知道

我們可以得到請求結果的網址如下：

也就是：

https://www.google.com/search?q=%E4%B8%8D%E7%9F%A5%E9%81%93&rlz=1C1CHWL_zh-CNAU918AU918&oq=%E4%B8%8D%E7%9F%A5%E9%81%93&aqs=chrome.0.69i59l2.885j0j1&sourceid=chrome&ie=UTF-

在這個網址當中，問號“？”後面的則是這次請求的引數，將問號前面的網址拿下來，放到程式碼裡。後面的引數我們可以程式碼進行人為的定義，這樣我們就可以使用爬蟲爬取任意搜尋結果的html網頁了。

剪輯後的url如下：

url='https://www.google.com/search'

？問號後面的“q=不知道”可以作為我們傳入給谷歌搜尋引擎的引數，因此可以編寫程式碼：

param={
    'q':kw
}

這樣程式就可以自己知道搜尋引擎後面跟隨的引數是什麼了。我們就可以傳遞進一個我們想要的kw進去即可。

完整的程式如下：

import requests

headers={
    ' 
User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}

url='https://www.google.com/search'
#處理url所攜帶的引數，將其封裝到字典當中
kw=input("enter a word：")
param={
    'q':kw
}
#對指定url發起的請求url是攜帶引數的
response=requests.get(url=url,params=param,headers=headers)
page_text 
=response.text
print(page_text)
file_name=kw+'.html'
with open(file_name,'w',encoding='utf-8') as fp:
    fp.write(page_text)

【Python爬蟲】：爬取（谷歌/百度/搜狗）的搜尋結果

步驟如下：1.首先匯入爬蟲的package：requests 2.使用UA偽裝進行反反爬蟲，將爬蟲偽裝成一個瀏覽器進行上網

Python爬蟲實戰：爬取美團美食資料

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲實戰：爬取淘女郎照片

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

Python爬蟲實戰：爬取小姐姐最近的聽歌曲目

前言作為網易雲村的深度使用者，網易雲音樂應該是我除了微信外開啟時間最長的 App 了。並不是應為網易雲上面的歌曲多，而是因為那些走心的評論。邊聽歌邊刷評論，感覺就像是走進了他人的人生之中，從另外一種意義來

Python爬蟲案例：爬取攜程評論

前言之前爬取美團，馬蜂窩等網站的資料都挺順利，大眾點評（這個反爬機制有點麻煩）在磕磕絆絆中也算成功（重點是網頁頁數的變化和關鍵字的隱藏替換）但攜程居然遇到了瓶頸。

Python爬蟲實戰：爬取首都醫科大學文章

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

python爬蟲教程：爬取酷狗音樂，零基礎小白也能爬取哦

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

【Python爬蟲】入門級爬蟲案例，20行程式碼爬取網站圖片（附原始碼）

知識點爬蟲的步驟 requests parsel xpath資料解析爬蟲四個步驟: 1.獲取網頁地址 (目標地址)2.傳送請求3.資料解析4.儲存本地

【Python爬蟲】爬取websockect

websockect基礎還有原理省略 PS:這裡我說下aiowebsocket這個依賴庫，堪稱垃圾中的戰鬥機，在Mac（Linux沒測試過，但是Mac的核心是Linux，放到centOS我估計也會出這個問題）上一直報錯SSL證書錯誤，在windowes上hand

【Python爬蟲】尺度太大了！爬一個專門看小姐姐的網站，寫一段緊張刺激的程式碼（附原始碼）

前言今天我們通過Python爬取小姐姐圖片網站上的美圖，零基礎學會通用爬蟲，當然我們還可以實現多執行緒爬蟲，加快爬蟲速度

【Python爬蟲】15行程式碼教你爬B站視訊彈幕，詞雲圖展示資料（附原始碼）

知識點爬蟲基本流程正則 requests >>> pip install requests jieba >>> pip install jieba

【Python爬蟲】太刺激了！本來只想爬個視訊的，誰知自己淪陷進去了（附原始碼）

知識點爬蟲基本流程 re正則表示式簡單使用 requests json資料解析方法視訊資料儲存

【python爬蟲】遊俠網部分新聞爬取

最後效果展示【用網頁表格的形式展示爬取的資料】用pyinstaller打包成exe了【python3.6 可執行的環境多一些】

python爬蟲實戰之爬取任意百度圖片（升級版）

技術標籤：python的學習之旅python百度爬蟲 python爬蟲實戰之爬取任意百度圖片（升級版）

【Python爬蟲】如何把抖音漂亮的小姐姐（高清、無水印）儲存到硬盤裡，附原始碼

前言現在自媒體平臺上經常有一些視訊素材需要儲存下來，但是大部分平臺下載下來都帶上了平臺水印，影響視訊美觀。這次我們用爬蟲，可以爬到高清無水印的視訊

【Python爬蟲】採集一個優秀藝術家相互交流的網站——P站（一個正經的網站）

前言總所周知, p站是日本知名的虛擬社群, 聚集了眾多來自日本, 中國, 韓國, 美國等國家的優秀藝術家。他們在p站上相互交流, 分享高清優秀插畫, 是一個正經的網站

【Python爬蟲】新發現一個高質量跳舞視訊網站爬一下試試，男生都喜歡

好難受，上次發了做遊戲的居然沒人看，每天為了給你們寫啥，老夫心都操碎了~

Python爬蟲 scrapy框架爬取某招聘網存入mongodb解析

建立專案 scrapy startproject zhaoping 建立爬蟲 cd zhaoping scrapy genspider hr zhaopingwang.com 目錄結構

Python爬蟲小例子——爬取51job釋出的工作職位

概述不知從何時起，Python和爬蟲就如初戀一般，情不知所起，一往而深，相信很多朋友學習Python，都是從爬蟲開始，其實究其原因，不外兩方面：其一Python對爬蟲的支援度比較好，類庫眾多。其二Pyhton的語法簡單，入門

【Python爬蟲】一個簡單的網路爬蟲

網頁結構的相似性爬蟲的目的，是從網站中自動化的批量提取資料。首先嚐試完成以下操作: