python爬蟲--旅遊景點

阿新 • • 發佈：2018-12-19

一、準備工作

1、python編譯器IDLE 或者下載pycharm(網上有教程和破解期限) 匯入requests包和BeautifulSoup4包。（快速下載包方法見我的部落格【快速pip下載python包】文章） 2、chrome谷歌瀏覽器（ie也湊合用）

對下面這部分的資訊，包括名稱，價格，圖片的爬取。在這裡插入圖片描述

程式碼如下

import requests
from bs4 import BeautifulSoup
url = requests.get('https://go.hao123.com')#請求這個網址
soup = BeautifulSoup(url.content, "lxml")#解析網址
#print(soup)  #可以檢視HTML原始碼
images = soup.select('body > div.content-outer-wrapper > div > div > div > div > div > div > div > a > img')
prices  = soup.select('body > div.content-outer-wrapper > div > div > div.tejia-menpiao > div.container > div > div > div.price > a > div.new')
names = soup.select('body > div.content-outer-wrapper > div > div > div.tejia-menpiao > div.container > div > div > div.pic > a > div')

data = {}
#三個同時遍歷用到zip()
for name, price, image in zip(names, prices, images):
    data = {
        'name': name.get_text(),
        'price': price.get_text(),
        'img': image.get('src')
    }
    print(data)     #遍歷列表，並用字典儲存

程式碼中的soup.select(’*******’)這裡解釋一下使用方法。谷歌瀏覽器開啟網頁滑鼠放在你所要抓取的圖片上右鍵檢查在這裡插入圖片描述之後你會看到以下原始碼，並且有一部分被索引著。然後滑鼠放在索引著的部分右鍵 copy --> copy selector ,你會得到以下程式碼

body > div.content-outer-wrapper > div > div:nth-child(2) > div.tejia-menpiao > div.container > div:nth-child(2) > div:nth-child(1) > div.pic > a > img

將裡面的 :nth-child(2) 或者 :nth-child(1) 之類的這種刪除，別的什麼都不用動，空格也不要刪。之後剩下的就是soup.select()裡面填寫的，挑選圖片的。挑選別的方法類似。

body > div.content-outer-wrapper > div > div > div.tejia-menpiao > div.container > div: > div > div.pic > a > img

最後輸出結果

在這裡插入圖片描述

謝謝支援，本人親測成功執行。

python爬蟲--旅遊景點

一、準備工作

程式碼如下

最後輸出結果

python爬蟲--旅遊景點

Python爬蟲系列 - 初探：爬取旅遊評論

NO.31——Python爬蟲分析馬蜂窩十一假期城市旅遊資料

用python爬蟲爬取去哪兒4500個熱門景點，看看國慶不能去哪兒

一個鹹魚的Python爬蟲之路（三）：爬取網頁圖片

[Python爬蟲] 之十五：Selenium +phantomjs根據微信公眾號抓取微信文章

Python爬蟲：學爬蟲前得了解的事兒

Python爬蟲-萌妹子圖片

Python爬蟲-爬取糗事百科段子

python 爬蟲1 開始，先拿新浪微博開始

python爬蟲入門-Scrapy的安裝

簡談-Python爬蟲破解JS加密的Cookie

python爬蟲：爬取網站視頻

python爬蟲xpath的語法

python爬蟲從入門到放棄（五）之正則的基本使用

Python爬蟲(三)爬淘寶MM圖片

python爬蟲從入門到放棄（六）之 BeautifulSoup庫的使用

如何自學Python爬蟲技術

Python爬蟲：新浪新聞詳情頁的數據抓取（函數版）

python——爬蟲&問題解決&思考（四）

python爬蟲--旅遊景點

一、準備工作

程式碼如下

最後輸出結果

相關推薦