Python爬蟲程式碼：雙十一到了，爬一下某東看看有沒有好東西，這不得買一波大的！

阿新 • • 發佈：2021-10-22

現在電商平臺有很多商品資料，採集到的資料對電商價格戰很有優勢，這不，雙十一預售都已經開啟了，不得對自己好一點，把購物車塞到滿滿當當。

所以今天咱們以京東為例，試一試效果叭~

知識點：

selenium工具的使用
結構化的資料解析
csv資料儲存

環境：

python 3.8
pycharm
selenium
csv
time

selenium用來實現瀏覽器自動化操作，我們想實現瀏覽器自動操作還需要下載一個chromedriver工具，沒有軟體或者不會安裝、沒有啟用碼等等，都在文末統一給出來。

好了，開始我們的正文吧。

需要用的模組先匯入進去，這一步寫給新手。

import csv  # 資料儲存模組, 內建模組
import time

from selenium import webdriver

既然我們要爬商品，當然就要實現搜尋商品吧。

def get_product(key):
    """搜尋商品"""
    driver.find_element_by_css_selector('#key').send_keys(key)
    driver.find_element_by_css_selector('#search > div > div.form > button').click()

然後把搜尋功能寫出來

keyword = input('請輸入你要搜尋商品的關鍵字:')

執行之後的搜尋效果
資料懶載入? 你如果沒有下拉頁面, 那麼頁面下半部分資料是不會給你顯示的。

所以我們要執行頁面的下拉操作

建立一個瀏覽器物件

driver = webdriver.Chrome()

執行瀏覽器自動化

driver.get('https://www.jd.com/')
driver.implicitly_wait(10)  # 設定瀏覽器的隱式等待, 智慧化等待<不會死等>
driver.maximize_window()  # 最大化瀏覽器

調用搜索商品的函式

get_product(keyword)
def drop_down():
    """執行頁面的下拉操作"""
    for x in range(1, 11, 2):  # 控制下拉次數  程式碼是活的,
        j = x / 10  # 1/10  3/10  ... 10/10
        # js   JavaScript 是可以直接執行在瀏覽器的一門計算機語言  通過js下拉頁面
        js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight * %f' % j
        driver.execute_script(js)
        time.sleep(0.5)  # 休息的時間是讓瀏覽器載入資料的

然後我們要做的是解析商品資料並儲存到Excel表格去，商品的標籤、名字、價格、評論、店鋪名字等等，當然只要你能看到的資料都可以爬下來。

def parse_data():
    """解析商品資料, 並且儲存資料"""

    lis = driver.find_elements_by_css_selector('.gl-item')  # 解析到了所有的li標籤

    for li in lis:
        try:
            name = li.find_element_by_css_selector('div.p-name a em').text  # 商品的名字
            price = li.find_element_by_css_selector('div.p-price strong i').text + '元'  # 商品的價格
            deal = li.find_element_by_css_selector('div.p-commit strong a').text  # 商品的評價數量
            title = li.find_element_by_css_selector('span.J_im_icon a').get_attribute('title')  # 商品的店鋪名字

            name = name.replace('京東超市', '').replace('\n', '')
            print(name, price, deal, title)

            # 資料的儲存
            with open('京東.csv', mode='a', encoding='utf-8', newline='') as f:
                csv_write = csv.writer(f)
                csv_write.writerow([name, price, deal, title])
        except:
            continue

這是獲取到的資料自動儲存為Excel

但是當前只爬了一頁，我們要實現更多的資料爬取，寫一個翻頁就好了。

def get_next():
    """翻頁"""
    driver.find_element_by_css_selector('#J_bottomPage > span.p-num > a.pn-next > em').click()

翻頁下的邏輯需要迴圈執行

for page in range(100):
    # 呼叫頁面下拉函式
    drop_down()
    # 呼叫資料解析函式
    parse_data()
    # 呼叫翻頁的函式
    get_next()

寫在最後

好了，今天就寫到這裡，大家可以自己嘗試，有跟本文對應的視訊教程，可以一步步學習，包括本文原始碼也可以獲取。

如需完整的專案原始碼+素材原始碼Python交流大家庭見：點選藍色文字新增即可獲取免費的福利！

兄弟們的支援就是對我最大的動力，點贊三連督促我加班熬夜更新吧！

如果在學習Python遇到了問題，有空的時候都可以給大家解答。

歡迎大家閱讀往期文章

Python爬蟲程式碼：雙十一到了，爬一下某東看看有沒有好東西，這不得買一波大的！

現在電商平臺有很多商品資料，採集到的資料對電商價格戰很有優勢，這不，雙十一預售都已經開啟了，不得對自己好一點，把購物車塞到滿滿當當。

python爬蟲利用selenium實現自動翻頁爬取某魚資料的思路詳解

基本思路: 首先用開發者工具找到需要提取資料的標籤列利用xpath定位需要提取資料的列表

我不就是吃點肉，應該沒事吧——爬取一座城市裡的烤肉店資料（附完整Python爬蟲程式碼）

寫在前面的一點屁話：對於肉食主義者，吃肉簡直幸福感爆棚！特別是烤肉，看著一塊塊肉慢慢變熟，聽著烤盤上“滋滋”的聲響，這種期待感是任何其他食物都無法帶來的。如果說甜點是“乍見之歡”，那肉則是“久處不

Python爬蟲實戰：自動化登入網站，爬取商品資料

前言隨著網際網路時代的到來，人們更加傾向於網際網路購物。某東又是電商行業的巨頭，在某東平臺中有很多商家資料。今天帶大家使用python+selenium工具獲取這些公開的商家資料

python爬蟲教程：爬取酷狗音樂，零基礎小白也能爬取哦

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

用python爬蟲方式：刷文章閱讀量，挺高你的文章訪問量

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python 爬蟲程式碼_python之路(一)_爬蟲—爬一下網頁程式碼輸出到檔案

技術標籤：python 爬蟲程式碼python爬蟲萬能程式碼python爬蟲程式碼python爬蟲程式碼大全python簡單爬蟲程式碼python輸出txt檔案

python爬蟲學習：從資料庫讀取目標爬蟲站點及爬蟲規程，批量爬取目標站點制定資料（scrapy框架）

資料庫databaseConfig.py ` from urllib.parse import quote_plus from pymongo import MongoClient import settings

簡單的python爬蟲程式碼，python爬蟲程式碼大全

最近學習Python，網上學習資料挺多的，這篇寫的不錯，關於簡單的python爬蟲程式碼和python爬蟲程式碼大全，大家有需要也可以看看。

抖音前端團隊迴應“抄襲阿里 Ant Design 程式碼”：早期使用了相關文案，深表歉意

10 月 28 日訊息，抖音前端團隊剛剛宣佈將其使用的設計系統和 UI 庫 Semi Design 進行開源，採用MIT 許可證。但巧得是有網友發現它的程式碼中出現了阿里巴巴同類產品 Ant Design 的痕跡。針對對於近期網傳的“抄襲阿

Python爬蟲實戰：爬取美團美食資料

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲實戰：爬取淘女郎照片

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

Python爬蟲實戰：爬取小姐姐最近的聽歌曲目

前言作為網易雲村的深度使用者，網易雲音樂應該是我除了微信外開啟時間最長的 App 了。並不是應為網易雲上面的歌曲多，而是因為那些走心的評論。邊聽歌邊刷評論，感覺就像是走進了他人的人生之中，從另外一種意義來

Python爬蟲入門練手案例，爬取某乎問答數（附原始碼）

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲案例：爬取攜程評論

前言之前爬取美團，馬蜂窩等網站的資料都挺順利，大眾點評（這個反爬機制有點麻煩）在磕磕絆絆中也算成功（重點是網頁頁數的變化和關鍵字的隱藏替換）但攜程居然遇到了瓶頸。

Python爬蟲實戰：爬取首都醫科大學文章

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

七夕節到了，單身狗程式設計師要對自己好點，用程式碼送自己點安慰

前言對於有些人來說（這些人肯定毋庸置疑是指那些與電腦為伍苦逼的程式設計師了）七夕依舊是與電腦為伍跟電腦打交道的一天

Python爬蟲框架：scrapy爬取迅雷電影天堂最新電影！

專案開始第一步仍然是建立scrapy專案與spider檔案切換到工作目錄兩條命令依次輸入

Python 爬蟲基礎：使用代理 IP 和隨機 UA 繞過反爬機制

機靈鶴 2018-12-23 21:47:391608收藏 8分類專欄： Python 爬蟲開發常見問題文章標籤： Python Spider User-Agent IP版權本週事情比較多，又要趕專案，又要搞畢設，而且住的地方也遠了，來回挺不方便的，所以......所

Python爬蟲實戰：抓取京東蘋果手機評價

目錄 1. 網站分析 2. 示例程式碼 3. 注意事項 1. 網站分析很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去學習更加

Python爬蟲程式碼：雙十一到了，爬一下某東看看有沒有好東西，這不得買一波大的！

相關推薦