雙十一福利！爬取電商平臺商品詳情！買東西我們只買優質產品！

阿新 • • 發佈：2021-10-23

嗨，兄弟們晚上好啊！
下午爬完京東，我們晚上再試試淘寶，剁手之路永不停歇！

其實我不太想爬的，沒辦法被媳婦知道了，說要在淘寶買東西，自己懶得看，讓我用程式碼去分析分析。
害，有這時間打兩把無限火力他不香嗎！

反正都爬完了，整理出來發給大家參考一下吧。

環境介紹：

python 3.6
pycharm
selenium
csv
time
random

python直譯器安裝包、安裝教程
pycharm程式碼編輯器安裝包、安裝教程、啟用碼
Chrome瀏覽器Webdriver外掛安裝教程
xpath-helper外掛安裝教程

這些如果沒有的話，可以在文末獲取。

第三方模組

selenium python模組操作瀏覽器驅動 pip install selenium

這裡簡單的說下chromedriver （谷歌驅動）

瀏覽器驅動用來自動翻頁的，下載跟你安裝的谷歌瀏覽器版本最相近的版本，放到你的Python安裝目錄，或者跟你的程式碼放在同一個資料夾中就好了。

這個是我的瀏覽器版本
這是跟我對應版本的驅動外掛
下載好解壓出來長這樣子，我這裡把它跟程式碼放一起了。其他幾個的話就不多說了

匯入模組
先匯入一下要用的模組，註釋夠詳細了吧。

from selenium import webdriver  # 
 匯入selenium模組的瀏覽器功能
import random  # 隨機資料模組 設定隨機等待
import time  # 時間模組, 這是等待的時間<隨機>  內建模組，  安裝直譯器的時候自帶的
from constants import TAO_USERNAME, TAO_PASSWORD  # 匯入使用者資訊
import csv  # 資料儲存  # 內建模組

解決登入

我們要根據關鍵字搜尋商品, 解決登入，避免淘寶檢測selenium, 儘量的模擬使用者操作去解決登入，淘寶登入它是有js 加密的， js會檢測selenium自動登入, 最好是學學JS解密。

def search_product(keyword):
    
    driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword)

    time.sleep(random.randint(1, 3))
    driver.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[1]/button').click()
    time.sleep(random.randint(1, 3))
    
    driver.find_element_by_xpath('//*[@id="fm-login-id"]').send_keys(TAO_USERNAME)
    time.sleep(random.randint(1, 3))
    driver.find_element_by_xpath('//*[@id="fm-login-password"]').send_keys(TAO_PASSWORD)
    time.sleep(random.randint(1, 3))

    driver.find_element_by_xpath('//*[@id="login-form"]/div[4]/button').click()
    time.sleep(random.randint(1, 3))

解析資料
這裡我們要對多個商品資料解析，所有的div標籤，然後進行二次提取商品價格、付款人數、店鋪名稱、店鋪地址、詳情頁地址

ef parse_data():
   
    # 多個商品資料解析
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfix"]/div/div')  # 所有的div標籤

    for div in divs:  # 二次提取
        try:
            info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text
            price = div.find_element_by_xpath('.//strong').text + '元'  # 商品價格  # 手寫
            deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text  # 付款人數  # 手寫
            name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text  # 店鋪名稱  # 手寫
            location = div.find_element_by_xpath('.//div[@class="location"]').text  # 店鋪地址  # 手寫
            detail_url = div.find_element_by_xpath('.//div[@class="pic"]/a').get_attribute('href')  # 詳情頁地址  # 手寫

            print(info, price, deal, name, location, detail_url, sep='|')

            with open('淘寶.csv', mode='a', encoding='utf-8', newline='')  as f:
                csv_write = csv.writer(f)
                csv_write.writerow([info, price, deal, name, location, detail_url])
        except:
            continue

實現根據關鍵字搜尋商品

word = input('請輸入你要搜尋商品的關鍵字:')

瀏覽器操作

建立一個瀏覽器

driver = webdriver.Chrome()

修改瀏覽器的屬性

driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
                       {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})"""})

執行瀏覽器操作

driver.get('https://www.taobao.com/')

get 是driver一個方法, 內部傳一個地址，driver.get() 不是函式, 是driver物件的一個方法, 方法的呼叫和自定義函式呼叫是有區別的。

智慧化等待: 頁面渲染載入過程需要時間

driver.implicitly_wait(10)

最大化瀏覽器

driver.maximize_window()

搜尋商品和解析商品

search_product(word)


for page in range(0, 100):  # 0123456...
    print(f'\n========================正在抓取第{page + 1}頁資料=========================')
    driver.get(f'https://s.taobao.com/search?q={word}&s={page * 44}')
    
    parse_data()
    time.sleep(random.randint(2, 4))

我們在執行瀏覽器的自動化操作的時候，使用者平常怎麼操作頁面, 那麼咱們程式碼邏輯和使用者操作的頁面的邏輯大致一樣。
驗證碼主要是驗證人機行為，一般是滑動, 點選, 普通驗證碼。

完整的免費原始碼領取處：

完整原始碼+對應視訊教程基地見：#點選藍色文字新增即可獲取免費的福利！

兄弟萌，我最大的動力就是來自你們的支援！！看完記得點贊收藏三連哈！

關於解答——

兄弟們在Python學習中遇到問題、有時間會給大家解答的！大家自行新增哈~

雙十一福利！爬取電商平臺商品詳情！買東西我們只買優質產品！

嗨，兄弟們晚上好啊！下午爬完京東，我們晚上再試試淘寶，剁手之路永不停歇！

抖音快手入局、“二選一”不再，今年 618 電商平臺怎麼玩

“做圖都做瘋了，5 月 24 日預售，6.1-6.3 開門紅，6.4-6.13 第二波活動，6.16-6.20 第三波集中爆發。以前只需要做兩波圖，現在 N 波在等著。”負責電商海報設計的靈珊一邊修改著圖中模特的位置，一邊抱怨。這是她經

Java生鮮電商平臺-商品資料庫的設計與SQL下載（小程式/APP）

Java生鮮電商平臺-商品資料庫的設計與SQL下載（小程式/APP）說明：Java生鮮電商平臺中根據自己的經驗，把相關的商品資料庫分享給大家，希望對大家有用.

JavaScript實現電商平臺商品細節圖

本文分享一個電商平臺常見檢視商品細節圖案例，如某東手機類別中具體某一部手機詳情頁中，手機的細節圖展示，左側小圖獲得使用者滑鼠焦點即可在螢幕右側展示出該圖片區域的大圖效果，其中部分主要涉及滑鼠經過、滑鼠

工信部要求規範電商平臺雙十一簡訊營銷行為，阿里巴巴、京東、拼多多、美團等承諾全面自查整改

10 月 27 日訊息，據工信微報官方訊息，隨著“雙十一”促銷活動臨近，工業和資訊化部資訊通訊管理局聚焦人民群眾反映強烈的營銷簡訊擾民問題，於 2021 年 10 月 25 日召開行政指導會，規範電商平臺簡訊營銷行為。阿

Python爬取視訊之愛情電影及解密TS檔案和兩種合併ts！

俗話說，興趣所在，方能大展拳腳。so結合興趣的學習才能事半功倍，更加努力專心，apparently本次任務是在視訊網站爬取一些好看的小電影，地址不放（狗頭保命）只記錄過程。

一晚上功夫爬取了海量資源連結，卻不知如何自動儲存到網盤，一袋煙後我頓悟了

覺得有幫助的別忘了關注一下知識圖譜與大資料公眾號,完整程式碼移步從今天開始種樹

雙十一要來了，微開講促銷功能能讓你的活動流水賬翻幾倍！

很多機構校長都知道，創立一個教培品牌，其實並沒有想象中只是排課教學那麼簡單，其中還涉及到招生以及運營等問題。那品牌創立知名度不足，學員量不多怎麼辦？那就要做營銷活動！想要提高品牌老客戶復購率與

例項一>>爬取airbnb房屋資訊

from selenium import webdriver # 下載的geckodriver的儲存位置 driver = webdriver.Chrome(executable_path=\'D:\\\\chromedriver.exe\')

python爬蟲學習（一）requests爬取dytt下載地址

當網址有加密傳送安全證書時可以使用verify=False，因為dytt利用的字元編碼是gb2312，所以解碼也要用gb2312

明天就是1024了，Python前來報到！爬取全網M子圖片！

今天是1024程式設計師節，不得整點活~ 雖然不太好教爬1024，但是可以爬點其它的！

電商平臺服務商冒充港股上市：自辦敲鐘儀式，成立僅一年

3 月 20 日訊息，今年 1 月份，一家名為“視奕科技”的公司宣稱 1 月 22 日在港交所上市，甚至出現了敲鐘環節。3 月 14 日，廈門市地方金融監督管理局官網釋出公告：近期，根據群眾舉報線索，我辦對廈門視奕科技有限

做電商怎樣為自己的產品引流？電商平臺有哪些引流方式？

電子商務逐漸將傳統的商務流程轉向電子化、數字化，一方面使電子流代替了實物流，大量減少人力、物力以及財力，降低成本。另一方面電商突破了時間和空間的限制，使交易活動不受限制，可以在任何時間和地點進

Java生鮮電商平臺-生鮮電商中微服務體系中的分層設計和領域劃分？(小程式/APP)

Java生鮮電商平臺-生鮮電商中微服務體系中的分層設計和領域劃分？說明：在Java生鮮電商平臺中，微服務體系的分層設計與領域劃分應該怎麼樣呢？

（十三）海哇VR全景電商平臺-“海哇商品分享”賺取收益

海哇平臺針對普通消費者提供自購省錢、分享賺錢機制，讓普通大眾也可以在海哇平臺進行創業，商品可以直接分享給朋友或者生成自己的分享海報發到朋友圈，朋友通過分享連結或掃描連結進入平臺後，永久和分享者

做好一個電商平臺的花費

任何一個平臺的開發花費主要集中在以下兩個方面：一是伺服器的開銷、二是網站的搭建所需要的花費，下面我們具體看看花費都在那些方面

電商平臺曝光蘋果iPad Air 4開售時間：或與新 iPhone 同步

9 月 16 日，蘋果召開秋季釋出會，釋出 iPad Air 系列迭代產品 iPad Air 4 平板電腦。在釋出會上，蘋果表示這款產品將在 10 月份發售。此前的訊息是蘋果可能會在昨日凌晨的釋出會上宣佈 iPad Air 發售時間，但事實告

（十五）海哇VR全景電商平臺-“海哇個人中心分享收益”功能分析

海哇平臺針對普通消費者提供自購省錢、分享賺錢機制，讓普通大眾也可以在海哇平臺進行創業，可以直接分享給朋友或者生成自己的分享海報發到朋友圈，朋友通過分享連結或掃描連結進入平臺後，永久和分享者繫結

github開源電商平臺（續）-實戰除錯

1、下載專案：下載git工具(https://git-scm.com/download/win)，執行： 2、IDEA匯入mall多模組專案

spring boot+vue實現爬取各大平臺每日熱榜資料功能

案例功能效果圖爬去資料的平臺頁面這個案例能爬取的平臺太多了，我沒有全部截圖出來，想看的你們自己下載原始碼自己跑起來！

雙十一福利！爬取電商平臺商品詳情！買東西我們只買優質產品！

相關推薦