Python爬蟲專案講解：採集地方官方網站採購商品資料

阿新 • • 發佈：2021-07-31

前言

今天, 帶大家採集地方官方網站的商品資料，其實這些公開的商品資料就是展示給使用者看的，只不過我們通過爬蟲採集下來可以更加方便我們看資料, 以及方便後續對資料做分析。

一起來看看吧!

本篇文章程式碼內容：

分析網頁性質, 找資料請求的地址
json資料的資料解析
如何儲存成csv

環境介紹：

python 3.6
pycharm
requests
csv

爬蟲案例實現的步驟:

找資料對應的url地址
傳送指定地址的請求
資料的提取
資料儲存

受害者地址：http://hljcg.hlj.gov.cn/

1. 找資料對應的url <統一資源定位符(連結地址)> 地址

原始表單資料

url = 'http://hljcg.hlj.gov.cn/proxy/trade-service/mall/search/searchByParamFromEs'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'}

json_data = {"queryPage":{"platformId":20,"pageSize":28,"pageNum":1},"orderType 
":"desc","homeType":"10","isAggregation":"true","publishType":"1","orderColumn":"saleCount","cid":1000033,"businessType":"1","cids":[]}

2. 傳送指定地址的請求

import requests  # 資料請求模組, 第三方模組
import pprint  # 格式化輸出

response = requests.post(url=url, json=json_data, headers=headers)
json_data = response.json()  # 
 變數
pprint.pprint(json_data)

3. 資料的提取，json提取

取下每一條商品資料

result_list = json_data['data']['itemList']['resultList']
# print(result_list)

for result in result_list:
    print(result)

鍵值對取值

skuName = result['skuName']  # 商品名字
maxPrice = result['maxPrice']  # 商品價格
pictureUrl = result['pictureUrl'].replace('\n', ' | ')  # 商品圖片連結
print(skuName, maxPrice, pictureUrl)

4. 資料儲存

import csv   # 資料儲存模組, 內建模組

with open('商品資料.csv', mode='a', encoding='utf-8', newline='') as f:
    csv_write = csv.writer(f)
    csv_write.writerow([skuName, maxPrice, pictureUrl])

最後執行程式碼得到結果

Python爬蟲專案講解：採集地方官方網站採購商品資料

前言今天, 帶大家採集地方官方網站的商品資料，其實這些公開的商品資料就是展示給使用者看的，只不過我們通過爬蟲採集下來可以更加方便我們看資料, 以及方便後續對資料做分析。

Python爬蟲實戰講解：某東商品評論資訊採集流程分析

前言電商平臺的小爬蟲，通過網站的搜尋介面拿到商品ID，根據商品ID採集對應的評論。

Python爬蟲實戰講解：爬取騰訊視訊

前言做了一些小專案，用的技術和技巧會比較散比較雜，寫一個小品文記錄一下，幫助熟悉。

Python爬蟲實戰案例：採集愛奇藝VIP視訊

一、實戰背景愛奇藝的VIP視訊只有會員能看，普通使用者只能看前6分鐘。很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去

Python爬蟲入門教程：爬取boss直聘招聘資料並做視覺化展示

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

Python爬蟲常用資料庫：Request 介紹講解

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲基礎講解（二十四）：第一個scrapy爬蟲

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看 https://space.bilibili.com/523606542

Python爬蟲基礎講解（二十五）：scrapy 框架結構

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看 https://space.bilibili.com/523606542

Python爬蟲基礎講解（二十六）：scrapy.Spider

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看 https://space.bilibili.com/523606542

Python爬蟲基礎講解（二十七）：scrapy 框架—ltem和scrapy.Request

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看 https://space.bilibili.com/523606542

最新！Python爬蟲專案案例講解一步步教你爬取淘寶商品資料

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看 https://space.bilibili.com/523606542

三個python爬蟲專案例項程式碼

這篇文章主要介紹了三個python爬蟲專案例項程式碼,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Docker部署Python爬蟲專案的方法步驟

1) 首先安裝docker： # 用 yum 安裝並啟動 yum install docker -y && systemctl start docker 2) 下載自定義映象需要用到的基礎映象：

Python爬蟲實戰演示：破解驗證碼識別和彈窗處理

前言在我們寫爬蟲的過程中，目標網站常見的干擾手段就是設定驗證碼等，本就將基於Selenium實戰講解如何處理彈窗和驗證碼，爬取的目標網站為某儀器預約平臺

Python GUI專案實戰：主窗體的介面設計與實現

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

scrapy爬蟲專案(1)：scrapy基本使用

之前在寫爬蟲時，都是自己寫整個爬取過程，例如向目標網站發起請求、解析網站、提取資料、下載資料等，需要自己定義這些實現方法等

Python爬蟲第一課：requests的使用

requests模組的入門使用注意是requests不是request. 1、為什麼使用requests模組，而不是用python自帶的urllib

Python tkinter應用講解：單機五子製作

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

python -爬蟲學習2：獲取資料requests 庫

上一篇介紹的主要是爬蟲的工作原理，大致分為四個步驟：獲取資料解析資料提取資料儲存資料。這一篇主要就從獲取資料介紹起。

python爬蟲二十三：fiddler介紹

1、什麼是fiddler Fiddler是⼀個http協議除錯代理⼯具,它能夠記錄並檢查所有電腦和網際網路之間的http、https、stp等通訊，它⽀持IE、Chrome、FireFox等等瀏覽器，可以在phone、pad等移動裝置進⾏連線不僅可