Python爬取京東手機評論資訊

阿新 • • 發佈：2022-03-13

程式碼如下：

  1 # coding='utf-8'
  2 import requests
  3 import json
  4 import time
  5 import random
  6 import xlwt
  7 import xlutils.copy
  8 import xlrd
  9 
 10 
 11 def start(page):
 12     # 獲取URL
 13     # score 評價等級 page=0 第一頁 producitid 商品類別
 14     # url = 'https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100014348492&score=0&sortType=5&page=&pageSize=10&isShadowSku=0&fold=1' 

 15     url = 'https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100014348492&score=0&sortType=5&page='+str(page)+'&pageSize=3100&isShadowSku=0&fold=1'
 16 
 17     headers = {
 18         "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Mobile Safari/537.36 
"
 19     }
 20     time.sleep(2)
 21     test = requests.get(url=url, headers=headers)
 22     t = test.text
 23     data = json.loads(t.lstrip('fetchJSON_comment98vv12345(').rstrip(');'))
 24     # data = json.loads(test)
 25     return data
 26     # 解析頁面
 27 
 28 
 29 def parse(data):
 30     items = data[' 
comments']
 31     for i in items:
 32         yield (
 33             i['id'],  # 使用者id
 34             i['guid'],
 35             i['content'],  # 內容
 36             i['creationTime'],  # 時間
 37             i['isTop'],
 38             i['referenceTime'],
 39             i['firstCategory'],
 40             i['secondCategory'],
 41             i['thirdCategory'],
 42             i['replyCount'],
 43             i['score'],
 44             i['nickname'],
 45             i['userClient'],
 46             i['productColor'],
 47             i['productSize'],
 48             i['plusAvailable'],
 49             i['productSales'],
 50             i['days'],
 51             i['afterDays']
 52         )
 53 
 54 
 55 def excel(items):
 56     # 第一次寫入
 57     newTable = "jingdong.csv"  # 建立檔案
 58     wb = xlwt.Workbook("encoding='utf-8")
 59 
 60     ws = wb.add_sheet('sheet1')  # 建立表
 61     headDate = ['id', 'guid', '內容', '時間', 'isTop', 'referenceTime', 'firstCategory', 'secondCategory', 'thirdCategory',
 62                 'replyCount', 'score', 'nickname', 'userClient', 'productColor', 'productSize',
 63                 'plusAvailable', 'productSales', 'days', 'afterDays']  # 定義標題
 64     for i in range(0, 19):  # for迴圈遍歷寫入
 65         ws.write(0, i, headDate[i], xlwt.easyxf('font: bold on'))
 66 
 67     index = 1  # 行數
 68 
 69     for data in items:  # items是十條資料 data是其中一條（一條下有三個內容）
 70         for i in range(0, 19):  # 列數
 71             print(data[i])
 72             ws.write(index, i, data[i])  # 行 列 資料（一條一條自己寫入）
 73         print('______________________')
 74         index += 1  # 等上一行寫完了 在繼續追加行數
 75         wb.save(newTable)
 76 
 77 
 78 def another(items, j):  # 如果不是第一次寫入 以後的就是追加資料了 需要另一個函式
 79 
 80     index = (j - 1) * 10 + 1  # 這裡是 每次寫入都從11 21 31..等開始 所以我才傳入資料 代表著從哪裡開始寫入
 81 
 82     data = xlrd.open_workbook('jingdong.csv')
 83     ws = xlutils.copy.copy(data)
 84     # 進入表
 85     table = ws.get_sheet(0)
 86 
 87     for test in items:
 88 
 89         for i in range(0, 19):  # 跟excel同理
 90             print(test[i])
 91 
 92             table.write(index, i, test[i])  # 只要分配好 自己塞入
 93         print('_______________________')
 94 
 95         index += 1
 96         ws.save('jingdong.csv')
 97 
 98 
 99 def main():
100     j = 1  # 頁面數
101     judge = True  # 判斷寫入是否為第一次
102 
103     for i in range(0, 300):
104         time.sleep(1.5)
105         # 記得time反爬 其實我在爬取的時候沒有使用代理ip也沒給我封 不過就當這是個習慣吧
106         first = start(j)
107         test = parse(first)
108 
109         if judge:
110             excel(test)
111             judge = False
112         else:
113             another(test, j)
114         print('第' + str(j) + '頁抓取完畢\n')
115         j = j + 1
116 
117 
118 if __name__ == '__main__':
119     main()
120     # 這個程式碼僅為全部資料下的評論而已 中差評等需要修改score！

效果圖：

Python爬取京東手機評論資訊

程式碼如下： 1 # coding=\'utf-8\' 2 import requests 3 import json 4 import time 5 import random 6 import xlwt

python爬取京東商品評論

可爬取的內容上程式碼 import requests import json import csv from lxml import etree from bs4 import BeautifulSoup

Python利用Xpath選擇器爬取京東網商品資訊

HTML檔案其實就是由一組尖括號構成的標籤組織起來的，每一對尖括號形式一個標籤，標籤之間存在上下關係，形成標籤樹；XPath 使用路徑表示式在 XML 文件中選取節點。節點是通過沿著路徑或者 step 來選取的。

Python CSS選擇器爬取京東網商品資訊過程解析

CSS選擇器目前，除了官方文件之外，市面上及網路詳細介紹BeautifulSoup使用的技術書籍和部落格軟文並不多，而在這僅有的資料中介紹CSS選擇器的少之又少。在網路爬蟲的頁面解析中，CCS選擇器實際上是一把效率甚高的利

python爬取京東評論

一.分析 1.找到京東商品評論所在位置(記得點選商品評論，否則找不到productPageComments.action)

使用Python爬取彈出視窗資訊的例項

此文僅當學習筆記用. 這個例項是在Python環境下如何爬取彈出視窗的內容,有些時候我們要在頁面中通過點選,然後在彈出視窗中才有我們要的資訊,所以平常用的方法也許不行.

Python爬取阿拉丁統計資訊過程圖解

背景目前專案在移動端上，首推使用微信小程式。各專案的小程式訪問資料有必要進行採集入庫，方便後續做統計分析。雖然阿拉丁後臺也提供了趨勢分析等功能，但一個個的獲取資料做資料分析是很痛苦的事情。通過將資料轉

爬取京東商城商品資訊

0x01 基於chrome+selenium爬取京東商城8G記憶體條 from selenium import webdriver from selenium.webdriver import ActionChains #獲取屬性

python爬取12306的車次資訊

詳情檢視下面的程式碼：如果被識別就要新增一個cookie如果沒有被識別的話就要一個user—agent就好了。如果出現亂碼就設定編碼格式為utf-8

看看最近京東哪些產品最火，Python爬取京東的商品排行

確立需求目標之所以寫爬蟲，肯定是有需求才會寫，不然就沒啥意義了。我們今天這個爬蟲主要的任務就是，輸入一個關鍵字，然後將京東返回的商品結果按一定的條件取得前十的商品名稱和價格。知道了要幹什麼，就開始上乾

Python爬取京東商品使用者的評價

一、爬取京東商品手機的使用者評價，包括評價、顏色、手機型號並存入資料庫（MySQL）

Python爬取豆瓣Top250電影資訊

1、爬取豆瓣Top250電影資訊以文字形式儲存資料：豆瓣電影 2、程式碼 import requests

基於Python爬取京東雙十一商品價格曲線

一年一度的雙十一就快到了，各種砍價、蓋樓、挖現金的口令將在未來一個月內充斥朋友圈、微信群中。玩過多次雙十一活動的小編表示一頓操作猛如虎，一看結果2毛5。浪費時間不說而且未必得到真正的優惠，雙十一電商的“

python爬取招聘要求等資訊例項

在我們人生的路途中，找工作是每個人都會經歷的階段，小編曾經也是苦苦求職大軍中的一員。懷著對以後的規劃和想象，我們在找工作的時候，會看一些招聘資訊，然後從中挑選合適的崗位。不過招聘的崗位每個公司都有不少

利用Python爬取京東商品的一種辦法

前言如今的京東、淘寶、天貓等等已經不同往日了, 在使用者不登入的情況下, 很難通過技術手段來大規模獲取到我們關注的商品資訊. 關於京東等購物網站的自動登入也有很多人在做, 但是大廠的反爬能力確實很強, 目

一篇文章教會你用Python爬取淘寶評論資料（寫在記事本）

【一、專案簡介】本文主要目標是採集淘寶的評價，找出客戶所需要的功能。統計客戶評價上面誇哪個功能多，比如防水，容量大，好看等等。

python爬取微博評論的例項講解

python爬蟲是程式設計師們一定會掌握的知識，練習python爬蟲時，很多人會選擇爬取微博練手。python爬蟲微博根據微博存在於不同媒介上，所爬取的難度有差異，無論是python新入手的小白，還是已經熟練掌握的程式設計師

Python爬取淘寶商品資訊寫入mysql

直接上程式碼：（商品名稱、單價、圖片連結） import pymysql import requests import re

python爬取部落格園資訊用於歸檔--excel篇

之所以要寫程式碼進行爬取，是因為我太懶了，嗚嗚嗚，如果能天天躺著刷手機誰會打程式碼~~

利用python爬取全國水雨情資訊

分析我們沒有找到介面，所以打算利用selenium來爬取。程式碼 import datetime import pandas as pd

Python爬取京東手機評論資訊

相關推薦