python爬取json介面

阿新 • • 發佈：2018-12-12

在某大佬的指導下，接觸第一個爬蟲，這裡是爬取了一個網站的介面資料並且儲存成Excel文件，程式碼不多，重在認識爬蟲

Python寫爬蟲真的是爽

#! /usr/bin/env python # coding=utf-8 import requests import json import sys import xlwt ses = requests.session() # # requests是與傳送請求有關的，xlwt模組是建立、讀寫Excel檔案，sys實現從程式外部向程式傳遞引數 reload(sys)#需要重新載入模組，以防止上一次呼叫過模組導致報錯 sys.setdefaultencoding('utf8') def http_get(url): return json.loads(requests.get(url,stream=True).content) workbook = xlwt.Workbook(encoding='utf-8') worksheet = workbook.add_sheet('Worksheet') row=0 for a in range(0,1): #這句程式碼是迴圈 0=<a<1 ，所有實際上就是輸出當a=0是寫入url，可有可無 #http://180.153.255.6/mobile/discovery/v2/category/metadata/albums/ts-1515757942203?calcDimension=hot&categoryId=0&device=android&pageId=1&pageSize=100&version=6.3.60 url="http://180.153.255.6/mobile/discovery/v2/category/metadata/albums/ts-1515757942203?calcDimension=hot&categoryId=0&device=android&pageId="+str(a)+"&pageSize=100&version=6.3.60" json_data=http_get(url) if json_data["list"]==[]: break else: b=len(json_data["list"]) for bb in range(0,b): special_list=[] tracks_list=[] albumId=json_data["list"][bb]["albumId"] sku_url="http://180.153.255.6/mobile/v1/album/ts-1515829937763?ac=WIFI&albumId="+str(albumId)+"&device=android&isAsc=true&pageId=1&pageSize=1&pre_page=2&source=5&supportWebp=true" json_sku_data=http_get(sku_url) if json_sku_data["data"]!="": try: user_id=json_sku_data["data"]["user"]["uid"] except: user_id="" print albumId, print user_id, print json_data["list"][bb]["title"] list = [albumId,json_data["list"][bb]["title"],json_data["list"][bb]["nickname"],json_data["list"][bb]["intro"]] for p in range(0, 4): worksheet.write(row, p, label=list[p]) row=row+1 print row-1 #從 0 開始，這裡應該直接輸出 row 就可以顯示多少條資料了 workbook.save('Excel_Workbook.xls')

需要注意的是，reload(sys) 是重新載入sys模組，如果不載入模組會報錯

好了，一個簡單的爬蟲就做出來了，這個爬蟲主要是爬取json介面的資料

python爬取json介面

在某大佬的指導下，接觸第一個爬蟲，這裡是爬取了一個網站的介面資料並且儲存成Excel文件，程式碼不多，重在認識爬蟲 Python寫爬蟲真的是爽 #! /usr/bin/env python # coding=utf-8 import requests import js

python爬取json資料

# coding utf-8 import requests import json import datetime import pymysql user_agent = 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1;

Python爬取Json格式資料並讀寫（改中文編碼）

Python Json檔案讀寫經過測試發現，req.json()返回的型別是dict（字典型別）如果有興趣的話，可以再加一個正則表示式來篩選出url的關鍵名字，用關鍵名來做檔名。

python爬取ios中app store關鍵字排行榜的介面

import requests cookies = { "Cookie": "xp_ci=3z2QZ7wgz1BDz4qZzAGKzHKUylWKp; itspod=9; mzf_in=092487; ns-mzf-inst=36-77-443-109-103-8282-92487-9-s

python爬取ajax請求，返回的json資料格式化報錯json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

python爬取ajax請求，返回Json資料中帶有<html><head></head><body><prestyle="word-wrap: break-word; white-space: pre-wrap;"></pre>

利用python爬取yapi後臺介面

解決的問題：檢測公司釋出系統之中，遺漏的介面路徑地址。採取的方法：爬取yapi管理後臺，爬取所有的介面路徑，同時檢測這個path路徑是否在釋出系統之中（如果不在釋出系統之後，通過域名訪問，會提示沒有許可權）好了瞭解了背景之後我就開始開工了。一、瞭解yapi 在

python爬取視訊段段子視覺化介面

Python的用途大家都知道，主要是用來爬蟲，對於的進行分析處理。我這個呢，主要是給大家分享一個爬取視訊段子視覺化下載的方法。望各位道友能夠喜歡。視覺化主要用到一個Tkinter庫，大家需要去下載安裝，這個庫很好下載的，網上就用，這裡小編就不多說了。爬

使用python爬取京東評論（json）

任務：爬取京東某手機的評論這次爬取的內容是動態的所以不能直接爬原始碼中的內容開啟網頁按下F12在Network裡找到productPageComments檔案開啟這個檔案這個檔案是

python 爬取鬥魚 Ajax動態載入js分頁使用phontomjs無介面瀏覽器

python2.7版本 #coding:utf8 import unittest from selenium import webdriver from bs4 import BeautifulSo

python爬取網易雲音樂歌單音樂

string attrs default textarea bsp color read contents dom 在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/ 依次第二頁：http://music.1

python 爬取qidian某一頁全部小說

decode return data- dib read etc break beautiful range 1 import re 2 import urllib.request 3 from bs4 import BeautifulSou

Python爬取今日頭條段子

找到 eat 修改是什麽一次時間地址 style 用戶名剛入門Python爬蟲，試了下爬取今日頭條官網中的段子，網址為https://www.toutiao.com/ch/essay_joke/源碼比較簡陋，如下： 1 import requests 2 i

利用python爬取龍虎榜數據及後續分析

登錄 one 可能股市 .com 爬蟲但我由於相關 ##之前已經有很多人寫過相關內容，但我之前並未閱讀過，這個爬蟲也是按照自己的思路寫的，可能比較醜陋，請見諒！本人作為Python爬蟲新手和股市韭菜，由於時間原因每晚沒辦法一個個翻龍虎榜數據，所以希望借助爬蟲篩選出

python爬取豆瓣小組700+話題加回復啦啦啦python open file with a variable name

技術分享 ash 寫入 blog ima ron tar 回復 -128 需求：爬取豆瓣小組所有話題（話題title，內容，作者，發布時間），及回復（最佳回復，普通回復，回復_回復，翻頁回復，0回復）解決：1. 先爬取小組下，所有的主題鏈接，通過定位nextp

Node.js/Python爬取網上漫畫

版本中間 kit ont mic 這一圖片加載同步改變　　某個周日晚上偶然發現了《火星異種》這部漫畫，便在網上在線看了起來。在看的過程中圖片加載很慢，而且有時候還不小心點到廣告，大大延緩了我看的進度。後來想到能不能把先把漫畫全部抓取到本地再去看。　　經過一段時間

python爬取百度搜索圖片

知乎需要 with 異常 mage 不足 request height adr 在之前通過爬取貼吧圖片有了一點經驗，先根據之前經驗再次爬取百度搜索界面圖片廢話不說，先上代碼 #!/usr/bin/env python # -*- coding: utf-8 -*- #

Python爬取百度貼吧數據

utf-8 支持我 family encode code word keyword 上一條時間　　本渣除了工作外，在生活上還是有些愛好，有些東西，一旦染上，就無法自拔，無法上岸，從此走上一條不歸路。花鳥魚蟲便是我堅持了數十年的愛好。　　本渣還是需要上班，才能支持我的

python爬取七星彩的開獎歷史記錄

clas 程序代碼 aip dal zip file utf mage decode 1.因為人不可能一直無休止的學習，偶爾也想做點兒別的，昨天無聊就想寫寫Python，當然我承認我上班後基本都是在學工作方面的事情，在這個崗位我也呆了三年多了，還是那句話問我什麽會不會我會給

python爬取網頁圖片

ima com col list https pytho 表達式 images 5% 在Python中使用正則表達式，一個小小的爬蟲，抓取百科詞條網頁的jpg圖片。下面就是我的代碼，作為參考： #coding=utf-8 # __author__ = ‘Hinfa‘ im

python爬取百度搜索結果ur匯總

百度搜索 sta attr amp end rom range 百度篩選寫了兩篇之後，我覺得關於爬蟲，重點還是分析過程分析些什麽呢： 1）首先明確自己要爬取的目標　　比如這次我們需要爬取的是使用百度搜索之後所有出來的url結果 2）分析手動進行的獲取目標的過程，以便

python爬取json介面

相關推薦