python爬取ajax請求，返回的json資料格式化報錯json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

阿新 • • 發佈：2018-11-08

python爬取ajax請求，返回Json資料中帶有<html><head></head><body><prestyle="word-wrap: break-word; white-space: pre-wrap;"></pre></body></html>標籤解決方法

一、分析：

如何使返回的資料去除非json格式的資料，

二、使用replace()方法：

replace()方法語法：

str.replace(old, new[, max])

old -- 將被替換的子字串。
new -- 新字串，用於替換old子字串。

max -- 可選字串, 替換不超過 max 次

返回字串中的 old（舊字串）替換成 new(新字串)後生成的新字串，如果指定第三個引數max，則替換不超過 max 次。

三、最終解決方式原始碼如下：

import json
from urllib.parse import urlencode

from selenium import webdriver

def get_page_index(offset, keyword):
    data = {
        'offset': offset,
        'format': 'json',
        'keyword': keyword,
        'autoload': 'true',
        'count': '20',
        'cur_tab': '1',
        'from': 'search_tab',
    }
    url = 'http://www.toutiao.com/search_content/?' + urlencode(data)
    browser = webdriver.PhantomJS()
    try:
        browser.get(url)
        return browser.page_source
    finally:
        browser.close()

def parse_page_index(html):
    '''解析網頁資源'''
    data = json.loads(html)
    if data and 'data' in data.keys():
        '''尋找key為data的資料'''
        for item in data.get('data'):
            yield item.get('article_url')

def main():
    html = get_page_index(0, '街拍')
    '''加入如下兩行程式碼即可''' 

    html = html.replace('<html><head></head><body><pre style="word-wrap: break-word; white-space: pre-wrap;">', '')
    html = html.replace('</pre></body></html>', '')
    # print(html)
    for url in parse_page_index(html):
        print(url)

if __name__ == '__main__':
    main()

python爬取ajax請求，返回的json資料格式化報錯json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

python爬取ajax請求，返回Json資料中帶有<html><head></head><body><prestyle="word-wrap: break-word; white-space: pre-wrap;"></pre>

python爬蟲：json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

目的：抓取一個網頁的評論部分執行指令碼檔案後，出現頁面原始碼，這是一個js檔案接下來使用json.loads()函式進行解析 json_data = json.loads(html_text) 問題： erro:json.decoder.JSONDecode

Python 爬取美女圖片，分目錄多級存儲

port Language resp pac rst apt itl album domain 最近有個需求：下載https://mm.meiji2.com/網站的圖片。所以簡單研究了一下爬蟲。在此整理一下結果，一為自己記錄，二給後人一些方向。爬取結果如圖：

python爬取百度翻譯返回：{'error': 997, 'from': 'zh', 'to': 'en', 'query 問題

escape result words fan use rip odin 解決 base 解決辦法：修改url為手機版的地址：http://fanyi.baidu.com/basetrans User-Agent也用手機版的測試代碼： # -*- coding: utf

Python爬取數萬條北京租房資料，從6個維度揭穿房租瘋漲的祕密！！！

導讀：昨天還幻想海邊別墅的年輕人，今天可能開始對房租絕望了。 8月初，有網友在“水木論壇”發帖控訴長租公寓加價搶房引起關注。據說，一名業主打算出租自己位於天通苑的三居室，預期租金7500元/月，結果被二方中介互相擡價，

Python 爬取 B 站，宋智孝李光洙哪個更受寵？

column 51cto vba imageview 韓國 water range vmax 關系在中國，大家應該都了解《跑男》這個節目吧，跑男這個節目就是引用了韓國的《Running Man》，成員組成包括原六位成員劉在石、池石鎮、金鐘國、HAHA（河東勛）、宋智孝、李

Python爬取ajax動態載入內容

import requests import json import csv url= "https://movie.douban.com/j/chart/top_list?" params={ "type":17, "interval_id" :"100

JAVA爬蟲框架WebMagic爬取ajax請求的頁面資料

檢視WebMagic文件：http://webmagic.io/docs/zh/posts/ch1-overview/ 爬取網址需要翻牆： https://www.reddit.com/r/funny/ &

python爬取電影原始碼，小編以後看電影再也不用VIP了（有程式碼）

小編有發爬取電影的視訊，今天小編再發一篇爬取電影的文章。不是小編懶，是小編真的不知道寫什麼了，見諒。如果小編Get到新的技能，一定發。是不是有好多的小夥伴跟好久好久以前的小編一樣，看一個電影充個會員，這個沒關係，最主要的是，充一個平臺的VIP還不行得有好幾個才可以。這麼貧窮的小編，當然只能看6分鐘的視訊

史上最詳細Python爬取電影教程，還不會那也是沒誰了

摘要：作為小白，爬蟲可以說是入門python最快和最容易獲得成就感的途徑。因為初級爬蟲的套路相對固定，常見的方法只有幾種，比較好上手。選取網頁結構較為簡單的貓眼top100電影為案例進行練習。重點是用上述所說的4種方法提取出關鍵內容。一個問題採用不同的解決方法有助於拓展思維，通過不斷練

Python爬取美劇，再也不用劇荒了，哈哈~

小編最近放元旦假期了，外面冰天雪地的又不想出去玩兒~還是宅在家裡吧~ 但是身為宅女的我怎麼可能不追劇呢？最近小編迷上了美劇，無奈好多網站的美劇質量內容都參差不齊，於是本宅女就得自己動手啦，用Python爬美劇去。走吧~ 小編推薦大家可以加我的扣扣群 735934841 。

Python爬取動態說說，生成詞雲，看看朋友的現狀

今天我們要做的事情是使用動態爬蟲來爬取QQ空間的說說，並把這些內容存在txt中，然後讀取出來生成雲圖，這樣可以清晰的看出朋友的狀況。這是好友的QQ空間10年說說內容，基本有一個大致的印象了。爬取動態內容 1.因為動態頁面的內容是動態加載出來的，所以

python爬取當前匯率，jython的應用，實時匯率兌換

之前學習swing時寫個一個簡單的匯率轉換器，之前又學習了python，於是想用python寫個爬蟲，把資料給java展示出來，媒介採用jython,將python解析的結果儲存到txt文件中，java讀取文件 ,如果不用jython就得手動先執行一遍python,就沒意思

通過爬取天貓商品評論例項分析Python爬取ajax動態生成的資料

本文主要通過爬取天貓商品kindle的評論為例來說明利用python爬取ajax動態生成的資料的方式，本文使用的工具如下：工具 chrome瀏覽器【尋找評論的動態連結】 python3.5【執行程式碼】 mysql【儲存爬蟲獲得

通過抓取淘寶評論為例講解Python爬取ajax動態生成的資料

'https://rate.taobao.com/feedRateList.htm?auctionNumId=538039793643&userNumId=2779992133&currentPageNum=6&pageSize=20&rateType=&orderTy

python爬取小視頻，看完身體一天不如一天！

image 規則 page 直接 nag 輸入 python代碼 dad 網頁 Python現在非常火，語法簡單而且功能強大，很多同學都想學Python！所以在這裏給各位看官們準備了高價值Python學習視頻教程及相關電子版書籍，都放在了文章結尾，歡迎前來領取！python

python爬取拉勾網網際網路大資料職業情況

爬取拉勾網資訊資料處理製圖所需知識只有一點點（畢竟是個小白）： requests基礎部分 json pyecharts wordcloud 接下來開始敲程式碼了，程式碼分成了3個部分：爬取、製圖、生成詞雲爬取部分：首先要說明的是，拉勾網有反爬

Python 爬取愛奇藝 52432 條資料分析

爬取資料奇葩說是愛奇藝獨播視訊，所以這一次，筆者選取官方評論資料作為資源庫，來進行資料分析。使用 Chrome 檢視原始碼模式，在“奇葩說”播放頁面往下面滑動，有一個get_comments 的請求，經過分析，這個介面就是獲取評論資料的介面。

Python爬取網易雲課堂課程資料

本人對於Python學習建立了一個小小的學習圈子，為各位提供了一個平臺，大家一起來討論學習Python。歡迎各位到來Python學習群：960410445一起討論視訊分享學習。Python是未來的發展方向，正在挑戰我們的分析能力及對世界的認知方式，因此，我們與時俱進，迎接變化，並不斷的成長，

利用python爬取實習僧網站上的資料

最近在找實習，就順便想到用python爬取一些職位資訊看看，有哪些崗位比較缺人。 #_*_coding:utf-8_*_ import requests from bs4 import BeautifulSoup import xlwt import r

python爬取ajax請求，返回的json資料格式化報錯json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

相關推薦