Python爬取優質高清桌布網站：彼岸

阿新 • • 發佈：2021-01-20

基本開發環境

·Python 3.6

·Pycharm

模組使用

網頁分析

1.檢視桌布詳情頁內容開啟開發者工具就可以看到桌布的地址以及桌布的名字了

複製桌布地址

詳情頁中的圖片地址就是高清圖片地址了

2.獲取每張桌布頁的url

如上圖所示，所有的桌布詳情頁地址都包含在li標籤中。

綜上所述：

1、請求列表頁，解析網頁資料獲取每張桌布的詳情頁url,拼接url地址；

2、請求詳情頁，解析網頁資料獲取每張桌布的圖片url地址以及標題

3、請求圖片url地址，儲存桌布

儲存資料的時候會有一個坑：

在請求圖片url地址的時候們要加上圖片cokkie,如果你不加cookie，儲存下來的圖片是破損的，所以需要兩個headers，一個是獲取url地址的嗎，一個是儲存圖片資料的。

程式碼如下：

import requests
import threding
import concurrent.futures

headers = {
    'Cookie': '__cfduid=d06f453df5c4252eb0aac3e9280e5b0b01606983134; Hm_lvt_14b14198b6e26157b7eba06b390ab763=1606983135; xygkqecookieinforecord=%2C12-23053%2C; Hm_lpvt_14b14198b6e26157b7eba06b390ab763=1606984094',
    'Host': 'www.netbian.com 
',
    'Referer': 'http://www.netbian.com/1920x1080/index.htm',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
}

headers1 = {
        'Cookie': 'Hm_lvt_14b14198b6e26157b7eba06b390ab763=1590498708; __cfduid=d7b17b08368a78ab8d8d6a42d580c62f01606985472 
',
        'Host': 'img.netbian.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3823.400 QQBrowser/10.7.4307.400',
}


def get_response(html_url):
    """
    獲取網頁原始碼
    :param html_url: 
    :return: 
    """
    response = requests.get(url=html_url, headers=headers)
    return response


def get_response1(html_url):
    """
    獲取網頁原始碼 (儲存桌布)
    :param html_url: 
    :return: 
    """
    response = requests.get(url=html_url, headers=headers1)
    return response


def get_parsing(html_data):
    """
    解析函式
    :param html_data: 
    :return: 
    """
    selector = parsel.Selector(html_data)
    return selector


def save(img_url, name):
    """
    儲存資料
    :param img_url: 
    :param name: 
    :return: 
    """
    filename = 'img\\' + name + '.jpg'
    img_content = get_response1(img_url).content
    with open(filename, mode='wb') as f:
        f.write(img_content)
        print('正在儲存：', name)
        print(img_url)


def get_img_url(page_url):
    """
    獲取圖片地址 以及 標題
    :param page_url: 
    :return: 
    """
    response = get_response(page_url)
    response.encoding = response.apparent_encoding
    selector = get_parsing(response.text)
    img_url = selector.css('.pic a img::attr(src)').get()
    name = selector.css('.pic a img::attr(title)').get()
    save(img_url, name)


def main(url):
    """
    主函式
    :param url: 
    :return: 
    """
    response = get_response(url)
    response.encoding = response.apparent_encoding
    selector = get_parsing(response.text)
    lis = selector.css('.list ul li a::attr(href)').getall()
    lis.pop(2)
    lis.pop(2)
    for li in lis:
        page_url = 'http://www.netbian.com' + li
        get_img_url(page_url)


if __name__ == '__main__':
    executor = concurrent.futures.ThreadPoolExecutor(max_workers=5)
    for page in range(2, 50):
        url = 'http://www.netbian.com/1920x1080/index_{}.htm'.format(page)
        executor.submit(main, url)
    executor.shutdown()

Python爬取優質高清桌布網站：彼岸

基本開發環境 ·Python 3.6 ·Pycharm 模組使用網頁分析 1.檢視桌布詳情頁內容開啟開發者工具就可以看到桌布的地址以及桌布的名字了

Python 爬取必應bing桌布

前言喜歡BING的高清大圖，快節奏的生活增添一絲絲溫暖以後是python完整程式碼（可以選擇下載的時間範圍)

安卓 12 高清桌布流出：共 7 張，已經可以下載

2月12日訊息安卓 Android 12 系統將於今年正式釋出，首個開發者預覽版有望於本月推出。新系統將有著諸多外觀、功能升級，隱私保護能力進一步加強。俄羅斯媒體 rozetked 近日提前拿到了安卓 12 開發者預覽版，並提取了

微軟 Win11 SE 預設高清桌布下載：包含 Surface、常規 PC、手機解析度

11 月 11 日訊息，微軟在最新的教育活動中正式釋出了Windows 11SE 系統，針對教育市場進行了一定的優化。該訊息釋出後，許多網友最關注的卻是該系統的預設桌布。該桌布在設計上與原版 Windows 11 的預設桌布類似，只

python爬蟲學習（一）爬取高清桌布（各種主流大小的高清圖）

from bs4 import BeautifulSoup import requests import time import os def get_photo(key): url = \"https://desk.zol.com.cn/meinv/\"+str(key)+\".html\"

python爬蟲爬取筆趣網小說網站過程圖解

首先：文章用到的解析庫介紹 BeautifulSoup： Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。

Python 爬取必應桌布的例項講解

最近看了下python，就想著獲取下bing的圖片，每天定時爬取，儲存到本地，可以做背景圖片用。也在網上看了一些其他的例子。就自己動手寫了一個小的爬圖片的python指令碼。

python爬取高匿代理IP（再也不用擔心會進小黑屋了）

為什麼要用代理IP 很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去學習更加高深的知識。那麼針對這三類人，我給大家提供

實用python爬取妹子圖網站圖片

參考自: https://gitee.com/52itstyle/Python/blob/master/Day01/%E8%84%9A%E6%9C%AC/%20mzitu_win.py 注: 未成年請在家長的陪同下使用該指令碼與訪問該網站

python爬取12306網站獲取火車票資訊

利用requests傳送請求，prettytable表格輸出，需要安裝requests，prettytable python -m pip install requests

Python爬取某境外網站漫畫，心血來潮，爬之

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

python 爬取免費簡歷模板網站的示例

程式碼 # 免費的簡歷模板進行爬取本地儲存 # http://sc.chinaz.com/jianli/free.html # http://sc.chinaz.com/jianli/free_2.html

Python爬取素材網站3000多條音訊素材檔案

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

基於Python爬取素材網站音訊檔案

基本環境配置 python 3.6 pycharm requests parsel 相關模組pip安裝即可目標網頁請求網頁 import requests

Python實現JS解密並爬取某音漫客網站

首先開啟網站 https://www.zymk.cn/1/37988.html 開啟開發者工具選擇XHR標籤頁，沒有找到什麼

Python爬取招聘網站資料並做資料視覺化處理

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

用python爬取網站的資料

技術標籤：pythonpython 用python爬取網站的資料匯入庫輸入要爬取的網站訪問設定爬取——整理——縮小爬取範圍定義列表——for迴圈有選擇性輸出列表（遍歷？）結果展示顯示Response 418的解決方法

Python爬取網站文章資料並存到資料庫

2. 資料庫表的準備（MySQL）1）確認要儲存的欄位：本文旨在獲取媽媽網網站文章的資料，因此需要文章標題（title）、文章連結（href）、文章內容（content）和內容圖片（imgs）2）建立資料庫表

自己動手用Python爬取資料：涉及Selenium、Scrapy、高併發處理

如果你仔細觀察，就不難發現，懂爬蟲、學習爬蟲的人越來越多，一方面，網際網路可以獲取的資料越來越多，另一方面，像 Python這樣的程式語言提供越來越多的優秀工具，讓爬蟲變得簡單、容易上手。

使用python爬取財經網站資料介面

網頁network發現介面返回的是json資料，怎樣通過python，通過分頁方式爬取下載到excel裡或者資料庫裡面

Python爬取優質高清桌布網站：彼岸

相關推薦