用Python爬取日向、櫻阪成員blog中的JPG檔案的url並將其下載到本地

阿新 • • 發佈：2020-11-23

前言

目前可以使用這段程式碼爬取日向阪46（hinatazaka46.com）、櫻阪46(keyakizaka46.com)的成員blog圖

目前對爬蟲以及正則表示式還是不是很熟悉，姑且只能做到這個程度，會在接下來的幾天加強自己對這方面的理解，然後會做下載紫團blog的程式碼
注意
程式碼中最開始的“初始設定”部分是需要使用者自定義的，比如：設定爬取的成員的名字（如katoshi、kosaka等等），還需要設定url，這需要使用者進入藍團官網或者白團官網的成員blog介面複製上方的網址並貼在url = 後面，
（PS：由於同一個成員的blog是可以翻頁的，所以需要不同的頁的url來獲取對應頁的圖片，此時注意不僅要改url名還要改name，可以改成如kosaka和kosaka_2_）

效果圖

這是我下載了幾個成員之後的狀態

這就是我上面說的用kosaka_2_命名name的效果

程式碼如下

import os,sys,time,json,time
import socket,random,hashlib
from concurrent.futures.process import ProcessPoolExecutor
import requests,configparser
import json,re

#初始設定
name = "katoshi" #想要將圖片取的名字
os.makedirs('./Picture/'+name, exist_ok=True)
#在目錄下建立一個資料夾用於儲存圖片，這裡以Picture為例子 

url = "https://www.hinatazaka46.com/s/official/diary/member/list?ima=0000&ct=5"# 加藤史
#url = "https://www.keyakizaka46.com/s/k46o/diary/member/list?ima=0000&ct=43"
#設定想要爬取的網站網址


path=os.getcwd()+'\\Picture\\'+name+"\\"
def getpicurl():
    jpglist =[]
    #設定url地址為想要爬取的圖片
    html = requests.get(url).text
    pic_url = 
 re.findall('img src="(.*?)"', html, re.S)
    count = 0
    print(len(pic_url))
    for key in pic_url:
        if("jpg" in key):
            jpglist.append(key)
            count=count+1
    print("全部張數為："+str(count)+"開始下載嘍")
    return jpglist
    #清洗只留下jpg檔案url


def download(pic_url):
    num=1
    for i in pic_url:
        print(i)
        r = requests.request('get', i)  # 獲取網頁

        with open(path + name + str(num) + '.jpg', 'wb') as f:  # 開啟寫入到path路徑裡-二進位制檔案，返回的控制代碼名為f
            f.write(r.content)  # 往f裡寫入r物件的二進位制檔案
        f.close()

        print("下載第"+str(num)+"張圖片成功！當前進度："+str(num)+"/"+str(len(pic_url)))
        num = num+1
#main
pic_url = getpicurl()
download(pic_url)
print(type(pic_url))
print("下載完畢嘍，祝您開心")

用Python爬取日向、櫻阪成員blog中的JPG檔案的url並將其下載到本地

前言

效果圖

用Python爬取日向、櫻阪成員blog中的JPG檔案的url並將其下載到本地

自己動手用Python爬取資料：涉及Selenium、Scrapy、高併發處理

用Python爬取7大視訊平臺的彈幕、評論，看這一篇就夠了

用 Python 爬取網易嚴選妹子內衣資訊，探究妹紙們的偏好

用python爬取歷史天氣資料的方法示例

用Python爬取28010條《隱祕的角落》評論，有沒發現點什麼？

steam夏日促銷悄然開始，用Python爬取排行榜上的遊戲打折資訊

用Python爬取LOL所有的英雄資訊以及英雄面板的示例程式碼

用Python 爬取貓眼電影資料分析《無名之輩》

Python爬取豆瓣電影、演員評分，平做出視覺化圖（律師函警告）

用 Python 爬取 QQ 空間說說和相簿

用Python爬取某蔬菜網的行情，分析底哪個地區的蔬菜便宜

實戰｜手把手教你用Python爬取儲存資料，還能自動在Excel中視覺化！

小夥子不講武德，竟用Python爬取了B站上1.4萬條馬老師視訊資料來分析

用Python爬取英雄聯盟（lol）全部面板

教你用python爬取抖音app視訊

用 Python 爬取音樂全部歌曲，土豪充綠鑽和刷永久綠鑽的除外

用Python爬取了三大相親軟體評論區，結果...

這年代誰還開VIP電影啊，教你用Python爬取最愛的電影並下載到本地

一篇文章教會你用Python爬取淘寶評論資料（寫在記事本）

用Python爬取日向、櫻阪成員blog中的JPG檔案的url並將其下載到本地

相關推薦