bs4圖片爬取

阿新 • • 發佈：2021-11-03

一、步驟

1、拿到主頁面的前端原始碼，然後提取子頁面的連結地址

2、通過href拿到子頁面的內容。從子頁面中找到圖片的下載地址

3、下載圖片

二、程式碼


import requests
from bs4 import BeautifulSoup
import os

headers = {

	"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36 Edg/95.0.1020.40"
}

url = "https://umei.cc/bizhitupian/weimeibizhi/"

resp = requests.get(url,headers)
resp.encoding = 'tuf-8'


main_page = BeautifulSoup(resp.text,"html.parser")

alist = main_page.find("div",class_="TypeList").find_all("a")




for i in alist:
	href = i.get('href')
        #獲取子頁面完整url 
	child_href = url + href.split("/")[-1]
	
	
	child_href_resp = requests.get(child_href,headers)	
	child_href_resp.encoding = 'tuf-8'
	child_href_text = child_href_resp.text
	
	child_page = BeautifulSoup(child_href_text,"html.parser")
        # 定點陣圖片地址
	p = child_page.find("p",align="center")
	img = p.find('img')
        # 獲取圖片URL
	src = img.get("src")
	
	img_resp = requests.get(src,headers=headers)
	img_name = src.split("/")[-1]
        # 判斷所在目錄下是否有該檔名的資料夾
	if  not os.path.exists('img'): 
                # 不存在建立
    		os.makedirs('img')
	else:
                # 存在開啟寫入，with open在windows下不存在會直接建立，但是在linux下我沒成功所以加了個判斷
		with open("img/"+img_name,mode="wb") as f:
                        # img_resp.content拿到的是位元組
			f.write(img_resp.content)
resp.close()

bs4圖片爬取

一、步驟 1、拿到主頁面的前端原始碼，然後提取子頁面的連結地址 2、通過href拿到子頁面的內容。從子頁面中找到圖片的下載地址

Python Scrapy圖片爬取原理及程式碼例項

1.在爬蟲檔案中只需要解析提取出圖片地址，然後將地址提交給管道在管道檔案對圖片進行下載和持久化儲存

xpath案例-4K圖片爬取

#!/usr/bin/python #需求：解析下載圖片資料 http://pic.netbian.com/4kmeinv/ import requests from lxml import etree

Python使用xpath實現圖片爬取

高效能非同步爬蟲目的：在爬蟲中使用非同步實現高效能的資料爬取操作非同步爬蟲的方式：

py 爬蟲正則，糗圖圖片爬取

技術標籤：爬蟲python \'\'\' 聚焦爬蟲：爬取頁面中指定的頁面內容 - 指定url -發起請求

python製作微博圖片爬取工具

有小半個月沒有發部落格了，因為一直在研究python的GUI，買了一本書學習了一些基礎，用我所學做了我的第一款GUI——微博圖片爬取工具。本軟體原始碼已經放在了部落格中，另外軟體已經打包好上傳到網盤中以供下載學習

BeautifulSoup圖片爬取

------------恢復內容開始------------ BeautifulSoup介紹：簡單來說，Beautiful Soup 是 python 的一個庫，最主要的功能是從網頁抓取資料。官方解釋如下：

python爬蟲學習（一）requests+bs4爬取圖片

import requests from bs4 import BeautifulSoup import time url = \"http://www.bizhi360.com/meinv/\" resp = requests.get(url)

Resquest、Bs4、多執行緒爬取全站圖片

　　#!/usr/bin/env python 　　# coding=utf-8 　　# author:Charles 　　# datetime:2021/03/23/0004 11:26

Python3直接爬取圖片URL並儲存示例

有時候我們會需要從網路上爬取一些圖片，來滿足我們形形色色直至不可描述的需求。

Python爬蟲爬取煎蛋網圖片程式碼例項

這篇文章主要介紹了Python爬蟲爬取煎蛋網圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python爬取知乎圖片程式碼實現解析

首先，需要獲取任意知乎的問題，只需要你輸入問題的ID，就可以獲取相關的頁面資訊，比如最重要的合計有多少人回答問題。

python協程gevent案例爬取鬥魚圖片過程解析

分析分析網站尋找需要的網址用谷歌瀏覽器摁F12開啟開發者工具，然後開啟鬥魚顏值分類的頁面，如圖：

python 爬取指定網頁中的圖片（python crawls the image in the specified page）

來自《Python專案案例開發從入門到實戰》（清華大學出版社鄭秋生夏敏捷主編）中爬蟲應用——抓取百度圖片

python 爬取指定網頁中的圖片精細版（python crawls the image in the specified page fine version）

來自《Python專案案例開發從入門到實戰》（清華大學出版社鄭秋生夏敏捷主編）中爬蟲應用——抓取百度圖片

python 圖片爬蟲系列三——爬取搜狗圖片庫中的圖片

來自《Python專案案例開發從入門到實戰》（清華大學出版社鄭秋生夏敏捷主編）中爬蟲應用——抓取百度圖片

利用python爬取網頁圖片

\"\"\"利用python爬取網頁圖片\"\"\" import requests import urllib from bs4 import BeautifulSoup import json

python+selenium+bs4爬取百度文庫內文字 && selenium 元素可以定位到，但是無法點選問題 && pycharm多行縮排、左移

先說一下可能用到的一些python知識一、python中使用的是unicode編碼, 而日常文字使用各類編碼如:gbk utf-8 等等所以使用python進行文字讀寫操作時候經常會出現各種錯誤, 一般都是操作時沒有進行轉碼操作.而轉碼則需

scrapy圖片資料爬取

scrapy中已經為我們封裝好了一個專門基於圖片請求和持久化儲存的管道類ImagesPipeline，如果想要基於scrapy實現圖片資料的爬取，則可以直接使用該管道類即可

python根據使用者需求輸入想爬取的內容及頁數爬取圖片方法詳解

本次小編向大家介紹的是根據使用者的需求輸入想爬取的內容及頁數。主要步驟：