Java-基於URL流的網頁圖片爬蟲

阿新 • • 發佈：2019-01-03

技巧

在網頁元素中以img開頭的表示圖片的元素，src=“內容"字串裡的內容就是圖片的資源地址
如：
它右鍵審查元素可以看到img data-v-0d738edb=”" src=“https://avatar.csdn.net/9/9/A/1_preyhard.jpg?1543834708” alt="" class=“head”

步驟

1.建立URL流獲取整個網頁的資訊
2.從資訊中篩選出圖片的資源地址，再分別建立URL流獲取圖片資料存到新的圖片檔案中

程式碼

package westos2;

import java.io.*;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import java.util.Random;

public class client {
    public static void main(String[] args) throws IOException {
        Random random = new Random ( );
        HttpURLConnection connection = (HttpURLConnection)
                new URL ("https://tieba.baidu.com/p/2256306796?red_tag=1781367364").openConnection();
        InputStream in = connection.getInputStream();
        BufferedReader buffer = new BufferedReader ( new InputStreamReader ( in ) );
        while (true){
            String s = buffer.readLine ( );
            if (s==null){
                break;
            }else {
                if (s.contains ( "<img" )){
                    show(s,random);
                }
            }
        }
    }

    private static void show(String s,Random random) throws IOException {
        int imgindex = s.indexOf ( "<img" );
        String s1 = s.substring ( imgindex );
        int srcindex = s1.indexOf ( "src=" );
        String s2 = s1.substring ( srcindex+5);
        int yinindex = s2.indexOf ( "\"" );
        String s3 = s2.substring ( 0, yinindex );
        System.out.println (s3 );
        if (s3.startsWith ( "http" )){
            HttpURLConnection url = (HttpURLConnection)new URL ( s3 ).openConnection ( );
            InputStream in = url.getInputStream ( );
            String i = random.nextInt ( )+"";
            FileOutputStream out = new FileOutputStream ( "C:\\Users\\Administrator\\Desktop\\jpg\\" + i + ".png" );

            while (true){
                byte[] bytes = new byte[1024 * 8];
                int read = in.read ( bytes );
                if (read==-1){
                    break;
                }
                out.write ( bytes,0,read );
            }
        }
        String str = s2.substring ( yinindex );
        if (str.contains ( "<img" )){
            show ( str,random );
        }
    }
}

結果

在這裡插入圖片描述

Java-基於URL流的網頁圖片爬蟲

技巧在網頁元素中以img開頭的表示圖片的元素，src=“內容"字串裡的內容就是圖片的資源地址如：它右鍵審查元素可以看到img data-v-0d738edb=”" src=“https://avatar.csdn.net/9/9/A/1_preyhard.jpg?154383470

Java基於httpclient獲取網頁資料，實現簡單網路爬蟲

1、pom檔案引入httpclient依賴 <dependency> <groupId>org.apache.httpcompon

基於nodejs的網路圖片爬蟲

這是我研究nodejs爬蟲後寫的一個圖片爬蟲小例子。不過功能還是挺強大的可以將你喜歡的圖片下載下來。主要的爬蟲程式碼： //var http = require('https'); var http = require('http'); var fs =

java根據url路徑下載圖片到本地

直接這個類就可以實現！ package paas_cicd.cn.finedo.paas.util; import java.io.File; import java.io.FileOutputSt

java根據url生成網頁截圖，縮圖

public class ShotsPic extends JPanel { private static final long serialVersionUID = 1L; // 行分隔符 final static public String LS = Syste

java基於jsoup實現簡單的圖片爬蟲並下載

2018年11月04日 17:20:32 小小申閱讀數：4 標籤： jsoup java

[Java爬蟲] 使用 Jsoup + HttpClient 爬取網頁圖片

一、前言把一篇圖文並茂的優秀文章全部爬取下來，就少不了 Java 爬蟲裡邊的圖片爬取技術了。很多人都用來爬取美女圖片，但是筆者覺得這有傷大雅。下面筆者使用它來爬取 CSDN 【今日推薦】文章附帶的圖片二、程式碼、依賴筆者對本程式碼經過多次

java讀取網頁圖片路徑並下載到本地

mage -h form read file cti 連接公司 date() java讀取網頁圖片路徑並下載到本地最近公司需要爬取一些網頁上的數據，自己就簡單的寫了一個demo,其中有一些數據是圖片，需要下載下來到本地並且將圖片的路徑保存到數據庫，示例代碼如下: pa

一個鹹魚的Python爬蟲之路（三）：爬取網頁圖片

you os.path odin 路徑生成存在 parent lose exist 學完Requests庫與Beautifulsoup庫我們今天來實戰一波，爬取網頁圖片。依照現在所學只能爬取圖片在html頁面的而不能爬取由JavaScript生成的圖。所以我找了這個網站

java sql編輯器動態報表數據庫備份還原 quartz定時任務調度自定義表單 java圖片爬蟲

springmvcmybatis整合 bootstrap 框架源碼 spring html5 官網 http://www.fhadmin.org/A代碼編輯器，在線模版編輯，仿開發工具編輯器，pdf在線預覽，文件轉換編碼B 集成代碼生成器 [正反雙向](單表、主表、明細表、樹形表，快速開

java sql 編輯器數據庫備份還原 quartz 定時任務調度自定義表單 java 圖片爬蟲集成代碼生成器

分離文件大小發送郵件進度條服務器配置 mysql http 備份數據庫生成報表 A代碼編輯器，在線模版編輯，仿開發工具編輯器，pdf在線預覽，文件轉換編碼B 集成代碼生成器 [正反雙向](單表、主表、明細表、樹形表，快速開發利器)+快速表單構建器 freemake

【轉載】【JAVA秒會技術之圖片上傳】基於Nginx及FastDFS，完成圖片的上傳及展示

相互沒有 con 性能 ext 存儲服務器網絡管理代理配置基於Nginx及FastDFS，完成商品圖片的上傳及展示一、傳統圖片存儲及展示方式存在問題： 1）大並發量上傳訪問圖片時，需要對web應用做負載均衡，但是會存在圖片共享問題 2）web應

java後臺框架 springmvc整合mybatis框架源碼 java圖片爬蟲 bootstra

java 官網 http://www.fhadmin.org/A代碼編輯器，在線模版編輯，仿開發工具編輯器，pdf在線預覽，文件轉換編碼B 集成代碼生成器 [正反雙向](單表、主表、明細表、樹形表，快速開發利器)+快速表單構建器freemaker模版技術，0個代碼不用寫，生成完整的一個模塊，帶頁面、建表sq

java後臺框架 springmvc整合mybatis框架源碼 java圖片爬蟲 bootstrap

支持 java圖片 pie ext eem 異步操作分配自動擴展 A代碼編輯器，在線模版編輯，仿開發工具編輯器，pdf在線預覽，文件轉換編碼B 集成代碼生成器 [正反雙向](單表、主表、明細表、樹形表，快速開發利器)+快速表單構建器freemaker模版技術，0個代

Aspose.words Java基於模板生成word之循環圖片

apt oid write posit lis 圖片路徑位置 pri for 1.新建一個word文檔 2.給插入圖片的地方設置書簽 3,設置書簽二,項目 1,2步的引入依賴以及加載授權文件同上一篇 3,獲取圖片路徑插入到word中並生成新的word文檔新

基於URL的高層次Java網絡編程

內部 exc sof shtml connect buffer throw 從服務器 game 一致資源定位器URL URL(Uniform Resource Locator)是一致資源定位器的簡稱，它表示Internet上某一資源的地址。通過URL我們可以訪問I

爬蟲簡易入門程式碼-爬取簡單網頁圖片

# -*- coding: utf-8 -*- """ Created on Mon Jul 9 22:12:07 2018 @author: name """ #!/usr/bin/env Python3 # -*- encodin

無搜尋條件根據url獲取網頁資料(java爬取網頁資料)

jsoup jar包 <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.11.3<

【我要程式設計】Java技術手冊之根據圖片連結把圖片轉化為io流，並輸出到頁面上的方法

適用場景：A程式只能內網訪問，B程式可以外網訪問，只有B程式可以訪問A程式，使用者需要通過B程式訪問A程式的圖片資源。這是可以使用該方法。 @RequestMapping("/getImageByPath") public void getImageByTomcat(St

JAVA 資料庫讀取blob（圖片）合成多張圖基於Struts2和Spring

今天工作要求把存在資料庫的圖片（blob）讀取出來，之前沒有做過所以找了不少資源，在這裡記錄一下。因為用的是jdbcTemplate，在這裡一起貼出來，以防忘了。因為資料庫查出來的圖片是多張圖，在這裡返回List，到前臺再轉成byte[]。有些方法是在查詢時直接轉成byte[

Java-基於URL流的網頁圖片爬蟲

技巧

步驟

程式碼

結果

相關推薦