驗證碼識別系統以及人工智慧總結神經網路encog影象識別入門

阿新 • • 發佈：2021-09-15

參考資料如下：

影象處理之錯切變換適用於錯切變換小於90度的情況，大於90度最後需要平移

爬山演算法模擬退火演算法 http://www.cnblogs.com/heaad/archive/2010/12/20/1911614.html

影象二值化----otsu（最大類間方差法、大津演算法）http://blog.csdn.net/abcjennifer/article/details/6671288

十三種基於直方圖的影象全域性二值化演算法原理、實現、程式碼及效果（轉）

二值影象膨脹腐蝕演算法的幾種實現方式http://www.tuicool.com/articles/YNB3Mf

實現驗證碼變形 http://www.shangxueba.com/jingyan/103044.html

支援向量機通俗導論（理解SVM的三層境界）

支援向量機上課版(上)http://www.julyedu.com/video/play/?id=38&course=23

計算機圖形學http://www.icourse163.org/course/cau-45006?tid=263003#/info

Qi Qi Web portal - AI course http://qiqi789.github.io/teaching/AI/ 老師的人工智慧課程

Web驗證碼的生成與識別_李穎這篇論文給我很多幫助，這次也讓我學會了如何利用論文，以前都是在百度看博文（並不是最佳的）。

不足之處：該系統比較侷限，只能較好的處理無粘連有扭曲的影象，對粘連驗證碼的處理還需要繼續研究。

svm

LIBSVM入門解讀

Libsvmjava版程式碼註釋及詳解http://blog.sina.com.cn/s/blog_8095e51d010152xf.html

訓練

package svm;

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;

import javax.imageio.ImageIO;

import utility.Tool;

public class InitModelData {    
    public static void main(String[] args) {
         init();
        // check();    

    }

    //訓練資料存放
    static String path = "SVM/train.txt";

    private static void check() {
        String context = Tool.inputFile(path);
        System.out.println(context);
    }

    private static void init() {
        File file = new File("train");
        File[] trainList = file.listFiles();
        String identity;
        String content = "";
        for (int i = 0; i < trainList.length; i++) {
            try {
                if (!trainList[i].isFile()) {
                    continue;
                }
                BufferedImage codeImg = ImageIO.read(trainList[i]);
                identity = trainList[i].getName().split("-")[0];
                content += dataTemplate(identity, codeImg);
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        Tool.outputFile(content, path);
        System.out.print(content);
        initModel();
    }
    
    /**
     * 利用訓練資料模板生成模型資料
     */
    private static void initModel() {
        /*"-v","20" ,"-c","500", */
        String[] arg = {"-v","20" ,//模型引數設定
                "svm/train.txt", //存放SVM訓練模型用的資料的路徑
                "svm/model.txt" }; //存放SVM模型資料
        // 建立一個訓練物件
        svm_train t = new svm_train();
        try {
            t.main(arg);
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } // 呼叫
    }
    /**
     * svm資料模板
     * @param charString
     * @param codeImg
     * @return
     */
    public static String dataTemplate(String charString, BufferedImage codeImg) {
        String content = "";
        content += charString + " ";
        int width = codeImg.getWidth();
        for (int x = 0; x < width; x++) {
            for (int y = 0; y < codeImg.getHeight(); y++) {
                int num = x * width + y;
                content += num + ":";
                int isBlack = Tool.isBlack(codeImg.getRGB(x, y)) ? 1 : 0;
                content += isBlack + " ";
            }
        }
        content += "\n";
        return content;
    }

}

識別

    private static String svmProcess(List<BufferedImage> charImgs) {

        String content = "";
        for (BufferedImage bufferedImage : charImgs) {
            content += InitModelData.dataTemplate("1", bufferedImage);
        }
        System.out.println(content);
        // 輸出測試檔案
        Tool.outputFile(content, "SVM/test.txt");
        return svmMatch();
    }

    private static String svmMatch() {

        String[] parg = { "SVM/test.txt", // 這個是存放測試資料
                "SVM/model.txt", // 呼叫的是訓練以後的模型
                "SVM/result.txt" }; // 生成的結果的檔案的路徑
        svm_predict p = new svm_predict();
        try {
            p.main(parg);
        } catch (IOException e) {
            e.printStackTrace();
        } // 呼叫
        String content = Tool.inputFile("SVM/result.txt");
//        content把小數1.02.0 小數點和小數點後的0消除
        content = content.replaceAll(".\\d", "");
        return content;
    }

2016/4/1更新

利用encog神經網路影象識別驗證碼

encog搜尋過沒有中文資料，只能從官網給的資料學習。

http://files.cnblogs.com/files/linkarl/Encog3Java-User.pdf

學習這本書的關於影象識別部分

chapter 2 obtaining data for encog

chapter 4 constructing neural networks in java

chapter 5 propagation traing

chapter 9 using image data

import java.awt.Image;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;

import javax.imageio.ImageIO;

import org.encog.ml.data.MLData;
import org.encog.ml.data.basic.BasicMLData;
import org.encog.ml.train.strategy.ResetStrategy;
import org.encog.neural.networks.BasicNetwork;
import org.encog.neural.networks.training.propagation.resilient.ResilientPropagation;
import org.encog.persist.EncogDirectoryPersistence;
import org.encog.platformspecific.j2se.TrainingDialog;
import org.encog.platformspecific.j2se.data.image.ImageMLData;
import org.encog.platformspecific.j2se.data.image.ImageMLDataSet;
import org.encog.util.downsample.SimpleIntensityDownsample;
import org.encog.util.simple.EncogUtility;

public class TrainProcess {
    private static ImgList imgList = new ImgList();
    private static ImageMLDataSet trainDataSet;
    private static BasicNetwork network;
    private static int downsampleHeight = 100;
    private static int downsampleWidth = 100;
    // RGB彩色圖片
    // RGBDownsample downsample=new RGBDownsample();
    // 取樣
    private static SimpleIntensityDownsample downsample = new SimpleIntensityDownsample();
    public static final String FILENAME = "encogexample.eg";

    public static void main(String[] args) {
        inputTrain();
        processNetwork();
        networkConfig();
        trainNetwork();
        System.out.println("Saving network");
        EncogDirectoryPersistence.saveObject(new File(FILENAME), network)
    }

    private static void trainNetwork() {
        // 圖形介面
        String mode = "gui";
        // The number of minutes to train for.
        int minutes = 1;
        // the minimum error must achieve
        double strategyError = 0.1;
        // the number of cycles achieve the error rate
        int strategyCycles = 20;
        // Resilient彈性
        final ResilientPropagation train = new ResilientPropagation(network,
                trainDataSet);
        train.addStrategy(new ResetStrategy(strategyError, strategyCycles));
        // strategies
        // Greedy HybridStrategy ResetStrategy
        // SmartLearningRate SmartMomentum
        // StopTrainingStrategy

        // gui介面
        TrainingDialog.trainDialog(network, trainDataSet);

        // 或者 console介面
        // EncogUtility.trainConsole(train, network, training, minutes);
        System.out.println("train end");
    }

    private static void networkConfig() {
        // 第一隱藏層神經元數目
        int hidden1 = 30;
        // 第二隱藏層神經元數目
        int hidden2 = 30;
        // true:use a hyperbolic tangent activation function.
        network = EncogUtility.simpleFeedForward(trainDataSet.getInputSize(),
                hidden1, hidden2, trainDataSet.getIdealSize(), true);
        System.out.println("Created network:" + network.toString());
    }

    /**
     * 用訓練資料設定網路
     */
    private static void processNetwork() {
        trainDataSet = new ImageMLDataSet(downsample, false, 1, 0);
        // processNetwork
        for (final ImagePair pair : imgList) {
            try {
                final MLData idealOutputData = returnIdealOutputData(pair);
                Image img = ImageIO.read(pair.getFile());
                final ImageMLData actualInputdata = new ImageMLData(img);
                // The ideal output should be specified when using supervised
                // 1:actual input data 2：ideal output data.
                trainDataSet.add(actualInputdata, idealOutputData);
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        trainDataSet.downsample(downsampleHeight, downsampleWidth);
    }

    /**
     * 設定該標識對應輸出神經元為1，其餘的為0的理想資料(設定情況) ideal output data.
     * 
     * @param pair
     * @return
     */
    private static MLData returnIdealOutputData(final ImagePair pair) {
        // hold the ideal output for each output neuron
        int outputCount = ImgList.outputCount;
        final MLData ideal = new BasicMLData(outputCount);
        int indexOutputNeuron = pair.getIndexOutputNeuron();
        // corresponds to the identity of the image currently being trained
        // will be set to 1
        for (int i = 0; i < outputCount; i++) {
            if (i == indexOutputNeuron) {
                ideal.setData(i, 1);
            } else {
                ideal.setData(i, -1);
            }
        }
        return ideal;
    }

    /**
     * 輸入訓練資料
     */
    private static void inputTrain() {
        File[] trainList = new File("trainData").listFiles();
        for (File file : trainList) {
            if (!file.isFile()) {
                continue;
            }
            String identity = file.getName().split("-")[0];
            imgList.add(file, identity);
            System.out.println(identity);
        }
        outputImgList();
    }

    /**
     * 序列化imgList物件儲存
     */
    private static void outputImgList() {
                try {
            ObjectOutputStream outputStream = new ObjectOutputStream(
                    new FileOutputStream("imgList.object"));
            outputStream.writeObject(imgList);
            outputStream.flush();
            outputStream.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

import java.io.File;
import java.io.Serializable;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;

public class ImgList extends ArrayList<ImagePair> implements Serializable {
    public final Map<String, Integer> identity2neuron = new HashMap<String, Integer>();
    public final Map<Integer, String> neuron2identity = new HashMap<Integer, String>();
    public static int outputCount = 0;

    public void add(File file, String identity) {
        int indexOutputNeuron = assignIdentity(identity);
        this.add(new ImagePair(file, indexOutputNeuron));
    }

    private int assignIdentity(final String identity) {
        String lowerCase = identity.toLowerCase();
        if (identity2neuron.containsKey(lowerCase)) {
            return identity2neuron.get(lowerCase);
        }
        final int result = outputCount++;
        identity2neuron.put(lowerCase, result);
        neuron2identity.put(result, lowerCase);
        return result;
    }
}

import java.io.File;
import java.io.Serializable;

/**
 * links the image to its output neuron index number.
 * 
 * @author Administrator
 *
 */
public class ImagePair implements Serializable {
    private final File file;
    private final int indexOutputNeuron;

    public ImagePair(File file, int indexOutputNeuron) {
        super();
        this.file = file;
        this.indexOutputNeuron = indexOutputNeuron;
    }

    public File getFile() {
        return file;
    }

    public int getIndexOutputNeuron() {
        return indexOutputNeuron;
    }

}

import java.awt.Image;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.ObjectInputStream;

import javax.imageio.ImageIO;

import org.encog.neural.networks.BasicNetwork;
import org.encog.persist.EncogDirectoryPersistence;
import org.encog.platformspecific.j2se.data.image.ImageMLData;
import org.encog.util.downsample.SimpleIntensityDownsample;

public class RecognizeProcess {
    public static final String FILENAME = "encogexample.eg";
    private static int downsampleHeight = 20;
    private static int downsampleWidth = 20;
    private static SimpleIntensityDownsample downsample = new SimpleIntensityDownsample();

    public static void main(String[] args) {
        ImgList imgList = inputImgList();
        BasicNetwork network = (BasicNetwork) EncogDirectoryPersistence
                .loadObject(new File(FILENAME));
        File[] files = new File("recognise").listFiles();
        int num = 0;
        for (File file : files) {
            if (!file.isFile()) {
                continue;
            }
            try {
                Image img = ImageIO.read(file);
                ImageMLData input = new ImageMLData(img);
                input.downsample(downsample, false, downsampleHeight,
                        downsampleWidth, 1, -1);
                final int winner = network.winner(input);
                String name = file.getName().split("[\\.-]")[2];
                String result = imgList.neuron2identity.get(winner);
                System.out.println(name + "   " + result);
                if (name.equals(result)) {
                    num++;
                }

            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        System.out.println(num);
    }

    /**
     * 反序列化imgList物件
     * 
     * @return
     */
    private static ImgList inputImgList() {
        ImgList imgList = null;
        try {
            ObjectInputStream inputStream = new ObjectInputStream(
                    new FileInputStream("imgList.object"));
            imgList = (ImgList) inputStream.readObject();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (ClassNotFoundException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return imgList;
    }
}

驗證碼識別系統以及人工智慧總結神經網路encog影象識別入門

參考資料如下：影象處理之錯切變換適用於錯切變換小於90度的情況，大於90度最後需要平移

驗證碼的工具以及驗證碼的簡單應用和小tips

以前跟著寫的一段獲取驗證碼的servlet,當時覺得還挺麻煩的要自己畫,最近找到了一個封裝好的工具類記錄一下

【裂縫識別】基於matlab GUI BP神經網路路面裂縫識別系統【含Matlab原始碼 1063期】

一、簡介高速公路路面病害養護和管理的重要部分就是路面裂縫的檢測。近年來,路面裂縫自動檢測技術已得到了廣泛應用,而由於路面裂縫影象的複雜性,檢測演算法直接影響著檢測結果的精確度。因此,本文將重點放在路面裂縫

Response_驗證碼_分析以及程式碼實現

Response_驗證碼_分析以及程式碼實現本質：圖片目的：防止惡意表單註冊步驟：

人工智慧-人工神經網路（2）

啟用功能在神經元完成輸入和權重之間的點積運算後，它還會對該結果施加非線性。該非線性函式稱為啟用函式。過去，啟用功能的流行選擇是S型和tanh。最近發現，由於稱為消失梯度的問題，ReLU層對深度神經網

人工智慧-人工神經網路（1）

神經網路是從大腦中獲得靈感的模型系列，用於近似依賴於大量輸入的函式，是一個非常好的模式識別模型。

【樹葉分類】基於matlab GUI BP神經網路植物葉片識別分類【含Matlab原始碼 916期】

一、簡介 1 概述 BP（Back Propagation）神經網路是1986年由Rumelhart和McCelland為首的科研小組提出，參見他們發表在Nature上的論文 Learning representations by back-propagating errors 。

【交通標誌識別】基於matlab GUI BP神經網路交通標誌識別【含Matlab原始碼 718期】

【情感識別】基於matlab PNN概率神經網路語音情感識別【含Matlab原始碼 544期】

一、簡介 1 概述 1.1 模式分類的貝葉斯決策理論 2 概率神經網路的網路結構（PNN）

【手寫數字識別】基於卷積神經網路CNN實現手寫數字識別分類matlab原始碼

一、CNN卷積神經網路我們知道神經網路的結構是這樣的：那捲積神經網路跟它是什麼關係呢？

手寫三層神經網路完成手寫體識別任務

import numpy as np import numpy.random import scipy.special class NeuralNetwork: # initialise the neural network

人工智慧-BP神經網路-1

1 import math 2 import numpy as np 3 import pandas as pd 4 from pandas import DataFrame,Series 5 6 y =[0.14 ,0.64 ,0.28 ,0.33 ,0.12 ,0.03 ,0.02 ,0.11 ,0.08 ]

利用面部識別演算法和卷積神經網路的轉移學習，分析朝鮮海報上的人物性別分佈

眾所周知，朝鮮是一個具有神祕色彩的國家。除了在電視或者網路上看到一些政治方面的新聞外，我們很難從網路上了解到朝鮮人民的日常生活狀態。但是，科技是萬能的。本文將利用面部識別演算法和應用於卷積神經網路的轉

如何使用卷積神經網路進行影象處理？

人工智慧(Artificial Intelligence，AI)是將人類思維嵌入計算機的一個領域。換句話說，就是建立模仿生物大腦功能的人工大腦。現在，人們需要將使用智慧可做的所有事情轉移到機器中。第一代 AI 專注於人類可

用卷積神經網路進行影象分類為何卷積神經網路優於傳統卷積神經網路

In the last decade, with the discovery of deep learning, the field of image classification has experienced a renaissance. Traditional machine learning methods have been replaced by newer