機器學習02之BP神經網路圖解及JAVA實現

阿新 • • 發佈：2019-02-07

package com.fei.bp02;
public class Bp {

    private double[] hide1_x;//// 輸入層即第一層隱含層的輸入；hide1_x[資料的特徵數目+1]， hide1_x[0]為1
    private double[][] hide1_w;// 隱含層權值，hide1_w[本層的節點的數目][資料的特徵數目+1];hide_w[0][0]為偏置量
    private double[] hide1_errors;// 隱含層的誤差,hide1_errors[節點個數]

    private double[] out_x;// 輸出層的輸入值即第二次層隱含層的輸出 out_x[上一層的節點數目+1]， out_x[0]為1
    private double[][] out_w;// 輸出層的權值 hide1_w[節點的數目][上一層的節點數目+1]//
                                // out_w[0][0]為偏置量
    private double[] out_errors;// 輸出層的誤差 hide1_errors[節點個數]

    private double[] target;// 目標值，target[輸出層的節點個數]

    private double rate;// 學習速率

    public Bp(int input_node, int hide1_node, int out_node, double rate) {
        super();

        // 輸入層即第一層隱含層的輸入
        hide1_x = new double[input_node + 1];

        // 第一層隱含層
        hide1_w = new double[hide1_node][input_node + 1];
        hide1_errors = new double[hide1_node];

        // 輸出層
        out_x = new double[hide1_node + 1];
        out_w = new double[out_node][hide1_node + 1];
        out_errors = new double[out_node];

        target = new double[out_node];

        // 學習速率
        this.rate = rate;
        init_weight();// 1.初始化網路的權值
    }

    /**
     * 初始化權值
     */
    public void init_weight() {

        set_weight(hide1_w);
        set_weight(out_w);
    }

    /**
     * 初始化權值
     * 
     * @param w
     */
    private void set_weight(double[][] w) {
        for (int i = 0, len = w.length; i != len; i++)
            for (int j = 0, len2 = w[i].length; j != len2; j++) {
                w[i][j] = 0;
            }
    }

    /**
     * 獲取原始資料
     * 
     * @param Data
     *            原始資料矩陣
     */
    private void setHide1_x(double[] Data) {
        if (Data.length != hide1_x.length - 1) {
            throw new IllegalArgumentException("資料大小與輸出層節點不匹配");
        }
        System.arraycopy(Data, 0, hide1_x, 1, Data.length);
        hide1_x[0] = 1.0;
    }

    /**
     * @param target
     *            the target to set
     */
    private void setTarget(double[] target) {
        this.target = target;
    }

    /**
     * 2.訓練資料集
     * 
     * @param TrainData
     *            訓練資料
     * @param target
     *            目標
     */
    public void train(double[] TrainData, double[] target) {
        // 2.1匯入訓練資料集和目標值
        setHide1_x(TrainData);
        setTarget(target);

        // 2.2：向前傳播得到輸出值；
        double[] output = new double[out_w.length + 1];
        forword(hide1_x, output);

        // 2.3、方向傳播：
        backpropagation(output);

    }

    /**
     * 反向傳播過程
     * 
     * @param output
     *            預測結果
     */
    public void backpropagation(double[] output) {

        // 2.3.1、獲取輸出層的誤差；
        get_out_error(output, target, out_errors);
        // 2.3.2、獲取隱含層的誤差；
        get_hide_error(out_errors, out_w, out_x, hide1_errors);
        //// 2.3.3、更新隱含層的權值；
        update_weight(hide1_errors, hide1_w, hide1_x);
        // * 2.3.4、更新輸出層的權值；
        update_weight(out_errors, out_w, out_x);
    }

    /**
     * 預測
     * 
     * @param data
     *            預測資料
     * @param output
     *            輸出值
     */
    public void predict(double[] data, double[] output) {

        double[] out_y = new double[out_w.length + 1];
        setHide1_x(data);
        forword(hide1_x, out_y);
        System.arraycopy(out_y, 1, output, 0, output.length);

    }

    
    public void update_weight(double[] err, double[][] w, double[] x) {

        double newweight = 0.0;
        for (int i = 0; i < w.length; i++) {
            for (int j = 0; j < w[i].length; j++) {
                newweight = rate * err[i] * x[j];
                w[i][j] = w[i][j] + newweight;
            }

        }
    }

    /**
     * 獲取輸出層的誤差
     * 
     * @param output
     *            預測輸出值
     * @param target
     *            目標值
     * @param out_error
     *            輸出層的誤差
     */
    public void get_out_error(double[] output, double[] target, double[] out_error) {
        for (int i = 0; i < target.length; i++) {
            out_error[i] = (target[i] - output[i + 1]) * output[i + 1] * (1d - output[i + 1]);
        }

    }

    /**
     * 獲取隱含層的誤差
     * 
     * @param NeLaErr
     *            下一層的誤差
     * @param Nextw
     *            下一層的權值
     * @param output 下一層的輸入
     * @param error
     *            本層誤差陣列
     */
    public void get_hide_error(double[] NeLaErr, double[][] Nextw, double[] output, double[] error) {

        for (int k = 0; k < error.length; k++) {
            double sum = 0;
            for (int j = 0; j < Nextw.length; j++) {
                sum += Nextw[j][k + 1] * NeLaErr[j];
            }
            error[k] = sum * output[k + 1] * (1d - output[k + 1]);
        }
    }

    /**
     * 向前傳播
     * 
     * @param x
     *            輸入值
     * @param output
     *            輸出值
     */
    public void forword(double[] x, double[] output) {

        // 2.2.1、獲取隱含層的輸出
        get_net_out(x, hide1_w, out_x);
        // 2.2.2、獲取輸出層的輸出
        get_net_out(out_x, out_w, output);

    }

    /**
     * 獲取單個節點的輸出
     * 
     * @param x
     *            輸入矩陣
     * @param w
     *            權值
     * @return 輸出值
     */
    private double get_node_put(double[] x, double[] w) {
        double z = 0d;

        for (int i = 0; i < x.length; i++) {
            z += x[i] * w[i];
        }
        // 2.激勵函式
        return 1d / (1d + Math.exp(-z));
    }

    /**
     * 獲取網路層的輸出
     * 
     * @param x
     *            輸入矩陣
     * @param w
     *            權值矩陣
     * @param net_out
     *            接收網路層的輸出陣列
     */
    private void get_net_out(double[] x, double[][] w, double[] net_out) {

        net_out[0] = 1d;
        for (int i = 0; i < w.length; i++) {
            net_out[i + 1] = get_node_put(x, w[i]);
        }

    }

}

（二） BP神經網路的測試

用上面實現的BP神經網路來訓練模型，自動判斷它是正數還是複數，奇數還是偶數.

package com.fei.bp02;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;

public class Test {

    /**
     * @param args
     * @throws IOException
     */
    public static void main(String[] args) throws IOException {
        
    
        Bp bp = new Bp(32, 15, 4, 0.05);

        Random random = new Random();
        
        List<Integer> list = new ArrayList<Integer>();
        for (int i = 0; i < 6000; i++) {
            int value = random.nextInt(1000);//1000內的隨機數
            list.add(value);
            list.add(0-value);
        }

        
        for (int i = 0; i !=25; i++) {
            for (int value : list) {
                double[] real = new double[4];
                if (value >= 0)
                    if ((value & 1) == 1)
                        real[0] = 1;
                    else
                        real[1] = 1;
                else if ((value & 1) == 1)
                    real[2] = 1;
                else
                    real[3] = 1;
                
                double[] binary = new double[32];
                int index = 31;
                do {
                    binary[index--] = (value & 1);
                    value >>>= 1;
                } while (value != 0);

                bp.train(binary, real);
               
                

            }
        }
        

        
        
        System.out.println("訓練完畢，下面請輸入一個任意數字(-1000--1000)，神經網路將自動判斷它是正數還是複數，奇數還是偶數。");

        while (true) {
            
            byte[] input = new byte[10];
            System.in.read(input);
            Integer value = Integer.parseInt(new String(input).trim());
            int rawVal = value;
            double[] binary = new double[32];
            int index = 31;
            do {
                binary[index--] = (value & 1);
                value >>>= 1;
            } while (value != 0);

            double[] result =new double[4];
             bp.predict(binary,result);

             
            double max = -Integer.MIN_VALUE;
            int idx = -1;

            for (int i = 0; i != result.length; i++) {
                if (result[i] > max) {
                    max = result[i];
                    idx = i;
                }
            }

            switch (idx) {
            case 0:
                System.out.format("%d是一個正奇數\n", rawVal);
                break;
            case 1:
                System.out.format("%d是一個正偶數\n", rawVal);
                break;
            case 2:
                System.out.format("%d是一個負奇數\n", rawVal);
                break;
            case 3:
                System.out.format("%d是一個負偶數\n", rawVal);
                break;
            }
        }
    }
}

機器學習02之BP神經網路圖解及JAVA實現

package com.fei.bp02; public class Bp { private double[] hide1_x;//// 輸入層即第一層隱含層的輸入；hide1_x[資料的特徵數目+1]， hide1_x[0]為1 private

深入淺出|深度學習演算法之BP神經網路詳細公式推導

所謂神經網路，目前用得最廣泛的一個定義是“的神經網路是由具有適應性簡單單元組成的廣泛並行互連的網路，它的組織能夠模擬生物神經系統對真實世界物體所做出的互動反應”。 BP(back propagation)神經網絡一種按照誤差逆向傳播演算法訓練的多層前饋神經網路，是目前應用

機器學習之BP神經網路演算法實現影象分類

BP 演算法是一個迭代演算法，它的基本思想為：(1) 先計算每一層的狀態和啟用值，直到最後一層（即訊號是前向傳播的）；(2) 計算每一層的誤差，誤差的計算過程是從最後一層向前推進的（這就是反向傳播演算法名字的由來）；(3) 更新引數（目標是誤差變小），迭代前面兩

簡單易學的機器學習演算法——神經網路之BP神經網路

%% BP的主函式 % 清空 clear all; clc; % 匯入資料 load data; %從1到2000間隨機排序 k=rand(1,2000); [m,n]=sort(k); %輸入輸出資料 input=data(:,2:25); output1 =data(:,1); %把輸出從1維變

機器學習之BP神經網路以及 tensorflow 實現

BP （Back Propagation）神經網路簡介：先介紹一下神經元，在生物神經網路中，每個神經元與其它神經元相連，當一個神經元“興奮”時，就會通過穿出神經向其它神經元傳送化學物質，其它神經元會通過穿人神經接受資訊然後再傳遞至神經中樞處理資訊。現在機器

機器學習4---淺談神經網路

1. 神經元模型神經網路是一個多學科交叉的領域，比較常見的定義是：“”神經網路是由具有適應性的簡單單元組成的廣泛並行互連的網路，它的組織能模擬生物神經系統對真實世界物體做出的互動反應“”。神經網路中最基本的成分是神經元模型，典型的為m-p神經元模型，從生物

Andrew Ng 機器學習筆記 09 ：神經網路

非線性假設神經網路邏輯單元激勵函式輸入層，輸出層，隱藏層前向傳播(forward propagation)的向量化實現 AND、OR、NOT、XNOR的實

【機器學習筆記20】神經網路（鏈式求導和反向傳播)

【參考文獻】【1】《面向機器智慧的TensorFlow實踐》4.7 假設存在網路結果如下各個層輸出定義 L1=sigmoid(w1⋅x)L_1 = sigmoid(w_1 \cdot x)L1=sigmoid(w1⋅x) L2=sigmoid(w2⋅L

【機器學習筆記21】神經網路（多層感知機)

【參考資料】【1】《深度學習》花書 6.1 亦或問題由於單層感知機相當於在一個空間增加了一個超平面進行分類，那麼對於像亦或問題這樣的情況則無法完成。因此在多層感知機中增加了一個隱藏層，即一個啟用函式。現代神經網路最常用的啟用函式是整流線性單元，ReL

【機器學習筆記19】神經網路（單層感知機）

【參考資料】【1】《人工神經網路教程》【2】《matlab 2015b 神經網路技術》基本概念單層感知器可以看成一個線性累加器和一個二值化閾值元器件，通常會在累加一個偏移量。由公式表達為:oj=sgn(∑i=1nwijxi+b)o_j= sgn(\s

【機器學習筆記22】神經網路(卷積神經網路)

【參考資料】【1】《面向機器智慧的tensorflow實踐》【2】Keras/example – mnist_cnn.py 【3】Keras中文文件常用層卷積層卷積理解就是之前影象處理裡用作檢測邊緣、檢測角點的運算元，例如: 輸入: [1234] \

【機器學習筆記23】神經網路（RNN)

基礎迴圈神經網路迴圈神經網路（RNN）是一個由神經元和權值構成的有向圖，它的當前狀態與前一時刻的狀態和當前輸入決定，因此當前狀態也被稱為工作記憶。迴圈神經網路在時間序列上展開後如上圖所示，用於解決序列化的問題，諸如語音識別、語音合成、文字生成。例子:利

【機器學習筆記24】神經網路(LSTM)

梯度消失原因 TBD 模型定義 LSTM 長短期記憶網路是一種特殊的RNN，為解決梯度爆炸和梯度消失的問題，LSTM將RNN中普通的神經元替換成了擁有少量記憶的LSTM單元。第一步: 決定丟棄資訊第二步: 確定更新資訊第三步: 更新狀態第四

python的神經網路實現之BP神經網路

在這裡插入程式碼片# -*- coding: utf-8 -*- """ Created on Sun Oct 14 10:41:33 2018 @author: fang """ # -*- coding:utf-8 -*- #! python2 impo

機器學習和PHP的神經網路 PHP-ML庫

根據維基百科，機器學習（英語機器學習） - 一個廣泛的子人工智慧，使用數理統計部分，數值優化方法，概率論，離散分析，並從資料中提取知識的數學學科。這句話，正是因為“神經網路”，已經2年了，專家是怎麼說的多樣化，是這些東西的未來。據認為，人工智慧所有這些表現需要使用特殊的語言，如，R或連的Py

機器學習和PHP的神經網路 PHP ML庫

根據維基百科，機器學習（英語機器學習） - 一個廣泛的子人工智慧，使用數理統計部分，數值優化方法，概率論，離散分析，並從資料中提取知識的數學學科。這句話，正是因為“神經網路”，已經2年了，專家是怎麼說的多樣化，是這些東西的未來。據認為，人工智慧所有這些表現需要使用特殊的語言，如

機器學習：如何理解神經網路可以用來解決複雜的非線性函式

我們知道神經網路裡面有很多的層，每一層又有很多的神經元。看起來就非常複雜，似乎輸入與輸出都很凌亂，對它的理解也很難。那麼我們可以從單個神經元入手，考慮單個神經元的輸入與輸出之間的關係，再擴充套件到整個神經網路。從圖中可以得到： hθ(x)=g(−30+

機器學習-第五章神經網路讀書筆記（周志華）

前言博主第一次接觸機器學習，內容可能有許多原文復現，但是我儘量用自己的話來講，覺得寫得還行的話點個喜歡，謝謝！讀書筆記第一目的是為了總結，第二是順便在部落格上記錄我的學習歷程，同時也希望讀者能有一點點收穫吧~如果不對的地方，還請多多指教！正文周志華的機器學習第五章講的是關於神

機器學習和PHP的神經網路：PHP-ML庫

根據維基百科，機器學習（英語機器學習） - 一個廣泛的子人工智慧，使用數理統計部分，數值優化方法，概率論，離散分析，並從資料中提取知識的數學學科。這句話，正是因為“神經網路”，已經2年了，專家是怎麼說的多樣化，是這些東西的未來。據認為，人工智慧所有這些表現需要使用特殊的

基於Tensorflow的機器學習(6) -- 卷積神經網路

本篇部落格將基於tensorflow的estimator以及MNIST實現LeNet。具體實現步驟如下：匯入必要內容 from __future__ import division, print_function, absolute_import #

機器學習02之BP神經網路圖解及JAVA實現

相關推薦