資料探勘學習------------------4-分類方法-4-神經網路（ANN）

阿新 • • 發佈：2019-01-23

4.4神經網路

它是一種應用類似於大腦神經突觸聯接的結構進行資訊處理的數學模型。

神經網路通常需要訓練，訓練的過程就是網路進行學習的過程。訓練改變了網路節點的連線權的值使其具有分類的功能，經過訓練的網路就可用於物件的識別。

1、感知器

由圖可知：①幾個輸入結點，用來表示輸入屬性；②一個輸出點，用來提供模型輸出。

③在感知器中，每個輸入結點都需要經過一個加權wi的連線到輸出結點。模擬神經元間神經鍵連線強度。

④像生物神經系統一樣，訓練一個感知器模型相當於不斷調整鏈的權值，直到能模擬訓練資料的輸入、輸出關係為止。

⑤感知器對於輸入加權求和，在減去偏置因子t，然後考察結果的符號，得到輸出值Y。

例如：3個輸入點，每個輸入點權值都是0.3，偏置因子t = 0.4。

y = { 1，（0.3x1 + 0.3x2 + 0.3x3 - 0.4） > 0

{-1，（0.3x1 + 0.3x2 + 0.3x3 - 0.4） < 0

因此，感知器模型輸出可以用如下數學方程式表示：

Y = sign（w1x1 + w2x2 +...+wnxn - t）

其中，wi：輸入鏈的權值，xi：輸入屬性值，sign：符號函式作為輸出神經元的啟用函式，t：偏置因子。

因此可以更加簡化為y = sign（wx - t）。

2、步驟

感知器訓練階段：

權值w不斷調整指導輸出和訓練樣例的實際輸出一致，感知器具體學習演算法如下：

①令 D = {（xi，yi）,i = 1,2，....N}是訓練樣例集。

②用隨機值初始化權值向量w(0)。

③對每個訓練樣例（xi，yi），計算預測輸出Y(k)。

④對每個權值w更新權值。

⑤重複③④直到滿足條件終值。

對於④步的權值更新公式：w(k+1) = w(k) + λ（y - Y(k)）Xij

其中,w(k)是第k次迴圈後第i個輸入鏈上的權值，則w(k+1)就是k的下一次。

λ成為學習率，其值在0,1之間，接近0，那麼新權值主要受舊權值的影響，接近1，新權值對當前迴圈中的調整量更加敏感。在某些情況下，可以使用一個自適應的λ：在前幾次迴圈時值相對較大，而在接下來的迴圈中逐漸減小。

Xij是訓練樣例xi的第j個屬性值。

Y(k)是③步第k次xi對應的預測輸出Y(k)。

y是③步的真實輸出。

（y-y(k)）是預測誤差。

則，該公式可以表示為：新權值w(k+1)等於舊權值w(k)加上一個正比於預測誤差（y -Y(k)）的學習率λ。

（1）預測正確，即預測誤差為零，那麼保持權值保持不變。

（2）預測錯誤，則比如：

如果y=1,Y=-1，那麼預測誤差（y-Y）=2。為了補償這個誤差，需要通過提高所有正輸入鏈的權值，降低所有負輸入鏈的權值來提高預測輸出值。

在權值更新公式時，對誤差影響最大的鏈需要的調整最大。

然而，權值不能改變太大，因為僅僅對當前訓練樣例計算了誤差項。

3、分類：

BP神經網路，RBP網路、Hopfield網路、自組織特徵對映神經網路、學習適量化神經網路。

目前最多的是BP網路。當前的神經網路仍然普遍存在收斂速度慢、計算量大、訓練時間長、不可解釋等缺點。

4、特點

①至少含有一個隱藏層的多層神經網路是一個普適近似，即可以用來近似任何目標函式。

②由於ＡＮＮ具有豐富的假設空間，因此對於給定的問題，選擇合適的拓撲結構來防止模型的過分擬合是很重要的。

③ANN可以處理冗餘特徵，因為權值在訓練過程中自動學習。冗餘特徵的權值非常小。

④神經網路對訓練資料中的噪聲非常敏感。處理噪聲問題的一種方法是使用確認集來確定模型的泛華誤差，另一種方法是每次迭代將權值減少一個因子。

⑤ANN權值學習使用的是梯度下降方法經常會收斂到區域性極小值。避免區域性極小值得方法是在權值更新公式中加上一個動量項。

⑥訓練ＡＮＮ是一個很耗時的過程，特別是當隱藏結點數量很大時，然而測試樣例分類時非常快。

5、例項

基於4.2銀行市場調查的分類器

資料探勘學習------------------4-分類方法-4-神經網路（ANN）

4.4神經網路它是一種應用類似於大腦神經突觸聯接的結構進行資訊處理的數學模型。神經網路通常需要訓練，訓練的過程就是網路進行學習的過程。訓練改變了網路節點的連線權的值使其具有分類的功能，經過訓練的網路就可用於物件的識別。 1、感知器由圖可知：①幾個輸入結點，用來表示輸

資料探勘十大演算法——支援向量機SVM（一）：線性支援向量機

首先感謝“劉建平pinard”的淵博知識以及文中詳細準確的推導！！！本文轉自“劉建平pinard”，原網址為：http://www.cnblogs.com/pinard/p/6097604.html。支援向量機原理SVM系列文章共分為5部分：（一）線性支援向量機

資料探勘十大演算法——支援向量機SVM（四）：SMO演算法原理

首先感謝“劉建平pinard”的淵博知識以及文中詳細準確的推導！！！支援向量機原理SVM系列文章共分為5部分：（一）線性支援向量機（二）線性支援向量機的軟間隔最大化模型（三）線性不可分支援向量機與核函式（四）SMO演算法原理（五）線性支援迴歸

資料探勘十大演算法——支援向量機SVM（二）：線性支援向量機的軟間隔最大化模型

資料探勘十大演算法——支援向量機SVM（五）：線性支援迴歸

資料探勘實戰之天池精準醫療大賽（3）——sklearn工具包簡介

Part 2 sklearn工具包簡介:前面介紹了一大堆的思路，要展開這一系列的流程，還要從sklearn包的使用開始，現對此作一些介紹。先分如下幾個方面介紹：2-0.學習文件2-1.轉換器，估計器及流水線 2-2.資料預處理2-3.特徵抽取、選擇2-4.模型呼叫2-5.模型

資料探勘實戰之天池精準醫療大賽（1）——賽題與資料

首先介紹題目與資料：特別提供一下資料，供後來看到的盆友下載研究（現在官網上剩下的資料是複賽的了），測試資料分AB榜，不瞭解的去看天池平臺的介紹：競賽題目中國是世界上糖尿病患者最多的國家，病人達到1.1億，每年有130萬人死於糖尿病及其相關疾病。每年用於糖尿病的醫療費用佔中國公

TensorFlow實戰：Chapter-6（CNN-4-經典卷積神經網路（ResNet）)

ResNet ResNet簡介 ResNet(Residual Neural Network)由微軟研究院的何凱明大神等4人提出，ResNet通過使用Residual Unit成功訓練152層神經網路，在ILSCRC2015年比賽中獲得3.75%的

機器學習13：卷積神經網路（CNN）

一、Why CNN for Image？ 1、對於一幅影象來說，用DNN全連線的話，引數會很多，而影象實際上是有很多冗餘的，有些地方的特徵可能不需要。而CNN其實是拿掉了DNN的一些引數。 2、識別工作中，有時候並不需要看整張圖，而只需要看部分位置如鳥嘴。不管鳥嘴出現在影象的哪個位置，

Python資料探勘學習筆記（12）淘寶圖片爬蟲實戰

所謂圖片爬蟲，即是從網際網路中自動把對方伺服器上的圖片爬下來的爬蟲程式。一、圖片爬蟲前的網頁連結分析 1.首先開啟淘寶首頁，在搜尋框中輸入關鍵詞，如“神舟”，在搜尋結果介面中點選下一頁，分別開啟第一頁，第二頁，第三頁的搜尋結果，並記下每一頁結果的URL至記

Python資料探勘學習——親和性分析

最近了解了一些Python資料探勘方面的內容，主要學習了《Python資料探勘入門與實踐》這本書的內容，在這裡對書中的內容以及我遇到的一些問題進行整理。資料探勘旨在讓計算機根據已有的資料作出決策。資料探勘的第一步一般是建立資料集，資料集主要包括：（1）樣本：表示真實世界中的物體

Python資料探勘學習筆記（1）文字挖掘入門

一、準備階段：（1）開啟cmd，pip安裝jieba（pip install jieba）（2）開啟python安裝目錄的Lib->site-packages->jieba，開啟dict.txt，可以看到這是jieba模組的詞典：每

R語言與資料探勘學習筆記(1)：資料探勘相關包的介紹

今天發現一個很不錯的部落格(http://www.RDataMining.com)，博主致力於研究R語言在資料探勘方面的應用，正好近期很想系統的學習一下R語言和資料探勘的整個流程，看了這個部落格的內容，心裡久久不能平靜。決定從今天開始，只要晚上能在11點之前把碗洗好，就花一個小時的時間學習部落格上的內容，並把

資料探勘學習（四）——常見案例總結

1、K-meaning演算法實戰主要是通過均值來聚類的一個方法。步驟為：1）隨機選擇k個點作為聚類中心；2）計算各個點到這k個點的距離，將距離相近的點聚集在一起，行程k個類；3）將對應的點聚到與他最近的聚類中心；4）分成k個聚類之後，重新計算聚類中心；5）比較當前聚類中心與前

資料探勘學習筆記-決策樹演算法淺析(含Java實現)

目錄一、通俗理解決策樹演算法原理二、舉例說明演算法執行過程三、Java實現本文基於書籍《資料探勘概念與技術》，由於剛接觸Data Mining，所以可能有理解不到位的情況，記錄學習筆記，提升自己對演算法的理解。程式碼下方有，如果有金幣的童鞋可以貢獻一下給無恥的

資料探勘學習（一）——常用的python包

1、資料分析的內容： 2、資料分析與挖掘的相關模組： 3、安裝報錯：Import genism時會報錯：Chunkize warning while installing gensim此時需要在import genism前面加上：UserWarning: d

【資料探勘學習筆記】10.頻繁模式挖掘基礎

一、基本概念頻繁模式– 頻繁的出現在資料集中的模式– 項集、子序或者子結構動機– 發現數據中蘊含的事物的內在規律• 項(Item) – 最小的處理單位 – 例如：Bread, Milk• 事務(Transaction) – 由事務號和項集組成 – 例如：<1, {Bre

【資料探勘學習筆記】11.頻繁模式挖掘進階與關聯規則

一、關聯規則關聯規則步驟：– 1、找個這個“同一項集”，相同的項集對應的規則有相同的支援度，找到支援度≥minsup的項集– 2、計算項集中所有規則的置信度，找到置信度≥minconf的規則由頻繁項集生成關聯規則生成關聯規則– 給定頻繁項集L，找出L的所有非空子集f，滿足f

演算法模型---演算法調優---資料探勘模型效果評估方法彙總

基於損失函式的標準混淆矩陣混淆矩陣用在分類器中，是對每一類樣本的統計，包括正確分類和錯誤分類的個數。對於m類樣本，可能的錯誤種類有m2−mm^2-mm2−m個。對於2分類問題存在4種可能的情況：

資料探勘-K-近鄰分類器-Iris資料集分析-使用K-近鄰分類器進行分類預測(四)

# coding: utf-8 #使用 scikit-learn庫的K-近鄰分類器完成分類 #1. 首先將資料集中的資料進行打亂 #2. 將資料分為訓練集和測試集兩部分 #3. 使用 k-means分類器進行分類訓練，得到預測模型 #4. 使用模型對測試集進行測試，並與真實

資料探勘學習------------------4-分類方法-4-神經網路（ANN）

4.4神經網路

1、感知器

2、步驟

3、分類：

4、特點

5、例項

相關推薦