1. 程式人生 > 其它 >增量學習:基本概念

增量學習:基本概念

定義:學習系統能不斷從新樣本中學習新的知識,並能儲存大部分之前已經學習到的知識。

增量學習的重要性主要體現在以下兩個方面:

(1)在實際的感知資料中,資料量往往是逐漸增加的,因此,在面臨新的資料時,學習方法應能對訓練好的系統進行某些改的,以對新資料中蘊含的知識進行學習。

(2)對一個訓練好的系統進行修改的時間代價通常低於重新訓練一個系統所需的代價。

增量學習思想可以描述為:每當新增資料時,並不需要重建所有的知識庫,而是在原有的知識庫的基礎上,僅對新增資料所引起的變化進行更新。增量學習的框架有很多,各框架的最核心的內容時處理新資料與已經儲存知識相似性評價方法。因此該方法決定察覺新知識並增加知識庫的方式,它影響著知識的增長。新知識的判斷機制才是增量學習的核心部件。

特點和意義:

傳統機器學習演算法大多屬於批量學習(batch learning)模式,即假設在訓練之前所有訓練樣本一次都可以得到,學習這些樣本後,學習過程就終止了,不再學習新的知識。然而在實際應用中,訓練樣本通常不可能一次性全部得到,而是隨著時間逐步得到的,並且樣本反應的資訊也可能隨著時間產生了變化。如果新樣本到達後要重新學習全部資料,需要消耗大量的時間和空間,因此批量學習演算法不滿足這種需求。只有增量學習可以漸進的進行知識的更新,且能修正和增強之前的知識,使得更新後的知識能夠適應到達的資料,而不必重新對全部資料進行學習。增量學習降低了對時間和空間的需求,更能滿足實際要求。

Robipolokar對於增量學習所應具有的特點進行了以下總結:

1)可以從新資料中學習到知識;

2)以前已經處理的資料不需要重複處理;

3)每次只有一個訓練觀測樣本被看到和學習;

4)學習新知識的同時能夠儲存之前學習到的大部分知識;

5)一旦學習完成訓練後訓練觀測樣本被丟棄;

6)學習系統沒有關於完整訓練樣本的先驗知識;

常見的增量學習框架:

1. 自組織增量學習神經網路

SOINN是一種基於競爭學習的兩層神經網路。SOINN的增量學習能使得它發現數據流中出現的新模式進行學習,同時不影響之前學習的結果。因此SOINN能夠作為一種通用的學習演算法應用於各類非監督學習問題中。

2. 情景記憶馬爾可夫決策過程

情景記憶馬爾可夫決策過程EM-MDP準確來說是一套完整的人工智慧方案(簡化版),這個框架中包括對情景的認知、增量學習、短期與長期記憶模型。我們將焦點放在框架中的增量學習部分。該框架基於自適應共振理論(ART)與稀疏分佈記憶(SDM)的思想實現對情景記憶序列的增量式學習。SDM是電腦科學家彭蒂.卡內爾瓦於1974年提出的能夠將思維所擁有的任何感知存入有限記憶機制的方法。這樣,在學習過程中,每次可有多個狀態神經元同時被告啟用,每個神經元均可看成一類相近感知的代表。相比SOINN網路每次最多隻能有一個輸出節點,該方法具有環境適應性好的優點。