讀書筆記-增量學習-Large Scale Incremental Learning

阿新 • • 發佈：2020-10-10

一篇2019年關於增量學習Incremental Learning的論文。

論文的應用場景是大規模（Class）資料集的增量學習。文中提及現有的增量學習方法均存在兩個致命問題：

the data imbalance between the old and new classes（新、舊類的資料不平衡）
the increasing number of visually similar classes（資料集中相似的類數量增加）

針對這兩個問題，作者發現整個模型的最後一個全連線層對新的資料類別有嚴重的偏向性，這種偏向性可以由一個線性模型糾正。

使用了作者提出的偏向糾正的方法，整個模型的效能隨著資料集規模增大，下降率明顯降低，如下圖所示。

該偏向糾正方法的流程圖如下圖所示：

整個模型被分為Stage 1和Stage 2兩部分，Stage 1是Input、卷積層和全連線層，Stage 2 是作者提出的偏向糾正層。
把新、舊資料整合後，切分為新、舊訓練集（Training）和新、舊驗證集（Validate）。其中新、舊驗證集的大小一致。
訓練集用於Stage 1的卷積層和全連線層的訓練，驗證集用於Stage 2的偏向糾正。

其中，新模型由這兩個Loss Function習得：

新、舊類別資料輸出採用知識蒸餾Distilling Loss：

Classification Loss採用交叉熵：

最終表示為：

新模型的Stage 2的糾正層輸出表達如下：

1到n表示舊樣本，不需要糾正。對於n+1到n+m的新樣本，引入兩個變數 α、β對其進行線性糾正。糾正後通過交叉熵Loss完成訓練，公式如下：

為了驗證是模型中的全連線層存在偏差，作者採取以下實驗：

把100類資料分5次遞增，每次遞增20類，發現兩種模型（使用baseline方法train分類器和用所有訓練資料train分類器）的準確率隨著增量學習下降明顯。且結果明顯偏向於最後加入的20類新資料。下圖(a)中綠色和藍色線。

先訓練一次特徵層和全連線層，然後凍結特徵層，再用新、舊資料訓練一次全連線層得到結果（下圖(a)中黃色線）。

該實驗驗證了兩個觀點：

模型中的全連線層的確對分類偏差有嚴重影響
作者提出的方法在增量學習中有效緩解效能下降問題

另一實驗把該新提出的模型應用於一個Large Scale Dataset中，比對另外3種模型，結果如下：

隨著分類數量增加，4種模型學習後準確率均降低，但作者提出的模型在該大型資料集中表現出更強效能，10000種類別時仍能保持準確率高達87%以上。

在不同資料集上的表現亦十分出色，當資料集越大，提出的模型優勢越大。在結果如下：

讀書筆記-增量學習-Large Scale Incremental Learning

一篇2019年關於增量學習Incremental Learning的論文。論文的應用場景是大規模（Class）資料集的增量學習。文中提及現有的增量學習方法均存在兩個致命問題：

讀書筆記-增量學習-A CNN-Based Broad Learning System

一篇2018年關於基於CNN的增量學習論文：A CNN-Based Broad Learning System。對計算機視覺來說，作者提出的CNN-Based Broad Learning System（CNNBLS）比 Broad Learning System（BLS）更有效。其中用卷積

讀書筆記-多工學習-A Novel Multi-task Deep Learning Model for Skin Lesion Segmentation and Classification

一篇2017年的論文，A Novel Multi-task Deep Learning Model for Skin Lesion Segmentation and Classification，基於多工學習的面板病變分割與分類。

機器學習實戰-讀書筆記

\'\'\'#簡介 1.3機器學習的主要任務書中基於鳥的四種特徵：體重、翼展、腳蹼、後背顏色來確定這隻鳥屬於那種類別，這個例子介紹了機器學習如何

《Go學習筆記》讀書筆記

目錄第四章——函式變參返回值 writer:zgx lastmodify:20200919 第四章——函式無須前置宣告

【原創】【論文閱讀】2020 Learning From Noisy Large-Scale Datasets With Minimal Supervision

論文地址：https://vision.cornell.edu/se3/wp-content/uploads/2017/04/DeepLabelCleaning_CVPR.pdf 利用大規模有噪資料訓練模型的常用方法是在有噪資料上做預訓練，在精標資料上做精調。本文提出一種利用

閱讀筆記-GROVER: Self-supervised Message PassingTransformer on Large-scale Molecular Data

GROVER: Self-supervised Message PassingTransformer on Large-scale Molecular Data 概要The GROVER Pre-training Framework

《深度學習入門：基於Python的理論與實現》讀書筆記02：其他

1.從感知機到神經網路：（過度的真的是無懈可擊！）： 2.啟用函式：還記得之前學過的啟用函式有一個：sigmoid。

《深度學習入門：基於Python的理論與實現》讀書筆記01：感知機

1.感知機: 感知機接收多個輸入訊號，輸出一個訊號. 感知機裡面有個閾值 2.把上述的cta換成-b，那麼就表示偏置項。

《The Matrix Calculus You Need For Deep Learning》讀書筆記

用於深度學習的矩陣微積分讀書筆記書籍簡介本教程涵蓋的內容內容總結1.引言2.Jacobian的推廣3.向量的逐元素二元運算求導4.涉及標量運算的向量求導5.向量和求導6.鏈式法則6.1 單變數鏈式法則6.2 單變數全

轉載讀書筆記《寬度學習：原理與實現》陳俊龍

摘要：寬度學習是一種不依賴深度結構的神經網路結構，其優秀的運算速度和簡潔的結構可以說是機器學習界的一股清流。本文將從原理和程式碼實現的角度對其進行分析和梳理，由於筆者水平有限，不足之處還望各位楷正。

Solving Large-Scale Granular Resource Allocation Problems Efficiently with POP（2021-POP-SOSP-文獻閱讀筆記）

讀者這篇文章來自2021的SOSP，單位是斯坦福大學和微軟。選該文章的理由有二，一是資源分配的主題較為相關；二是文章結構、語言很清晰，讀起來很舒服。

HeadFirst 讀書筆記

java的工作方式 primitive 原始資料型別每種primitive主資料型別變數有固定的位數(杯子的大小),存放數值的primitive主資料型別有下列6種大小

JVM資料區域與垃圾收集<深入理解JVM讀書筆記>

目錄目錄前言自動記憶體管理機制執行時資料區域記憶體分配虛擬機器器上物件的建立過程

高效能mysql讀書筆記（四） Mysql高階特性

分割槽表對使用者來說，分割槽表是一個獨立的邏輯表，但是底層由多個物理子表組成。實現分割槽表的程式碼實際上是對一組底層表的控制程式碼物件的封裝。對分割槽表的請求，都會通過控制程式碼物件轉化成對儲存引擎的

《SQL初學者指南》讀書筆記

關係型資料庫和SQL SQL語言的三個部分 DML：Data Manipulation Language，資料操縱語言，檢索、修改、增加、刪除資料庫（表）中的資料

MySQL必知必會——第27章全球化和本地化讀書筆記

本章介紹MySQL處理不同字符集和語言的基礎知識。 1 字符集和校對順序資料庫表用來儲存和檢索資料。

高效能MySQL讀書筆記（第五章下）

高效能索引策略高效能的索引策略（如何高效實用索引）高效能的索引策略（如何高效實用索引）

《程式碼不朽：編寫可維護軟體的10大要則（C#版）》讀書筆記

程式碼不朽：編寫可維護軟體的10大要則（C#版）【荷】Joost Visser 著張若飛譯

侯策《前端開發核心知識進階》讀書筆記——API實現

jQuery offset 實現 offset() 方法返回或設定匹配元素相對於文件的偏移。（一）遞迴實現:

讀書筆記-增量學習-Large Scale Incremental Learning

相關推薦