【MXNet Gluon】使用預訓練好的模型fine-tune

阿新 • • 發佈：2019-01-08

finetune關鍵程式碼

prenet=ResNet(466)
net=ResNet(3400)
ctx = [mx.gpu(i) for i in range(3)]
if finetune ==1:
    prenet.load_params('params/net-%d.params' % (start_iter),ctx)
    #features為需要保留的模型引數，output為修改為新資料集類別數的Dense層
    net.features=prenet.features
    net.output.initialize(mx.init.Xavier(), ctx)
else 
:
     net.collect_params().initialize(mx.init.Xavier(magnitude=2.24), ctx)

ResNet程式碼參考
class ResNetV2(HybridBlock):

def __init__(self, block, layers, channels, classes=1000, thumbnail=False, **kwargs):
    super(ResNetV2, self).__init__(**kwargs)
    assert len(layers) == len(channels) - 1
    with self.name_scope():
        self.features = nn.HybridSequential(prefix='')
        self.features.add(nn.BatchNorm(scale=False, center=False))
        if thumbnail:
            self.features.add(_conv3x3(channels[0], 1, 0))
        else:
            self.features.add(nn.Conv2D(channels[0], 7, 2, 3, use_bias=False))
            self.features.add(nn.BatchNorm())
            self.features.add(nn.Activation('relu'))
            self.features.add(nn.MaxPool2D(3, 2, 1))

        in_channels = channels[0]
        for i, num_layer in enumerate(layers):
            stride = 1 if i == 0 else 2
            self.features.add(self._make_layer(block, num_layer, channels[i+1],
                                               stride, i+1, in_channels=in_channels))
            in_channels = channels[i+1]
        self.features.add(nn.BatchNorm())
        self.features.add(nn.Activation('relu'))
        self.features.add(nn.GlobalAvgPool2D())
        self.features.add(nn.Flatten())

        self.output = nn.Dense(classes, in_units=in_channels)

def _make_layer(self, block, layers, channels, stride, stage_index, in_channels=0):
    layer = nn.HybridSequential(prefix='stage%d_'%stage_index)
    with layer.name_scope():
        layer.add(block(channels, stride, channels != in_channels, in_channels=in_channels,
                        prefix=''))
        for _ in range(layers-1):
            layer.add(block(channels, 1, False, in_channels=channels, prefix=''))
    return layer

def hybrid_forward(self, F, x):
    x = self.features(x)
    x = self.output(x)
    return x

【MXNet Gluon】使用預訓練好的模型fine-tune

finetune關鍵程式碼 prenet=ResNet(466) net=ResNet(3400) ctx = [mx.gpu(i) for i in range(3)] if finetune ==1: prenet.load_params('p

【深度學習】120G+訓練好的word2vec模型（中文詞向量）

很多人缺少大語料訓練的word2vec模型，在此分享下使用268G+語料訓練好的word2vec模型。訓練語料：百度百科800w+條，26G+ 搜狐新聞400w+條，13G+ 小說：229G+ image.png 模型引數： window=5

【ACF學習】ACF訓練檢測模型

ACF在行人檢測取得了不錯的成績，適合剛性目標或者準剛性目標的訓練 1，資料量說明本文準備了12W+正樣本，以豎直手掌為主，有部分樣本存在輕微的旋轉負樣本7k+（不夠，訓練一級分類器就停止了，後面增加到2W+） 2，熟悉acfTrain 輸入 opts=acfTrain

【TensorFlow】從訓練好的模型中獲取引數值

checkpoint_file = tf.train.latest_checkpoint(FLAGS.checkpoint_dir)graph = tf.Graph()with graph.as_default(): session_conf = tf.ConfigPr

【NLP面試QA】預訓練模型

[TOC] #### 自迴歸語言模型與自編碼語言 - 自迴歸語言模型 - 通過給定文字的上文，對下一個字進行預測 - 優點：對文字序列聯合概率的密度估計進行建模，使得該模型更適用於一些生成類的NLP任務，因為這些任務在生成內容的時候就是從左到右的，這和自迴歸的模式天然匹配。 - 缺點

TensorFlow 同時調用多個預訓練好的模型

預測 txt success ucc data 分享 ext font 訓練在某些任務中，我們需要針對不同的情況訓練多個不同的神經網絡模型，這時候，在測試階段，我們就需要調用多個預訓練好的模型分別來進行預測。調用單個預訓練好的模型請點擊此處弄明白了如何調用單個

在 C/C++ 中使用 TensorFlow 預訓練好的模型—— 直接調用Ｃ++ 接口實現

input lac frame core 9.png pla 低版本訓練接口現在的深度學習框架一般都是基於 Python 來實現，構建、訓練、保存和調用模型都可以很容易地在 Python 下完成。但有時候，我們在實際應用這些模型的時候可能需要在其他編程語言下進行，本

【AI實戰】動手訓練自己的目標檢測模型（YOLO篇）

在前面的文章中，已經介紹了基於SSD使用自己的資料訓練目標檢測模型（見文章：手把手教你訓練自己的目標檢測模型），本文將基於另一個目標檢測模型YOLO，介紹如何使用自己的資料進行訓練。 YOLO（You only look once）是目前流行的目標檢測模型之一，目前最新已經發

【阿里2017】利用分片線性模型實現大規模資料點選率預估

==定期更新,獲取更多,歡迎star。另外歡迎關注計算廣告實驗,我會總結一些實現。== 一、論文基本描述。 CTR預估由於是針對大規模非線性資料的機器學習存在很多的困難。本論文提出了一個新型的模型（LS-PLM）。利用$L_1$和$L_{2,1}$正則來解決學習問題，將會導致非凸和非光滑的優化問題。因

TensorFlow 呼叫預訓練好的模型—— Python 實現

1. 準備預訓練好的模型 TensorFlow 預訓練好的模型被儲存為以下四個檔案 data 檔案是訓練好的引數值，meta 檔案是定義的神經網路圖，checkpoint 檔案是所有模型的儲存路

在 C/C++ 中使用 TensorFlow 預訓練好的模型—— 直接呼叫Ｃ++ 介面實現

現在的深度學習框架一般都是基於 Python 來實現，構建、訓練、儲存和呼叫模型都可以很容易地在 Python 下完成。但有時候，我們在實際應用這些模型的時候可能需要在其他程式語言下進行，本文將通過直接呼叫 TensorFlow 的 C/C++ 介面來匯入 T

faster rcnn訓練測試+單獨測試預訓練好的模型

這裡主要講兩個方面內容，一方面是從無到有如何成功執行demo（假設你的Caffe已經可以用），另一方面是如何自己訓練模型，可以用自己的資料，也可以是本文的VOC資料集。一、執行demo 直接按照git上的readme進行安裝和編譯即可，由於git上的說明較為簡單，所以接下來詳細介紹： 1、Clone

深度學習tensorflow實戰筆記（5）用預訓練好的VGG-16模型提取影象特徵

上一篇部落格介紹瞭如果使用自己訓練好的模型用於影象分類和特徵提取，但是有時候自己的資料集大小有限，所以更多的時候我們需要用VGG-16預訓練好的模型提取特徵，相關學者預訓練好的模型使用的都是公開的標準資料集，所以我們直接用預訓練的模型提取我們自己影象的特徵，可以用於

【補題】組隊訓練第一場

現在 play ota mona fun 轉義易到 bsp spl 本來想一次補完的（正常應該補兩次的）但是晚上玩dota2和rpg去了然後……又墮落了啊。好吧進入正題，題目按照從易到難的順序（個人感覺）其他題目現在對我來說太難了，以後再補。 A題 ZOJ 38

【補題】組隊訓練第二場 & 個人訓練第一場

for 分享貪心 n) nbsp true open tput stdin 組隊第二場： C題 CodeForces Gym 100735D 題意：給你N個木棍，問他們能拼成多少個三角形。思路：從小到大排序，然後貪心地去取。 1 #include<cstdi

【做題】agc006C - Rabbit Exercise——模型轉換

block arr 個性特殊但我 pla 所有時間 %d 題意：數軸上有$n$個點，從$1$到$n$編號。有$m$個操作，每次操作給出一個編號$i \, 1 < i < n$，即把點$i$等概率移動到它關於點$i-1$的對稱點

《錯誤手記-01》 facenet使用預訓練模型fine-tune重新訓練自己資料集報錯

環境資訊：windows10+python3.5+tensorflow1.6.0 問題描述：在自己的訓練集上跑train_softmax.py. 引數： --logs_base_dir F:/work/runspace/log/ --models_base_

PyTorch中使用預訓練的模型初始化網路的一部分引數(增減網路層，修改某層引數等) 固定引數

在預訓練網路的基礎上，修改部分層得到自己的網路，通常我們需要解決的問題包括： 1. 從預訓練的模型載入引數 2. 對新網路兩部分設定不同的學習率，主要訓練自己新增的層一. 載入引數的方法：載入引數可以參考apaszke推薦的做法，即刪除與當前mo

【藍橋杯】基礎訓練完美的代價

問題描述　　迴文串，是一種特殊的字串，它從左往右讀和從右往左讀是一樣的。小龍龍認為迴文串才是完美的。現在給你一個串，它不一定是迴文的，請你計算最少的交換次數使得該串變成一個完美的迴文串。　　交換的定義是：交換兩個相鄰的字元　　例如mamad 　　第一次交換 ad : m

pytorch fine-tune 預訓練的模型

之一: torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。安裝 pip install torchvision 如何 fine-tune 以

【MXNet Gluon】使用預訓練好的模型fine-tune

相關推薦