Pytorch-Bert預訓練模型的使用（呼叫transformers）

阿新 • • 發佈：2020-08-27

1. transformer資料

transformers（以前稱為pytorch-transformers和pytorch-pretrained-bert）

提供用於自然語言理解（NLU）和自然語言生成（NLG）的BERT家族通用結構（BERT，GPT-2，RoBERTa，XLM，DistilBert，XLNet等），包含超過32種、涵蓋100多種語言的預訓練模型。
首先下載transformers包，pip install transformers
其次手動下載模型（直接from transformers import BertModel會從官方的s3資料庫下載模型配置、引數等資訊，在國內並不可用）
- 下載bert-base-chinese的config.josn，vocab.txt，pytorch_model.bin三個檔案後，放在bert-base-chinese資料夾下，此例中該資料夾放在F:/Transformer-Bert/下。

提前導包：

import numpy as np
import torch 
from transformers import BertTokenizer, BertConfig, BertForMaskedLM, BertForNextSentencePrediction
from transformers import BertModel

model_name = 'bert-base-chinese'
MODEL_PATH = 'F:/Transformer-Bert/bert-base-chinese/'

# a. 通過詞典匯入分詞器
tokenizer = BertTokenizer.from_pretrained(model_name)
# b. 匯入配置檔案
model_config = BertConfig.from_pretrained(model_name)
# 修改配置
model_config.output_hidden_states = True
model_config.output_attentions = True
# 通過配置和路徑匯入模型
bert_model = BertModel.from_pretrainedo(MODEL_PATH, config = model_config)

利用分詞器進行編碼：

encode僅返回input_ids
encode_plus返回所有編碼資訊
- input_ids：是單詞在詞典中的編碼
- token_type_ids：區分兩個句子的編碼（上句全為0，下句全為1）
- attention_mask：指定對哪些詞進行self-Attention操作

print(tokenizer.encode('吾兒莫慌'))   # [101, 1434, 1036, 5811, 2707, 102]

sen_code = tokenizer.encode_plus('這個故事沒有終點', "正如星空沒有彼岸")
# print(sen_code)
# [101, 1434, 1036, 5811, 2707, 102]
#  {'input_ids': [101, 6821, 702, 3125, 752, 3766, 3300, 5303, 4157, 102, 3633, 1963, 3215, 4958, 3766, 3300, 2516, 2279, 102], 
#  'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1], 
#  'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}

將input_ids轉化回token：

print(tokenizer.convert_ids_to_tokens(sen_code['input_ids']))

# ['[CLS]', '這', '個', '故', '事', '沒', '有', '終', '點', '[SEP]', '正', '如', '星', '空', '沒', '有', '彼', '岸', '[SEP]']

將分詞輸入模型，得到編碼：

Pytorch-Bert預訓練模型的使用（呼叫transformers）

筆記摘抄 1. transformer資料 transformers（以前稱為pytorch-transformers和pytorch-pretrained-bert）

pytorch載入預訓練模型後,實現訓練指定層

1、有了已經訓練好的模型引數，對這個模型的某些層做了改變，如何利用這些訓練好的模型引數繼續訓練：

PyTorch載入預訓練模型例項(pretrained)

使用預訓練模型的程式碼如下： # 載入預訓練模型 resNet50 = models.resnet50(pretrained=True)

pytorch載入預訓練模型出現錯誤：ModuleNotFoundError: No module named 'models'

問題描述：在使用pytorch載入預訓練模型的時候，出現錯誤：ModuleNotFoundError: No module named \'models\'，該預訓練模型是從官方下載的yolov5s.pt

關於bert預訓練模型的輸出是什麼

我們在使用Bert進行微調的時候，通常都會使用bert的隱含層的輸出，然後再接自己的任務頭，那麼，我們必須先知道bert的輸出都是什麼，本文接下來就具體記錄下bert的輸出相關的知識。

tensorflow學習023——預訓練網路（遷移學習）基礎知識

預訓練網路是一個儲存好的之前已在大型資料集（大規模影象分類任務）上訓練好的卷積神經網路。如果這個原始資料集足夠大且足夠通用，那麼預訓練網路學到的特徵的空間層次結構可以作為有效的提取視覺世界特徵的模型。

預訓練模型transformers綜合總結（二）

技術標籤：深度學習自然語言處理接著第一部分，這裡寫如何使用自定義資料集，呼叫transformers庫去訓練模型，其實感覺本質就是如何把資料集合理讀取進來。

NLP（三十四）：huggingface transformers預訓練模型如何下載至本地，並使用？

huggingface的transformers框架，囊括了BERT、GPT、GPT2、ToBERTa、T5等眾多模型，同時支援pytorch和tensorflow 2，程式碼非常規範，使用也非常簡單，但是模型使用的時候，要從他們的伺服器上去下載模型，那麼有沒有

BERT預訓練tensorflow模型轉換為pytorch模型

在Bert的預訓練模型中，主流的模型都是以tensorflow的形勢開源的。但是huggingface在Transformers中提供了一份可以轉換的介面（convert_bert_original_tf_checkpoint_to_pytorch.py）。但是如何在windows的IDE中執行

pytorch 實現在預訓練模型的 input上增減通道

如何把imagenet預訓練的模型，輸入層的通道數隨心所欲的修改，從而來適應自己的任務

使用pytorch搭建AlexNet操作(微調預訓練模型及手動搭建)

本文介紹瞭如何在pytorch下搭建AlexNet，使用了兩種方法，一種是直接載入預訓練模型，並根據自己的需要微調（將最後一層全連線層輸出由1000改為10），另一種是手動搭建。

MxNet預訓練模型到Pytorch模型的轉換方式

預訓練模型在不同深度學習框架中的轉換是一種常見的任務。今天剛好DPN預訓練模型轉換問題，順手將這個過程記錄一下。

在jupyter Notebook中使用PyTorch中的預訓練模型ResNet進行影象分類

預訓練模型是在像ImageNet這樣的大型基準資料集上訓練得到的神經網路模型。

pytorch 預訓練模型最後幾層的修改方法

技術標籤：pytorch網路模型pytorch神經網路自動駕駛深度學習 pytorch 預訓練模型最後幾層的修改方法

Pytorch 預訓練模型的應用

技術標籤：深度學習pytorch深度學習神經網路遷移學習 1、載入預訓練模型呼叫網上的預訓練引數：

pytorch 修改預訓練model例項

我就廢話不多說了，直接上程式碼吧！ class Net(nn.Module): def __init__(self,model): super(Net,self).__init__()

tensorflow獲取預訓練模型某層引數並賦值到當前網路指定層方式

已經有了一個預訓練的模型，我需要從其中取出某一層，把該層的weights和biases賦值到新的網路結構中，可以使用tensorflow中的pywrap_tensorflow(用來讀取預訓練模型的引數值)結合Session.assign()進行操作。

使用Keras預訓練模型ResNet50進行影象分類方式

Keras提供了一些用ImageNet訓練過的模型：Xception，VGG16，VGG19，ResNet50，InceptionV3。在使用這些模型的時候，有一個引數include_top表示是否包含模型頂部的全連線層，如果包含，則可以將影象分為ImageNet中的1

淺談Tensorflow載入Vgg預訓練模型的幾個注意事項

寫這個部落格的關鍵Bug: Value passed to parameter \'input\' has DataType uint8 not in list of allowed values: float16,bfloat16,float32,float64。本部落格將圍繞載入圖片和儲存圖片到本地來詳細解釋和解決

Tensorflow載入Vgg預訓練模型操作

很多深度神經網路模型需要載入預訓練過的Vgg引數，比如說：風格遷移、目標檢測、影象標註等計算機視覺中常見的任務。那麼到底如何載入Vgg模型呢？Vgg檔案的引數到底有何意義呢？載入後的模型該如何使用呢？

Pytorch-Bert預訓練模型的使用（呼叫transformers）

1. transformer資料

相關推薦