CBLUE 中文醫療資訊處理基準 NLP (論文復現流程)
阿新 • • 發佈:2022-04-17
本次小組課程設計主要完成的分析是對於CMeEE中文醫學實體命名,下面是課程設計的流程
查閱官方檔案
任務解讀
jupyter實現
jupyter規格選擇
使用的jupyter是華為雲modelarts系統,基礎環境選擇如下:
伺服器選擇北京四:
映象源選擇如圖:
型別與規格如圖:
其他選項不用改變,28元/小時。
環境配置
- 上傳資料夾:
資料夾下載
解壓資料夾
import zipfile import os files = zipfile.ZipFile('cblue.zip', 'r') files.extractall(os.getcwd()) files.close()
解壓後結果
-
配置訓練環境
開啟pytorch編輯器
編輯器配置相應環境:
pip install --upgrade pip
pip install transformers==4.5.1
pip install jieba
pip install gensim
在編輯器中依次執行各語句。
開始訓練
在jupyter下開啟指令碼檔案
CBLUE_CMeEE/examples/run_ee.sh
如圖:
全選複製。
開啟Terminal,
將剛剛複製的指令碼程式貼上到執行框中
開始訓練:
訓練時間大約為30-60分鐘
提交結果
等待執行完成後,在目錄下找到結果檔案,下載。
CBLUE_CMeEE/data/result_output/CMeEE_test.json
壓縮後提交到天池平臺,結果為62分。