1. 程式人生 > 其它 >CBLUE 中文醫療資訊處理基準 NLP (論文復現流程)

CBLUE 中文醫療資訊處理基準 NLP (論文復現流程)

本次小組課程設計主要完成的分析是對於CMeEE中文醫學實體命名,下面是課程設計的流程

查閱官方檔案

CBLUE官方簡介

天池打榜(截至2022年4月30日)

jupyter官網

任務解讀

jupyter實現

jupyter規格選擇

使用的jupyter是華為雲modelarts系統,基礎環境選擇如下:

伺服器選擇北京四:

映象源選擇如圖:

型別與規格如圖:

其他選項不用改變,28元/小時。

環境配置

  1. 上傳資料夾:
    資料夾下載

解壓資料夾

import zipfile
import os

files = zipfile.ZipFile('cblue.zip', 'r')
files.extractall(os.getcwd())
files.close()

解壓後結果

  1. 配置訓練環境

    開啟pytorch編輯器

編輯器配置相應環境:

pip install --upgrade pip

pip install transformers==4.5.1

pip install jieba

pip install gensim

在編輯器中依次執行各語句。

開始訓練

在jupyter下開啟指令碼檔案

CBLUE_CMeEE/examples/run_ee.sh

如圖:

全選複製。

開啟Terminal,

將剛剛複製的指令碼程式貼上到執行框中

開始訓練:

訓練時間大約為30-60分鐘

提交結果

等待執行完成後,在目錄下找到結果檔案,下載。

CBLUE_CMeEE/data/result_output/CMeEE_test.json

壓縮後提交到天池平臺,結果為62分。

引數解讀以及調參方法

Q&A