1. 程式人生 > 其它 >Brat標註工具安裝及使用(虛擬機器系統Ubuntu16)

Brat標註工具安裝及使用(虛擬機器系統Ubuntu16)

原文地址https://blog.csdn.net/p_jinsan/article/details/96152078

稍作了一些補充

1.環境
windows10->虛擬機器->Ubuntu 16.04 64位

2.前置條件

  2.1更新apt

sudo apt upgrade
sudo apt update

  2.2安裝git

sudo apt install git

  2.3安裝apache2

sudo apt install apache2

檢測:瀏覽器中輸入http://127.0.0.1/或者http://localhost/
進入下圖介面,則說明安裝成功

  2.4安裝google chrome#個人習慣

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

3.安裝

  3.1下載brat

進入主頁下載 http://brat.nlplab.org/index.html

補充:點選Download,像我就出現了無法連線的情況,可以將下載地址複製到迅雷進行下載

http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz

  3.2解壓

tar xzf 路徑/檔名
eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz

  3.3進入資料夾

重新命名為brat

cd brat

  3.4安裝,配置一些使用者資訊

./install.sh

  3.5開啟#每次使用都需要

python2 standalone.py

  3.6開啟瀏覽器進入即可開始標註

http://127.0.0.1:8001/index.xhtml

4.使用

  4.1登入後,選中文字後會彈出視窗,選擇實體型別
  4.2拖動標註好的實體可以連線關係
  4.3雙擊標籤可對標籤進行修改或刪除
  4.4點選data可匯出標註好的資料
  ps:未登入不能進行標註

5.配置

annotation.conf

1.entities用來定義標註的實體名稱,其格式為每行一個實體型別,
    比如:人名、地名、英雄名、技能名等,可以採用tab來增加二級標註,
    hero
        hero1
2.relations用來定義實體間的關係,格式為每行定義一種關係,第一列為關係型別,
    隨後是用逗號分隔的ArgNrelations用來定義實體間的關係,格式為每行定義一種關係,第一列為關係型別,
    隨後是用逗號分隔的ArgN:實體名,用來表示關係的各個相關者。
    relation1 Arg1:hero1, Arg2:hero1
3.events用來定義事件,每行定義一類事件,第一列為事件名,隨後是用逗號分隔的Participant:實體名,
    用來表示事件的各個參與者。
4.attributes用來定義屬性,每行一個屬性,第一列為屬性名,隨後是用逗號分隔的Arg:<模組型別>, Value:屬性值,
    注意屬性值可以有多個

visual.conf#視覺配置檔案

1.採用中文標籤時需要
2.將annotation.conf中名稱替換
3.labels
    [labels]
    hero1 | 魏

6.其他

  6.1中文支援

新增

n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

到./server/src/projectconfig.py第163行

  6.2給.txt檔案新增.ann的標引檔案

find 資料夾名稱 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
eg:find data/exa -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch

給資料夾內所有.txt檔案新增對應的.ann標引檔案

6.3新增使用者(本地不需要)

直接在config.py檔案中新增

USER_PASSWORD = { 
    'admn': 'admin', 
    'test': 'test', 
    #'user':'password',
    # (add USERNAME:PASSWORD pairs below this line.) 
}

7.參考

中文文字標註工具調研以及BRAT安裝使用

標註工具Brat安裝(本地)