Brat標註工具安裝及使用(虛擬機器系統Ubuntu16)
原文地址https://blog.csdn.net/p_jinsan/article/details/96152078
稍作了一些補充
1.環境
windows10->虛擬機器->Ubuntu 16.04 64位
2.前置條件
2.1更新apt
sudo apt upgrade
sudo apt update
2.2安裝git
sudo apt install git
2.3安裝apache2
sudo apt install apache2
檢測:瀏覽器中輸入http://127.0.0.1/或者http://localhost/
進入下圖介面,則說明安裝成功
2.4安裝google chrome#個人習慣
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb sudo dpkg -i google-chrome-stable_current_amd64.deb
3.安裝
3.1下載brat
進入主頁下載 http://brat.nlplab.org/index.html
補充:點選Download,像我就出現了無法連線的情況,可以將下載地址複製到迅雷進行下載
http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz
3.2解壓
tar xzf 路徑/檔名
eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz
3.3進入資料夾
重新命名為brat
cd brat
3.4安裝,配置一些使用者資訊
./install.sh
3.5開啟#每次使用都需要
python2 standalone.py
3.6開啟瀏覽器進入即可開始標註
http://127.0.0.1:8001/index.xhtml
4.使用
4.1登入後,選中文字後會彈出視窗,選擇實體型別
4.2拖動標註好的實體可以連線關係
4.3雙擊標籤可對標籤進行修改或刪除
4.4點選data可匯出標註好的資料
ps:未登入不能進行標註
5.配置
annotation.conf
1.entities用來定義標註的實體名稱,其格式為每行一個實體型別, 比如:人名、地名、英雄名、技能名等,可以採用tab來增加二級標註, hero hero1 2.relations用來定義實體間的關係,格式為每行定義一種關係,第一列為關係型別, 隨後是用逗號分隔的ArgNrelations用來定義實體間的關係,格式為每行定義一種關係,第一列為關係型別, 隨後是用逗號分隔的ArgN:實體名,用來表示關係的各個相關者。 relation1 Arg1:hero1, Arg2:hero1 3.events用來定義事件,每行定義一類事件,第一列為事件名,隨後是用逗號分隔的Participant:實體名, 用來表示事件的各個參與者。 4.attributes用來定義屬性,每行一個屬性,第一列為屬性名,隨後是用逗號分隔的Arg:<模組型別>, Value:屬性值, 注意屬性值可以有多個
visual.conf#視覺配置檔案
1.採用中文標籤時需要 2.將annotation.conf中名稱替換 3.labels [labels] hero1 | 魏
6.其他
6.1中文支援
新增
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
到./server/src/projectconfig.py第163行
6.2給.txt檔案新增.ann的標引檔案
find 資料夾名稱 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch eg:find data/exa -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
給資料夾內所有.txt檔案新增對應的.ann標引檔案
6.3新增使用者(本地不需要)
直接在config.py檔案中新增
USER_PASSWORD = { 'admn': 'admin', 'test': 'test', #'user':'password', # (add USERNAME:PASSWORD pairs below this line.) }
7.參考