1. 程式人生 > 實用技巧 >【NLP資料訓練】文字標註工具推薦

【NLP資料訓練】文字標註工具推薦

對於自然語言處理技術的研究一直是AI領域的重點方向,而NLP訓練中的首要條件是具備結構化訓練資料對資料模型進行訓練。
因此,對文字資料進行標註就成為在對自然語言處理演算法進行研究之前需要解決的一個重要問題。
京東眾智Wise開放標註平臺初版文字實體標註工具上線以來,已經幫助眾多平臺上的NLP領域的AI從業者完成了資料訓練。
為了滿足更多的NLP從業者的需求,京東眾智推出了全新升級的文字標註工具,包括整體判斷、實體提取及實體關係標註三項功能,配合多種靈活配置項,可以支援更多NLP領域的多樣化需求。

文字標註工具上線,限時1折

工具名稱:文字標註工具
工具功能:整體判斷/實體提取/實體關係標註
工具價格

:0.02元/條 0.2元/條
福利時間:2020年10月13日-10月31日
體驗連結https://biao.jd.com/wise

下面來看一下本次上線的新文字標註工具的使用方法
本次我們以一個京東數科及其品牌京東眾智相關的文字為例來介紹本工具。

設定工具配置項

1. 選擇標註專案
首先需要選擇本次需要進行哪些標註專案,在本次案例中我們需要通過全域性標註來判斷文字的感情傾向,通過元素標註來進行實體及其關係標註,所以全選。
在這裡插入圖片描述
由於本次文字型別為中文,所以語序為從左至右,若標註一些語序特殊的小語種文字時可以選擇從右至左的語序。

2. 配置全域性標註標籤
在本次案例中,需要判斷文字整體的情感傾向:積極/中性/消極,如圖新增三個並列的標籤,並設定為必選以及單選。

在這裡插入圖片描述

3. 配置元素標籤
在本次示例中我們需要標註出新聞文字中的一些實體,即按圖所示新增“公司”“品牌”“服務”三個實體標籤。
在這裡插入圖片描述
同時,需要判斷實體間的關係,及如圖所示,新增實體關係標籤,為“從屬關係”或“並列關係”。
在這裡插入圖片描述
在配置標籤時,點選【設定關聯標籤】可以提前預設各個實體之間的關係,如圖中所示,當從品牌指向公司時為從屬關係,若標註時先點選“公司”後點擊“品牌”則無法建立關係。
在這裡插入圖片描述
完成配置項設定後,我們來演示體驗一下這個工具。

實體標註

首先可以在頁面右上角處選擇整體判斷標籤,如圖中選擇“積極”;然後通過長按滑鼠左鍵在正文中選中需要標註的實體,並選擇對應的實體標籤。
若標註錯誤,可以單擊正文中標註的標籤內容,並選擇正確的標籤即可更正實體標籤,同時也可以進行刪除。

在這裡插入圖片描述

實體關係標註

首先需要在頁面右側點選【新增關係】,如圖示選擇【從屬關係】,並按順序點選對應的兩個標籤即可建立實體關係。
在這裡插入圖片描述

修改

若需要快速檢視已標註實體關係在文字中的位置,可以在右側標註列表欄單擊左上角的圖示進行任意定位。
當實體關係標註錯誤時,可以在右側標註列表欄,點選錯誤實體關係後的編輯按鈕更改實體關係
當實體標註錯誤時,可以在正文中單擊錯誤的標籤,並點選【修改】後,選擇正確的文字即可完成修改。
在一個實體關係中,可以任意調換兩個實體的位置或替換其中的任意一個實體。
在這裡插入圖片描述

以上就是對本次新上線文字標註工具的介紹,如果有相關需求的話,快去開放平臺試用併發布專案吧!1折限時優惠中!
同時,京東眾智Wise開放標註平臺為使用者提供2020年全年2折優惠,活動結束後將調整為0.04元/條。
搶先體驗方法:使用PC端登入京東眾智Wise開放標註平臺,點選【進入開放平臺】,選擇【需求方入口】後,點選【建立標註專案】,選擇文字標註工具即可。