1. 程式人生 > 實用技巧 >本週六定位上海!解析百度文心(ERNIE)如何助力快速定製企業級NLP模型

本週六定位上海!解析百度文心(ERNIE)如何助力快速定製企業級NLP模型

文心(ERNIE)是依託百度深度學習平臺飛槳打造的語義理解技術與平臺,集先進的預訓練模型、全面的NLP演算法集、端到端開發套件和平臺化服務於一體,為企業和開發者提供一整套NLP定製與應用能力。在2020世界人工智慧大會,百度文心(ERNIE)榮獲最高獎項SAIL獎(Super AI Leader,卓越人工智慧引領者)。

ERNIE開創性地將大資料預訓練與多源豐富知識相結合,持續學習海量資料中的知識,將機器語義理解水平提升到一個新的高度。以中文模型為例,目前ERNIE已經學習了1500萬篇百科語料和詞語、實體知識,700萬個人類對話,3億的文章的因果結構關係,以及10億次的搜尋查詢與結果的對應關係,以及2000萬的語言邏輯關係知識。模型還在持續不斷地建模新的海量資料與知識,不斷地提升下游的應用效果。ERNIE在中英文的16個任務上已經超越了業界最好模型,全面適用於各類NLP應用場景。

目前,EasyDL已預置了領先的預訓練模型ERNIE2.0,並配套了多種NLP經典演算法網路,支援了文字分類、短文字匹配和序列標註等典型文字處理任務

近日,文心(ERNIE)重磅釋出三項功能,新增定製多標籤文字分類、情感傾向分析、文字實體抽取模型等功能,同時資料管理能力也進一步增強,更好地滿足NLP領域開發者需求,開發者可通過百度AI開發平臺EasyDL進行使用。

EasyDL是百度大腦面向企業開發者推出的零門檻AI開發平臺,基於百度自主研發的深度學習平臺飛槳,結合業界先進的工程服務技術打造,覆蓋視覺與自然語言處理兩大技術方向,支援一站式智慧標註、模型訓練、服務部署等全流程功能。目前EasyDL已經被廣泛應用在零售、網際網路、安全生產、工業質檢、教育、醫療、交通等20多個行業,擁有70多萬用戶。

使用EasyDL簡單三步即可完成NLP任務配置與訓練,效能優異。

那麼,文心這麼厲害,有沒有機會和高工面對面,快速掌握技術原理與實際應用?

本週六,百度資深研發工程師空降上海,一個上午從文心(ERNIE)技術解析到實戰演練為你解析如何定製企業高精度NLP模型。(文末海報報名哦)

我們先來點技術乾貨稍做預習,瞭解下文心(ERNIE)近期重磅上線的多項實用功能!

新增定製化多標籤文字分類功能

“多標籤文字分類”指對一段文字同時標記多個標籤,如:“未來的學和教正在發生顛覆,學生將會在家裡學習,機器人將走上講臺。”可對應標籤為“教育”、“科技”。該功能應用場景廣泛,如媒體場景中對新聞內容進行自動歸類,在內容推薦場景中利用內容標籤提升召回,通過自動標籤功能對知識文件進行多層級分類等。

目前,EasyDL平臺經典版和專業版均新增了這項功能,在“專業版”的任務配置過程中,開發者還可選擇ERNIE Tiny、ERNIE Large、ERNIE Base三種各有所長的預訓練模型。

新增定製化情感傾向分析功能

“情感傾向分析”指對一段文字進行“積極情感”或“消極情感”的判斷,如“酒店位置很好,服務周到熱情,下次一定會再來”的使用者評價,部署模型後可直接得到“Positive(積極情感)”的標籤和99%的置信度。

該功能最常應用於使用者評論分析和輿情分析,比如商品、店鋪的口碑分析,對事實性的新聞事件或網際網路話題進行輿情分析等,在汽車、餐飲、酒店等多個垂類上,分析準確率可達到95%以上。

目前,該功能已經上線EasyDL經典版,後續平臺將逐步增加基於實體級和句子級的情感分類,力求覆蓋更多的應用需求。

文字資料管理和資料標註功能全面升級

針對開發者資料管理和資料標註過程中的痛點,EasyDL支援了更加靈活的資料格式,當前可支援zip、Excel、TXT三種檔案格式進行上傳。除了提供線上標註能力外,還提供智慧標註功能,大幅降低了開發者的標註成本,開發者可直接上傳未標註資料體驗該功能。

圖:文字智慧標註示意圖

為了幫助企業及開發者更快理解文心(ERNIE)的技術原理與應用方法,本週六上午,就在上海徐彙區復興路1199號A座5層,百度AI快車道【EasyDL零門檻模型訓練營】,資深研發工程師詳解NLP技術能力,並帶來現場實操與面對面答疑解惑,助你三小時掌握EasyDL的NLP模型開發祕籍!