1. 程式人生 > 實用技巧 >會議交流 - CNCC 技術論壇 | NLP中知識和資料怎麼選?當然是全都要!——第四屆中文資訊科技發展戰略研討會...

會議交流 - CNCC 技術論壇 | NLP中知識和資料怎麼選?當然是全都要!——第四屆中文資訊科技發展戰略研討會...

本文轉載自公眾號:中國計算機學會 。


本論壇將於CNCC2020期間,10月23日下午16:00-18:00,在北京新世紀日航飯店3層南京廳舉行。本論壇將邀請多位來自國內著名高校和人工智慧企業的知名自然語言處理專家介紹他們在知識圖譜、知識獲取、預訓練模型、表示學習等方面的最新研發進展。歡迎光臨!

自然語言處理技術是人工智慧技術的最重要分支之一,被譽為“人工智慧皇冠上的明珠”。近年來,各種來源的標註資料、未標註資料、自然標註資料為基於機器學習、深度學習的自然語言處理提供了海量的訓練語料,為自然語言處理演算法效能的巨大提升提供了資料保障;知識圖譜、百科知識、問答知識等知識資源為自然語言處理技術的實用化進一步插上了翅膀。本次論壇將以融合知識和資料的自然語言處理為主題,邀請多位來自國內著名高校和人工智慧企業的知名自然語言處理專家介紹他們在知識圖譜、知識獲取、預訓練模型、表示學習等方面的最新研發進展。

講者簡介

浙江大學

陳華鈞

報告一題目: 知識圖譜與低資源學習

報告摘要: 低資源是很多真實業務問題所面臨的迫切挑戰,本報告嘗試探討知識圖譜與低資源問題之間的關係。一方面,討論低資源條件下知識圖譜的構建與推理問題,分別介紹了對抗關係學習(Adversarial Relational Learning),元關係學習(Meta Relational Learning)以及融合圖神經網路等不同方法在長尾關係抽取、少樣本關係預測等方面的應用。另外一方面,進一步探討知識圖譜與零樣本學習(Zero-shot Learning)之間的關係,提出利用知識圖譜建模標籤語義空間可以更加有效實現零樣本條件下的知識遷移,同時增強零樣本學習的可解釋性。

報告人簡介: 陳華鈞博士,浙江大學電腦科學與技術學院教授/博導,主要研究方向為知識圖譜、自然語言處理、大資料系統、智慧生物醫藥等。浙大阿里知識引擎聯合實驗室主任、浙江省大資料智慧計算重點實驗室副主任、愛思唯爾Elsevier Big Data Research 主編、CCF傑出演講者、中國人工智慧學會知識工程與分佈智慧專業委員會副主任、中國中文資訊學會語言與知識計算專業委員會副主任、中文開放知識圖譜OpenKG牽頭髮起人。在WWW/WSDM/ISWC, IJCAI/AAAI/KR, ACL/EMNLP/NAACL, VLDB/ICDE, IEEE Computational Intelligence, IEEE Intelligent System, TKDE, AI in Medicine 等國際頂級會議或期刊上發表多篇論文,並曾獲國際語義網會議ISWC2006最佳論文獎(第一作者)。作為負責人主持國家自然科學基金重點專案、國家重點研發計劃專案、國家重大科技專項專案及企業合作專案等二十餘項。曾獲得教育部技術發明一等獎、國家科技進步二等獎、阿里巴巴優秀學術合作獎、博文視點圖書獎等獎勵。

清華大學

劉知遠

報告二題目: 開放域知識獲取技術及其挑戰

報告摘要: 從海量文字中自動獲取結構化知識,是構建和擴充套件大規模知識圖譜,實現知識指導的自然語言處理的關鍵技術。現有實體關係抽取技術,主要從單句中挖掘實體關係的語義模式,面臨知識覆蓋度低等問題。如何面向開放領域的複雜語境進行建模,是知識獲取面臨的關鍵挑戰之一。本報告將主要介紹在文件級關係抽取、少次學習關係抽取、新型別關係識別等方面的最新進展,並展望開放域關係抽取的未來發展方向。

報告人簡介: 劉知遠博士,清華大學計算機系副教授、博士生導師。主要研究方向為表示學習、知識圖譜和社會計算。2011年獲得清華大學博士學位,已在ACL、IJCAI、AAAI等人工智慧領域的著名國際期刊和會議發表相關論文80餘篇,Google Scholar統計引用超過1萬次。承擔多項國家自然科學基金。曾獲中文資訊學會青年創新獎,入選《麻省理工科技評論》“35歲以下科技創新35人”中國區榜單(MIT TR-35 China)、智源青年科學家、中國科協青年人才託舉工程。

微軟亞洲研究院

段楠

報告三題目: Learning Universal Representations via Multitask Multilingual Multimodal Pre-training

報告摘要:In this talk, we will first review the most representative pre-trained models and then present a Multitask Multilingual Multimodal Pre-trained model (M^3P) that combines multilingual-monomodal pre-training and monolingual-multimodal pre-training into a unified framework via multitask learning. This model learns universal representations that can map objects occurred in different modalities or expressed in different languages to vectors in a common semantic space. To verify the generalization capability of M3P, we fine-tune the pre-trained model for different types of downstream tasks: multilingual image-text retrieval, multilingual image captioning, multimodal machine translation, multilingual natural language inference and multilingual text generation. Evaluation shows that M3P can (i) achieve comparable results on multilingual tasks and English multimodal tasks, compared to the state-of-the-art models pre-trained for these two types of tasks separately, and (ii) obtain new state-of-the-art results on non-English multimodal tasks in the zero-shot or few-shot setting. In the last part, we will present our current progress and future plan on learning better universal representations based on different types of knowledge.

報告人簡介: 段楠博士,微軟亞洲研究院高階研究員/研究經理,從事包括自動問答、語義分析、多語言多模態預訓練、機器推理等在內的自然語言處理基礎研究,多項成果用於必應搜尋、必應廣告、微軟新聞、語音助手等人工智慧產品。CCF A/B類會議發表學術論文80餘篇,著有《智慧問答》。

論壇:融合知識和資料的自然語言處理

嘉賓:陳華鈞 浙江大學,劉知遠 清華大學,段楠 微軟亞洲研究院,趙軍 中科院自動化所,邱錫鵬 復旦大學

論壇主題:3位講者和2位論壇嘉賓將同臺就融合知識和資料的自然語言處理技術的發展和應用場景進行進一步研討。專家與聽眾互動,展現更多角度的觀點,啟發與會者對知識和資料在自然語言處理中如何作用和融合的更深認識。

嘉賓簡介:

趙軍,中國科學院自動化研究所模式識別國家重點實驗室研究員,博士生導師;中國科學院大學人工智慧學院崗位教授。研究領域為自然語言處理、知識圖譜等。發表論文80餘篇,谷歌學術引用9千餘次。曾獲第25屆國際計算語言學大會COLING 2014最佳論文獎,曾獲2018年度中國中文資訊學會“錢偉長中文資訊處理科學技術獎”一等獎。在中國科學院大學主講《知識圖譜導論》等課程,主持編著《知識圖譜》一書入選國家十三五重點圖書出版規劃。

嘉賓簡介:

邱錫鵬博士,復旦大學計算機科學技術學院教授,博士生導師,於復旦大學獲得理學學士和博士學位。主要從事自然語言處理、深度學習等方向的研究,發表CCF-A類論文30餘篇,獲ACL2017傑出論文獎,CCL 2019最佳論文獎,領導開發了被廣泛使用的開源自然語言處理框架FudanNLP和FastNLP,獲中國中文資訊學會“錢偉長中文資訊處理科學技術獎青年創新一等獎”,中國科協人才託舉工程,Aminer “2020年度AI 2000人工智慧全球最具影響力提名學者”。

點選“閱讀原文”,報名參會。



OpenKG

開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜資料的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。