自然語言處理(一)NLP概述
阿新 • • 發佈:2018-12-27
NLP概述
NLP是利用計算機為工具,對人類特有的書面形式和口頭形式的自然語言的資訊進行各種型別處理和加工的技術.
NLP內容結構
NLP基礎技術
詞法分析
詞法分析目的是從句子中分出單詞,找出詞彙的各個詞素,從中獲得單詞的語言學資訊並確定單詞的詞性. 詞法分析是很多中文資訊處理任務的必要步驟.
- 自動分詞
- 命名實體識別
- 詞性標註
句法分析
句法分析是對句子和短語結構進行分析,如句子的形式結構:主語、謂語、賓語等. 句法分析是語言學理論和實際的自然語言應用的一個重要橋樑. 一個實用的、完備的、準確的句法分析將是計算機真正理解自然語言的基礎.
- 短語結構分析(賓州樹庫)
- 依存分析
語義分析
解釋自然語言句子或篇章各部分(詞、片語、句子、段落、篇章)的意義. 目前語義計算的理論、方法、模型尚不成熟.
- 詞義消歧(詞)
- 語義歸納、推理(詞)
- 語義角色標註(句子)
篇章分析
指超越單個句子範圍的各種可能分析,包括句子(語段)之間的關係以及關係型別的劃分,段落之間的關係的判斷,跨越單個句子的詞與詞之間的關係分析,話題的繼承與變遷等.
NLP核心應用
- 機器翻譯(Machine translation, MT)
- 資訊檢索(Information Retrieval)
- 資訊抽取(Information Extraction)
- 自動文摘(Automatic summarization/abstracting)
- 問答系統(Question-Answering system)
- 閱讀理解(Machine Reading)
- 文件分類(Document categorization)
- 情感分類(Sentimental classification)
- 資訊推薦與過濾(Formation Recommendation and Filtering)
NLP技術及應用架構
NLP領域的學術會議
- ACL(Association of Computational Linguistics)
- Coling(International Conference on Computational Linguistics)
- EMNLP(Conference on Empirical Methods in Natural language Processing)
- EACL(European Chapter of ACL)
- IJCNLP(International Joint Conference on Natural language Processing)
- SIGIR(SIG Information Retrieval)
- TREC(Text REtrievalConference)
- JSCL(全國計算語言學聯合學術會議)
國內NLP研究組
- Tencent AI Lab
- 蘇州大學NLP實驗室
- 微軟亞洲研究院自然語言計算組NaturalLanguageComputing(NLC)Group
- 頭條人工智慧實驗室
- 清華大學自然語言處理與社會人文計算實驗室
- 清華大學智慧技術與系統國家重點實驗室資訊檢索組
- 北京大學計算語言學教育部重點實驗室
- 北京大學計算機科學技術研究所語言計算與網際網路挖掘研究室
- 哈工大社會計算與資訊檢索研究中心
- 哈工大機器智慧與翻譯研究室
- 哈爾濱工業大學智慧技術與自然語言處理實驗室
- 中科院計算所自然語言處理研究組
- 中科院自動化研究所語音語言技術研究組
- 南京大學自然語言處理研究組
- 復旦大學自然語言處理研究組
- 東北大學自然語言處理實驗室
- 廈門大學智慧科學與技術系自然語言處理實驗室
參考資料
中國科學院大學-NLP課程課件(IIE胡玥老師主講)