1. 程式人生 > >關鍵字提取工具(面向英文)

關鍵字提取工具(面向英文)

最近研究關鍵字提取技術(畢設需要)。語料集是英文。推薦一些相關工具。

作為窮人,必然是開源的優先,目前主要使用了RAKE,KEA和maui indexer。
最初接觸RAKE(Rapid Automatic Keyword Extraction)演算法是通過伯樂線上的一篇翻譯版的文章(http://python.jobbole.com/82230/),這篇文章的原作者是Alyona Medelyan,RAKE的更新版本就是她完成的,muai indexer也是她的傑作,她的GitHub上有很多關鍵字提取的專案。(https://github.com/zelandiya),目前在紐西蘭經營了一家NLP相關的公司。大部分論文和資料都可以在提供的連結中找到。

參考文獻:
[1 ] Automatic keyword extraction from individual documents。
[2 ] KEA Practical Automatic Keyphrase Extraction
[3 ] Keyphrase Extraction in Scientific Publications