1. 程式人生 > >乾貨 | 自然語言處理入門資料推薦

乾貨 | 自然語言處理入門資料推薦

微信公眾號

關鍵字全網搜尋最新排名

【機器學習演算法】:排名第一

【機器學習】:排名第一

【Python】:排名第三

【演算法】:排名第四

| AI深入淺出

最近幾個月小編遨遊在稅務行業的智慧問答調研和開發中,裡面涉及到了很多的自然語言處理NLP的功能點。雖然接觸NLP也有近兩年的時間了,現在真正要應用到問答中,避免不了還是需要再重新熟識並深入研究理解。

下面是與NLP相關的一些書籍推薦、課件推薦和開源工具推薦。

主要是記錄下入門的資料,由於資料的儲存位置沒有做規整,所以本文沒有附帶資源下載連結。如果有同學需要其中的資源,可以在公眾號上給我留言,回頭我把資源連結反饋給您。

部分開源工具和語料資源

1、NLTK官方提供的語料庫資源列表

2、OpenNLP上的開源自然語言處理工具列表

3、斯坦福大學自然語言處理組維護的“統計自然語言處理及基於語料庫的計算語言學資源列表” 

4、LDC上免費的中文資訊處理資源

課件

1、哈工大劉挺老師的“統計自然語言處理”課件; 

2、哈工大劉秉權老師的“自然語言處理”課件;

3、中科院計算所劉群老師的“計算語言學講義“課件; 

4、中科院自動化所宗成慶老師的“自然語言理解”課件; 

5、北大常寶寶老師的“計算語言學”課件;

6、北大詹衛東老師的“中文資訊處理基礎”的課件及相關程式碼; 

7、MIT大牛Michael Collins的“Machine Learning Approaches for Natural Language Processing(面向自然語言處理的機器學習方法)”課件; 

8、Michael Collins的“Machine Learning (機器學習)”課件; 

9、SMT牛人Philipp Koehn “Advanced Natural Language Processing(高階自然語言處理)”課件; 

10、Philipp Koehn “Empirical Methods in Natural Language Processing”課件; 

11、Philipp Koehn“Machine Translation(機器翻譯)”課件。

書籍

1、《自然語言處理綜論》英文版第二版 

2、《統計自然語言處理基礎》英文版 

3、《用Python進行自然語言處理》,NLTK配套書 

4、《Learning Python第三版》,Python入門經典書籍,詳細而不厭其煩 

5、《自然語言處理中的模式識別》

6、《EM演算法及其擴充套件》 

7、《統計學習基礎》 

8、《自然語言理解》英文版(似乎只有前9章) 

9、《Fundamentals of Speech Recognition》,質量不太好,不過第6章關於HMM的部分比較詳細,作者之一便是Lawrence Rabiner; 

10、概率統計經典入門書:

《概率論及其應用》(英文版,威廉*費勒著) 第一卷  第二卷  DjVuLibre閱讀器(閱讀前兩卷書需要) 

11、一本利用Perl和Prolog進行自然語言處理的介紹書籍:《An Introduction to Language Processing with Perl and Prolog》

12、國外機器學習書籍之: 

1) “Programming Collective Intelligence“,中文譯名《集體智慧程式設計》,機器學習&資料探勘領域”近年出的入門好書,培養興趣是最重要的一環,一上來看大部頭很容易被嚇走的” 

2) “Machine Learning“,機器學習領域無可爭議的經典書籍,下載完畢將字尾改為pdf即可。

豆瓣評論 by 王寧):老書,牛人。現在看來內容並不算深,很多章節有點到為止的感覺,但是很適合新手(當然,不能”新”到連演算法和概率都不知道)入門。比如決策樹部分就很精彩,並且這幾年沒有特別大的進展,所以並不過時。另外,這本書算是對97年前數十年機器學習工作的大綜述,參考文獻列表極有價值。國內有翻譯和影印版,不知道絕版否。 

3) “Introduction to Machine Learning” 

13、國外資料探勘書籍之: 

1) “Data.Mining.Concepts.and.Techniques.2nd“,資料探勘經典書籍。華裔科學家寫的書,相當深入淺出。 

2) Data Mining:Practical Machine Learning Tools and Techniques 

3) Beautiful Data: The Stories Behind Elegant Data Solutions( Toby Segaran, Jeff Hammerbacher) 

14、國外模式識別書籍之: 

1)“Pattern Recognition” 

2)“Pattern Recongnition Technologies and Applications” 

3)“An Introduction to Pattern Recognition” 

4)“Introduction to Statistical Pattern Recognition” 

5)“Statistical Pattern Recognition 2nd Edition” 

6)“Supervised and Unsupervised Pattern Recognition” 

7)“Support Vector Machines for Pattern Classification” 

15、國外人工智慧書籍之: 

1)Artificial Intelligence: A Modern Approach (2nd Edition) 人工智慧領域無爭議的經典。 

2)“Paradigms of Artificial Intelligence Programming: Case Studies in Common LISP” 

16、其他相關書籍: 

1)Programming the Semantic Web,Toby Segaran , Colin Evans, Jamie Taylor 

2)Learning.Python第四版,英文

640?wx_fmt=jpeg640?wx_fmt=png

加入微信機器學習交流

請新增微信:guodongwe1991

備註姓名-單位-研究方向

廣告、商業合作

請新增微信:guodongwe1991

(備註:商務合作)