1. 程式人生 > >機器學習、資料探勘、計算機視覺等領域經典書籍推薦

機器學習、資料探勘、計算機視覺等領域經典書籍推薦

    人工智慧、機器學習、模式識別、計算機視覺、資料探勘、資訊檢索、自然語言處理等作為電腦科學重要的研究分支,不論是學術界還是工業界,有關這方面的研究都在如火如荼地進行著,學習這些方面的內容有一些經典書籍,現總結如下,方便自己和大家以後學習研究:

人工智慧:

《Artificial Intelligence: A Modern Approach》,第三版,Russell著,權威、經典的人工智慧教材,闡述了人工智慧的核心內容,反映了人工智慧最近10年來的新進展。

《ProgrammingCollective Intelligence》,Toby Segaran著,本書將帶你進入機器學習和統計學的世界,對演算法的描述簡明清晰,很對程式碼都可以直接拿去實際應用。

資料探勘:

《DataMining, Concepts and Techniques》,第三版,Han著,資料探勘領域最具里程碑意義的經典著作。

《DataMining: Practical Machine Learning Tools and Techniques》,第二版,Witten著,介紹了機器學習的基本理論和實踐方法,並提供了一個公開的資料探勘工作平臺Weka,演算法部分介紹得很詳細。

資訊檢索:

《An Introductionto Information Retrieval》,Manning著,這是一本介紹資訊檢索的入門書籍,書中對資訊檢索的基本概念和基本演算法做了介紹,適合初學者。

《Search Engines Information Retrieval in Practice》,Croft著,這本書講述了搜尋引擎的構造方法,通過實際程式碼展示了搜尋引擎的工作原理,對於學生和從事相關領域的工程師,本書都值得一看。

《Managing Gigabytes》,《Mining the Web -Discovering Knowledge from Hypertext Data》

《Information Theory:Inference and Learning Algorithms》

模式識別和機器學習:

《Pattern Classification 》,第二版,Duda著,模式識別的奠基之作,但對SVM、Boosting幾乎沒提,有掛一漏萬之嫌。

《Pattern Recognition and Machine Learning》,Bishop著,側重概率模型,詳細介紹了Bayesian方法、有向圖、無向圖理論等,體系完備。

《Kernel Methods for Pattern Analysis》,John Shawe-Taylor著,SVM等統計學的諸多工具裡都用到了核方法,可以將將低維非線性空間對映到高維的線性空間中,但同時會引入高維資料的難題。

計算機視覺:

《Computer Vision: A Modern Approach》,第二版,Forsyth著,一本不錯的計算機視覺教材,全書理論聯絡實際,並加入了計算機視覺領域的最新研究成果。

《Computer Vision: Algorithms and Applications》,Richard Szeliski的大作,《數字影象處理》課程老師推薦的一本書籍,這本書我還沒有看完,書中對計算機視覺領域最新的一些演算法進行了彙編,包括影象分割,特徵檢測和匹配,運動檢測,影象縫合,3D重建,物件識別等影象處理的諸多方面,藉助本書我們可以對最新主流影象處理演算法有個全域性把握。

線性代數:

《Linear Algebra and Its Applications》Fourth Edition, Gilbert Strang的著作,本書詳細介紹了向量空間、線性變換、本徵值和本徵向量等線性代數的重要基本概念,把抽象的線性空間形象地表達出來,適合初學者。

《Introduction to Probability Models》第10版,Ross著,一本書能夠發行到第十版,你說是不是很經典呢?

離散數學:

《Discrete Mathematics and Its Applications》,第六版,Rosen著,本書囊括了離散數學推導、組合分析、演算法及其應用、計算理論等多方面的內容,適合初學者。

矩陣數學:

《Matrix Analysis》,Horn著,本書無疑是矩陣論領域的經典著作了,風行幾十年了。

概率論與數理統計:

《All Of Statistics》,Wasserman著,一本數理統計的簡介讀本。

《Introductionto Mathematical Statistics》,第六版,Hogg著,本書介紹了概率統計的基本概念以及各種分佈,以及ML,Bayesian方法等內容。

《Statistical Learning Theory》Vapnik的大作,統計學界的權威,本書將理論上升到了哲學層面,他的另一本書《The Nature ofStatistical Learning Theory》也是統計學習研究不可多得的好書,但是這兩本書都比較深入,適合有一定基礎的讀者。

《統計學習方法》,李航著,國內很多大學都在用這本書,本書從具體問題入手,由淺入深,簡明地介紹了統計學習的主要方法,適合初學者而又想對統計學習理論有一個全域性理解的學生。

《The Elements of Statistical Learning-Data Mining, Inference, and Prediction》,第二版,Trevor Hastie著,機器學習方面非常優秀的一本書,較PC和PRML,此書更加深入,對工程人員的價值也許更大一點。

《AnIntroduction to Probabilistic Graphical Models》,Jordan著,本書介紹了條件獨立、分解、混合、條件混合等圖模型中的基本概念,對隱變數(潛在變數)也做了詳細介紹,相信大家在隱馬爾科夫鏈和用Gaussian混合模型來實現EM演算法時遇到過這個概念。

《Probabilistic Graphical Models-Principles and Techniques》,Koller著,一本很厚很全面的書,理論性很強,可以作為參考書使用。

最優化方法:

《Convex Optimization》,Boyd的經典書籍,被引用次數超過14000次,面向實際應用,並且有配套程式碼,是一本不可多得的好書,網址http://www.stanford.edu/~boyd/cvxbook/。

《Numerical Optimization》,第二版,Nocedal著,非常適合非數值專業的學生和工程師參考,演算法流程清晰詳細,原理清楚。

另外推薦幾個部落格和網站:

https://www.coursera.org/,這是一個由世界頂級大學聯合創辦的網上線上視訊公開課網站,裡面有stanford, MIT,CMU等電腦科學一流大學提供的免費教學視訊,內容全面,電腦科學方面的資源較網易視訊公開課網站(http://open.163.com/)內容要新、要全。

http://blog.csdn.net/pongba/article/details/2915005,本文的部分內容就是借鑑劉未鵬大神的部落格而來的,也正是看過他的那個書單後,我才決定寫一個總結歸納性的文章,這樣可以方便大家學習,更可以勉勵自己多看些有益的經典書籍。

http://blog.pluskid.org/,這是浙大學生張馳原的部落格網站,現在他去了MIT,部落格裡面的很多資源都值得一看,博文的很大一部分都是關於機器學習的,加入了作者自己的理解,深入淺出。