機器學習和資料科學領域必讀的10本免費書籍
雲棲君導讀:在這個暑假,有興趣的可以閱讀一下這些免費的有關機器學習和資料科學的書籍,他們能給你開啟一扇看清機器學習和資料科學的窗。
1. Python Data Science Handbook
作者:Jake VanderPlas
本書介紹了在Python中處理資料所必需的核心庫,特別是IPython,NumPy,Pandas,Matplotlib,Scikit-Lean和相關的軟體包。在此之前您需要掌握Python這種語言,如果您想快速掌握這門語言,可以參閱這個針對研究人員和科學家的Python語言快速入門的“Python的旋風之旅(A Whirlwind Tour of Python)”。
書籍地址:
https://github.com/jakevdp/PythonDataScienceHandbook
2. Neural Networks and Deep Learning
作者:Michael Nielsen
這是一本免費的線上書籍。通過這本書你會知道神經網路是一個美麗的生物啟發式程式設計範例,使計算機可以從觀測資料中學習。而深度學習則是一套強大的神經網路學習技術。
目前,神經網路和深度學習為影象識別、語音識別和自然語言處理(NLP)中的問題提供了很多效果不錯的解決方案。通過這本書您將會知道更多神經網路和深度學習背後的核心概念。
書籍地址:
http://neuralnetworksanddeeplearning.com/
3. Think Bayes
作者:Allen B.Downey
這本書主要介紹瞭如何使用計算方法處理貝葉斯統計。
如果您想使用本書中的技能來學習其他技能,您需要知道如何程式設計。
貝葉斯統計是根據數學概念(如微積分)提出的,有關它的大多數書籍也都使用的是數學符號。本書使用Python程式碼而不是數學,因此“積分”變成了“總和”。這是書中的一個特色。
書籍地址:
http://greenteapress.com/wp/think-bayes/
4. Machine Learning & Big Data
作者:Karee Alkaseer
這本書背後的目的是為了讓軟體工程師在不依賴庫的情況下可以輕鬆使用機器學習模型。大多數情況下,模型或技術背後的概念很簡單、直觀,但在細節或行話中會丟失。另外,一般情況下,現有的庫可以解決手頭的問題,但是有時候它們會用自己的方式抽象和隱藏基本概念,這就是它們被稱為“黑盒子”的原因。這本書也嘗試著將“黑盒子”裡被抽象和隱藏的基本概念清晰化。它是一個還在進行中的作品,它的內容將慢慢的豐富。
書籍地址:
http://www.kareemalkaseer.com/books/ml
5. Satistical Learning with Sparsity:The Lasso and Generalizations
作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright
在過去的十年中,計算和資訊科技得到了迅猛發展。隨著它的應用,在醫學、生物學、金融和市場營銷等領域中湧現出了大量的資料。本書在一個共同的概念框架下,闡述了這些領域中的一些重要觀點。
書籍地址:
https://web.stanford.edu/~hastie/StatLearnSparsity/
6. Statistical inference for data science
作者:Brian Caffo
作為資料科學專業的一部分 ,本書是統計推理課程(Statistical Inference)的一本配套書籍。如果你沒有上這門課,也可以配著YouTube上有關視訊單獨學習這本書。
本書旨在以低成本介紹統計推理這一重要領域,使得具有程式設計能力的學生將這些技能用到資料科學或統計學當中去。
書籍地址:
https://leanpub.com/LittleInferenceBook
7. Convex Optimization
作者:Stephen Boyd & Lieven Vandenberghe
這本書的主要內容是關於凸優化(convex optimization),這是一類特殊的數學優化問題,它包括最小二乘和線性規劃問題。眾所周知,最小二乘和線性規劃問題有一個相當完整的理論,出現在各種應用中,並且可以非常有效地用數值求解。本書的基本觀點是,對於較大類的凸優化問題也可以如此。
書籍地址:
http://stanford.edu/~boyd/cvxbook/
8. Natural Language Processing with Python
作者:Steven Bird & Ewan Klein & Edward Loper
本書基於Python程式語言和一個叫自然語言工具包(NLTK)的開源庫寫作而成的。“自然語言”是指用於人類日常交流的語言,與程式語言和數字符號等語言不同,自然語言在代代相傳的過程中不斷髮展,並且很難用明確的規則來確定。為了讓計算機更好地理解自然語言,我們開發運用了自然語言處理(NLP)。這本書就是有關自然語言處理(NLP)的書。
書籍地址:
https://www.nltk.org/book/
9. Automate the Boring Stuff with Python
作者:AI Sweigart
你是否有過為花費數小時為檔案重新命名或更新表格裡的數百個單元格而煩躁的經歷?在這本書中,你將會學到如何使用Python來輕鬆搞定這些問題。Python十分好上手,一旦掌握了程式設計的基礎知識,就可以建立Python程式,就此輕鬆解決那些繁瑣的事情。
書籍地址:
https://automatetheboringstuff.com/
10.Social Media Mining: An Introduction
作者:Reza Zafarani & Mohammad Ali Abbasi & Huan Liu
社交媒體在過去十年的發展已經徹底革新了個人互動和行業開展業務的方式。個人通過社交媒體互動、共享產生了大量的資料。
在這本書中,你將瞭解到社交媒體挖掘(Social Media Mining)整合了社交媒體,社交網路分析和資料探勘,為學生、從業人員、研究人員等提供了一個方便而一致的平臺。同時也將會了解到社交媒體挖掘(Social Media Mining)的潛力。
書籍地址:
http://dmml.asu.edu/smm/
本文由阿里云云棲社群組織翻譯。
文章原標題《10 More Free Must-Read Books For Machine Learning and Data Science》
作者:Matthew Mayo
譯者:烏拉烏拉,審校:袁虎。
文章為簡譯,更為詳細的內容,點選左下角閱讀原文檢視。
更多精彩
點此檢視原文!