1. 程式人生 > >自學的數據分析書單

自學的數據分析書單

偏差 miners 介紹 相關 多圖 vdp 翻譯 博士 link

入門版


適合對數據分析的入門者,對數據分析沒有整體概念的人,常見於應屆畢業生,經驗尚淺的轉行者。

1.深入淺出數據分析 (豆瓣):HeadFirst 類的書籍,一向淺顯易懂形象生動,可以對分析概念有個全面的認知。電子工業出版社的經典書目系列,從數據分析基本步驟開始、實驗方法、最優化方法、假設檢驗方法、貝葉斯統計方法、主觀概率法、啟發法、直方圖法、回歸法、誤差處理、相關數據庫、數據整理技巧一一講到。圖比較多,適合入門。

2.誰說菜鳥不會數據分析 (豆瓣):不僅講解了一些常見的分析技巧,並附帶 Excel 的一些知識以及數據分析在公司中所處的位置,對職場了解亦有一定幫助。

3.赤裸裸的統計學 (豆瓣):作者年輕時是個追求學習意義的學霸,後來自己從統計學中發掘了很多可以應用到生活的地方。這也是本書的主旨,結合生活講解統計知識,生動有趣。可以避免統計學一上來就大講貝葉斯概率和隨機分析的枯燥。

同樣類似的書籍還有「統計數字會撒謊 (豆瓣)」,這本書知名度要高點,不過我還沒看…

4.深入淺出統計學 (豆瓣):Headfirst 類書籍,可以幫助你快速了解統計方面的知識。
5.「網站分析實戰 (豆瓣)」,是國內一本講網站分析的書,沒有上面經典,但勝在新出,很多案例和理念都有及時的更新。 6.《數據之魅-基於開源工具的數據分析》鏈接:數據之魅 (豆瓣)
7.者是華盛頓大學理論物理學博士。這本書是數據分析的經典之一,包含大量的R語言模擬過程及結果展示,例舉了很多數據分析實例和代碼。 8.《數據挖掘-市場營銷、銷售與客戶關系管理領域應用》鏈接:數據挖掘技術 (豆瓣), 作者是Data Miners的創辦人,有二十多年的營銷和客戶關系管理結合數據挖掘的經驗。詳細介紹了作為一個數據挖掘團隊需要的知識體系,包括數據庫、SAS使用、統計學、機器學習、數據可視化、如何訪問用戶收集需求、如何寫論文與溝通等等。有條件的建議看英文原版。 9.《Data Analytics for Beginners: Basic Guide to Master Data Analytics》
入門五星推薦。裏面很多圖表實例,手把手教你如何EXCEL畫圖,對各種知識點(平均值,模式,中值,方差,標準偏差)的講解相當的到位,比起大學裏的各種課本靠譜。
10.統計學基礎書可以看一下::統計學習三大巨匠Trevor Hastie, Robert Tibshirani和Friedman《the elements of statistical learning》了,也提到了Trevor Hastie, Robert Tibshirani的13年的新書《An Introduction to Statistical Learning: with Application in R》 《the elements of statistical learning》中文版是清華大學出的版社的《統計學習基礎》
,這個嘛,不推薦,翻譯得不好,很多術語和表述都不夠"統計",但是我認為能翻譯巨作的,都是有貢獻的。
技術分享
《An Introduction to Statistical Learning: with Application in R》的中文版是機械工業出版社的《統計學習導論:基於R的應用》,15年6月份出來的新書,譯者和原書作者都是在同一個領域搞研究的,可以說是同宗同源啦,水平也是相當高的;以前找我推薦書的,都被安利了這本;甚至還有書還沒上市就被我安利的人...
技術分享
也有回答提到了吳喜之老師的《從數據到結論》,其實我會更加推薦吳喜之老師的另外一本《統計學:從概念到數據分析》,這本書搜索成本比《從數據到結論》要稍微高一點,吳老師一慣的風格,書特別薄,三言兩語點透方法的精髓;而且也都有R代碼;
技術分享

進階版 1.《Doing Data Scienc》中文版圖書鏈接:https://book.douban.com/subject/26320485/ 作者Cathy O’Neil是哈佛大學的博士,MIT的數據博士後,曾今作為一名Quant在對沖基金D.E. Shaw 工作,目前是一家紐約初創公司的Data scientist 。這本書需要有一定的編程和理論基礎,作為入門教材來說有點難,雖然只有400來頁,但是涉及的知識點很全面。每一章節的核心內容都附有編程案例,R/Python/Shell三種語言任君挑選。 2.《Python for Data Analysis》中文版圖書鏈接:https://book.douban.com/subject/25779298/
Python數據分析必看,適合入行不久的數據分析師。作者有多年的Python數據分析工作經驗,對各種Pyhon包iPython,NumPy,pandas,matpotlib等有著很深的理解。看完這本,敲完代碼,Python數據分析就算入行了。 3.《Data Science for Business
很多牛人為之作序,數據科學如何與商業結合,相信這本書會給你一些啟發。 4.Python Data Science Handbook》一本包含Python數據分析各個包的工具書,比如numpy pandas matplotlib scikit learn等,便於學習查閱使用。 2016年6月出版的,500頁保質保量,作者(Jake VanderPlas)是華盛頓大學電子科學研究所的高級數據科學研究員,研究領域包括天文統計學、機器學習和可擴展計算。書的前半部分介紹了用於數據分析和一般的科學計算的基本Python庫,後面從實際應用的角度使用Python庫scikit-learn開始機器學習實踐。適合有一定Python基礎人(或者R基礎),並且想學習如何使用Python進行數據分析的人。 5.Storytelling with Data

作者Cole NussbaumerKnaflic,私募分析師,前Google人力分析團隊總監。本書展示了如何高效率展示量化資訊,如何用豐富的資料講故事。Google內部的數據可視化課程講師,之前也在Maryland Institute College of Art兼職講師。如果你想知道如何以圖敘事,這邊好書不容錯過。

這些推薦全部轉載於知乎如下坐著的推薦,僅作為本人學習目的用途。
作者:呆小槑
鏈接:https://www.zhihu.com/question/19640095/answer/90456737
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。 作者:Han Hsiao
鏈接:https://www.zhihu.com/question/19640095/answer/24240031
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。 作者:張溪夢 Simon
鏈接:https://www.zhihu.com/question/20757000/answer/119738611
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。

自學的數據分析書單