用 Python 進行資料分析,不懂 Python,求合適的 Python 書籍或資料推薦?
阿新 • • 發佈:2019-02-14
我自己的碩士論文是用Python做資料分析的(https://github.com/cqcn1991/Wind-Speed-Analysis)
這個回答,可能不是很適合題主。題主應該就是想稍微用一下Python. 我這裡介紹的是系統性、偏重使用的。
1. 什麼樣的教程最好,最快、最適合入門
對於0基礎的人來說,最簡答的辦法是從例子開始。比如說,一個實際的資料分析,然後你跟著走一邊,從讀入資料、畫圖,怎麼解釋資料,其實就都大概懂了。而不是先去學Python語言特性,然後再去看某些庫的文件(Numpy, Matplotlib, Pandas等等)。
另外重要的,就是最好能有視訊教程。因為你可能也不知道怎麼安裝、使用Python和相關的庫,怎麼使用Git, 用什麼樣的編輯器(IDE)來寫程式碼等等。這些東西,如果有視訊的話,其實就一目瞭然了。看起來比書快很多。
也就是說最理想的教程,應該是以例子入手(而不是Python基礎、要素入手),而且最好有視訊
2. 具體教程
國內中文的教程不清楚;英文的話,目前沒有碰到過特別優秀的,完全符合上述要求的
說說我熟悉的教程,都是英文的
①Havard CS109 Data Science
http://cs109.github.io/2015/
首推。內容包括最基礎的概率、統計分析,到更深的Machine Learning。既包括理論內容講解,也包括實際的程式設計(用的Python)。課堂講解、程式均有相應視訊(而且有英文字幕)。有案例作業,拿資料進行分析,可以仔細的學習參考答案裡面的程式碼(也就是有程式設計案例)。完全免費。
不過,為什麼還要學概率論這些一大堆東西?(這也是我最開始說的,這篇答案不是適合樓主的輕量級需求)
因為,你以為你想要學的是Python, 而實際上是分析資料的方法,這個是任何文件、程式設計的書無法教給你的。但卻是最重要的。也就是背後的理論、思考等等。
這個教程唯一的缺點,就是沒有書。很難去快速查詢、複習。比如再學完這門課,碰到一個東西,想要查的時候。無從查起。
②Udemy, Learning Python for Data Analysis and Visualization
https://www.udemy.com/learning-python-for-data-analysis-and-visualization/
當時,按照我對於理想教程的要求,買的。Udemy上評價最好,賣得最好的教程
然而,並不好。不推薦。
為什麼?因為這裡的視訊,僅僅是把文件重新講了一遍,在最後才有一個例子。沒有人需要先學習如何“查詢資料”,如何“畫柱狀圖”。這種東西大家都可以搜得到。真正缺乏的,是以問題為導向,把這些東西實際運用起來。
對我來說,這個教程最大的好處,是知道了Kaggle,可以瞻仰一下真正大牛們是怎樣用Data Science來解決問題的
剩下的,就沒有什麼教程了。也就是我開始說的,缺乏系統性的教程。只是,再次強調一下,不學什麼。
不從0開始學Python語言。
為什麼?簡單的If, For loop這些,其實大家都會。Python的基本語言,一看就懂,完全不需要在開始去系統的讀Python的教學。真正缺的,反而是例子,而且是使用Pandas, Matplotlib等等庫的例子。
這樣子,能夠在最短的時間內,見到學習效果。
只有當你真正發現,Python不會寫。或者程式碼組織很麻煩。或者看到的程式碼不理解的時候,才需要去認真學Python語言。其實這個時候,也才真正學得進去。
或者,可以直接讀《Data Science from Scratch: First Principles with Python》,裡面Python Crash Course一部分,1個小時就足夠了解Python的基本語法和一些特性。 這本書裡其他的東西,就完全不要看了。因為是講的是如何去實現Pandas, Numpy中的某些內容。而沒有講實際Pandas, Numpy等等的使用技巧。
3. 一些補充
就像上面說的,Python只是一門語言。一般的資料分析,Python, R, Matlab,甚至Excel都可以做。很多同學可能已經會Matlab了,那麼其實直接用Matlab就行了
這個回答,可能不是很適合題主。題主應該就是想稍微用一下Python. 我這裡介紹的是系統性、偏重使用的。
1. 什麼樣的教程最好,最快、最適合入門
對於0基礎的人來說,最簡答的辦法是從例子開始。比如說,一個實際的資料分析,然後你跟著走一邊,從讀入資料、畫圖,怎麼解釋資料,其實就都大概懂了。而不是先去學Python語言特性,然後再去看某些庫的文件(Numpy, Matplotlib, Pandas等等)。
另外重要的,就是最好能有視訊教程。因為你可能也不知道怎麼安裝、使用Python和相關的庫,怎麼使用Git, 用什麼樣的編輯器(IDE)來寫程式碼等等。這些東西,如果有視訊的話,其實就一目瞭然了。看起來比書快很多。
也就是說最理想的教程,應該是以例子入手(而不是Python基礎、要素入手),而且最好有視訊
2. 具體教程
國內中文的教程不清楚;英文的話,目前沒有碰到過特別優秀的,完全符合上述要求的
說說我熟悉的教程,都是英文的
①Havard CS109 Data Science
http://cs109.github.io/2015/
首推。內容包括最基礎的概率、統計分析,到更深的Machine Learning。既包括理論內容講解,也包括實際的程式設計(用的Python)。課堂講解、程式均有相應視訊(而且有英文字幕)。有案例作業,拿資料進行分析,可以仔細的學習參考答案裡面的程式碼(也就是有程式設計案例)。完全免費。
不過,為什麼還要學概率論這些一大堆東西?(這也是我最開始說的,這篇答案不是適合樓主的輕量級需求)
因為,你以為你想要學的是Python, 而實際上是分析資料的方法,這個是任何文件、程式設計的書無法教給你的。但卻是最重要的。也就是背後的理論、思考等等。
這個教程唯一的缺點,就是沒有書。很難去快速查詢、複習。比如再學完這門課,碰到一個東西,想要查的時候。無從查起。
②Udemy, Learning Python for Data Analysis and Visualization
當時,按照我對於理想教程的要求,買的。Udemy上評價最好,賣得最好的教程
然而,並不好。不推薦。
為什麼?因為這裡的視訊,僅僅是把文件重新講了一遍,在最後才有一個例子。沒有人需要先學習如何“查詢資料”,如何“畫柱狀圖”。這種東西大家都可以搜得到。真正缺乏的,是以問題為導向,把這些東西實際運用起來。
對我來說,這個教程最大的好處,是知道了Kaggle,可以瞻仰一下真正大牛們是怎樣用Data Science來解決問題的
剩下的,就沒有什麼教程了。也就是我開始說的,缺乏系統性的教程。只是,再次強調一下,不學什麼。
不從0開始學Python語言。
為什麼?簡單的If, For loop這些,其實大家都會。Python的基本語言,一看就懂,完全不需要在開始去系統的讀Python的教學。真正缺的,反而是例子,而且是使用Pandas, Matplotlib等等庫的例子。
這樣子,能夠在最短的時間內,見到學習效果。
只有當你真正發現,Python不會寫。或者程式碼組織很麻煩。或者看到的程式碼不理解的時候,才需要去認真學Python語言。其實這個時候,也才真正學得進去。
或者,可以直接讀《Data Science from Scratch: First Principles with Python》,裡面Python Crash Course一部分,1個小時就足夠了解Python的基本語法和一些特性。 這本書裡其他的東西,就完全不要看了。因為是講的是如何去實現Pandas, Numpy中的某些內容。而沒有講實際Pandas, Numpy等等的使用技巧。
3. 一些補充
就像上面說的,Python只是一門語言。一般的資料分析,Python, R, Matlab,甚至Excel都可以做。很多同學可能已經會Matlab了,那麼其實直接用Matlab就行了