Python爬蟲學習必看
阿新 • • 發佈:2018-12-11
如果你用Python3寫爬蟲,強力推薦《Python網路資料採集》這本書,應該是目前最系統最完善介紹python爬蟲的書。可以去圖靈社群買電子版。
書的內容很新也很系統,從beautifulSoup,requests到ajax,影象識別,單元測試。比起絕大多數blog零散的教程要好的多,看完書後就可以去做些實戰專案,這個時候可以去github上找類似的專案借鑑下。
圖靈社群圖書:《Python網路資料採集》
國內也有一本講爬蟲的好書,《自己動手寫網路爬蟲》,這本書除了介紹爬蟲基本原理,包括優先順序,寬度優先搜尋,分散式爬蟲,多執行緒,還有云計算,資料探勘內容。只不過用了java來實現,但思路是相同的。
Python爬蟲靠系統學習固然好,直接寫一個專案出來效果更加簡單粗暴!(不過自己現在的水平寫出來都是流水一般的面向過程的程式碼,程式碼的重複部分太多,正在回過頭去學習面向物件程式設計,學習類和方法的使用。不過,我還是堅定地認為:入門的時候,應該直接簡單粗暴地實踐一個專案。
3、哪裡不會搜哪裡!哪裡報錯改哪裡!相信我你遇到的99%的問題都能從網上找到相似的問題,你需要做的就是寫程式碼!搜問題!調BUG!你搜不到解決辦法的情況下,80%的情況是你搜索的姿勢不對,另外20%可能需要你自己動動腦子,換個思路去做。
說了這麼多,要是現在的情況不適合你進行自學:或許是你的自制力不夠,或許是你沒有足夠多的時間自學,或許你需要更專業的課程學習…