1. 程式人生 > >45 個快速提升資料科學技能的方法

45 個快速提升資料科學技能的方法

0?wx_fmt=jpeg作者 | Kirill Eremenko 

編譯 | 夜風輕揚



在大資料時代,一名合格的資料科學家錢途廣闊,如何能快速起步少走彎路呢,希望本文會對你有所啟迪。

當詢問領英群組成員:在成為成熟資料科學家過程中,面臨的最大挑戰是什麼?得到最多的回答有:

  • 不知道目標是什麼

  • 缺乏經驗

  • 無法形成網路

  • 難以接觸到真正有用的人


作為迴應,筆者從SuperDataScience 播客嘉賓中收集了45種方法,希望能有所幫助。

開始起步


學習


1. 擠出時間


Kimberly Deas建議花費1年時間來學習資料科學中的必要技術,學習類似c++的指令碼語言,以熟悉程式設計的語法和程式設計技巧。

2. 閱讀!


播客的嘉賓推薦了很多書目,這裡不能一一列出,只給出其中的幾本: 

  • The Signal and the Noise(訊號與噪聲), Nate Silver 

  • Big Data: A Revolution That Will Transform How We Live, Work, and Think(大資料:將會改變我們生活,工作和思考的革命), Viktor Mayer-Schönberger and Kenneth Cukier 

  • Moneyball: The Art of Winning an Unfair Game(點球成金:贏取一場不公平比賽的藝術), Michael Lewis 

  • The Future of the Mind(思想的未來), Michio Kaku 

  • Dataclysm(資料災難), Christian Rudder 

0?wx_fmt=gif


3. 採用多種學習方法


千篇一律的學習方法讓人厭煩。採用線上課程?嘗試訂閱一份期刊。只閱讀課本?為何不在上班的路上聽聽播客呢?還可以向行業裡的老司機學習

練習


4. 不要陷入理論中


像Emma Whyte那樣,把所學的知識應用到實際生活中。

5. 利用EXCEL進行訓練


對於初學者,Chris Dutton推薦使用EXCEL來掌握資料科學的基礎,因為可以幫助你觀察如何操作資料的。

6. 利用Python或R入門


這是我們大部分播客嘉賓的偏好。如果不知如何下手,Python 會因其使用者友好的特性而成為初學者最好的選擇。

7. 通過現實案例進行練習


Damian Mingle說:資料科學家必須將他們的知識應用到現實世界的資料集中。

8. 瞭解你自己的弱點


每週進行一下複習,找出可以改進的地方。

9. 構建自己的應用


即使它不會廣泛應用:例如,為了線上購物,Paul Brown用Python編寫了一個簡單的程式,發現打折最給力的商家。 

0?wx_fmt=gif


10. 練習向外行解釋複雜問題


Greg Poppe說資料科學家必須能夠和投資者交流觀點,他們其中的很多人可能對這個領域一無所知(Caroline McColl 說在悉尼,與投資者交流通暢者會有額外$2萬-3萬的加薪)。

參與


11. 加入對等導師專案


這是Daniel Whitenack推薦的。這些專案對於很多初學者規避22條軍規,去結識“對的人”大有益處。

12. 獲得隱祕導師


例如,發起一個討論來聽取他們對於你工作的想法。

13. 線上釋出


這樣可以向面試官展示你自己,並證明你的努力。

14. 充分利用社交媒體


Beau Walker建議向社群諮詢解決問題的方法,而不只是闡明你的觀點。

15. 幫助公民科學


正如Garth Zoller所說,回饋社會是有益的。很多公民科學專案需要志願者。

16. 獲取關注的重點


不要籠統的自我介紹,獲得關注的最好方法,是解釋為何要與對方進行交流。

17. 參與競爭


Eu Jin Lok說競爭會提高資料科學技能,並能提供施展這些技能的舞臺。


準備申請


社會化 


18. 培育自己的網路


David Tanaskovic說,首先需要構建一個熟悉者組成的人際網路,然後向外擴充套件這個網路。如果不知從哪開始,線上群組和 Data Science events是好的起點。

19. 保持社會化


如 Caroline McColl 所說,公司經常會在大型活動中推出新的技術-所以需要多參與這些活動。

20. 保持資訊通暢


閱讀有關資料科學的最新訊息。它們不僅是訪談中的話題;而且會讓你在行業中保持領先。 

0?wx_fmt=gif


提升


21. 管理好領英中的簡歷


Andy Kriebel 說獵頭會一直關注領英-所以一定確保要照看好自己的數字足跡。

22. 寫一份優秀的模板簡歷和求職信


Richard Downes建議要突出錄取你的原因,以及你會給公司帶來的收益。

23. 強調你的經驗和教育


像Erika Dorland那樣,考慮如何在面試中把“這些無關”主題轉換為重點。

過濾


24. 關注你的興趣


並尋找與興趣有關的工作。不要走那些順途,儘管這是最安全的道路。Nadieh Bremer說,只有你充滿熱情,你才能保持領先。

25. 考慮大公司還是小公司


是的,有Tesla和SolarCity這樣的大公司,但是也有很多可以給你展示才能的小公司。

26. 分析競爭


研究你嚮往公司所招員工的特點,找出和你才能相似之處。 

0?wx_fmt=gif


準備 


27. 準備相關的問題


類似於:“你如何定義一個數據科學家”和“公司其他資料科學家是如何投資他們的個人培訓和發展的?”

28. 提到過去工作的經歷…


並準備討論這些經歷。Nicholas Cepeda在其Tableau課程中提到,他就是這樣獲得了工作機會。

29. 面試中的技巧


Sam Flegal 建議找出公司使用的工具,並研究這些工具提供的資料。這樣你會脫穎而出。


作為資料科學家進行工作


(再)發現


30. 複習基礎知識


Deepak Prasad說資料科學的基礎知識應該紮實。

31. 在開始專案前要框定問題


對Garth Zoller來說,資料科學家最重要的技能是思考如何思考一個問題。在處理問題前要理清問題的相互關係及上下文。

32. 明白為什麼要使用所選的工具


David Venturi說,採用特定的工具來解決某個問題的原因背後有很多學問,所以弄明白每一種工具的用途很重要。

33. 提升自己


Josh Coulson喜歡那些保持“一顆進去心”的員工-他們能一直不斷的學習、尋求反饋以及改進現狀。

適應


34. 保持靈活性


Harpreet Singh說最好的資料科學家,是那些善於提出問題和假設的,而不是一頭扎進專案的人。

35. 保持積極主動


Damian Mingle期望資料科學家能從業務問題中找出資料科學解決方法。這樣做可以為公司創造未來。

36. 必有我師


良師可遇而不可求,所以不要害羞也不必挑剔:Paul Brown說他的一些導師只是些普通的經理,但是他們發現了他的潛能。 

37. 要有大局觀


並且自問你工作的價值。如果工作不能給公司帶來價值和收入,那麼要考慮採用其他的方法。Richard Hopkins相信經常會忽視如何在執行環境中利用資料。

38. 不要遺忘視覺化工具


理解資料的形態會有助於分析。 Tableau對Megan Putney完成工作幫助很大,因為讓她能夠一眼就能找到所需的資料

39. 與對的人交流


Ruben Kogel與那些面臨類似困難的人聯絡,在討論中找到靈感,使他們能很快的發現最佳方案。

生產


40. 會說故事


Vitaly Dolgov的導師建議他帶著客戶去旅行,首先描繪出問題,然後提供一個合理的方案。

41. 要有選擇性


Harpreet Singh說,擁有領域的專業知識是至關重要的,這可以產生更大的影響。在職業生涯的這個階段,需要足夠的知識基礎。

42. 創立線上課程(I)


YouTube是一個很好的網站,提供了一個進行試水的平臺,而不像Udemy網站課程那樣嚴謹。Geoffrey Hinton推薦觀看Geoffrey Hinton關於神經網路開發的系列課程。

43. 創立線上課程(II)


當更有信心以後,可以到 Udemy網站看看有無對你主題的需求。然後規劃你課程的內容,在網站上開設課程。

0?wx_fmt=gif


44. 從不直接獲益處入手


誰知道將來哪些事會讓你獲利呢?

45. 成為一個諮詢顧問


Jen Underwood說,擁有一家公司的好處是:可以把精力集中在催人奮進的專案上。

原文:https://medium.com/towards-data-science/45-ways-to-activate-your-data-science-career-6a0d9c664e84