1. 程式人生 > >幾個月就能化身為數據科學家?

幾個月就能化身為數據科學家?

中間 三角形 nts 經濟 問題 想要 app andrew 消失

關於做一名數據科學家,我有一些想法。成為一名數據科學家並不容易,需要付出很多努力,但如果你對數據科學充滿興趣,那一切都是值得的。

時常有人問我:如何成為一名數據科學家?必修的課程是什麽?需要多長時間?你是怎麽成為數據科學家的?我已多次回答過這些問題。所以在我看來,寫一篇匯總的文章也許能幫助那些想要成為數據科學家的人。

關於我自己

我(俄羅斯,莫斯科)在密歇根州立大學經濟學院獲得碩士學位,並在 ERP 系統規劃領域做了 4 年的分析師和顧問。我的工作涉及與客戶交談,討論他們的需求並將其落地,編寫文檔,向程序員說明任務,測試結果,組織項目和許多其它事情。

這是一項壓力很大的工作,需要處理很多問題。更重要的是,我並不喜歡它。盡管我喜歡處理數據,但我做的大多數事情還是令人索然無味。所以,在 2016 年的春夏之交,我開始另謀出路。我通過了精益六西格瑪(Lean Six Sigma)的綠帶測試,但還未找到新的就業機會。有一天我發現了大數據(BigData)。在 google 上搜索和閱讀了許多文章後,我意識到這可能是我的夢想職業。

我辭去工作,並在八個月後在一家銀行找到了第一份數據科學家的工作。從那之後,我先後就職了幾家公司,但我對數據科學的熱情日益增加。我完成了一些關於機器學習和深度學習的課程,實踐了一些項目(如聊天機器人或數字識別 APP),先後參加了許多機器學習的比賽和活動,在 Kaggle 上獲得了三枚銀牌。總之,我有一些學習數據科學和作為數據科學家工作的經驗。當然,我還有很多技能需要學習。

免責聲明

本文所述僅為我自己的觀點。可能有些人會對其中的內容持反對態度,但我無意冒犯任何人。我認為想成為一名數據科學家必須投入大量的時間和精力,否則將一事無成。Course 或 MOOC 聲稱可以讓你在幾周或幾個月內成為機器學習/深度學習/數據科學專家的廣告語並不是真的。你可以在數周/數月內獲得一些知識和技能。但如果沒有廣泛的實踐(大多數課程內不包含這一部分),你無法真正掌握它。

你確實需要內在的動力,但更重要的是,你需要嚴格地規範自己,這樣你可以在動力消失後繼續努力。

再說一遍——你需要自己動手動腦。如果你在提出最基礎的問題之前沒有用 Google/ StackOverflow 或思考幾分鐘,那你將永遠無法趕上專業人士。

在我參加的大多數課程中,只有大約 10-20%的人完成了這些課程。半途而廢的人基本都缺乏耐心和決心。

什麽樣的人能成為數據科學家?

技術分享圖片

上圖顯示了數據科學家所需的一些核心技能,比如:數學和統計學,編程和開發,領域相關知識和軟技能。

這麽多技能!怎麽可能完全掌握呢?嗯,需要花費很多時間。但告訴你一個好消息:沒必要掌握全部。

2018 年 10 月 21 日,Yandex 上有一個有趣的演講,其中提到數據科學專家類型有很多,他們只是擁有上述技能中的某幾種而已。

技術分享圖片

數據科學家應該處於圖片中間的位置,但實際上他們可以處於三角形的任何位置,不同位置對應了不同的專家能力。

在本文中,我將討論的一類數據科學家是那些可以與客戶交談,進行分析,構建模型並實施項目的人。

轉行?這意味著你已有所了解!

有人說轉行相當困難。雖然這是事實,但轉行也通常意味著你對現在工作已經有所了解。也許你有編程和開發經驗,也許你在數學/統計學領域工作過,或者你每天鍛煉你的軟技能。至少你擁有一些自己領域的專業知識。你可以揚長避短。

來自 Reddit 的數據科學路線圖

實際上這裏有兩個路線圖:)

第一個來自 Reddit:

首先,閱讀 Hastie、Tibshirani 和 Jerome Friedman 所著的《The Elements of Statistical Learning》第 1-4 章和 7-8 章。就算暫時不理解,也要堅持閱讀。

如果需要,你可以閱讀該書的其它部分。假設你對全書都已有所了解。

觀看 Andrew Ng 的 Coursera 課程。用 python 和 R 語言完成所有練習。確保你能寫出正確答案。

然後閱讀一本深度學習書。在 Linux 系統中運行 tensorflow 和 pytorch 框架並實踐示例項目,直到完成。嘗試使用卷積神經網絡、循環神經網絡和前饋神經網絡。

完成所有這些後,繼續在 arXiv 上閱讀最新的有用論文。文獻不斷在更新,所以要跟上大部隊。

完成這些的你現在會被大多數公司錄取。如果你需要完善簡歷,可以參加一些 Kaggle 比賽。如果你有調試問題,請使用 StackOverflow。如果在數學方面有問題,請多讀文獻。如果生活上問題,自己看著辦吧。

幾個月就能化身為數據科學家?