1. 程式人生 > >入行數據科學一定要有研究生學歷嗎?

入行數據科學一定要有研究生學歷嗎?

info 需要 創業公司 ron 是把 ras 而不是 算法 最好

技術分享圖片

作者 | Jeremie Harris

翻譯 | Mika

CDA 數據分析師原創作品,轉載需授權

首先我要說的是,我是一名博士肄業生。

這個頭銜給我帶來了所謂的光環,它暗示我在研究生院待過,做過一些學術研究。完成博士學位,意味著你不過是千萬個”書呆子”中的一員,而在學了幾年後輟學似乎顯得你更有個性。人們期待知道你之後會做些什麽。他們可能會說,“特斯拉的CEO Elon Musk就選擇放棄研究生學位,離開學校去創業,你也可能成為下一個Elon!”

那麽如果想入行數據科學,學歷重要嗎?一定需要博士學歷或研究生學歷嗎?在本文中我將分享我的看法。

我在數據科學導師制創業公司工作。在工作中,我已經面試過數千位有抱負的數據科學家,當中有些人有博士學位,有些有碩士學位,有些是本科生,也有各個階段的肄業生。這也讓我對數據科學職業有了更深的認識。

STEM:科學(Science),技術(Technology),工程(Engineering),數學(Mathematics)這四門學科

有許多人會向他人咨詢,是否要繼續深造讀研或讀博,而當中很多人對前景沒有全面的分析。

其實不是所有的學位都適合每個人,原因如下。

一、博士學位

(這可能會讓許多有博士學位的人感到不舒服,在此我提前道歉。)

“我看到許多數據科學工作都需要博士學位。我是否要有博士學位才能成為數據科學家呢?“

不,並不需要。

不要誤會我的意思,博士頭銜的確會給你帶來明顯的優勢。但也要考慮一些現實因素。

如果你的目標是成為數據科學家或機器學習工程師/研究員,那麽有博士學位會給你加分不少。但與此同時也要考慮以下兩點:

1.獲得博士學位需要非常長的時間。

2.除非你跟著合適的導師,攻讀合適的學位,否則你可能學不到任何有價值的東西。

針對第1點,在美國或加拿大,獲得博士學位需要4年到8年才能完成。平均需要5到6年,具體取決於學校。現在讓我們把它放到透視中。

在數據科學領域瞬息萬變,5年內各種成果層出不窮。要知道,在5年前Spark、XGBoost、jupyter notebook、GloVe、spaCy、TensorFlow、Keras、Pytorch、InceptionNet、ResNet、強化學習等等都還不存在。

因此,除非你打算當新技術出現時,花時間自己鉆研。否則你會發現學習期間接觸到的技術遠遠跟不上當下的發展。這意味著即使你畢業後,還需要自己學習這些技術。

關鍵在於,數據科學和機器學習的發展非常快,在未來只會發展得更快。因此,當考慮攻讀數據科學或機器學習相關領域的博士學位時,你實際上是把賭註都下在你所要學習的領域。你希望在畢業時,該領域還是炙手可熱的。而這樣的賭註很冒險,而且賭註很高。

技術分享圖片

第2點,思考一下你的導師是誰,為什麽他們沒有在Google或Facebook工作。

當然,有些人更喜歡學術研究,而不是在行業中運用數據科學或機器學習。但值得記住的是,行業頂級的機器學習人才的薪資是非常豐厚的,因此學術界的可能會稍遜一籌。

當然,有些地方也有些例外。這主要指的是加拿大的Vector Institute或MILA;麻省理工學院和美國伯克利的數據科學課程等頂級精英項目。

總結一下:如果你只想成為Airbnb的深度學習工程師,那麽博士學位一定程度上能成為你的敲門磚。但是,如果你不是在頂級項目中攻讀博士學位,那麽不要期望被行業頂尖的公司錄用。

但是,如果你想找份普通的數據科學工作,獲得博士學位可能並不是正確的舉措。你可以用4到8年的時間獲得豐富的工作經驗,去成長為一名真正的數據科學家,那麽出現新技術時,你能更好的進行預測,保持領先的位置。

如果你考慮攻讀與數據科學無關領域的博士學位(例如物理,生物學,化學),並且目標是找數據科學方面的工作,那麽這條建議可能有些刺耳:如果你離畢業還有18個月或更長時間,而且你確定自己想成為一名數據科學家,那麽可以考慮輟學。考慮到沈沒成本,你應該對之前決策感到質疑,根據我之前的經驗來看放棄可能是正確的選擇。

二、碩士學位

入行數據科學需要碩士學位嗎?

視情況而定。以下是我列出的記分表,如果根據你的情況,分數大於6,那麽答案是“碩士學位可能會有所幫助”。

你有非常相關的STEM背景(物理、數學、計算機科學等本科學歷):0分

你有較為相關的STEM背景(生物學、生物化學、經濟學等本科學歷):2分

你沒有相關的STEM背景:5分

你有不到1年的Python使用經驗:3分

你沒有編程相關的工作經驗:3分

你不認為自己擅長獨立學習:4分

當我說這個記分表實際是一個邏輯回歸算法時,你不明白我的意思:1分

註意:

需要考慮的是,你是否需要數據科學碩士學位或數據科學訓練營。如果選擇參加訓練營,要註意他們的激勵措施:是否課程完成後保證聘用?是否有與訓練營相關的求職指導服務?

許多人都對訓練營持懷疑態度,這是有道理的。但大多數忽略的是,他們對待大學所提供的相關碩士學位也該如此。鞏固碩士學位就相當於訓練營。如果你不在乎你的成績,那麽要註重你從中學到了什麽。在選擇相應的碩士學位和課程項目時要詢問其研究生就業率。有的大學希望學生選一個簡單的專業,而不是好的專業,這是一場心理博弈。你的目標是最終被聘用,找到理想的工作,而不是僅僅為了一紙文憑而付出時間和精力。

即使完成了碩士學位,你還需要學習很多技能,可能比你預想的還要多。但只要碩士課程的時間較短(最好不超過2年),成本不是太高。

技術分享圖片

三、本科學位

總的來說,是的,成為數據科學家你需要相關本科學位。不僅僅是因為你需要掌握相關知識,而且公司並不認為你通過自學,參加訓練營和一些在線課程就能勝任數據科學的工作 。

但關於本科學位你要註意的是,如果你和科技行業的人聊聊,你很快會發現科技型工作中涉及到的內容要遠遠超出學校課本。這是因為學校所教的本科課程一般比現實情況要滯後5到10年。如果你學的是不會發生很大變化的專業是沒有太大問題的,比如如物理、數學或統計數據等。

但是如果你是工程或計算機科學專業,並且你在一家出色的公司實習,你想休學或肄業來獲得更多的工作經驗,那麽你可以考慮這樣做。如果你讀本科的目的是為了獲得一份工作,你已經在一家有不錯前景的公司獲得職位,那麽何必多付幾年學費呢。

我的意思並不是你應該不讀完本科就去工作,我想說的是,如果你完成了實習並且獲得了相應的全職工作,那麽對於是否完成學業應該有更開放的觀念。而不是因為大家都這麽做,才做出這種選擇。

結語

在本文中,我給出的一些建議可能不是那麽常規。但在數據科學這樣快速發展的領域,慣例往往並不是最優選擇。當今社會中,人們對傳統教育價值的看法應該與時俱進。

當然,這並不意味著正規教育以及研究生學位是不值得的。但是,不應該認為獲得碩士或博士學位是必備的。如果你讀研讀博只是為了符合數據科學職業軌跡的刻板印象,那麽你可能需要重新考慮了。

入行數據科學一定要有研究生學歷嗎?