1. 程式人生 > >解讀|資料科學領域常見的3種職業轉型方向

解讀|資料科學領域常見的3種職業轉型方向


作者 | Jeremie Harris
翻譯 | Mika
本文為 CDA 資料分析師原創作品,轉載需授權

在大學我學習物理時,每當遇到不理解的術語,我就會上網搜尋,這時我常會用到的就是維基百科。

雖然維基百科很好用,但是上面很多文章都不適合我的水平。那些文章要不就是超出我的理解,或者對我來說太簡單了。這種情況時常發生,因此我從中總結的經驗就是,維基百科上的技術詞條很難既提供有效資訊,又做到易於理解。

很多資料科學方面的職業建議也是如此,有些是針對完全零基礎的初學者;有些是針對初級資料科學家磨練技能;有些則針對資深的軟體工程師。而這容易讓許多想成為資料科學家的人群感到無從下手,他們不知道該如何花在哪裡。

在本文中,我打算針對三種不同型別的人群給出相應的職業轉型建議。

第一類:零基礎的初學者

如果你剛剛進入資料科學領域,請記住該領域的發展速度非常快,也許現在我給出的建議在你準備求職時已經過時了。如今資料科學的招聘標準與一兩年後的標準之間的差距可能會更大。

在明確這點的基礎上,如果你想進入資料科學領域,並且沒有任何程式設計方面的背景,我要給出的建議如下:

首先要保持開放的心態

如果你是一名初學者,那麼你可能完全不知道資料科學的具體內涵。那麼可以先和一些資料科學家聊一聊;關注相關的科學播客。成為一名資料科學家需要花費大量的時間和精力,因此只因為你認為自動駕駛汽車很酷就一頭扎進去,這並不是一個很好的理由。確保自己瞭解資料科學中不那麼高大上的部分,資料處理和構建資料管道等,這些方面佔資料科學家日常工作的大部分。

如果你決定繼續前進,這太好了!首先你要做的第一件事就是學習Python。參加一些線上課程,並儘快建立一個基礎專案。當你掌握一定Python技能時,學習如何使用Jupyter notebook。

在找工作時,一開始就從全面的資料科學職位並不是最好的。相反,可以選擇資料視覺化或資料分析職位,這類職位市場需求量大,而且要求沒有資料科學家那麼高。這些職位經常與資料科學家一起工作,當你獲得了一些經驗後,也可以著手向這個方向發展。

如何發揮自己的優勢:

當你準備好找工作時,你會發現學會推銷自己在在資料科學中非常重要。你可能會擔心,因為你沒有任何專業經驗或電腦科學的研究生學位,推廣自己是一個難題。但這也可以成為你最大的優勢:你是從零開始,自學成才的資料科學家,公司需要這些努力而且學習能力強的資料科學家。為此你需要符合自己的這種形象,不斷提高技能,解決一個個挑戰,但當中的回報絕對是值得的。

第二類:軟體工程師

我遇到的想成為資料科學家的人中,可能有20%都是軟體工程師。一方面,有將程式碼部署到生產和與開發團隊合作的相關經驗,這是非常重要的資產。另一方面,如今對全棧開發人員的需求非常高,有時公司會將軟體工程師歸為這個方向。因此想轉為資料科學家時,你要避免被當作軟體工程師,而不是資料科學家。

其他建議:

首先你可以考慮轉為專注後端或資料庫相關方向。熟悉資料管道是一個良好的開端,這可以幫助你構建核心資料操作技能組。

機器學習工程可能是最接近資料科學的職位,這更容易過渡。在求職時,你可以找哪些強調部署模型,或將其整合到現有應用程式的職位,這些職位將最有效地利用你現有的技能。

你很可能要建立機器學習或資料科學專案來打動僱主。利用你的軟體工程技能,將這些技能整合到可以向招聘人員展示的應用程式中。這特別有效,因為這更為明確,而且突顯了你作為全棧資料科學家的潛力。

要記住,在職業轉型時你的薪資很可能會減少。即使是高階軟體工程師,當他們轉行資料科學時,也需要從初級的職位開始。

如何發揮自己的優勢:

最好的方法就是利用你在軟體開發方面的經驗。你已經知道如何編寫乾淨、文件記錄良好的程式碼,以及該如何與他人協作,這是大多數初級職位求職者所缺乏的優勢。

第三類:電腦科學、數學或物理專業的應屆畢業生

如果你是一名本科、碩士或博士生,你可能在統計學和數學方面有很好的基礎。但你可能從未申請過科技方面的工作,而且你不確定如何準備面試。此外,假設你讀書時一直在程式設計,你很可能無法寫出乾淨、結構良好的程式碼。

幾點建議:

你在讀書期間學的R語言還不夠。如果你是學物理的,那你的MATLAB或數學技能也是不夠的,去學學Python吧。

這些內容你需要儘快學習:協作版本控制,比如如何與其他人一起使用GitHub);容器化,比如如何使用Docker;開發運營,學習如何使用AWS或其他類似服務在雲中部署模型;SQL也是必須的。

學習Python中的測試驅動開發。學習如何使用文件字串,如何將程式碼模組化,以及如何使用Jupyter notebook。

如果你在以數學為導向的領域,那麼深度學習是一個很好的探索方向。要注意先從更傳統的“scikit-learn”型資料科學職位開始,然後轉向深度學習更容易。對你來說,最重要的是先入行,並儘快開始生產程式碼。

如何發揮自己的優勢:

如果你是數學或物理專業,你最好的策略就是發揮有深厚理論知識的特定。為此,你需要能夠自信地解釋各種模型的原理,熟悉文獻中最新的文章。

結語

注意:我這裡提供的建議並不能完全使用與所有情況。有些軟體工程師可能要學習的更多,而有些初學者有很好的數學基礎,更適合成為深度學習研究人員。但希望本文能你一個不錯的起點。

最後,無論你是軟體工程師,剛畢業的大學生,還是零基礎的初學者,你都要問自己一個關鍵的問題:哪種職業發展軌跡最接近你的情況?很多情況下,通過稱為資料分析師或資料視覺化專家進入該領域都是不錯的選擇。