1. 程式人生 > >機器學習英雄訪談錄之 Kaggle Kernels 專家:Aakash Nain

機器學習英雄訪談錄之 Kaggle Kernels 專家:Aakash Nain

目錄

機器學習英雄訪談錄之 Kaggle Kernels 專家:Aakash Nain

Sanyam Bhutani 是 Medium 上一位專注 ML 和 CV 的博主,本系列翻譯自他進行的系列採訪——《機器學習英雄訪談錄》。

學習從模仿開始,要模仿就要模仿那些最棒的人,這是我開始本系列的初衷。


正文

這次我採訪的是 Aakash Kumar Nain,一位 Kaggle kernel 專家、資料科學家、深度學習工程師。


Sanyam:

嗨,Aakash,感謝你接受這次採訪。

Aakash: 嗨,Sanyam,謝謝你能想到我。

Sanyam: 你是我認識的最酷的印度大學生之一,你能向讀者介紹下你自己嗎?

Aakash: 謝謝你的稱讚。好吧,我的職業是一名資料科學家。我喜歡用機器學習來解決複雜的問題。玩資料是我的另一個愛好,計算機視覺是我最喜歡的領域。Python 是我生命中唯一的真愛。除此之外,我是一個運動員,足球運動員、業餘旅行者和狂熱的閱讀者。哲學是繼電腦科學之後我第二熱愛的學科。

Sanyam: 了不起,我知道你也吸合法的資料科學“粉兒”——Kaggle。你能告訴我們一些你的 Kaggle 之旅嗎?是什麼讓你對 AI 如此感興趣,以至於你決定把它作為職業生涯?

Aakash: 哈!是的,你說的對,我完全沉迷於此。我的 Kaggle 之旅與大多數人有點不同。我在大學前的最後一年,我的一位前輩向我展示了使用強化學習訓練的自主馬里奧遊戲。在那個時候真的讓我大吃一驚。我開始學習機器學習的線上課程。問題是,沒有一門課程能為你提供複雜問題的實踐經驗。那時我聽說有 Kaggle。我在 2016 年 1 月加入 Kaggle。一開始,我感到完全沒有頭緒,我暫時沒有參加任何比賽。在練習了一些小而簡單的問題後,我於 2016 年 7 月參加了比賽。我加入了 Kaggle Noobs 社群,並開始向人們提出非常棒的問題,以澄清並深入瞭解一些基本概念。從那以後,這段旅程開始變得非常有趣。

Sanyam: 我非常喜歡從你的 kernel 中學習。你能告訴我們更多關於寫作動機的事嗎?一個人背後付出了多少努力?

Aakash: 資料科學和機器學習是廣闊的領域。對於初學者來說,這條路幾乎總是艱鉅的,這是我的個人經歷。分享知識是自學的重要部分。此外,我們有責任回饋一直為你服務的社群。這正是我開始編寫 kernel 的原因。每次我編寫 kernel 時,我都會確保它包含其他人尚未嘗試過的新內容。

關於這些努力,我想說編寫高質量的 kernel 需要付出巨大的努力。例如,我可以在幾個小時內編寫一個簡單的kernel,但為了確保程式碼整潔、優化,並與最佳實踐一致,可能需要數天時間。

Sanyam: 我知道來自 AI 職位稀缺的同一個國家,是什麼讓你決定把它作為你的職業選擇?

Aakash: 當你在找工作時,你應該經常考慮兩件事:

  1. 你的個人興趣
  2. 你的工作範圍和成長率

你應該做你喜歡的工作。當我在大學時,我學習程式設計是因為我當時想成為一名核心開發人員,然後我嘗試了網路程式設計,但沒有什麼能比機器學習更令我興奮。就在那時,我決定只在資料科學和機器學習領域工作。

Sanyam: 我認為我們倆都同意印度的機器學習機會目前非常稀缺。你對想在該領域工作的新人有什麼建議?

Aakash: 我會糾正第一個觀點“印度的機器學習機會目前非常稀缺”。這並不意味著突破口不存在。問題是每個人都希望成為機器學習工程師,每個公司都希望在他們的工作中應用機器學習,因為他們認為它很“酷”。最重要的是,即使公司本身不知道機器學習是做什麼的,工作要求也包括“5 年以上的機器學習經驗”。所以,問題在於另一方面。

我已經說機器學習是一個廣闊的領域。機器學習涉及多個學科,如計算機視覺、自然語言處理、語音等。不要試圖成為每個學科的專家。每個子領域都非常多樣化,在一個子域內有太多東西需要學習。你應該選擇最感興趣的一個,但同時你應該知道其他子域中使用的基本概念。

Sanyam: 從我們之前的談話中,我們都同意線上學習作為碩士學位的替代同樣好,甚至更好。你能分享一下你的想法嗎?你是否認為 Kaggle 可以為你提供比碩士學位更好的資料科學職位?

Aakash: 今天網際網路上有兩種型別的線上課程。第一個是涵蓋“廣度”的那些,而第二個是涵蓋“深度”的那些。例如,Udacity 課程涵蓋寬度。他們會教你幾乎所有方面的課程,但沒有一個會被深入介紹。另一方面,如果你希望深入研究某些方面,coursera 課程是很好的,但它們不會涵蓋所需的每個要素。這是當前的主要瓶頸。對於線上課程來說,要在一個地方查詢學習所需的所有內容有點困難。再加上什麼都不便宜。線上課程並不像碩士學位那樣昂貴,但是依然價格昂貴。

參加 Kaggle 比賽和選擇碩士學位是兩件完全不同的事情。前者使你更善於嘗試不同的事物,並被更廣泛的受眾所認可,而後者則會讓你能更好地研究。有些人喜歡再次上大學,而其他人更喜歡實踐經驗和日常解決問題。

Sanyam: 在我們結束之前,還有什麼想對讀者說的嗎?

Aakash: 考慮到我們在過去幾年中在機器學習方面取得的進步,特別是在深度學習方面,我們正生活在一個令人難以置信的時代。當你自學成才時,事情會更加大不相同。成為機器學習工程師或資料科學家的道路很簡單,但成為一名非常優秀的機器學習工程師或資料科學家的道路並不容易。在某個時間點,你會因為看到當前研究的數量(如此之多)而感到消沉。如果你有這種感覺,沒關係。我們應該永遠記住兩件事:

  1. 你的成功不依賴於他人,反之亦然。
  2. 永遠不要害羞和害怕去問那些甚至是最基本的問題。如果你不問,你就是自己的絆腳石。

KaggleNoobs slack 是最好的聯絡方式。雖然,我在 Twitter 上也很活躍,但我根本不使用 Twitter 進行通訊。

Sanyam: 感謝你在此次採訪中的談話。


Kaggle Noobs 是 Kaggle 最棒的社群,在那裡可以找到 Aakash、Kaggle Grandmasters、Masters、Experts,並且它甚至對我這樣的菜鳥新手也很友好。

如果你想成為 Aakash 那樣的專家,儘管加入吧。

對我的啟發

  • 分享知識是自學的重要部分。
  • 我們有責任回饋一直為你服務的社群。
  • 前面兩點可以結合在一起。
  • 不要試圖成為每個學科的專家,要一專多能