奈學百萬AI架構師一期
和同事一起買的。 記錄一下心得。 如何成為一門AI架構師
首先,你要對人工智慧知識體系有一個深入的瞭解,也就是要從下到上涉獵。在進入公司之前,我有5年的博士學習經歷,4年的博士後工作經歷。我自己編寫公式和程式碼。雖然我沒有參與過tensorflow這樣的大火框架的開發,但是我從底層開始編寫了自己的演算法。如果你只是說我上過線上課程,會呼叫api,那麼實現架構是很困難的,因為你只能做別人設定的任務和別人設計的模型。然而,真正的問題非常複雜。幾乎沒有直接適合線上課程學習的知識。通常,您需要回到您自己的知識庫來重新構想問題和模型(廢話:P)有豐富的專案經驗。許多理論上的事情在實踐中是很難做到的。
在這個時候,你需要做出很多妥協和妥協。在工作坊層面有許多小技能,但它們往往是專案成功的關鍵,但它們不會寫在教科書中。此外,它們因專案而異,甚至因客戶而異。你只能從時間中積累和總結規則,沉澱。例如,你學習的機器學習可能是資料被標記。與客戶交談後,你認為客戶的問題也可以轉化為一個預測問題。討論是愉快的。然而,當資料到達您手中時,已經標記的資料已經完全沒有標記或只有少量資料。如何快速貼上標籤已經成為一個瓶頸,這將是對一個人能力的極大考驗。但如果你做得更多,你會有經驗和感覺。豐富的想象力和創造力。這可能與傳統的軟體架構師不同。原因是傳統的軟體開發基本上是需求驅動的。目前客戶經常有資料卻沒有需求,或者有需求卻不合理(有的客戶經常說這是我的資料,我想預測明天的彩票中獎號碼)。
此時,你不僅要了解業務,還要創造性地從客戶資料中發現有用的價值,而這種價值可以被人工智慧挖掘出來。這是基於內容的開發和基於需求的開發之間的本質區別。這種能力的三分之一來自經驗,三分之一來自天賦,三分之一來自運氣。將現實問題抽象為人工智慧問題的能力。這是大多數人工智慧編碼器所沒有的能力。很多人都上過人工智慧課程,內容涉及影象分類和文字的情感分析。然後他們只能做影象和文字。如果他們提供其他資料,比如蛋白質序列,他們就無能為力了。這是因為對AI模型沒有更重要的理解。文字是文字序列,影象是二維畫素序列,蛋白質也是氨基酸序列。事實上,在模型上並沒有本質的區別。對於更復雜的資料,如果您從模型的角度來看它,而不僅僅是從API的角度來看它,那麼它是類似的且可訪問的。
能夠講故事,組織協調,使用架構工具,熟悉各種技術棧(TF, pytorch)和各種資料預訓練模型(vgg16, vgg19等)的優缺點。這些都是傳統軟體架構師所需要的能力,而且不會重複。