1. 程式人生 > 資訊 >Bengio 實驗室推出開源 AI 藥物研發平臺,清北上交學生參與開發

Bengio 實驗室推出開源 AI 藥物研發平臺,清北上交學生參與開發

AI 製藥,讓“大海撈針”變成“按圖索驥”,研發時間一度從 10 年縮短到 18 個月

而一個好的開源平臺也是未來 AI 醫藥研發發展的關鍵之一。

現在,來自加拿大蒙特利爾學習演算法研究所(Mila)的唐建團隊,就推出了一個專門用於 AI 藥物研發的開源機器學習平臺 ——TorchDrug。

研究人員可以在該平臺上免費使用或貢獻 AI 藥研相關的演算法、庫、軟體等工具

唐建表示:

希望這個平臺能夠將機器學習和生物醫學界的研究人員聚集在一起,加速新藥發現的過程,並在未來成為該領域一個領先的開源平臺。

基於 PyTorch 的藥物研發原型設計平臺

TorchDrug 涵蓋了從圖機器學習(圖神經網路、幾何深度學習和知識圖譜)、深度生成模型到強化學習的技術,基於 PyTorch 平臺。

該平臺提供了一個全面而靈活的介面來支援藥物發現模型的快速原型設計,可以用來進行成藥屬性預測、預訓練分子表徵、分子生成、逆合成以及知識圖譜推理,官方也提供了詳細的教程。

該平臺主要有四個特點:

  • 最小化的領域知識

由於平臺主要面向對於醫藥知識瞭解不全面的機器學習者,所以抽象了大量專業知識,提供了一個基於張量的介面。從而允許使用者用張量代數和機器學習方法來進行醫藥開發。

  • 大量資料集和構造塊(Building Blocks)

這樣無需編寫樣板程式碼就能很容易地實現標準模型。此外,構建塊也具有高可擴充套件性方便使用者自由探索模型設計。

  • 全面的基準測試

為了提供對流行的深度學習框架系統的比較,平臺已對現有的一些專案進行了全面的基準測試。測試結果也有望跟蹤新模型的進展,激發新的研究方向(可在官網檢視)。

  • 可擴充套件訓練和推理

可擴充套件的設計可加速在多個 CPU 或 GPU 之間的訓練和推理。只需修改一行程式碼,就能實現在 CPU、GPU 甚至分散式配置之間無縫切換。

後續團隊將通過幾何深度學習為該平臺增加 3D 建模功能

安裝介面需 Python 版本 >= 3.5,PyTorch>= 1.4.0,方法有兩種:

  • 從 conda

  • 從 GitHub 源

先通過 conda 獲得 TorchDrug 依賴的化學資訊學開源工具包 rdkit:

研發團隊

研發團隊所在的實驗室 Mila,是圖靈獎得主、加拿大蒙特利爾大學教授 Yoshua Bengio 於 1993 年創立的 AI 研究機構。

有 500 多名專門從事機器學習的研究人員,主要貢獻集中在語言模型、機器翻譯、物件識別和生成模型。

TorchDrug 平臺的開發由 Mila 實驗室的助理教授、加拿大蒙特利爾大學商學院博士生導師唐建領導。

唐教授 2014 年博士畢業於北京大學資訊科學技術學院,2014-2016 年任職微軟亞洲研究院副研究員,2016-2017 年成為密歇根大學和卡內基梅隆大學聯合培養博士後。

唐教授的主要研究方向為:圖表示學習、圖研究網路、知識圖譜、藥物發現。

他曾獲得機器學習頂級會議 ICML2014 的最佳論文,發表的一系列在圖表示學習領域的經典論文包括 LINE、LargeVis、RotatE 以及 Graph Markov Neural Networks(GMNN)。

團隊成員還包括多位該實驗室的華人博士學生以及來自清華北大上交大的交換生。

他們還得到了 Bengio 等十餘位 AI、生物學領域學者的指導: