1. 程式人生 > >《我不是藥神》與AI研製新葯

《我不是藥神》與AI研製新葯

640?wx_fmt=png

最近電影《我不是藥神》引發熱議,原研藥貴,且研製過程九死一生。近期Science Advances上發表了《Deep reinforcement learning for de novo drug design》(基於深度強化學習的新葯設計)、以及2017Journal of Cheminformatics上的《Molecular de-novo design through deep reinforcement learning》。掀起來人工智慧方法研製新葯的序幕,人工智慧到底如何研製新葯的?這種方法有什麼優缺點?

在製藥行業,新葯研發是個費時費力、成本高昂、而且成功率極低的工作。一般研製一個新葯,需要上十年的時間,費用超過10億美元。製藥企業積累了大量調控蛋白功能的小分子化合物,規模約百萬規模的化合物。需要從百萬個候選化合物中,刷選出1

個藥物。這有點像是大海撈針,運氣成分很大。而人工智慧方法利用機器學習方法,從海量化合物資料庫中提取關鍵有效資訊,也許可以大大減少研發時間,提高篩選的成功率,成為新葯研發的新的方法。一旦這條路能順利走通,必將革新小分子化學藥研製。

640?wx_fmt=jpeg

人工智慧方法篩選分子有兩個途徑:一個是用監督學習的方法建模篩選模型,這種方法好比構建一個大海撈針的模型。另一種方法是利用生成建模依照所需特性來生成分子結構,該方法不需要撈針,而是自動生成生成針取代常規的篩選的過程。我們最初提到近期兩篇文章,用的是後一種方法。該方法的的目標是訓練出一個生成藥物分子的模型,在完成訓練之後用該模型生成候選藥物。

人工智慧具體用到了兩類方法:一個是深度學習方法,在這裡深度學習方法主要是

RNN和生成式對抗網路(GAN,Generative Adversarial Networks),GAN是近年來非常火的一種學習模型,通過生成模型和判別模型相互博弈產生模型。另一個是強化學習方法,用人類已經研製出的藥物作為監督樣本,調整模型引數。關於強化學習、監督學習、非監督學習方法,Yann LeCun大神對它們有一個比喻圖如下:

640?wx_fmt=jpeg

生成模型的輸入是什麼呢?回想GAN方法正在影象處理中,輸入就直接是影象本身。而在新葯研製中,如果將分子數字化是個很好玩的事情,因為總不能將一個分子直接搬到計算機記憶體裡去吧(想想都怪怪的),只能將分子數字化。而人類對分子描述包括分子式、分可以作為分子的數字化特徵。

例如在《

The cornucopia of meaningful leads: Applying deep adversarial auto encoders for new molecule development in oncology》論文中,他們使用用美國癌症研究所(NCI)的NCI-60藥物篩檢資料庫中針對乳癌細胞MCF-76252種化合物,以及分子指紋和分子濃度、生長抑制百分比等資料作為分子的數字化特徵,模型輸入包括166個引數,來訓練一個生成模型。他們所設計的深度網路結構,由輸入層(166+1),編碼網路(分別由128個和64個神經元組成的兩層網路)、解碼網路(分別由64個和128個神經元組成的兩層網路)、輸出層(166+1)、中間的潛在層(分別由4個神經元和1個代表抑制癌細胞效果資料的GI)、鑑別網路(分別由64個和3個神經元組成的兩層網路)組成。研究人員在PubChem的七千多萬個小分子中,發現了69個化合物,其中13個是已經申請專利的藥物分子,另有13個是被PubChem BioAssay登記有效的化合物。

也有文章直接用分子式或者SMILES資料、分子影象以及其他化學和生物相關的分子結構表徵資料作為輸入,建立模型。想想都覺得瘋狂,直接用SMILES資料描述一個分子,也就是將一個分子類比一個自然語言句子,採用自然語言處理方法中常用的RNN或者LSTM方法對這個分子進行建模。這個AI系統得多智慧啊!!!直接看分子式就能研製藥物了!!本文一開頭提到的兩篇論文就是用SMILES資料作為模型輸入,訓練模型的,他們發現直接學習分子式也是一個可行的策略。

對分子式用SMILES編碼方法如下圖。在本文開頭提到的文章中,作者利用RNN方法(或者LSTM方法)可以訓練出生成全新SMILES字串的模型,再基於強化學習中的遷移方法,利用之前人類的小分子資料集作為學習範本,對前面RNN模型進行微調。最終得到的生成模型有可能產生出於真實世界中藥物的化合物。

640?wx_fmt=png

用人工智慧方法設計新葯看起來很容易、但實際上,當前AI設計新葯存在許多缺陷:一是很難解釋,設計出來的模型為什麼能成功,缺乏解釋。二是樣本量不夠大。儘管分子式達到了千萬的規模,但是監督資料卻非常少,根據《Nature Reviews Drug Discovery2016年的資料,在被FDA批准的1578個藥物中,總共涉及的靶點數才667個。而且還沒辦法想AlphaGO那樣自動生成樣本。三是強化學習方法中的獎勵分無法明確給出,使得現有的強化學習方法運用在新葯研製上,真正起作用有限。四是就算挑選出新的分子式,它的臨場表現如何還得經歷九死一生的過程。

歸根結底,是因為我們對新葯產生的分子機制還不真正清楚,用人工智慧方法研製新葯任重道遠。

往期回顧:

640?wx_fmt=jpeg