《我不是藥神》與AI研製新葯

阿新 • • 發佈：2019-01-06

640?wx_fmt=png

最近電影《我不是藥神》引發熱議，原研藥貴，且研製過程九死一生。近期Science Advances上發表了《Deep reinforcement learning for de novo drug design》（基於深度強化學習的新葯設計）、以及2017年Journal of Cheminformatics上的《Molecular de-novo design through deep reinforcement learning》。掀起來人工智慧方法研製新葯的序幕，人工智慧到底如何研製新葯的？這種方法有什麼優缺點？

在製藥行業，新葯研發是個費時費力、成本高昂、而且成功率極低的工作。一般研製一個新葯，需要上十年的時間，費用超過10億美元。製藥企業積累了大量調控蛋白功能的小分子化合物，規模約百萬規模的化合物。需要從百萬個候選化合物中，刷選出1

個藥物。這有點像是大海撈針，運氣成分很大。而人工智慧方法利用機器學習方法，從海量化合物資料庫中提取關鍵有效資訊，也許可以大大減少研發時間，提高篩選的成功率，成為新葯研發的新的方法。一旦這條路能順利走通，必將革新小分子化學藥研製。

640?wx_fmt=jpeg

人工智慧方法篩選分子有兩個途徑：一個是用監督學習的方法建模篩選模型，這種方法好比構建一個大海撈針的模型。另一種方法是利用生成建模依照所需特性來生成分子結構，該方法不需要撈針，而是自動生成生成針取代常規的篩選的過程。我們最初提到近期兩篇文章，用的是後一種方法。該方法的的目標是訓練出一個生成藥物分子的模型，在完成訓練之後用該模型生成候選藥物。

人工智慧具體用到了兩類方法：一個是深度學習方法，在這裡深度學習方法主要是

RNN和生成式對抗網路（GAN,Generative Adversarial Networks），GAN是近年來非常火的一種學習模型，通過生成模型和判別模型相互博弈產生模型。另一個是強化學習方法，用人類已經研製出的藥物作為監督樣本，調整模型引數。關於強化學習、監督學習、非監督學習方法，Yann LeCun大神對它們有一個比喻圖如下：

640?wx_fmt=jpeg

生成模型的輸入是什麼呢？回想GAN方法正在影象處理中，輸入就直接是影象本身。而在新葯研製中，如果將分子數字化是個很好玩的事情，因為總不能將一個分子直接搬到計算機記憶體裡去吧（想想都怪怪的），只能將分子數字化。而人類對分子描述包括分子式、分可以作為分子的數字化特徵。

例如在《

The cornucopia of meaningful leads: Applying deep adversarial auto encoders for new molecule development in oncology》論文中，他們使用用美國癌症研究所（NCI）的NCI-60藥物篩檢資料庫中針對乳癌細胞MCF-7的6252種化合物，以及分子指紋和分子濃度、生長抑制百分比等資料作為分子的數字化特徵，模型輸入包括166個引數，來訓練一個生成模型。他們所設計的深度網路結構，由輸入層（166+1），編碼網路（分別由128個和64個神經元組成的兩層網路）、解碼網路（分別由64個和128個神經元組成的兩層網路）、輸出層（166+1）、中間的潛在層（分別由4個神經元和1個代表抑制癌細胞效果資料的GI）、鑑別網路（分別由64個和3個神經元組成的兩層網路）組成。研究人員在PubChem的七千多萬個小分子中，發現了69個化合物，其中13個是已經申請專利的藥物分子，另有13個是被PubChem BioAssay登記有效的化合物。

也有文章直接用分子式或者SMILES資料、分子影象以及其他化學和生物相關的分子結構表徵資料作為輸入，建立模型。想想都覺得瘋狂，直接用SMILES資料描述一個分子，也就是將一個分子類比一個自然語言句子，採用自然語言處理方法中常用的RNN或者LSTM方法對這個分子進行建模。這個AI系統得多智慧啊！！！直接看分子式就能研製藥物了！！本文一開頭提到的兩篇論文就是用SMILES資料作為模型輸入，訓練模型的，他們發現直接學習分子式也是一個可行的策略。

對分子式用SMILES編碼方法如下圖。在本文開頭提到的文章中，作者利用RNN方法（或者LSTM方法）可以訓練出生成全新SMILES字串的模型，再基於強化學習中的遷移方法，利用之前人類的小分子資料集作為學習範本，對前面RNN模型進行微調。最終得到的生成模型有可能產生出於真實世界中藥物的化合物。

640?wx_fmt=png

用人工智慧方法設計新葯看起來很容易、但實際上，當前AI設計新葯存在許多缺陷：一是很難解釋，設計出來的模型為什麼能成功，缺乏解釋。二是樣本量不夠大。儘管分子式達到了千萬的規模，但是監督資料卻非常少，根據《Nature Reviews Drug Discovery》2016年的資料，在被FDA批准的1578個藥物中，總共涉及的靶點數才667個。而且還沒辦法想AlphaGO那樣自動生成樣本。三是強化學習方法中的獎勵分無法明確給出，使得現有的強化學習方法運用在新葯研製上，真正起作用有限。四是就算挑選出新的分子式，它的臨場表現如何還得經歷九死一生的過程。

歸根結底，是因為我們對新葯產生的分子機制還不真正清楚，用人工智慧方法研製新葯任重道遠。

往期回顧：

640?wx_fmt=jpeg

《我不是藥神》與AI研製新葯

往期回顧：

《我不是藥神》與AI研製新葯

對《我不是神藥》的點點看法

我不是藥神，我是AI智能電銷機器人

《我不是藥神》！小編也看了，用Python分析為何能三天破10億！

孔壹學院：我不是“藥”神，只是在進行一場區塊鏈世界的救贖

用 Python 帶你看《我不是藥神》

Python分析《我不是藥神》豆瓣評論

《我不是藥神》票房超25億曝片段呈現群像式演技

《我不是藥神》

程式設計師版“我不是藥神”：求求領導，別再追查假簡歷了

《我不是藥神》背後的真相

《我不是藥神》觀後感

《我不是藥神》熱映引總理重視，區塊鏈能否讓“天價藥”成為歷史?

我不是藥神——山寨也能救命

觀《我不是藥神》有感

關於《我不是藥神》的一些思考

使用Python分析《我不是藥神》電影豆瓣評論

第五期：崔永元公佈逃稅、我不是藥神投資方回本｜網際網路行業公會

《我不是藥神》：我會資料分析，我可以為他們做些什麼？

我不是藥神評價

《我不是藥神》與AI研製新葯

往期回顧：

相關推薦