1. 程式人生 > >拯救乳房:乳腺癌AI診斷系統

拯救乳房:乳腺癌AI診斷系統

640?wx_fmt=gif

背景:7月28日,騰訊雲在北京舉辦雲+社群沙龍,邀請來自騰訊與四川雲檢科技的五位AI技術專家,分享他們在專業領域的AI開發經驗,幫助開發者在具體行業場景中實踐AI技術。本文根據江鋮在【7.28日騰訊雲+社群技術沙龍-AI技術全面場景化落地實踐】現場演講內容整理而成。

講師介紹

江鋮,武漢大學博士,法國傅立葉大學博士後,騰訊AI醫療中心高階工程師。研究方向主要為乳腺癌鉬靶和病理AI學習系統構建。

本次分享大綱:

1.AI乳腺癌診斷的研究背景

2.乳腺鉬靶AI診斷系統

3.乳腺病理、核磁共振和超聲研究

4.總結

AI乳腺癌診斷的研究背景

隨著時代的進步和經濟發展,人們的健康意識日益提高,同時伴隨著AI技術的發展,AI醫療理所應當地成為了網際網路行業內的風口,值此之際,騰訊推出了騰訊覓影,目前已經涵蓋了食管癌、肺癌、乳腺癌、結腸癌、宮頸癌和糖尿病性視網膜病變。

640?wx_fmt=png

為什麼研究乳腺癌?

開展乳腺癌方向的研究簡單來說主要基於兩方面的原因,一是對於女性來說乳腺癌是所有惡性腫瘤當中發病率最高的一種,在國內約佔全部惡性腫瘤的17%左右,正嚴重危害著女性的健康;二是乳腺癌雖然發病率很高,但如果在較早期發現,治癒的可能性非常高。相對美國來說,我國的五年生存率還較低,這主要是因為中國人口基數過多,有經驗的影像科醫生較為缺乏,使得大範圍早篩困難重重,騰訊覓影釋出的AI乳腺癌診斷系統能夠有效緩解這一矛盾,最大限度地幫助患者和醫生。 

640?wx_fmt=png

AI乳腺癌一體化診療系統

現在對乳腺癌的診斷主要依賴超聲、鉬靶、核磁共振、病理和基因等,對於一般的三甲醫院,通常先使用鉬靶進行篩查,如果無法定性,會要求病人進一步進行超聲和核磁共振檢查,如果出現疑似惡性的情況,將進行病理穿刺檢查,並對是否癌變,惡性程度以及分子分型做出判斷。

我們的目標是能夠把這些資料模態有機地結合起來,形成一個完整的體系,從而提高乳腺癌的診療技術。由於其中最主流和有效的篩查診斷方式是鉬靶,因此我們在這方面的研究開展最早,目前騰訊的AI鉬靶乳腺癌診斷系統已經對外發布,並已經在30多家三甲醫院落地試用。

640?wx_fmt=png

乳腺鉬靶AI診斷系統

1.目標功能

乳腺鉬靶診斷系統主要包含三方面的目標功能。第一是實現了疑似病灶的定位;第二是給出了乳房的良惡性判定;第三是能夠自動生成影像報告。這些功能的目標是實現和醫生的相互配合,減少誤診率和漏診率,並且隨著模型的不斷優化可以逐步地降低醫生的勞動強度。

2. 技術框架

這三方面的目標功能是如何實現的呢?這主要基於一個包含三個維度的技術框架。其中架構前端是鉬靶影像的前處理層;中間層是AI學習模型;最後是通過醫生反饋對前兩部分進行的動態更新層。

640?wx_fmt=png

在前處理層,主要是對不同廠商(例如西門子、Hologic、GE)裝置進行窗寬窗位的歸一化適配,使得輸入後續演算法的資料具有儘可能類似的風格。另外,會結合醫生的看片經驗,對於可能的異常區域進行ROI提取,以儘可能地減少不相關資訊的干擾。

在中間層,我們為了乳腺癌鉬靶檢查而重新設計了全新的神經網路模型TMuNet,該網路包含四個方面的特點。第一是傳統的網路輸入通常都是單圖輸入,而現在的方案可實現對左右乳CC位和MLO位進行對比的四張圖同時輸入;第二是採用多尺度網路,使得圖片輸入網路前不需要進行縮放;第三是漸進式的網路構建,這種方式類似大腦學習過程,它把疑難問題分解後逐層解決,在構建網路時由區域性到整體,由單幅影象到多幅影象;第四是自步學習的訓練方式,類似於大腦由易到難的學習方式,先將訓練的樣本按難易程度進行分類,在訓練過程當中由易到難地逐步把樣本加進去,對模型進行多輪訓練,這可以讓模型達到最好的效果。

3.當前精度

在三層技術框架下,通過對各項技術合理的組織和運用,系統達到了業內領先的水平。在我們的工作經驗中,我們發現疑難病例的數量和種類能在很大程度上決定AI系統的上限。因此,我們非常注重資料集的運營,對於部分難例,我們會請專家進行標註或者利用病理和其他模態資料進行交叉確認。

640?wx_fmt=png

乳腺病理、核磁共振和超聲研究

1.乳腺病理

目前乳腺癌病理研究主要解決兩方面問題,第一是組織學分級,即定義腫瘤惡性的程度,它主要依據核分裂計數、核多形性打分、腺管形成程度三項內容;第二是免疫組化,使用不同染色片進行分子分型研究。目前研究團隊已經完成了有絲分裂技術方面的研究,並已經開展對於KI-67和HER2染色片的研究工作。對於已經完成的有絲分裂檢測部分,在學術界TUPAC專業比賽上,之前的冠軍F1 score分值為0.73,而我們的系統可以達到0.82,有很大程度的提升。精度的提升主要歸功於三方面的技術。第一點是使用了難例挖掘方式,採用多輪迭代方式然後在每一輪次對樣本進行整理,由專家確認較難的標註,再放入樣本集中強化訓練;第二點是影象的歸一化,通過使用對抗網路將影象做歸一化,達到提升;第三點是在速度上改進,拋棄原始計算機視覺中將一整幅圖切分的方式,採用共享計算和模型壓縮的效果,讓一幅病理片可以達到0.5秒以內的處理速度,基本上接近於實時。

2.核磁共振和超聲

對於乳腺MRI,有多種3D資料模態,而對於病灶的標註依然是所有研究工作的基礎。目前研究團隊推出了一種半自動標註工具,通過構造一個半自動的神經網路模型,將醫生手工資訊融入神經網路,輔助分割病灶,此標註工具可以大大加速病灶的標註,由純人工的幾十分鐘提升到1分鐘的水平。在乳腺超聲方面,我們正在開展資料收集工作,並與此同時進行相應的調研工作。

總結

通過乳腺癌AI診斷系統的研發,專案團隊對於樣本的選擇和標記,網路結構的設計,訓練方法和技巧等都有了較深的積澱。乳腺樣本庫也在不斷的豐富和擴充套件中,大量的疑難病例被逐步加入,一步步地構建著產品的護城河。在各模態資料研究逐漸成熟之後,我們的最終目標是將多個模態資料進行融合,實現高精度診斷和個性化的服務,這將極大地造福患者和醫生。

在公眾號後臺回覆“乳腺癌AI”可獲得本次沙龍上分享的PPT。

640?wx_fmt=png