醫療保健研究報告-生物大資料的時代(附下載)
醫藥行業的大資料時代即將到來,未來十年,將會逐漸對行業內產業鏈各個環節產生深遠影響。
“大資料”這一名詞 2012 年在奧巴馬國情諮文中被重點提及,從此為大眾所知,近幾年來發展迅猛,已經在很多行業得到體現,國內比較經典的案例是阿里巴巴利用大資料分析作網路精準營銷,顛覆了傳統零售業。醫藥行業的變革歷來發生較為遲緩,然而即使如此,醫藥資料的積累正在加速進行,我們認為從供給和需求兩方面來看,醫療大資料即將迎來量變到質變的一刻。
生物大資料包羅資訊多、價值大,若能有效挖掘,醫藥行業的每個參與方均有望從中受益。“精準醫療”的實現依賴於生物大資料的解讀。美國總統奧巴馬近日提出的“精準醫療”概念、和以往所說的“個性化醫療相似”,指標對同一種病、根據每個患者的不同情況採用不同的臨床路徑。其背後依賴於對各個患者多方面資料的積累,包括各種生物組學資料(基因組、蛋白組等)、患者病史、生活習慣、行為習慣等多方面,對比過往患病人群到相關資料,通過大資料分析,找出最優的治療方案。這一理念的實現,依賴於生物大資料的積累、以及後續對這些資料的挖掘和解讀。
我們認為生物大資料行業會有兩個壁壘: 1)資料的積累; 2)資料的挖掘和解讀。 前者是先進入該子行業的廠家具備的天然優勢,例如華大基因在基因測序積累多年,中國人的基因樣本庫; 23andme 通過對個人服務積累的基因組資料庫等。資料的挖掘和解讀壁壘更高,從美國來看,目前涉足生物大資料處理和分析的公司主要有兩類:一類是傳統的 IT 公司和統計資料處理公司,例如 Google、 IBM、 SAS, 另一類是專職於生物大資料處理的公司,例如 NEXTBIO、 Knome 等。國內目前尚無專職處理生物大資料的公司,未來一定會有這種業態出現。
1. 資料積累 + 技術進步 = 生物大資料時代來臨
1.1. 供給和需求雙輪驅動,生物大資料時代已經到來醫藥行業的大資料時代即將到來
未來十年,將會逐漸對行業內產業鏈各個環節產生深遠影響。“大資料”這一名詞 2012 年在奧巴馬國情諮文中被重點提及,從此為大眾所知,近幾年來發展迅猛,已經在很多行業得到體現,國內比較經典的案例是阿里巴巴利用大資料分析作網路精準營銷,顛覆了傳統零售業。醫藥行業的變革歷來發生較為遲緩,然而即使如此,醫藥資料的積累正在加速進行,我們認為從供給和需求兩方面來看,醫療大資料即將迎來量變到質變的一刻。供給驅動來自於醫療電子資料的積累、資料探勘手段的提升和移動互聯的普及。伴隨著電子病歷,二代測序,網際網路醫療,藥品網售、雲端儲存這些全新技術平臺出現,醫療資料電子化成為可能,醫療大資料的積累正在加速進行。同時移動互聯和智慧手機的普及,帶來了全新的醫療、健康理念,獲得患病人群和健康人群的即時監控資料成為可能。另一方面, GOOGLE、 IBM 這類 IT 龍頭讓資料探勘、大資料分析的手段日益精進。需求驅動來自於以下方面。 1)醫藥產業鏈中各個環節的效率均有待提升:醫保吃緊,醫生資源緊缺,患者體驗差、不滿升級; 2)“精準醫療/個性化醫療”的需求:不同於以往基於人群統計結果的循證醫學,精準醫療講究“對人下藥”而非“對症下藥”,二代測序技術讓精準醫療成為可能; 3)健康管理&慢病管理的需求:人口老齡化,癌症、心腦血管疾病、糖尿病等慢性病發病率逐年攀升,同時人們的保健意識逐漸甦醒,帶來健康管理和疾病管理的需求。
1.2. 資料量的積累:量變到質變
醫藥行業是資料密集的行業,資料量正以爆炸式速度增加。按照 IDC Digital Universe Study2012 年的預測,截至 2020 年,人類產生和複製的總資料量將達到 40 萬億 GB,是 2010年的 30 倍。同時資料生成和共享的速度也在迅速增加,導致資料的加速積累。醫藥行業是資料密集的行業,囊括藥企研發,科研進展,醫生診療記錄,患者各種病歷,檢測和用藥記錄,患者大健康資料,付費方(保險)賠償記錄等方方面面。 Intel 在 2013 年預測,到 2020 年,醫療資料也將會積累到萬億 GB 的量級。
1.3. IT 技術的進步讓大資料分析成為可能
1.4. 生物大資料的應用已經存在: IBM Watson
以 IBM 的超級電腦 Watson 為例,生物大資料已經開始被廣泛應用於臨床診斷、醫保分析、癌症研究、健康管理等多個領域。生物大資料的應用並非空中樓閣, Watson 是世界上最大的超級電腦,在大資料分析方面,設計醫藥行業的專案覆蓋十分廣泛,包括與WellPoint 合作進行藥品福利管理和惡性腫瘤的臨床診斷,與 BlueCross 合作進行醫保資料分析,與 Sloan 癌症中心合作進行癌症研究、輔助醫生進行癌症診斷等多個方面。 JP Morgan估計, 2017 年, Watson 的大資料分析可以為 IBM 帶來 20 億美元的收入。
2.生物大資料的來源
生物大資料將主要來源於四個方面:研發資料、診療資料、患者的行為和感官資料和醫保資料。
研發資料主要指藥企或科研機構進行研發獲得的資料。包括藥企從臨床前、 I-III 期臨床、 IV 期臨床、上市後大量人群中進行療效&副作用跟蹤獲得的資料;還包括最新的科研進展。
診療資料主要指患者在醫院進行就醫行為產生的資料。包括病歷(電子病歷),傳統檢測手段(生化、免疫、 PCR 等)、新興的檢測手段(二代測序、基因晶片等)、醫生的用藥選擇、診療路徑記錄等。
患者的行為和感官資料指患者自身的、在院外的行為和感官所產生的資料。包括患者的家族病史、服藥的依從性、以及通過各種可穿戴裝置&即時監控裝置&智慧手機採集到的疾病管理、健康管理資料。還包括患者在網際網路上的一些網路行為產生的資料,例如尋醫問藥、與患有交流等。
醫保資料是指一切與付費方相關的稽核記錄、報銷記錄。包括參保人的病史、報銷記錄、藥物經濟學評價;同病種下人群診療路徑比對等。
2.1. 診療資料:二代測序讓資料積累實現了質的飛躍
傳統的診斷手段目前依舊是診療資料的主要來源。傳統的院內檢測專案,例如生化診斷、免疫診斷、核酸診斷等,目前依舊體量最大,現階段會是診療資料主要的組成部分。一些新的技術,例如基因晶片、二代測序等,目前由於技術新穎,尚未全面推廣,未來隨著成本下降,對臨床指導作用會越來越強,替代部分傳統的檢測手段是大趨勢。
二代測序(高通量)技術的出現讓全基因組測序得以大範圍進行。
2014 年 Illumina 在 JPMorgan 的大健康年會上宣佈利用其二代測序平臺,全基因組測序成本降至 1000 美金以下(多年前用一代測序進行人類基因組計劃,成本是 30 億美金/個基因組),同時二代測序的通量遠高於一代測序,自此大範圍的基因組測序成為可能,基因組資料開始迅速積累,逐步為臨床操作和基礎研發帶來價值。
基因組資料價值極高、存在無限被挖掘的可能性。
基因組資料隱含生命全部密碼,對臨床、科研、研發價值極高,目前 CFDA 已經批准的應用是無創產前篩查,進行試點的有單基因病篩查,未來有望繼續放開癌症早期篩查、癌症臨床用藥指導等後續應用。另一方面,積累足夠多人群基因組資料庫後,基因資料還可以實現幫助藥企提升研發效率、進行疾病預警等功能。
電子病歷的推廣是趨勢,保障診療資料電子化,是大資料分析的前提。
電子病歷電子裝置(計算機、健康卡等)儲存、管理、傳輸和重現的數字化的病人的醫療記錄。我國衛生部先後在 2010, 2011 釋出了關於電子病歷系統的規範和通知檔案,近年來已在北京、上海等多個城市廣泛試點,電子病歷取代手寫紙張病歷是趨勢。診療資料電子化是大資料分析的前提條件,屆時臨床全部的診斷結果、醫生的處方行為、臨床的診療路徑和效果都可以在人群範圍內實現集中分析。
2.2. 互聯健康、移動健康登上舞臺
大部分可穿戴裝置尚未能提供醫療價值,但技術不斷進步,資料會更值得挖掘。 目前的的可穿戴裝置、移動健康裝置採集的資料有以下幾類:血糖(連續或間斷)、心率、血壓、體重、體溫、睡眠、各種運動資料等。目前大部分的可穿戴裝置走的依舊是酷炫娛樂路線,尚無證據證明大部分移動醫療裝置所採資料具備臨床價值。 Google 此前披露其智慧手機 Project Ara 模型,已經具備心電、呼吸檢測功能,尚有更多功能在開發當中。隨著技術的進步,可穿戴提供的資料質量會更高、穩定性會更好,種類也會更多,其臨床價值會更值得挖掘。
可穿戴的成功案例:WellDoc 的BlueStar,通過FDA 認證,臨床價值明確。WellDoc 的BlueStar 是一款病人主導的糖尿病管理產品,進行了嚴格的臨床實驗證明其臨床價值,是為數不多的通過FDA 認證的移動醫療產品之一,需要醫生開具處方,II 型糖尿病患者才可使用,也側面其已被正規醫療體系所接受。BlueStar 幫助病人進行自主糖尿病管理,可以提供即時血糖、血壓、血脂監測,通過資料處理為醫生臨床決斷給出建議;還可以給病人進行健康管理提醒。BlueStar 的成功也證明了可穿戴裝置確實可以帶來臨床價值,其資料也值得積累和挖掘。
網路和移動互聯的普及,患者行為將網際網路化和數字化,提供新一維度的大資料。2014年是網際網路衝擊醫藥行業的元年,阿里巴巴力推未來醫院、網路問診平臺春雨醫生融資、處方藥網售放開傳聞。隨著網路普及,部分就醫、購藥行為向網路端轉移是必然趨勢。然而更早的時候開始,部分患者已經會在網路上詢問病情,患者尋醫問藥的行為網路化和數字化,為生物大資料增添了一個新維度。未來通過網路搜尋+大資料分析做流行病學預測,精準推薦尋醫購藥資訊在技術上都是可行的。
2.3. 研發大資料提升研發效率
研發資料包含了藥企目前所有臨床前、臨床的研發資料、科研機構進行基礎研究的研發資料、以及藥品上市後,後續對藥效和安全性進行跟蹤的相關資料。遠期來看,網際網路、雲端儲存、大資料會帶來藥企研發模式的變革,有望提升新葯研發效率。在這一領域尚處於願景階段,部分巨頭跨國藥企已經開始有所嘗試:GSK 2013 年和統計巨頭SAS 合作開展藥企R&D 資料公開的專案,旨在通過分享經驗,加緊和科研界的合作,避免業內重複研發、資源浪費的情況。醫藥大資料助力研發的另一個方向是希望通過對產品上市後用藥人群分析,檢測其療效、副作用,來指導臨床前分子實體的篩選,從而達到提高研發成功率的目的。
3. 生物大資料潛在應用廣泛
生物大資料包羅資訊多、價值大,若能有效挖掘,醫藥行業的每個參與方均有望從中受益。
臨床決策支援,“精準醫療”的實現依賴於生物大資料的解讀。美國總統奧巴馬近日提出的“精準醫療”概念、和以往所說的“個性化醫療相似”,指標對同一種病、根據每個患者的不同情況採用不同的臨床路徑。其背後依賴於對各個患者多方面資料的積累,包括各種生物組學資料(基因組、蛋白組等)、患者病史、生活習慣、行為習慣等多方面,對比過往患病人群到相關資料,通過大資料分析,找出最優的治療方案。這一理念的實現,依賴於生物大資料的積累、以及後續對這些資料的挖掘和解讀。
生物大資料可幫助患者更好的進行健康管理和疾病管理。健康管理和疾病管理在我國剛剛起步,考慮到人口老齡化、慢性病發病率升高、居民健康意識提升等多方面因素,未來是極有潛力的市場。大資料模式下的健康管理和疾病管理,通過收集物件的健康檔案、疾病檔案、生活狀態、睡眠質量、心理表現等生理或心理方面的行為資料,進行分析、處理,監測該物件的身體狀態,通過行為干預,幫助人們改善不合理的行為習慣,實現積極健康的生活方式。
幫助提升藥企研發效率。大資料可以從多方面提升醫藥行業的研發效率:
1)各種組學資料的積累,推動最上游基礎科學的研究,包括瞭解疾病分子機理、開發新靶點、新技術等,下游產業研發收益於上游知識的進步;
2)藥企臨床研究過程中,通過大資料分析尋找最適宜的病人作為臨床物件,提高藥品應答率,節約不必要的時間、經費成本;
3)藥品上市後,通過對產品在實際應用的大批量患者中的有效率和副反應率相關資料的積累和挖掘,反饋給研發管道上游,及早發現潛力專案。
患者行為通過網際網路數字化和網路化,有效的資料探勘對公共健康管理價值無限。網際網路和移動端的普及,越來越多的患者開始通過網路尋醫問藥,搜尋行為、購買行為、地域分佈這些資訊本身構成了新一維度的生物大資料。大型搜尋平臺如 google,已可以實現通過各地人群搜尋行為本身進行流行病學預警;國內也有如阿里巴巴這樣的企業通過終端過往購買行為、瀏覽行為的資料分析後進行精準營銷。隨著網際網路逐漸滲透到醫藥行業的每個角落,積累資料的挖掘潛力值得期待。
生物大資料有望為保險公司提供有效的控費手段。保險公司從產品開發、精準營銷、風險評估、核保核賠、控費等多角度均可受益於大資料分析。
3.1. “精準醫療”的核心是生物大資料分析
精準醫療和循證醫療的核心區別在於精準醫療是依據個體的生物大資料設計臨床方案。傳統的循證醫學,是針對同一病種患病群體的大概率解決方案(循證醫學在患同一病種的患者中進行試驗,採用的是可以治療大部分患者的解決方案並作為此類病種全部人群的標準解決方案),忽視每個病人的個體差異。個性化醫療或精準醫療的理念,是力求綜合考慮每個患者的全部資訊(目前對臨床上有直接指導意義的是基因靶點資訊,未來希望可以包括進含基因組蛋白質組在內的其它“組學”、患者的生活習性、過往病史、家族基因譜、甚至是最新的研發進展等多方面資訊),綜合分析以後提出解決方案。因此精準醫療得以實現的核心,在於積累患者各方面的生物大資料,還在於建立起這些生物大資料和疾病、疾病解決方案之間的聯絡,即資料的解讀也是關鍵。
精準醫療的美股標的“Foundation Medicine”業務流程核心步驟是基因組大資料採集和分析。 Foundation Medicine 通過二代高通量測序採集患者基因組資料,通過特定演算法進行突變分析(點突變、 In/Del、拷貝數異常、重組等),將獲得的突變進行在已有基因資料庫中進行儘可能解讀,最終給出臨床建議,輔助醫生設定治療方案。
基因組大資料目前最主要的應用領域是癌症。 目前除了部分癌症外,別的病種尚未能將基因突變和下游疾病發生、疾病治療方案建立起直接聯絡,因此目前基因組大資料最主要的應用領域是癌症。通過對癌症患者基因組/外顯子組進行全測序分析,尋找可能致病的突變,設計相應的靶向治療方案。 Foundation Medicine 已推出包含 280+種基因突變篩查的試劑盒 FoundationOne,利用高通量測序,一把檢測目前已知的全部可能致癌的突變,尋找疾病根源。其它病種,由於基因突變和疾病之間並無簡單直接因果關係或具體聯絡尚未被知曉,基因組大資料應用的全面推廣需要一定時間。
越來越多靶向治療的出現讓精準醫療越發重要。 靶向治療是癌症等疾病治療方案的主要發展方向之一,隨著人們對癌症的分子分型越來越詳細、越來越多的靶向療法推向世面(替尼類小分子新靶點、抗體耦聯毒素、免疫檢查點抑制劑等),通過基因測序尋找致病突變、設計合適的靶向療法,精準醫療也會變得更加重要。
3.2. 移動醫療會成為醫療的重要組成部分
移動醫療對於慢病管理、健康管理的價值是毋庸臵疑的。 儘管目前大部分移動 APP 尚處於探索階段、能夠採集的資料種類比較侷限,資料的臨床價值不明確,也已經出現瞭如WellDoc 這樣的成功案例。 PwC2015 年針對美國 1000 名醫生和患者的問卷顯示, 86%的醫生相信未來 5 年移動手機 APP 會成為協助病人做健康管理的重要手段。
3.3. 公共健康:流行病學預測
生物大資料可對流行病學做出指引。 例如:針對特定種族多人次的基因組分析比對可以預測疾病易感性,對人群在網路端相關行為資料進行分析可以掌控流感疫情進展等。Google 已經成功依據美國民眾搜尋行為預測了流感疫情; Twitter 也根據各地人微博文風預測當地心臟病風險,所得結果均和疾控中心公佈的實際結果高度吻合。
3.4. 保險公司全面受益
生物大資料有望為保險公司提供有效的控費手段。保險公司從產品開發、精準營銷、風險評估、核保核賠、控費等多角度均可受益於大資料分析。
產品開發:根據各地流行病學資料、患者在網路端搜尋資料進行潛在需求分析,有針對性的進行產品開發。
精準營銷:依據需求分析,將特定的產品有針對性的營銷給相應的單位和個人。
風險評估:對潛在投保人員健康資料、基因資料的掌握,讓保險公司一定程度上可以進行風險評估,制定相應的保費標準。
核保核賠:擁有特定病種群體的臨床路徑資料、用藥資料等,制定合理的核保核賠標準。
控費:美國PBM(藥品福利管理)模式可以成功控費的原因之一是輔助醫生和藥劑師進行了臨床路徑優化和用藥選擇的優化,國內保險公司目前尚且無法做到這一點,然而大量的資料已經開始被積累,這一模式誕生只是時間問題。
3.5. 助力醫藥行業研發
醫藥行業的研發,從上游基礎科學的研發,至於下游藥企產品開發,均可從生物大資料的積累和分析中獲得價值。
對於製藥企業來說,臨床藥物基因組學的研究可以增進對候選藥機理和安全性的瞭解;臨床試驗中,通過基因圖譜篩選最有可能對藥物產生應答的試驗物件、提高藥物的應答率、節約時間和經費成本,提高研發效率;藥品上市以後,追蹤大範圍用藥患者(而不是臨床中有限的幾百例案例)在真實臨床環境下對藥物的應答率和副反應率資料,總結經驗,反饋給上游研發,指導早期化合物篩選。
生物大資料也可推進基礎研究的加速進展。多個藥企已經開始和研究機構合作,進行各種組學、電子病歷等多累生物大資料的蒐集、整合、分析,力圖推進基礎研究的進展。上游知識的積累無疑會帶動下游企業研發步入新的高度。
4. 生物大資料的價值無窮
由於生物大資料有潛力為醫藥行業每個參與方都帶來價值,資料本身存在無窮被挖掘的可能性,價值無法估量。作為簡單的參考,麥肯錫2010 年測算顯示,綜合考慮醫療大資料可以為醫藥行業各個環節帶來的改進,累計有望帶來3330 億美金的價值。千億美金數量級價值的實現有賴於資料的積累和挖掘。
生物大資料的價值在境外已開始被資本追逐。除了著名的基因檢測公司23andme 曾獲google 多倫投資外,羅氏、藥明康德、安進近期都有涉及生物大資料的收購。標的均是積累多年的基因檢測、基因資料處理公司,標的的核心價值都在於資料庫和資料探勘演算法。
5. 資料的積累和挖掘是大資料行業的壁壘
我們認為生物大資料行業會有兩個壁壘:1)資料的積累;2)資料的挖掘和解讀。前者是先進入該子行業的廠家具備的天然優勢,例如華大基因在基因測序積累多年,中國人的基因樣本庫,23andme 通過對個人服務積累的基因組資料庫等。資料的挖掘和解讀壁壘更高,從美國來看,目前涉足生物大資料處理和分析的公司主要有兩類:一類是傳統的IT 公司和統計資料處理公司,例如Google、IBM、SAS, 另一類是專職於生物大資料處理的公司,例如NEXTBIO、Knome 等。國內目前尚無專職處理生物大資料的公司,未來一定會有這種業態出現。