1. 程式人生 > >追求大資料 首先要保證資料可靠

追求大資料 首先要保證資料可靠

 

 

由於大資料和深度學習的推動,人工智慧在當下已成為科學技術領域炙手可熱的名詞。眼下,許多人談起大資料津津樂道,以為有了大資料,再加上深度學習,就可以無所不能了。然而事實並非如此簡單。許多人以為通過多中心、大樣本收集到越來越多的資料就是大資料,卻忽略了一個十分重要的問題,即資料的真實性。

 

就醫療衛生界而言,在各級各類醫院中都存在資料不真實的問題。據媒體報道,山東省鄒城市一老人受傷住進該市某醫院,家屬發現收費清單上老人一天內竟然持續吸氧48小時。在同一醫院,陳先生的奶奶因意外摔傷住院,出院後發現費用清單上顯示住院6天吸氧278小時,平均每天吸氧40多個小時。某三甲醫院的一住院醫師竟然不會看什麼是杵狀指,明明患者有典型的杵狀指,其病歷上硬是寫的“未見杵狀指”。呼吸科的大夫不會辨識Veclron囉音,明明是典型的IPF患者,胸部可以聽到典型的Veclron囉音,病歷上竟然寫“未聽到Veclron囉音”。還有醫生明明患者是典型的脊柱側後彎,病歷上卻寫成胸廓脊柱無畸形。內科住院醫師竟然不知道什麼是竇性心律不齊、T波倒置和T波低平,有的醫生竟然在典型的心房纖顫患者的心電圖上測量出P-R間期來,在一個典型的心房纖顫患者的住院日誌中,竟然會出現脈率96次/分,而心率卻為66次/分……這些極為荒唐。

 

試想,如果我們所倡導的大資料就是建立在這樣虛假的資料基礎之上,即使經過深度學習、精密處理後得出的結果和結論的可信性又有多大,這樣的結論又有什麼實際價值呢?

 

(圖片來源於網路)

 

誠然,出現上述問題的原因是多方面的。我們不排除某些情況下問題出在醫生的水平和能力欠缺,並非故意造假。但是,也有的問題是源於工作態度不嚴肅,敷衍塞責,對工作不負責,對人民健康和生命不負責。目前社會上瀰漫著一種浮躁的情緒,人們往往追求一夜成名、一夜暴富,而不願意日復一日紮實、認真地積累,不願意經年累月地學習和工作。表現在醫療衛生系統,有一些醫院津津樂道和攀比的不外乎是醫院有多少張床,門診量為多少,病房收治病人數,平均住院天數,床位使用率和週轉率,每年毛收入多少個億等,至於疑難病例確診率、危重病人搶救成功率、醫療差錯、病歷質量等則無人問津或不敢深查。醫療科研上,也是片面追求論文數量和SCI多少,買論文,請人捉刀代筆,以致形成了產業鏈,科研資料造假已經在國內外造成了極壞的影響。

 

總之,大資料固然迷人,然而資料的真實性更為重要,因為資料的真實性乃是資料生命力所在。近悉,全國已有8個省份設立了與大資料發展相關的全新機構,在此,也想提醒一下相關部門,在組建大資料機構時務必要保證資料的真實性和可靠性,監管部門也要加大對資料造假行為的懲處力度。

在這裡我還是要推薦下我自己建的大資料學習交流裙:805127855, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴。