使用Keras處理和識別醫學影象

阿新 • • 發佈：2019-01-10

最近在做醫學影象的處理，簡單的記錄一下。

預處理

已知的資料集是通過labelimg工具打好標籤的圖片(如下圖所示)，總共區分三種病例。但標籤框的大小不一致，必須要統一大小，以滿足後期製作統一格式的資料集(*.npz、*.tfrecord等)。

但如果只是簡單的將圖片取出來再統一大小，圖片的解析度可能會受影響，所以這裡先將所有的標籤框統一大小(取最大值)再把圖片取出來(如下圖)。

通過分析，發現樣本資料不平衡，其中常見的病例佔了近90%，不利於模型的訓練。

查閱了資料找到了兩種方法：

一.可以採用資料少的資料集裡面資料增廣的方式：
1.影象crop
2.影象旋轉
3.影象平移
二.可以採用修改損失函式的方式，在資料量小的樣本上增大權重
樣本數量差別很大，會導致少樣本的類別基本不被預測到，就像傳統機器學習一樣。
引數調節個人感覺主要在損失函式的計算上。

這裡我使用了第一種方法(第二種後面再試試)。Keras內建的ImageDataGenerator用來生成資料非常方便，而且這個生成器還提供很多增強識別效果的特徵提取方法，如：去中心化、均值化、ZCA白化等。

製作npz格式資料集

訓練網路

用Keras簡單構建了卷積神經網路，程式碼如下：

#! /usr/bin/env python
# -*- coding:utf-8 -*-
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Convolution2D, MaxPool2D
from keras.utils import np_utils
import numpy as np

# 全域性變數
batch_size = 128    # 每批次多少樣本
nb_classes = 3     # 類別總數
epochs = 50         # 遍歷次數
img_rows, img_cols = 100, 100
nb_filters = 32         # 卷積個數
pool_size = (2, 2)      # 池化面積大小
kernel_size = (3, 3)    # 卷積核大小
'''
    第一步，載入資料
'''
# 自定義資料
(x_train, y_train), (x_test, y_test) = np.load('train_data_1.npy', 'test_data_1.npy')
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')
# 將標籤資料轉換為二維
y_train = np_utils.to_categorical(y_train, nb_classes)
y_test = np_utils.to_categorical(y_test, nb_classes)
'''
    第二步，構建網路層
'''
# 卷積神經網路
model = Sequential()
model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1]),
                        padding='same',
                        input_shape=(100, 100, 1)))   # 卷積層1
model.add(Activation('relu'))
model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1])))  # 卷積層2
model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=pool_size))   # 池化層

model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1])))  # 卷積層3
model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=pool_size))   # 池化層

model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1])))  # 卷積層4
model.add(Activation('relu'))
model.add(MaxPool2D(pool_size=pool_size))   # 池化層

model.add(Flatten())      # 拉成一維資料
model.add(Dense(128))   # 全連線層
model.add(Activation('relu'))
model.add(Dense(nb_classes))
model.add(Activation('softmax'))
'''
    第三步，編譯訓練
'''
model.compile(loss='categorical_crossentropy', optimizer='adadelta', metrics=['accuracy'])

'''
    第四步，訓練
'''
print('開始訓練')
model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, verbose=1, validation_data=(x_test, y_test))
'''
    第五步，輸出
'''
print('開始評估')
scores = model.evaluate(x_test, y_test, verbose=1)
print('Test score:', scores[0])
print('Test accuracy:', scores[1])
# 儲存模型
# model.save('model.h5')

評估後的準確率為96%，通過調整損失函式和引數優化等，準確率還能提高點(ps:剛開始直接用的Keras的神經網路例子，準確率只有50%，卷積神經網路還是強大)。

結論

對於醫學影象的分類識別，最主要的就是影象特徵的提取，如果直接把原圖放進去訓練效果很差。

使用神經網路來識別不常見的影象資訊，這種方法越來越受到關注，後面試試用機器學習的方法來分類看看效果如何。

使用Keras處理和識別醫學影象

最近在做醫學影象的處理，簡單的記錄一下。預處理已知的資料集是通過labelimg工具打好標籤的圖片(如下圖所示)，總共區分三種病例。但標籤框的大小不一致，必須要統一大小，以滿足後期製作統一格式的資料集(*.npz、*.tfrecord等)。但如果只是簡單的將

用Apache Hadoop和Apache Solr處理和索引醫學影象

你還在為大規模影象管理感到頭疼嗎?讀下去,看看這個團隊是如何使用開源產品來更有效地索引和儲存高解析度醫學影象的。時下，醫學影像迅速地成為了一種評估病人狀況，以及確定是否存在醫療條件的最好非侵入性方法。多數情況下，用來協助診斷的影像是構建現代醫學體系的第一步，而成

深度學習（一）計算機如何處理和識別圖片揭祕

前言先來一張美景圖，欣賞一下大自然，順便大家猜猜這是哪裡？有時候真感嘆大自然的雄偉壯闊，自然形成了無數的山和風景不需要任何點綴，有

動態HTML處理和機器影象識別-----案例：嘗試對驗證碼進行機器識別處理

嘗試對知乎網驗證碼進行處理：許多流行的內容管理系統即使加了驗證碼模組，其眾所周知的註冊頁面也經常會遭到網路機器人的垃圾註冊。那麼，這些網路機器人究，竟是怎麼做的呢?既然我們已經，可以成功地識別出儲存在電腦上的驗證碼了，那麼如何才能實現一個全能的網路機器人呢? 大多數網站生成的驗證碼圖片都具有以下

動態HTML處理和機器影象識別-----機器學習：訓練Tesseract

訓練Tesseract 大多數其他的驗證碼都是比較簡單的。例如，流行的 PHP 內容管理系統 Drupal 有一個著名的驗證碼模組(https://www.drupal.org/project/captcha)，可以生成不同難度的驗證碼。那麼與其他驗證碼相比，究竟是什麼讓這個驗

ImageNet和CNN怎樣幫助醫學影象的識別

從ImageNet和CNN說起影象的分類和識別一直是計算機視覺的熱門研究領域，在醫學影象領域，很多方法也都是從計算機視覺領域借鑑過來的，而計算機視覺的許多方法又離不開機器學習和人工智慧的基礎。在典型的影象分類和識別問題中，通常有兩個重要的步驟，一個是特徵提取，常見的有GLCM, HOG, LBP,

影象處理和影象識別中常用的matlab函式

1、imread：read image from graphics file； 2、imshow：display image in Handle Graphics figure； 3、imwrite：write image to graphics file； 4、rgb2gray：convert RGB im

基於opencv3.0下的人臉識別和識別部分的高斯模糊處理

根據 proc enter BE AS lur .com code 示例如題這裏將任務分解為三大部分： 1.錄播放視頻 2.人臉識別 3.部分高斯模糊其中重點放在人臉識別和部分高斯模糊上 1.錄播放視頻（以opencv中的VideoCapture類進行實現）首先羅

醫學影象處理

一、DICOM介紹 DICOM（Digital Imaging and Communications in Medicine）即醫學數字成像和通訊，是醫學影象和相關資訊的國際標準（ISO 12052）。DICOM被廣泛應用於放射醫療、心血管成像以及放射診療診斷裝置（X射線，CT，核磁共振，超聲等

影象處理和OpenCV初步

影象從數學和計算機的角度理解就是一個矩陣，矩陣中的每一個元素叫做畫素，又由於影象有灰度影象和彩色影象之分，所以影象在矩陣的基礎上引入通道(channel)，其中色彩用數字來表示的時候，規定數字0表示黑色，數字255表示白色。 OpenCV角度來看影象 OpenCV中的cv::Mat類就是用來表示影象的矩陣

[Python影象處理] 十.形態學之影象頂帽運算和黑帽運算

該系列文章是講解Python OpenCV影象處理知識，前期主要講解影象入門、OpenCV基礎用法，中期講解影象處理的各種演算法，包括影象銳化運算元、影象增強技術、影象分割等，後期結合深度學習研究影象識別、影象分類應用。希望文章對您有所幫助，如果有不足之處，還請海涵~ 同時推薦作者的

MATLAB：虹膜識別的影象灰度化處理，直方圖均衡化

（1）影象灰度化處理：讀取一張圖片之後，進行灰度化處理，然後對其進行直方圖均值化。 clear;close all %讀取原圖地址 RGB= imread('D:\img\1.jpg'); %影象灰度化處理 GRAY = rgb2gray(RGB); % 直方圖均衡化:Histogr

遙感影象處理 | 採用GDAL讀取影象成功後獲取影象的一些基本資訊和統計資訊(C#)

描述資訊： const char* GDALDataset.GetDriver().GetDescription()，通常是影象的格式影象大小：影象寬度 int GDALDataset.GetRasterXSize() &nbs

Keras處理TIFF影象

Keras是一個高層神經網路API，Keras由純Python編寫而成並基 Tensorflow、Theano以及CNTK後端。Keras 為支援快速實驗而生，能夠把你的idea迅速轉換為結果，如果你有如下需求，請選擇Keras：簡易和快速的原型設計（keras具有高度模組化，

OpenCV+OCR 影象處理字元識別原理及程式碼

需配置好OpenCV和OCR環境下執行 1、OpenCV簡介 OpenCV的全稱是Open Source Computer Vision Library，是一個跨平臺的計算機視覺庫。 OpenCV用C++語言編寫，它的主要介面也是C++語言，但是依然保留了大量的C語言介

keras 處理文字，分類，數值資料，並新增進網路的步驟和方法

一，讀取資料：主要使用pandas 讀取，以後考慮使用其他方法（libsvm等）二，獲取訓練集和測試集：這一步主要是劃分資料集，drop()掉訓練集裡的預測那一列三，處理缺失值：可以使用fillna(value,inplace)來把缺失值補全四：送入網

【數字影象處理系列四】影象資料集增強方式總結和實現

本系列python版本：python2.7.15 本系列opencv-python版本：opencv-python3.4.2.17 本系列使用的開發環境是jupyter notebook，是一個python的互動式開發環境，測試十分方便，並集成了vim操作，

一起學opencv-python十（給影象加噪聲，模糊處理和影象銳化）

參考了https://www.bilibili.com/video/av24998616/?p=9 https://www.bilibili.com/video/av24998616/?p=10和 https://opencv-python-tutroals.readth

深度學習（七）U-Net原理以及keras程式碼實現醫學影象眼球血管分割

原文作者：aircraft 原文連結：https://www.cnblogs.com/DOMLX/p/9780786.html 全卷積神經網路醫學影象分割框架醫學影象分割主要有兩種框架，一個是基於CNN的，另一個就是基於FCN的。這裡都是通過網路來進行語義分割。那麼什麼是語義分割？可

【資訊科技】【2011】【含部分原始碼】影象處理和機器學習技術在數字乳腺影象中癌組織檢測與分類的應用

本文為馬來西亞馬來亞大學（作者：JAWAD NAGI）的電腦科學碩士論文，共355頁。乳腺癌是最常見的癌症之一，也是導致女性死亡的主要原因。乳腺攝影是目前最有效的乳腺癌影像學檢查方法，可用於鑑別異常癌細胞。研究顯示，在當前的乳腺癌篩查中，大約15%到30%的

使用Keras處理和識別醫學影象

預處理

製作npz格式資料集

訓練網路

結論

相關推薦