keras實現網路流量分類功能的CNN

阿新 • • 發佈：2018-12-10

資料集選用KDD99
資料下載地址：http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
需求：https://blog.csdn.net/com_stu_zhang/article/details/6987632
執行環境
win10+keras
安裝步驟：https://blog.csdn.net/u010916338/article/details/83822562
資料預處理
包含數值替換文字、數值歸一化、標籤獨熱編碼

# -*- coding: utf-8 -*-
"""
Created on Tue Nov  6 09:24:20 2018

@author: hrh
"""

import pandas as pd
from sklearn.preprocessing import OneHotEncoder
from pandas.core.frame import DataFrame

def get_total_data():
    
    data = pd.read_csv('data_test.csv',header=None)
    
    data[1]=data[1].map({'tcp':0, 'udp':1, 'icmp':2})
    data[2]=data[2].map({'aol':0, 'auth':1, 'bgp':2, 'courier':3, 'csnet_ns':4,'ctf':5, 'daytime':6, 'discard':7, 'domain':8, 'domain_u':9,'echo':10, 'eco_i':11, 'ecr_i':12, 'efs':13, 'exec':14,'finger':15, 'ftp':16, 'ftp_data':17, 'gopher':18, 'harvest':19,'hostnames':20, 'http':21, 'http_2784':22, 'http_443':23, 'http_8001':24,'imap4':25, 'IRC':26, 'iso_tsap':27, 'klogin':28, 'kshell':29,'ldap':30, 'link':31, 'login':32, 'mtp':33, 'name':34,'netbios_dgm':35, 'netbios_ns':36, 'netbios_ssn':37, 'netstat':38, 'nnsp':39,'nntp':40, 'ntp_u':41, 'other':42, 'pm_dump':43, 'pop_2':44,'pop_3':45, 'printer':46, 'private':47, 'red_i':48, 'remote_job':49,'rje':50, 'shell':51, 'smtp':52, 'sql_net':53, 'ssh':54,'sunrpc':55, 'supdup':56, 'systat':57, 'telnet':58, 'tftp_u':59,'tim_i':60, 'time':61, 'urh_i':62, 'urp_i':63, 'uucp':64,'uucp_path':65, 'vmnet':66, 'whois':67, 'X11':68, 'Z39_50':69})
    data[3]=data[3].map({'OTH':0, 'REJ':0, 'RSTO':0,'RSTOS0':0, 'RSTR':0, 'S0':0,'S1':0, 'S2':0, 'S3':0,'SF':1, 'SH':0})
    data[41]=data[41].map({'normal.':0, 'ipsweep.':1, 'mscan.':2, 'nmap.':3, 'portsweep.':4, 'saint.':5, 'satan.':6, 'apache2.':7,'back.':8, 'land.':9, 'mailbomb.':10, 'neptune.':11, 'pod.':12,'processtable.':13, 'smurf.':14, 'teardrop.':15, 'udpstorm.':16, 'buffer_overflow.':17, 'httptunnel.':18, 'loadmodule.':19, 'perl.':20, 'ps.':21,'rootkit.':22, 'sqlattack.':23, 'xterm.':24, 'ftp_write.':25,'guess_passwd.':26, 'imap.':27, 'multihop.':28, 'named.':29, 'phf.':30,'sendmail.':31, 'snmpgetattack.':32, 'snmpguess.':33, 'spy.':34, 'warezclient.':35,'warezmaster.':36, 'worm.':37, 'xlock.':38, 'xsnoop.':39})

    data[2] = (data[2]-data[2].min())/(data[2].max() - data[2].min())
    data[4] = (data[4]-data[4].min())/(data[4].max() - data[4].min())
    data[5] = (data[5]-data[5].min())/(data[5].max() - data[5].min())
    data[22] = (data[22]-data[22].min())/(data[22].max() - data[22].min())
    data[23] = (data[23]-data[23].min())/(data[23].max() - data[23].min())
    data[31] = (data[31]-data[31].min())/(data[31].max() - data[31].min())
    data[32] = (data[32]-data[32].min())/(data[32].max() - data[32].min())
    
    return data
    
def get_target_data():
    
    data = get_total_data()
    
    enc = OneHotEncoder(sparse = False)
    enc.fit([[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20], [21], [22], [23], [24], [25], [26], [27], [28], [29], [30], [31], [32], [33], [34], [35], [36], [37], [38], [39]])
    result = enc.transform(data[[41]])
    
    return DataFrame(result)

def get_input_data():
    
    data = get_total_data()
    del data[41]
    
    return data
    
if __name__ == '__main__':
    data_input = get_input_data()
#    data = get_total_data()
    data_input.to_csv('data_test_input.csv',header=None,index=None)
    data_target = get_target_data()
    data_target.to_csv('data_test_target.csv',index=None,header=None)

程式碼

import time 
start = time.time()

import keras
from keras.models import Sequential  #序貫模型
from keras.layers import Dense    #全連線層
from keras.layers import Dropout  #隨機失活層
from keras.layers import Flatten  #展平層，從卷積層到全連線層必須展平
from keras.layers import Conv1D   #二維卷積層，多用於影象
from keras.layers import MaxPooling1D  #最大值池化
import pandas as pd
from keras import backend as k

batch_size = 128  #一批訓練樣本128張圖片
num_classes = 40  #有10個類別
epochs = 12   #一共迭代12輪


x_train = pd.read_csv('data_input.csv',header=None).values
y_train = pd.read_csv('data_target.csv',header=None).values
x_test = pd.read_csv('data_test_input.csv',header=None).values
y_test = pd.read_csv('data_test_target.csv',header=None).values


if k.image_data_format() == 'channels_first':
   x_train = x_train.reshape(x_train.shape[0], 1, 41)
   x_test = x_test.reshape(x_test.shape[0], 1, 41)
   input_shape = (1, 41)
else:
   x_train = x_train.reshape(x_train.shape[0], 41, 1)
   x_test = x_test.reshape(x_test.shape[0], 41, 1)
   input_shape = (41, 1)


model = Sequential()  #序貫模型，一個架子


model.add(Conv1D(32, 3, activation='relu',input_shape=input_shape))  #卷積層， 32個神經元， 卷積核3x3
model.add(Conv1D(64, 3, activation='relu'))  #卷積層， 64個神經元， 卷積核3x3
model.add(MaxPooling1D(pool_size=(2))) #池化層
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu')) #全連線層， 128神經元
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

#編譯，損失函式， 優化函式， 評價標註是準確率
model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers.Adadelta(), metrics=['accuracy'])

#執行 ， verbose步長
model.fit(x_train, y_train, batch_size= batch_size, epochs=epochs, verbose=1, validation_data=(x_test, y_test))


score = model.evaluate(x_test, y_test, verbose=0)


print('Test loss:', score[0])
print('Test accuracy:', score[1])


stop = time.time()
print(str(stop-start) + "秒")

執行結果

CNN模型訓練準確率及誤差：

Train on 494021 samples, validate on 311029 samples
Epoch 1/12
494021/494021 [==============================] - 35s 71us/step - loss: 0.0380 - acc: 0.9932 - val_loss: nan - val_acc: 0.9161
Epoch 2/12
494021/494021 [==============================] - 34s 70us/step - loss: 0.0192 - acc: 0.9971 - val_loss: nan - val_acc: 0.9162
Epoch 3/12
494021/494021 [==============================] - 35s 70us/step - loss: 0.0178 - acc: 0.9975 - val_loss: nan - val_acc: 0.9163
Epoch 4/12
494021/494021 [==============================] - 34s 69us/step - loss: 0.0178 - acc: 0.9976 - val_loss: nan - val_acc: 0.9165
Epoch 5/12
494021/494021 [==============================] - 34s 70us/step - loss: 0.0160 - acc: 0.9978 - val_loss: nan - val_acc: 0.9165
Epoch 6/12
494021/494021 [==============================] - 34s 70us/step - loss: 0.0159 - acc: 0.9978 - val_loss: nan - val_acc: 0.9165
Epoch 7/12
494021/494021 [==============================] - 35s 71us/step - loss: 0.0160 - acc: 0.9979 - val_loss: nan - val_acc: 0.9185
Epoch 8/12
494021/494021 [==============================] - 34s 69us/step - loss: 0.0155 - acc: 0.9979 - val_loss: nan - val_acc: 0.9163
Epoch 9/12
494021/494021 [==============================] - 34s 70us/step - loss: 0.0156 - acc: 0.9980 - val_loss: nan - val_acc: 0.9172
Epoch 10/12
494021/494021 [==============================] - 34s 69us/step - loss: 0.0147 - acc: 0.9981 - val_loss: nan - val_acc: 0.9181
Epoch 11/12
494021/494021 [==============================] - 34s 69us/step - loss: 0.0146 - acc: 0.9980 - val_loss: nan - val_acc: 0.9164
Epoch 12/12
494021/494021 [==============================] - 34s 69us/step - loss: 0.0148 - acc: 0.9981 - val_loss: nan - val_acc: 0.9163
Test loss: nan
Test accuracy: 0.916342206033768
427.40167260169983秒

keras實現網路流量分類功能的CNN

資料集選用KDD99 資料下載地址：http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html 需求：https://blog.csdn.net/com_stu_zhang/article/details/6987632

keras實現網路流量分類功能的BP神經網路

資料集選用KDD99 資料下載地址：http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html 需求：https://blog.csdn.net/com_stu_zhang/article/details/6987632

keras實現手寫體數字識別功能的CNN

資料為框架自帶的數字手寫體中間的數值為灰度值，注意灰度值和RGB值不是一個概念，灰度值是介於白和黑之間的值，表示範圍0-255.可以理解成黑的程度。所以圖片只需要一層就OK。資料集包含60000張圖片，大小均為28x28. 程式碼如下: #

前端開發框架總結之利用Jtopo實現網路拓撲功能（四）

前端開發框架總結之利用Jtopo實現網路拓撲功能（四）上文我們講了拓撲容器相關的互動設計和實現思路以及一些關鍵技術細節。至此，我們已經覆蓋了結

前端開發框架總結之利用Jtopo實現網路拓撲功能（三）

前端開發框架總結之利用Jtopo實現網路拓撲功能（三）上文我們講了一些拓撲連線、拓撲文字節點相關的互動設計和實現思路以及一些關鍵技術細節。本文

前端開發框架總結之利用Jtopo實現網路拓撲功能（二）

前端開發框架總結之利用Jtopo實現網路拓撲功能（二）上文我們講了一些拓撲結點生成的實際場景設計和實現思路以及一些關鍵技術細節。本文我們繼續我們的拓撲管理

前端開發框架總結之利用Jtopo實現網路拓撲功能（一）

前端開發框架總結之利用Jtopo實現網路拓撲功能（一）前言：前段時間由於專案需要實現一個網路裝置拓撲管理的

基於keras實現多標籤分類（multi-label classification）

首先討論多標籤分類資料集（以及如何快速構建自己的資料集）。之後簡要討論SmallerVGGNet，我們將實現的Keras神經網路架構，並用於多標籤分類。然後我們將實施SmallerVGGNet並使用我們的多標籤分類資料集對其進行訓練。最後，我們將通過在示例影象上測試我

keras實現網路照相機的實時性別/年齡預測

目錄 1、簡介 1、簡介你是否曾經有過這樣的時刻：猜測另一個人的年紀？下面這個簡單的神經網路模型也許可以幫助你。下面這個你即將執行的demo將會從網路照相機中獲取動態的視訊流，並給獲取到的人臉打上年齡和性別的標籤。想象一下，如果我們把一

CNN分類網路架構演進：從LeNet到Densnet解析及其keras實現

文章轉自：http://www.cnblogs.com/skyfsm/p/8451834.html 卷積神經網路可謂是現在深度學習領域中大紅大紫的網路框架，尤其在計算機視覺領域更是一枝獨秀。CNN從90年代的LeNet開始，21世紀初沉寂了10年，直到12年AlexNet開始又再煥發第二春，從Z

實戰keras——用CNN實現cifar10影象分類

原文：https://blog.csdn.net/zzulp/article/details/76358694 import keras from keras.datasets import cifar10 from keras.models import Sequenti

keras實現多種分類網路的實現

Keras應該是最簡單的一種深度學習框架了,入門非常的簡單. 簡單記錄一下keras實現多種分類網路:如AlexNet、Vgg、ResNet 採用kaggle貓狗大戰的資料作為資料集. 由於AlexNet採用的是LRN標準化,Keras沒有內建函式實現,這裡用batchNormali

keras實現基於vgg16的貓-狗二分類網路

import keras from keras.models import Sequential from keras.layers import Dense,MaxPooling2D,Input,Flatten,Convolution2D,Dropout from kera

Keras實現CNN文字分類

本文以CAIL司法挑戰賽的資料為例，敘述利用Keras框架進行文字分類的一般流程及基本的深度學習模型。步驟 1：文字的預處理，分詞->去除停用詞->統計選擇top n的詞做為特徵詞步驟 2：為每個特徵詞生成I

柵格重分類和條件函數均可以實現對流量統計數據進行定義劃分

target 結構 .html ctu 定義 net hue thread 影響 ArcGIS水分分析工具的流向分析是基於D8單流向算法，如果分析使用的DEM存在凹陷點，就會產生匯，導致徑流斷流從而影響了分析結果。在前面章節《ArcGIS水文分析實戰教程（2）ArcGIS水

iOS開發之使用UICollectionView實現美團App的分類功能【偶現大眾點評App的一個小bug】

sso leg 一個 borde spa line 註意 oba alt 郝萌主傾心貢獻，尊重作者的勞動成果，請勿轉載。假設文章對您有所幫助，歡迎給作者捐贈，支持郝萌主，捐贈數額任意，重在心意^_^ 我要捐贈: 點擊捐贈Cocos2d-X源代碼下載：點我傳送遊戲官方下載

#####好好好好####Keras深度神經網路訓練分類模型的四種方法

Github程式碼： Keras樣例解析歡迎光臨我的部落格：https://gaussic.github.io/2017/03/03/imdb-sentiment-classification/ (轉載請註明出處：https://gaussic.github.io) Keras的官方E

使用keras實現深度殘差網路

from keras.models import Model from keras.layers import Input, Dense, Dropout, BatchNormalization, Conv2D, MaxPooling2D, AveragePooling2D, concate

Keras搭建第一個分類（Classification）神經網路（mnist手寫體數字分類）

我們使用mnist資料集，這個資料集有手寫體數字0-9的圖片，一共10類，我們對這個資料集中的手寫體數字圖片進行分類。如果mnist資料集無法自動下載，可能是因為from keras.datasets import mnist自動下載資料集的網址被牆，請手動下載並按下面程式碼中註釋進行相應

Linux程序網路流量統計方法及實現

1 前言在某些應用安全場景需要結合程序級網路連線、流入流出流量等資料直接分析出程序的異常。例如，在內網主機上是否存在持續惡意外傳敏感資料的現象、在網路監控時發現伺服器大量頻寬被佔用但不清楚由系統具體哪個程序佔用。為此都需要獲取更細粒度的程序級網路流量資料直接鎖定異常服務。在Lin

keras實現網路流量分類功能的CNN

相關推薦