學習筆記（九）：使用支援向量機識別XSS

阿新 • • 發佈：2018-11-10

1.特徵化：提取特徵，對特徵進行向量化，標準化，均方差縮放，去均值操作

def get_len(url):
    return len(url)
def get_url_count(url):
    if re.search('(http://)|(http://)',url,re.IGNORECASE):
        return 1
    else:
        return 0
def get_evil_char(url):
    return len(re.findall("[<>,\'"/]",url,re.IGNORECASE))
def get_evil_word(url):
    return len(re.findall("(alert)|(script=)(%3c)|(%3e)|(%20)|(onerror)|(onload)))

min_max_scaler = preprocessing.MinMaxScaler()
x_min_max=min_max_scaler.fit_transform(x)

2.資料打標：XSS標記為1，正常訪問標記為0。

3.資料拆分：將資料區分成訓練組和測試組。

x_train,x_test,y_train, y_test=cross_validation.train_test_split(x,y,test_size=0.4)

4.資料訓練：我們使用最簡單的核函式linear

clf = svm.SVC(kernel='linear',C=1).fit(x,y)
joblib.dump(clf, "xss-svm-200000-module.m")

7.模型驗證

clf = joblib.load("xss-svm-200000-module.m")
y_test = []
y_test = clf.predict(x)
print metrics.accuracy_score(y_test,y)

Python3《機器學習實戰》學習筆記（九）：支援向量機實戰篇之再撕非線性SVM

一前言上篇文章講解的是線性SVM的推導過程以及簡化版SMO演算法的程式碼實現。本篇文章將講解SMO演算法的優化方法以及非線性SVM。二 SMO演算法優化在幾百個點組成的小規模資料集上，簡化版SMO演算法的執行是沒有什麼問題

機器學習筆記（五）：支援向量機（SVM）

支援向量機是目前機器學習的眾多演算法中使用得最為廣泛的演算法之一，本文主要介紹支援向量機的概念與原理。目錄什麼是支援向量機硬間隔線性支援向量機軟間隔線性支援向量機非線性支援向量機一、什麼是支援向量機 &nbs

吳恩達機器學習作業（五）：支援向量機

目錄 1）資料預處理 2）Scikit-learn支援向量機 3）決策邊界比較 4）非線性SVM 5）最優超引數 6）垃圾郵件過濾器在本練習中，我們將使用支援向量機（SVM）來構建垃圾郵件分類器。我們將從一些簡單的2D資料集開始使用SVM來檢視它們的工作原理。

學習筆記（九）：使用支援向量機識別XSS

1.特徵化：提取特徵，對特徵進行向量化，標準化，均方差縮放，去均值操作 def get_len(url): return len(url) def get_url_count(url): if re.search('(http://)|(http://)',url,re.IGNO

TypeScript學習筆記（九）：裝飾器（Decorators）

標註時裝 als cal () 操作 enume 筆記文檔裝飾器簡介裝飾器（Decorators）為我們在類的聲明及成員上通過元編程語法添加標註提供了一種方式。需要註意的是：裝飾器是一項實驗性特性，在未來的版本中可能會發生改變。若要啟用實驗性的裝飾器特性

java學習筆記（九）：Java 流(Stream)、文件(File)和IO

用戶輸入 public 文件內容輸出流 out 單個 java 我們 ready Java 的控制臺輸入由 System.in 完成。為了獲得一個綁定到控制臺的字符流，你可以把 System.in 包裝在一個 BufferedReader 對象中來創建一個字符流。需要i

javaweb學習筆記（九）：JavaScript（2）

目錄 1.BOM 1.1window物件 1.2history物件 1.3location物件 2. DOM 2.1dom節點及獲取 2.2Event 1.BOM 1.1window物件一般來說，Window 物件的方法都是對瀏覽器視窗或框架進行某種

機器學習筆記（九）：Tensorflow 實戰一（Tensorflow入門）

1 - TsensorFlow計算模型 ——計算圖 1.1- 計算圖的概念計算圖是TensorFlow中最基本的一個概念，TensorFlow中的所有計算都會被轉化為計算圖上的節點。在TensorFlow中，張量可以簡單地理解為多為陣列。如果說TensorFlow的第一個詞T

python 學習筆記（九）：資料庫壓測程式設計

這個程式碼是利用多執行緒多mysql資料庫批量插入資料，可用於mysql壓測 #!/usr/bin/python # -*- coding: utf-8 -*- from __future__ import print_function import argp

ARM aarch64彙編學習筆記（九）：使用Neon指令（一）

NEON是一種基於SIMD思想的ARM技術。 SIMD， Single Instruction Multiple Data，是一種單條指令處理多個數據的並行處理技術，相比於一條指令處理一個數據，運算速度將會大大提高。 ARMv8 有31 個64位暫存器,1個不同

21天學通C++學習筆記（九）：類和對象

行為邏輯在一起編譯特征 str 不能的人學習 1. 類和對象現實中的人等事物往往具備一些特征並且可以做某些事情，要在程序中模擬這些事物，需要一個結構，將定義其屬性（數據）以及其可用這些屬性執行的操作（函數）整合在一起。這種結構就是類，而這種結構的每一個實例就

各種音視訊編解碼學習詳解之編解碼學習筆記（九）：QuickTime系列

最近在研究音視訊編解碼這一塊兒，看到@bitbit大神寫的【各種音視訊編解碼學習詳解】這篇文章，非常感謝，佩服的五體投地。奈何大神這邊文章太長，在這裡我把它分解成很多小的篇幅，方便閱讀。大神部落格傳送門：https://www.cnblogs.com/skyofbitbit/p/3651

機器學習筆記（九）：聚類

有學者按照機器學習發生場景的不同，將機器學習劃分為三種正規化，它們分別是有監督學習、無監督學習與強化學習。有監督學習指的是用來訓練模型的資料是帶有標籤的，訓練過程可簡單概括為根據“資料帶有的標籤”與“模型產生的輸出”之間的誤差來調整模型的引數。無監督學習則適用於無標籤的資料集，它往往通過對訓練集進行

TensorFlow學習筆記（九）：CIFAR-10訓練例子報錯解決

以下報錯主要是由於TensorFlow升級1.0後與以前程式碼不相容所致。 1．AttributeError: 'module' object has noattribute 'random_crop' 解決方案：將distorted_image= tf.ima

演算法導論學習筆記（九）：紅黑樹

前言前面已經學完了二叉查詢樹，這是我們學習紅黑樹的基礎，必須要熟練掌握，不然學習紅黑樹會很吃力的。雖然前面已經學習了二叉查詢樹，但感覺學習紅黑樹的時候還是沒那麼輕鬆。紅黑樹是一類特殊的二叉查詢樹，是一顆平衡的二叉查詢樹，但只是接近平衡。它能保證在最壞情況下，基本的動態

python OpenCV學習筆記（九）：圖片的幾何變形

縮放 import numpy as np import cv2 as cv img = cv.imread('test.jpg') res = cv.resize(img, None, fx=2, fy=2, interpolation=

Cesium學習筆記（九）：匯入3D模型（obj轉gltf）

在用cesium的過程中難免需要匯入別人做好的3D模型，這時候就需要將這些模型轉成gltf格式了當然，官方也給了我們一個網頁版的轉換器，但是畢竟是網頁版的，效率極其低下，檔案還不能太大，所以我們就需要一個格式轉換器了現在只支援obj和dae轉gltf

Java for Web學習筆記（九）：Servlet（7）上傳檔案

上傳檔案 Servlet的引數設定採用annotation方式如下： @WebServlet( name = "TicketServlet", urlPatterns = {"/tickets"}, loadOnStartup = 1 ) /* MultipartConfig配置了本Servlet

機器學習回顧篇（11）：支援向量機（SVM）

1. 引言¶ SVM，Support Vector Machine，也就是我們中文名的支援向量機，我相信，只要是與機器學習有過照面的童鞋或多或少都聽說過這個名字。作為機器學習家族中的老牌成員，其經典自不必說。從原理和特性上講，SVM

Kubernetes學習筆記（九）：StatefulSet--部署有狀態的多副本應用

## StatefulSet如何提供穩定的網路標識和狀態 ReplicaSet中的Pod都是無狀態，可隨意替代的。又因為ReplicaSet中的Pod是根據模板生成的多副本，無法對每個副本都指定單獨的PVC。來看一下StatefulSet如何解決的。 ### 提供穩定的網路標識 StatefulSet建

學習筆記（九）：使用支援向量機識別XSS

相關推薦