SLS機器學習最佳實戰：批量時序異常檢測

阿新 • • 發佈：2019-07-01

0.文章系列連結

1. 高頻檢測場景

1.1 場景一

叢集中有N臺機器，每臺機器中有M個時序指標（CPU、記憶體、IO、流量等），若單獨的針對每條時序曲線做建模，要手寫太多重複的SQL，且對平臺的計算消耗特別大。該如何更好的應用SQL實現上述的場景需求？

1.2 場景二

針對系統中的N條時序曲線進行異常檢測後，有要如何快速知道：這其中有哪些時序曲線是有異常的呢？

2. 平臺實驗

2.1 解決一

針對場景一中描述的問題，我們給出如下的資料約束。其中資料在日誌服務的LogStore中按照如下結構儲存：

timestamp : unix_time_stamp
machine: name1
metricName: cpu0
metricValue: 50
---
timestamp : unix_time_stamp
machine: name1
metricName: cpu1
metricValue: 50
---
timestamp : unix_time_stamp
machine: name1
metricName: mem
metricValue: 50
---
timestamp : unix_time_stamp
machine: name2
metricName: mem
metricValue: 60

在上述的LogStore中我們先獲取N個指標的時序資訊：

* | select timestamp - timestamp % 60 as time, machine, metricName, avg(metricValue) from log group by time, machine, metricName

現在我們針對上述結果做批量的時序異常檢測演算法，並得到N個指標的檢測結果：

* | 
select machine, metricName, ts_predicate_aram(time, value, 5, 1, 1) as res from  ( 
    select
        timestamp - timestamp % 60 as time, 
        machine, metricName, 
        avg(metricValue) as value
    from log group by time, machine, metricName )
group by machine, metricName

通過上述SQL，我們得到的結果的結構如下

| machine | metricName | [[time, src, pred, upper, lower, prob]] |
| ------- | ---------- | --------------------------------------- |

針對上述結果，我們利用矩陣轉置操作，將結果轉換成如下格式，具體的SQL如下：

* | 
select 
    machine, metricName, 
    res[1] as ts, res[2] as ds, res[3] as preds, res[4] as uppers, res[5] as lowers, res[6] as probs
from ( select machine, metricName, array_transpose(ts_predicate_aram(time, value, 5, 1, 1)) as res from  ( 
    select
        timestamp - timestamp % 60 as time, 
        machine, metricName, 
        avg(metricValue) as value
    from log group by time, machine, metricName )
group by machine, metricName )

經過對二維陣列的轉換後，我們將每行的內容拆分出來，得到符合預期的結果，具體格式如下：

| machine | metricName | ts | ds | preds | uppers | lowers | probs |
| ------- | ---------- | -- | -- | ----- | ------ | ------ | ----- |

2.2 解決二

針對批量檢測的結果，我們該如何快速的將存在特定異常的結果過濾篩選出來呢？日誌服務平臺提供了針對異常檢測結果的過濾操作。

select ts_anomaly_filter(lineName, ts, ds, preds, probs, nWatch, anomalyType)

其中，針對anomalyType有如下說明：

0：表示關注全部異常
1：表示關注上升沿異常
-1：表示下降沿異常

其中，針對nWatch有如下說明：

表示從實際時序資料的最後一個有效的觀測點開始到最近nWatch個觀測點的長度。

具體使用如下所示：

* | 
select 
    ts_anomaly_filter(lineName, ts, ds, preds, probs, cast(5 as bigint), cast(1 as bigint))
from
( select 
    concat(machine, '-', metricName) as lineName, 
    res[1] as ts, res[2] as ds, res[3] as preds, res[4] as uppers, res[5] as lowers, res[6] as probs
from ( select machine, metricName, array_transpose(ts_predicate_aram(time, value, 5, 1, 1)) as res from  ( 
    select
        timestamp - timestamp % 60 as time, 
        machine, metricName, 
        avg(metricValue) as value
    from log group by time, machine, metricName )
group by machine, metricName ) )

通過上述結果，我們拿到的是一個Row型別的資料，我們可以使用如下方式，將具體的結構提煉出來：

* | 
select 
    res.name, res.ts, res.ds, res.preds, res.probs 
from
    ( select 
        ts_anomaly_filter(lineName, ts, ds, preds, probs, cast(5 as bigint), cast(1 as bigint)) as res
    from
        ( select 
            concat(machine, '-', metricName) as lineName, 
            res[1] as ts, res[2] as ds, res[3] as preds, res[4] as uppers, res[5] as lowers, res[6] as probs
          from ( 
                select 
                    machine, metricName, array_transpose(ts_predicate_aram(time, value, 5, 1, 1)) as res 
                from  ( 
                    select
                        timestamp - timestamp % 60 as time, 
                        machine, metricName, avg(metricValue) as value
                    from log group by time, machine, metricName )
                group by machine, metricName ) ) )

通過上述操作，就可以實現對批量異常檢測的結果進行過濾處理操作，幫助使用者更好的批量設定告警。

3.硬廣時間

3.1 日誌進階

這裡是日誌服務的各種功能的演示日誌服務整體介紹，各種Demo

原文連結
本文為雲棲社群原創內容，未經

SLS機器學習最佳實戰：批量時序異常檢測

0.文章系列連結 SLS機器學習介紹（01）：時序統計建模 SLS機器學習介紹（02）：時序聚類建模 SLS機器

SLS機器學習最佳實戰：時序預測

為何需要預測？通過分析序列進行合理預測，做到提前掌握未來的發展趨勢，為業務決策提供依據，這也是決策科學化的前提。時間序列就是按時間順序排列的一組資料序列。時間序列分析就是發現這組資料的變動規律並用於預測的統計技術。明天的賬單大約多少？？（根據在各個雲產品中資源消耗量進行預測 ---> 業務

SLS機器學習最佳實戰：日誌聚類+異常告警

摘要：圍繞日誌，挖掘其中更大價值，一直是我們團隊所關注。在原有日誌實時查詢基礎上，今年SLS在DevOps領域完善了如

機器學習案例實戰：信用卡欺詐檢測

故事背景原始資料為個人交易記錄，但是考慮資料本身的隱私性，已經對原始資料進行了類似PCA的處理，現在已經把特徵資料提取好了，接下來的目的就是如何建立模型使得檢測的效果達到最好，這裡我們雖然不需要對資料做特徵提取的操作，但是面對的挑戰還是蠻大的。import pa

機器學習-多元高斯分佈（異常檢測）

的系列文章進行學習。不過博主的部落格只寫到“第十講資料降維” http://blog.csdn.net/abcjennifer/article/details/8002329，後面還有三講，內容比較偏應用，分別是異常檢測、大資料機器學習、photo OCR。為了學習的完整性，我將把後續三講的內容補充

Coursera-吳恩達-機器學習-（程式設計練習8）異常檢測和推薦系統（對應第9周課程）

exercise 8 —— 異常檢測和推薦系統在本練習中，第一部分，您將實施異常檢測演算法並將其應用於檢測網路上發生故障的伺服器。在第二部分中，您將使用協作過濾來構建電影的推薦系統。 1 異常檢測在這個練習中，您將實現一個異常檢測演算

SLS機器學習介紹（02）：時序聚類建模

文章系列連結 SLS機器學習介紹（01）：時序統計建模 SLS機器學習介紹（02）：時序聚類建模 SLS機器學習介紹（03）：時序異常檢測建模 SLS機器學習介紹（04）：規則模式挖掘前言第一篇文章SLS機器學習介紹（01）：時序統計建模上週更新完，一下子炸出了很多潛伏的業

SLS機器學習介紹（03）：時序異常檢測建模

文章系列連結 SLS機器學習介紹（01）：時序統計建模 SLS機器學習介紹（02）：時序聚類建模 SLS機器學習介紹（03）：時序異常檢測建模 SLS機器學習介紹（04）：規則模式挖掘 SLS機器學習最佳實戰：時序異常檢測和報警摘要與背景雖然計算機軟硬體的快速發展已

SLS機器學習介紹（01）：時序統計建模

文章系列連結 SLS機器學習介紹（01）：時序統計建模 SLS機器學習介紹（02）：時序聚類建模 SLS機器學習介紹（03）：時序異常檢測建模 SLS機器學習介紹（04）：規則模式挖掘 SLS機器學習最佳實戰：時序異常檢測和報警背景時序資料是業務監控中最多方法，雙十

SLS機器學習介紹（05）：時間序列預測

00系列文章目錄 0.1 演算法原理目錄 SLS機器學習介紹（01）：時序統計建模 SLS機器學習介紹（02）：時序聚類建模 SLS機器學習介紹（03）：時序異常檢測建模 SLS機器學習介紹（04）：規則模式挖掘 SLS機器學習介紹（05）：時間序列預測 0.2 演算法最佳實踐

python 機器學習實戰：信用卡欺詐異常值檢測

今晚又實戰了一個小案例，把它總結出來：有些人利用信用卡進行詐騙等活動，如何根據使用者的行為，來判斷該使用者的信用卡賬單涉嫌欺詐呢？資料集見及連結：在這個資料集中，由於原始資料有一定的隱私，因此，每一列（即特徵）的名稱並沒有給出。一開始，還是匯入庫：

最全機器學習種類講解：監督、申請和批量學習都講明白了！股票配資平臺連連支付通道連連支付股票配資可以接三方支付麽？股票配資支付通道股票配資平臺通道費股票配資系統源碼api通道券商配資api接口

獨立批量單獨就是發貨區塊銀行監督式需要有的機器學習系統種類繁多，根據以下內容將它們進行分類有助於我們理解：是否在人類監督下訓練（監督式學習、無監督式學習、半監督式學習和強化學習）是否可以動態地進行增量學習（在線學習和批量學習）是簡單地將新的數據

機器學習最佳入門學習資料匯總

行程 view 概率應該 mic 時有挖掘書包發現譯者：teyla 原文作者：Jasonb 發布：2014-06-05 13:54:15 挑錯這篇文章的確很難寫，因為我希望它真正地對初學者有幫助。面前放著一張空白的紙，我坐下來問自己一個難題：面對一個對機器學習

機器學習第二章：模型評估與選擇-總結

但是交叉 roc曲線掃描 com ram hidden 技術分享 preview 1、數據集包含1000個樣本，其中500個正例，500個反例，將其劃分為包含70%樣本的訓練集和30%樣本的測試集用於留出法評估，試估算共有多少種劃分方式。留出法將數據集劃分為兩個互斥的

機器學習python實戰----邏輯回歸

多次 python實戰 ron and 代碼實現技術訓練集錯誤常數　　當看到這部分內容的時候我是激動的，因為它終於能跟我之前學習的理論內容聯系起來了，這部分內容就是對之前邏輯回歸理論部分的代碼實現，所以如果有不甚理解的內容可以返回對照著理論部分來理解，下面我們進入

機器學習python實戰----線性回歸

pyplot 理論普通遍歷 sca def blog reg .so 一、綱要　　線性回歸的正規方程解法　　局部加權線性回歸二、內容詳述　　1、線性回歸的正規方程解法　　線性回歸是對連續型的數據進行預測。這裏討論的是線性回歸的例子，對於非線性回歸先不做討論。這

機器學習筆記(3)：多類邏輯回歸

display images 可能 https 都沒有 -s labels 明顯交叉仍然是動手學嘗試學習系列的筆記，原文見：多類邏輯回歸 — 從0開始。這篇的主要目的，是從一堆服飾圖片中，通過機器學習識別出每個服飾圖片對應的分類是什麽（比如：一個看起來

分布式學習最佳實踐：從分布式系統的特征開始（附思維導圖）

擴展問題 sca ref 調度這也集中技術 park 　　　我的探索歷程　　這一部分，與分布式不大相關，記錄的是我是如何在分布式學習這條道路上摸索的，不感興趣的讀者請直接跳到下一章。　　過去的一年，我在分布式學習這條道路上苦苦徘徊，始終沒有找到一個好的學

Ubuntu機器學習python實戰(一)k-近鄰算法

0.12 繪圖 http tps eat 2.6 .sh 輸入重復 2018.4.18Python機器學習記錄一.Ubuntu14.04安裝numpy 1.參考網址 2.安裝代碼: 在安裝之前建議更新一下軟件源 : sudo apt-get update 如果py

機器學習筆記十三：Ensemble思想(上)

形象 alt fill data stat cli views LV 元素從上面幾篇的決策樹開始,就能夠開始進入到集成學習(ensemble learning)了,

SLS機器學習最佳實戰：批量時序異常檢測

0.文章系列連結

1. 高頻檢測場景

1.1 場景一

1.2 場景二

2. 平臺實驗

2.1 解決一

2.2 解決二

3.硬廣時間

3.1 日誌進階

相關推薦