電力竊漏電使用者自動識別（SPSS Modeler）

阿新 • • 發佈：2018-12-12

據統計，全國每年因竊電造成的損失都在200億元左右；被查獲的竊電案件不足總竊電案件的30%。而傳統的用電檢查及反偷查漏工作主要依靠突擊檢查的手段來打擊竊電行為；存在先天性的缺陷和不足。

現有的電力計量自動化系統能夠採集到各相電流、電壓、功率因數等用電負荷資料以及用電異常等終端報警資訊。異常告警資訊和現場稽查來查找出竊漏電使用者，並錄入系統。若能通過這些資料資訊提取出竊漏電使用者的關鍵特徵，構建竊漏電使用者的識別模型，就能自動檢查判斷使用者是否存在竊漏電行為。

我們使用2009年1月1日到2014年12月31日所有竊漏電使用者和正常使用者的用電量、告警及線損資料，以及該使用者是否竊漏電的標誌，共291條記錄，資料詳見“建模資料.csv”。其中：

電量趨勢下降指標：統計日期前後五天內，當天用電量低於前一天用電量的天數。

線損指標：統計日期後五天線損率的平均值和前五天線損率的平均值，若前者比後者的增長率超過了1%，則指標為1，否則為0。

告警類指標：與竊漏電相關的所有告警次數總和。

目標：構建竊漏電使用者識別模型，能夠應用竊漏電使用者識別模型實現使用者診斷。

具體要求：

1、進行資料稽核，檢視資料基本情況，繪製各變數分佈圖；

2、資料預處理階段完成資料型別轉換、異常值查詢與處理、資料變換（將線損指標記錄值內的1轉換為“上升”，0轉換為“下降”）；

3、模型構建過程需要首先將資料分為測試資料和訓練資料，可構建決策樹模型、神經網路模型或其他分類預測模型；

4、構建模型後完成模型評估，詳細分析預測結果，並對結果加以解釋；

5、使用模型對新使用者資料“診斷資料.csv”進行竊漏電診斷識別。

[實驗步驟]

1、進行資料稽核，檢視資料基本情況，繪製各變數分佈圖；

通過變數檔案新增資料檔案

繪製各變數分佈圖

2、資料預處理階段完成資料型別轉換、異常值查詢與處理、資料變換（將線損指標記錄值內的1轉換為“上升”，0轉換為“下降”）；

資料型別轉換：將一個型別節點加到目前的流程中，點選“讀取值”，將“線損指標”的測量設定為“分類”，其它不變。

異常值查詢與處理：在型別節點的後加入選擇節點，在選擇框的模式項選擇“丟棄”，點選選擇框的表示式構建器，建立表示式。

在選擇節點後加入資料稽核節點，質量選項，在離群值和極值一欄選擇輸入四分位距的上/下四位數範圍。

執行結果：

質量選項，對於離群值和極值，單擊操作下的具有離群值和極值的變數。在下拉選單中選擇強制，之後點選生成選項的離群值與極值節點，

將超節點連結到資料流中，如下圖所示，並重新連結資料稽核節點。

通過選擇節點的資料流就沒有空值，離群值和極值也被處理掉，

將欄位欄中的“重新分類”節點加入資料流中，雙擊重新分類節點，在”重新分類欄位“選項下拉選單中選擇線損指標，在重新分類為選擇現有欄位，點選獲取按鈕，將線損指標記錄值內的1轉換為“上升”，0轉換為“下降”。

3、模型構建過程需要首先將資料分為測試資料和訓練資料，可構建決策樹模型、神經網路模型或其他分類預測模型；

在重新分類節點後面加入一個過濾器節點，將認為影響判定結果無關的ID刪除，

建立一個分割槽節點，將80%資料作為訓練，20%資料作為測試，

建立一個決策樹模型一個c5.0節點與型別節點相連，選擇是否竊漏電做判定目標，其餘做輸出，

點選右上角模型，，所有變數的重要性比較接近，其中是否竊漏電的重要性比較突出，說明這這個屬性在區分使用者是否存在竊電的過程中佔有比較重要的角色。

模型結果下的模型，點選全部，可以看到以規則形式展示的決策樹模型。

4、構建模型後完成模型評估，詳細分析預測結果，並對結果加以解釋；

將模型與輸出欄目下的分析節點連線，執行節點顯示觀測值與預測值的匹配程度如何的資訊，在節點的引數設定頁面勾選重合矩陣，

分析結果：

所有流程：

5、使用模型對新使用者資料“診斷資料.csv”進行竊漏電診斷識別。

將新資料集直接新增到原始資料流的起始階段，並在最終的模型後加入一個表格，

執行表格：

電力竊漏電使用者自動識別（SPSS Modeler）

據統計，全國每年因竊電造成的損失都在200億元左右；被查獲的竊電案件不足總竊電案件的30%。而傳統的用電檢查及反偷查漏工作主要依靠突擊檢查的手段來打擊竊電行為；存在先天性的缺陷和不足。現有的電力計量自動化系統能夠採集到各相電流、電壓、功率因數等用電負荷資料以及用電異常等終

電力竊漏電使用者自動識別細節

# 計算每類使用者類別及使用者數 Type <- table(data_FB[, 3]) # 方法1：基礎繪圖 p <- barplot(Type, space = 0, ylim = c(0, 30), col = rainbow(7), xaxt = "n",

實戰-電力竊露漏電使用者自動識別

問題描述：判斷使用者是否竊漏電問題解決：二分類問題缺失值：拉格朗日插值法進行填充使用的特徵：電量趨勢下降指標、線損指標、警告類指標這裡使用的資料來<python資料分析與實戰第六章> 資料：程式碼實現： 1、載入資料 import pandas as pd from random i

資料探勘案例一：竊漏電使用者的識別

最近在準備數學建模，其中的很多問題涉及了資料的處理挖掘，同時，機器學習和資料探勘也是我以後想從事的方向，因此我花時間閱讀了《matlab資料探勘分析與實戰》，下面是書中的第一個實戰主題。資料 1、電路負荷資訊包括電路上的各項電流、電

NOI2015 程序自動分析（luogu p1955）

tro 滿足並查集 con name font http -s esp 原題鏈接：https://www.luogu.org/problem/show?pid=1955 夏令營的模擬考試題，今天才發現是NOI原題，沒想到15年也有這樣裸的題。。。離散化一下，這樣就能

人臉識別（初學篇）-VS2015+opencv3.2的配置

logs 點擊環境變量安裝 details 接下來安裝包 png 應該初學人臉識別，感覺安裝也是一個很大的麻煩。寫在這裏記錄一下吧一：先安裝好我們需要的軟件首先安裝Vs2015，在官網或者csdn搜一下應該找的到。安裝步驟沒有太多講究。點擊exe文件，

Zabbix 3.0.X 配置客戶端自動註冊（Auto-Registration）

zabbix auto_registration 自動註冊一、客戶端配置 1、配置zabbix官方源 [root@node11 ~]# rpm -iUh http://repo.zabbix.com/zabbix/3.0/rhel/7/x86_64/zabbix-release-3.0-1.el

跨網段實現DHCP動態IP的自動分配（DHCP中繼）

dhcp dhcp中繼一、 DHCP:動態主機配置協議 1. 作用：實現企業大量主機IP的動態配置和集中管理。減少工作量，減少人為配置錯誤。 2. DHCP工作原理： a) 發現階段---發送DHCP discover 報文 b) 提供階段---服務器回應o

程序自動分析（BZOJ 4195）

led \n 同時全部獨立現在 memset sort 數據規模 Description 在實現程序自動分析的過程中,常常需要判定一些約束條件是否能被同時滿足。考慮一個約束滿足問題的簡化版本：假設x1,x2,x3,…代表程序中出現的變量，給定n個形如xi=xj或

mybatis自動生成器（mybatis.generator）使用

我們在工程開發時經常會需要很多表，需要生成很多model物件，如果需要一個一個的寫這些model和對應的對映檔案及sql，是一件比較繁雜的事情。幸好，有現成的工具可以通過簡單的配置，然後一鍵生成github地址點選開啟連結下面展示一下使用方式 1，第一步下載eclipse外

Mybatis -程式碼自動生成（generatorConfig.xml）配置資訊詳解

<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE generatorConfiguration PUBLIC "-//mybatis.org//DTD MyBatis Generator Configuration 1

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）

#用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）本人接的任務，做離線語音識別，用的是科大訊飛的離線識別，java不支援離線了，所以下載了windows的離線包，用JNA進行呼叫。之前用的是jni，但是一直沒有測試通過，本人又不會C++，研究了一個星期終究

第十八天呼叫攝像頭人臉識別（有誤判）

import cv2 as cv import numpy as np def face_detect_demo(image): gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY) ##疊加分類器 face_detector = c

設計模式（三）建造者模式Builder（建立型）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

自然語言處理-錯字識別（基於Python）kenlm、pycorrector

轉載出處：https://blog.csdn.net/HHTNAN 中文文字糾錯劃分中文文字糾錯任務，常見錯誤型別包括：諧音字詞，如配副眼睛-配副眼鏡混淆音字詞，如流浪織女-牛郎織女字詞順序顛倒，如伍迪艾倫-艾倫伍迪字詞補全，如愛有天意-

mysql自動備份（全量）

備份環境：Linux 3.10.0-862.e17.x86_64 Mysql版本：5.7.0 本次備份使用crontab 定時執行備份指令碼方法，備份指令碼使用mysql 的mysqldump進行備份；具體方法如下：編寫備份指令碼： #!/bin/bash MY_USER="

Spring Cloud Eureka原理分析（二）：續租、下線、自我保護機制和自動清理（服務端）

續租、下線等操作比較直觀，實際上也不復雜。讓我們自己想想它們大概會在服務端有什麼操作。 renew: 更新Lease的lastUpdateTimestamp, 更新一下InstanceInfo的最新狀態。然後呼叫其他同伴節點的renew介面。 cancel：把lease從registry中移除，設

指令碼實現U盤自動掛載（linux平臺）

原文地址：這裡是通過對udev 的設定，讓 udev 收到核心發來的 U 盤訊息後自動掛載，首先你要確保你的系統有udev的支援，如果有直接進行對udev設定，如果沒有請先移植udev，移植方法在本文最後面。自動掛載： 1、在/etc/udev/rules.d

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（二）

上一篇講到了最難的地方，引數的轉換，這裡單獨寫出來 ** 三、引數的轉換（難點） ** 注：本文是以訊飛提供的C語言例子作為模板改寫，語音來源於檔案 1、先分析提供的例子本人使用的是VS2010 下載連結連結：https://pan.baidu.com/s/

Spring Boot 自動配置（auto-configurtion）揭祕

本章，我們為你揭祕Spring Boot自動配置（Auto Configuration）執行機制，談到auto-configuration，肯定離不開@EnableAutoConfiguration註解。 package org.springframework.