《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于用電特征的多維度竊電識(shí)別技術(shù)
基于用電特征的多維度竊電識(shí)別技術(shù)
2018智能電網(wǎng)增刊
隋春明,張劍鋒,楊文博,任彥偉
國網(wǎng)吉林省電力公司,,吉林 長春 130000
摘要: 針對(duì)某地區(qū)電網(wǎng)存在的竊電用戶較多的問題,基于用戶用電特征構(gòu)建數(shù)學(xué)分析模型,,通過整合各類典型竊電案例數(shù)據(jù)特征,,建立多維度的反竊電分析方法,精確定位出竊電嫌疑用戶,。實(shí)踐表明,,采用全方位多角度構(gòu)建的竊電識(shí)別技術(shù)是科學(xué)有效的,對(duì)實(shí)際的竊電排查工作有很大的推動(dòng)作用,。
中圖分類號(hào): TM7
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.057
Abstract:
Key words :

0  引言

    反竊電工作是電網(wǎng)公司的重點(diǎn)工作之一,隨著地區(qū)經(jīng)濟(jì)的持續(xù)增長,,居民生活水平不斷提升,,電力需求增長的同時(shí),竊電現(xiàn)象卻越發(fā)嚴(yán)重,,竊電的手段也多種多樣,,由以前的跨表用電向現(xiàn)在的高科技竊電演變,使得竊電排查工作更加困難,。竊電問題嚴(yán)重影響了電網(wǎng)公司正常的供電秩序,,嚴(yán)重危害了公共安全和社會(huì)穩(wěn)定。因此提高竊電用戶排查的準(zhǔn)確性和覆蓋面迫在眉睫[1-3],。

    本項(xiàng)目基于用電信息采集系統(tǒng)和營銷業(yè)務(wù)應(yīng)用系統(tǒng)積累的海量用戶用電信息,,綜合考慮各種竊電特征,建立用戶竊電概率分析模型,,通過機(jī)器學(xué)習(xí)算法分析手段,,力求較為準(zhǔn)確地定量分析出各用戶的竊電嫌疑水平,,以提高竊電嫌疑用戶鎖定精度。建立預(yù)警,、排查和處理的閉環(huán)工作機(jī)制,,加大反竊電的查處懲治力度,保障企業(yè)經(jīng)營效益,。

1  研究現(xiàn)狀

    據(jù)了解,,現(xiàn)階段國內(nèi)多個(gè)研究結(jié)構(gòu)在反竊電研究領(lǐng)域有各自的特點(diǎn),例如:研究的數(shù)據(jù)范圍主要是以電壓,、電流,、三相不平衡為主的高壓用戶竊電識(shí)別;以功率,、負(fù)荷,、臺(tái)戶關(guān)系等為出發(fā)點(diǎn),研究發(fā)生竊電行為時(shí)的間接表現(xiàn)形式,;以專家經(jīng)驗(yàn)判斷的比較粗糙的過濾規(guī)則等[4],。

    這些研究方法都有很多的片面性,例如數(shù)據(jù)維度較少,、只針對(duì)高壓用戶,、分析方法比較簡單等,在實(shí)際應(yīng)用中并沒有達(dá)到理想效果,。雖然在某些情況下也能有一定的表現(xiàn)效果,,但是如果推廣到全量用戶的竊電識(shí)別下,就會(huì)顯得不太適用,,即使使用了高精準(zhǔn)度的模型算法,,如果沒有選擇最合適的數(shù)據(jù)范圍,仍然達(dá)不到理想的識(shí)別效果[5-6],。

2  研究思路

    本文基于已有的數(shù)據(jù)挖掘在反竊電場(chǎng)景的研究成果,,來實(shí)現(xiàn)全量數(shù)據(jù)、多維用戶特征,、高精度模型算法的竊電用戶精確識(shí)別,,并便于輕量部署應(yīng)用,以支撐業(yè)務(wù)人員的反竊電工作[7],。改進(jìn)方向主要體現(xiàn)在:

    (1)本次研究以某省全量用戶的用戶群體為分析目標(biāo),,對(duì)各類型的用戶有普遍的適用性,便于在后期的應(yīng)用中快速推廣部署,。

    (2)數(shù)據(jù)范圍以全量歷史用電數(shù)據(jù),、用戶基礎(chǔ)特征信息數(shù)據(jù)及臺(tái)區(qū)線損數(shù)據(jù)為主,構(gòu)建特有的用電特征量,可以直接反映出發(fā)生竊電時(shí)的數(shù)據(jù)特點(diǎn),。

    (3)本次研究在多個(gè)前沿的機(jī)器學(xué)習(xí)模型基礎(chǔ)上,,進(jìn)行了多重交叉驗(yàn)證與自適用優(yōu)化策略,取得很高的精準(zhǔn)度,,可實(shí)現(xiàn)模型的自學(xué)習(xí)過程與智能優(yōu)化,。

    (4)建立了針對(duì)性的高維度特征工程,對(duì)特定的用戶群體進(jìn)行單獨(dú)標(biāo)記識(shí)別,,可識(shí)別周期性用電與不規(guī)律用電,。

    (5)研究成果可輕量部署在國網(wǎng)公司內(nèi)部服務(wù)器上,操作簡單易懂,,可定期輸出某地區(qū)的疑似竊電用戶清單,,供排查人員線下查訪。

    一般發(fā)生竊電的情況下,,最直接會(huì)體現(xiàn)在用電量的異常上,。本文所研究內(nèi)容,以全量用戶的歷史用電數(shù)據(jù)為中心,,構(gòu)建基于用戶特征的用電量挖掘模型,,從多個(gè)時(shí)間維度構(gòu)建深度用電量特征量。

    從不同的竊電手段來看,,對(duì)電表動(dòng)手腳的竊電的行為會(huì)導(dǎo)致用戶用電量減少,,根據(jù)竊電方式不同和竊電嚴(yán)重程度很可能會(huì)出現(xiàn)用電量突降、電能示值逆向減少的異?,F(xiàn)象,,因此可利用電表日凍結(jié)電能示值及天、周,、月不同時(shí)間周期的多種統(tǒng)計(jì)值判斷用電趨勢(shì)的異常走向和不規(guī)律用電,;對(duì)于越表竊電的行為,竊電量大的會(huì)導(dǎo)致臺(tái)區(qū)線損異常增大,,可以根據(jù)臺(tái)區(qū)線損的變化情況判斷臺(tái)區(qū)用戶的嫌疑概率,;同時(shí)電壓等級(jí)、行業(yè)分類,、用戶分類、用電容量等用戶特征也是區(qū)分竊電用戶的重要特征,,可以增強(qiáng)模型對(duì)各類別用戶的區(qū)分功能,。竊電識(shí)別流程如圖1所示。

scm-t1.gif

3  數(shù)據(jù)處理

3.1  數(shù)據(jù)范圍

    竊電行為發(fā)生后會(huì)直接體現(xiàn)在用電量的異常變化和線損的增高,,所以本次研究選取某地區(qū)全量的用戶數(shù)據(jù),,以用電戶檔案信息、電能表示數(shù)值的數(shù)據(jù),、臺(tái)區(qū)線損數(shù)據(jù)及歷史竊電記錄數(shù)據(jù)為主要分析數(shù)據(jù),,如表1所示,。

scm-b1.gif

3.2  計(jì)算特征統(tǒng)計(jì)量

    通過對(duì)基礎(chǔ)數(shù)據(jù)的探索,確定選取用戶電能示數(shù)表的部分?jǐn)?shù)據(jù)為主要建模原始數(shù)據(jù),。其次,,通過對(duì)歷史竊電用戶歷史電能表走勢(shì)的變化情況進(jìn)行探索總結(jié),并結(jié)合業(yè)務(wù)知識(shí),,以用電量數(shù)據(jù)的多種統(tǒng)計(jì)指標(biāo)為依據(jù),,精準(zhǔn)區(qū)分出用電量異常情況下數(shù)據(jù)的表現(xiàn)特征,用此特征量數(shù)據(jù)輸入模型,,可達(dá)到明顯的效果,。選定竊電用戶與未知用戶的電能示數(shù)數(shù)據(jù)進(jìn)行以下處理:

    (1)計(jì)算匯總每個(gè)用戶不同時(shí)間周期下的用電量數(shù)據(jù);

    (2)計(jì)算每個(gè)用戶相鄰時(shí)間周期之間的差異變化,;

    (3)計(jì)算線損率與當(dāng)月度匯總用電量的相關(guān)性,,并設(shè)定權(quán)重值;

    (4)對(duì)用戶基礎(chǔ)信息數(shù)據(jù)進(jìn)行分類編碼,。

    對(duì)以上數(shù)據(jù)表進(jìn)行多維度統(tǒng)計(jì)匯總,,計(jì)算得出多種指標(biāo),分別代表各時(shí)間周期下用戶每日的用電量和用電量差異的統(tǒng)計(jì)指標(biāo),,包括均值,、標(biāo)準(zhǔn)差、極差,、50%分位區(qū)間,、中位數(shù)、偏度,、峰度及日用電量小于等于0的次數(shù)等,。

4  模型算法

    利用數(shù)據(jù)處理得出的50個(gè)維度的特征變量,構(gòu)建多種分類模型算法,,經(jīng)過多重交叉驗(yàn)證的對(duì)比篩選,,選擇表現(xiàn)效果最好的模型進(jìn)行最終的分類預(yù)測(cè)。Adaboost算法屬于集成學(xué)習(xí)算法,,是Boosting 算法家族中代表算法,通過若干個(gè)弱分類器,,整合為一個(gè)強(qiáng)分類器的方法來提高學(xué)習(xí)準(zhǔn)確性,AdaBoost 算法就是將容易找到的識(shí)別率不高的弱分類算法提升為識(shí)別率很高的強(qiáng)分類算法,。

4.1  建模過程

    經(jīng)過加工后的特征量包括用電曲線特征和用戶檔案特征,,例如用電量數(shù)據(jù)在不同時(shí)間段下的多種統(tǒng)計(jì)量、用戶電壓等級(jí),、行業(yè)類型等,。AdaBoost算法通過對(duì)用戶特征集的訓(xùn)練產(chǎn)生不同的分類器,每次迭代都通過計(jì)算誤差率來改變樣本權(quán)重,也就是提高分錯(cuò)樣本權(quán)重,重點(diǎn)對(duì)分錯(cuò)樣本進(jìn)行訓(xùn)練,直到達(dá)到迭代次數(shù)或者損失函數(shù)小于某一閾值,如圖2所示,。

scm-t2.gif

    (1)初始化每個(gè)訓(xùn)練樣例的權(quán)值,,共M個(gè)訓(xùn)練樣例。

    (2)共進(jìn)行N輪學(xué)習(xí),,第n輪學(xué)習(xí)過程如下:

    ① 使用權(quán)值分布為Wn的訓(xùn)練樣例學(xué)習(xí)得到基分類器Gn,;

    ② 計(jì)算上一步得到的基分類器的誤差率;

    ③ 計(jì)算Gn前面的權(quán)重系數(shù),;

    ④ 更新訓(xùn)練樣例的權(quán)重系數(shù),;

    ⑤ 重復(fù)步驟①~④,得到一系列的權(quán)重參數(shù)an和基分類器Gn,。

    (3)通過臺(tái)區(qū)線損計(jì)算出線損修正系數(shù),,臺(tái)區(qū)線損越高,其竊電嫌疑越高,,得出最終用戶竊電嫌疑概率,。

4.2  模型結(jié)果

    模型結(jié)果如表2所示,列表中分別為電表編號(hào),、歷史竊電記錄標(biāo)識(shí),、預(yù)測(cè)分類及各分類的概率。以竊電概率大于50%作為劃分疑似竊電用戶和正常用戶的邊界,,實(shí)際應(yīng)用中可以根據(jù)實(shí)際情況調(diào)高此分界值,。

scm-b2.gif

    圖3為對(duì)應(yīng)的ROC曲線,曲線整體靠近左上角,,其中,,準(zhǔn)確率為96%,召回率為93%,,模型結(jié)果的準(zhǔn)確率較好,,召回率也較高,預(yù)測(cè)準(zhǔn)確性較高,。

scm-t3.gif

4.3  模型成效

    選取某地區(qū)全量用戶進(jìn)行竊電用戶識(shí)別,,識(shí)別出較多電表頻繁歸零、電表逆走,、異常波動(dòng)等情況,,其中某用戶電能示值曲線如圖4所示,實(shí)地排查后找出部分用戶確有真實(shí)竊電的行為,,其余疑似竊電用戶雖未找到竊電的證據(jù),,但是由于用戶無法解釋異常的用電曲線,也同樣判定為重點(diǎn)監(jiān)控目標(biāo),。

scm-t4.gif

5  結(jié)束語

    本次研究是基于用戶全量特征,針對(duì)全量用戶做的分析,對(duì)各類型的用電戶有普遍適用性,,適合開展大面積的排查工作,。模型可以進(jìn)行輕量部署,定期支持常規(guī)用電檢查和專項(xiàng)反竊電活動(dòng),。

    基于反竊電模型的成果,,可以進(jìn)一步開展研究工作。例如結(jié)合擴(kuò)報(bào)裝新用戶的用戶畫像和用電負(fù)荷模擬情況,,將用戶實(shí)際用電量和預(yù)測(cè)用電量比對(duì),,提前預(yù)測(cè)用戶的用電行為;也可以結(jié)合智能電表的實(shí)時(shí)采集信息進(jìn)行實(shí)時(shí)監(jiān)控,,在發(fā)現(xiàn)異常的第一時(shí)間及時(shí)報(bào)警,;也可以將反竊電的成果和臺(tái)區(qū)線損治理、營配調(diào)貫通治理的工作結(jié)合起來,,相互配合,,通過數(shù)據(jù)治理的成果提升數(shù)據(jù)的可靠性。

參考文獻(xiàn)

[1] 建峰,,葛健.基于用電行為的反竊電智能分析系統(tǒng)[J].電力設(shè)備,,2016(23).

[2] 林志堅(jiān), 姚偉智, 黃朝凱, 等. 基于用電行為分析的反竊電在線監(jiān)測(cè)及智能診斷系統(tǒng)研究[J]. 新技術(shù)新工藝, 2015(5): 137-140.

[3] 周文婷, 顧楠, 王濤, 等. 基于數(shù)據(jù)挖掘算法的用戶竊電嫌疑分析[J]. 河南科學(xué), 2015, 33(10): 1767-1772.

[4] 于光輝,耿桂森.基于用電信息采集系統(tǒng)的防竊電措施[J].山東電力技術(shù),,2014, 41(3): 49-51.

[5] 陳鵬飛. 基于用電信息采集系統(tǒng)的竊電在線稽查裝置的開發(fā)應(yīng)用[D].北京:華北電力大學(xué),2013.

[6] 張瑞. 基于用電信息數(shù)據(jù)挖掘的智能反竊電研究與應(yīng)用[J]. 價(jià)值工程, 2016, 35(35): 51-54.

[7] 柴鵬飛,,陳國棟.數(shù)據(jù)分析在反竊電中的應(yīng)用[J].河南電力技術(shù), 2013(2): 61-64.



作者信息:

隋春明,張劍鋒,楊文博,任彥偉

(國網(wǎng)吉林省電力公司,吉林 長春 130000)

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。