文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.058
0 引言
隨著人們用電需求的不斷提升和社會(huì)的快速發(fā)展,,對(duì)供電企業(yè)的供電服務(wù)質(zhì)量的要求越來(lái)越高,。然而,目前大部分的電力企業(yè)在供電服務(wù)方面仍然存在許多不足,,其中配網(wǎng)搶修作為影響用戶(hù)用電體驗(yàn)的一項(xiàng)電力主營(yíng)業(yè)務(wù),,仍然停留在傳統(tǒng)的以用戶(hù)為主要發(fā)起人的被動(dòng)搶修模式。如何提前發(fā)現(xiàn)電網(wǎng)系統(tǒng)薄弱環(huán)節(jié),,提前精準(zhǔn)預(yù)測(cè)配網(wǎng)搶修高危區(qū)域,,采取相應(yīng)措施有效降低配網(wǎng)故障率,事前做好搶修準(zhǔn)備,,是電力企業(yè)急需解決的一個(gè)問(wèn)題,。
為加快電網(wǎng)發(fā)展、全力確保電力可靠供應(yīng),,本文深入研究配網(wǎng)故障預(yù)測(cè)理論方法,,利用大數(shù)據(jù)挖掘技術(shù),基于電力故障搶修歷史數(shù)據(jù),,以特殊時(shí)期,、天氣、溫度,、設(shè)備老化情況,、負(fù)荷率等作為擾動(dòng)因數(shù),研究了一套基于具擾動(dòng)特性的滾動(dòng)基值法的配網(wǎng)搶修高危區(qū)域預(yù)測(cè)體系,,并應(yīng)用于國(guó)網(wǎng)山東省電力公司,,對(duì)某一區(qū)域未來(lái)3天及某一特定時(shí)期的配網(wǎng)搶修工單數(shù)量進(jìn)行預(yù)測(cè),實(shí)現(xiàn)對(duì)配網(wǎng)搶修的提前預(yù)測(cè),。根據(jù)預(yù)測(cè)結(jié)果指導(dǎo)優(yōu)化配網(wǎng)結(jié)構(gòu)和配網(wǎng)搶修工作的精準(zhǔn)化管理,,切實(shí)促進(jìn)電網(wǎng)發(fā)展,提升供電服務(wù)質(zhì)量,。
1 樣本數(shù)據(jù)預(yù)處理
從95598業(yè)務(wù)應(yīng)用系統(tǒng),、營(yíng)銷(xiāo)業(yè)務(wù)應(yīng)用系統(tǒng)等電力業(yè)務(wù)應(yīng)用系統(tǒng)中獲取原始數(shù)據(jù),因原始數(shù)據(jù)存在數(shù)據(jù)缺失,、數(shù)據(jù)不合規(guī)等問(wèn)題,,需要對(duì)數(shù)據(jù)做進(jìn)一步的清洗,然后對(duì)數(shù)據(jù)進(jìn)行分類(lèi)與統(tǒng)計(jì),。
1.1 樣本數(shù)據(jù)部門(mén)范圍
樣本數(shù)據(jù)部門(mén)包括山東省17個(gè)市級(jí)供電公司,、171個(gè)區(qū)縣級(jí)供電單位和394個(gè)工單數(shù)搶修部門(mén)。
1.2 樣本數(shù)據(jù)時(shí)間范圍
樣本數(shù)據(jù)時(shí)間范圍如表1所示,。
因特殊時(shí)期搶修為活躍期,,所以選取春節(jié)保電期間各部門(mén)的搶修單數(shù)量,,時(shí)間范圍選取了3年的春節(jié)前后的2~3個(gè)月。
1.3 數(shù)據(jù)列名稱(chēng)
原始數(shù)據(jù)中對(duì)項(xiàng)目研究有意義的列名稱(chēng)有:統(tǒng)計(jì)周期,、上級(jí)單位,、供電單位、工單數(shù)原因,、處理部門(mén),、工單數(shù)排除時(shí)間、是否退單,。
1.4 樣本數(shù)量
(1)總樣本數(shù)量:根據(jù)設(shè)定的部門(mén)范圍和時(shí)間范圍,,滿(mǎn)足條件的總樣本數(shù)量共計(jì)357 862條。
(2)壞樣本數(shù)量:將取值范圍異常,、工單數(shù)原因?yàn)榕及l(fā)事件的數(shù)據(jù)定義為壞樣本數(shù)據(jù),這部分?jǐn)?shù)據(jù)不可預(yù)測(cè),,也不應(yīng)該包含在預(yù)測(cè)樣本中,。
①是否退單字段值為審核不通過(guò)、退單,、空白,;
②工單數(shù)原因字段值為盜竊、計(jì)劃停限電,、客戶(hù)誤報(bào),、鳥(niǎo)害等小動(dòng)物、停限電,、外部火災(zāi),、外部異物外力破壞、外力因素,、小動(dòng)物,、車(chē)輛、樹(shù)線矛盾,、樹(shù)枝搭掛,、自然因素、空白,;
③搶修總時(shí)長(zhǎng)字段值在小于5 min或大于1 440 min的,。
據(jù)統(tǒng)計(jì),該部分?jǐn)?shù)據(jù)記錄共計(jì)73 343條,,應(yīng)該從樣本數(shù)據(jù)中剔除,。
(3)有效樣本數(shù)量
有效樣本數(shù)量=總樣本數(shù)量-壞樣本數(shù)量=284 519條。
1.5 分部門(mén)樣本數(shù)量
(1)市級(jí)供電公司
山東省電網(wǎng)公司共設(shè)有17個(gè)市級(jí)供電公司,,其有效樣本數(shù)據(jù)量如表2所示,。
(2)區(qū)縣級(jí)供電公司
經(jīng)統(tǒng)計(jì),,全省共171個(gè)區(qū)縣級(jí)供電單位含有效工單數(shù)據(jù),由于篇幅限制,,其數(shù)據(jù)的具體分布不在這里展示,。
(3)處理部門(mén)
經(jīng)統(tǒng)計(jì),全省共394個(gè)搶修部門(mén)含有效工單數(shù)據(jù),,由于篇幅限制,,其數(shù)據(jù)的具體分布不在這里展示。
2 數(shù)據(jù)分析及模型算法
2.1 數(shù)據(jù)分析
在研究數(shù)據(jù)分布及特點(diǎn)階段,,嘗試了采用多種維度,、多個(gè)方向的模型技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析,包括大數(shù)據(jù)模型等,,結(jié)果顯示:部分模型由于模型本身限制不適用于該問(wèn)題的解決,,部分模型由于數(shù)據(jù)樣本不足限制了模型性能的發(fā)揮。
通過(guò)MATLAB軟件對(duì)各市級(jí)供電公司,、區(qū)縣級(jí)供電單位以及搶修部門(mén)搶修工單進(jìn)行的數(shù)據(jù)可視化分析,,各單位的搶修工單數(shù)量總是在一段時(shí)間內(nèi)圍繞某一基準(zhǔn)進(jìn)行小范圍波動(dòng),并不時(shí)有少部分波動(dòng)范圍較大的點(diǎn)出現(xiàn),。
選取2015年除夕前后各7天的數(shù)據(jù)進(jìn)行分析,,其中部分單位數(shù)據(jù)變化情況展示如下。
(1)市級(jí)供電公司舉例
濟(jì)南供電公司工單數(shù)量變化曲線圖如圖1所示,,數(shù)據(jù)統(tǒng)計(jì)表如表3所示,。
分析得出,有70%~80%的工單數(shù)量圍繞在平均工單數(shù)量上下波動(dòng),,波動(dòng)值在平均工單數(shù)的上下20%~30%之間,,另有部分波動(dòng)值超過(guò)了30%,引起這種極端波動(dòng)的主要原因是天氣惡劣,、設(shè)備老化,、用戶(hù)原因。
2.2 預(yù)測(cè)模型分析
根據(jù)2.1小節(jié)的數(shù)據(jù)分析可以得出如下結(jié)論:
(1)搶修單數(shù)量在某一時(shí)間段內(nèi)通常會(huì)有一固定的均值,;
(2)時(shí)間段不同,,均值不同;
(3)通常情況下?lián)屝迒螖?shù)量都在圍繞這一均值上下波動(dòng);
(4)在有惡劣天氣擾動(dòng)情況下,搶修工單數(shù)量值會(huì)有一個(gè)大的波動(dòng),,產(chǎn)生一個(gè)極值,;
(5)如果有設(shè)備老化問(wèn)題、用戶(hù)管理等問(wèn)題,在遇到惡劣天氣時(shí),極值的幅度通常會(huì)更大,。
由上述結(jié)論,,可以用如下模型來(lái)預(yù)測(cè)某一天的工單數(shù)量:
其中,,Wpre為某一天的工單數(shù)量的預(yù)測(cè)值;Wba為樣本空間內(nèi)剔除所有極值后的工單數(shù)量平均值,;Wco為圍繞基值的隨機(jī)波動(dòng)值,;Qmax為樣本空間內(nèi)所有極值的最大值;Dco為擾動(dòng)系數(shù),,包括惡劣天氣,、設(shè)備老化、用戶(hù)管理等問(wèn)題引起的工單數(shù)變化,。
上述模型被稱(chēng)為具擾動(dòng)特性的滾動(dòng)基值法,。擾動(dòng)是指惡劣天氣、設(shè)備老化,、用戶(hù)管理等擾動(dòng)因素對(duì)預(yù)測(cè)結(jié)果有顯著的影響,;滾動(dòng)是指基于在一定時(shí)期內(nèi)設(shè)備的狀態(tài)及管理水平等不會(huì)出現(xiàn)大的變化情況下始終使用前N天數(shù)據(jù)作為樣本空間;基值是指在無(wú)擾動(dòng)情況下?lián)屝薰蔚钠骄怠?/p>
2.3 算法分析
為便于工程計(jì)算,,需要對(duì)具擾動(dòng)特性的滾動(dòng)基值法公式(式(1)),、參數(shù)進(jìn)行必要的說(shuō)明和改進(jìn)。
(1)基值Wba計(jì)算方法
① 預(yù)測(cè)日的前N天數(shù)據(jù)構(gòu)建樣本空間,,N>10。
② 計(jì)算樣本空間內(nèi)工單數(shù)量平均值,。
③ 定義工單數(shù)量超出平均值P%的數(shù)據(jù)為極值Q,,統(tǒng)計(jì)出Q的個(gè)數(shù)T。
④ 從樣本空間中剔除這些極值數(shù)據(jù)Q,,樣本空間的長(zhǎng)度變?yōu)镹-T,。
⑤ 向前增加T天數(shù)據(jù),補(bǔ)齊長(zhǎng)度為N的樣本空間,。
⑥ 返回步驟②繼續(xù),,直至樣本空間內(nèi)不再有極值,此時(shí)的樣本空間稱(chēng)為有效樣本空間,。
⑦ 基值Wba等于有效樣本空間內(nèi)工單數(shù)的算術(shù)平均值,。
(2)隨機(jī)波動(dòng)值Wco計(jì)算方法
① 在有效樣本空間內(nèi)找出最大工單數(shù),與基值的差記為D,。
② 定義S是在[-1,,1]區(qū)間上的隨機(jī)數(shù)。
③ Wco=D×S,。
(3)Qmax極值的最大值計(jì)算方法
計(jì)算基值Wba時(shí)剔除掉的所有極值中最大值,。當(dāng)沒(méi)有極值時(shí)取Wba×(1+P%)作為Qmax。
(4)Dco:擾動(dòng)系數(shù)計(jì)算方法
①擾動(dòng)因素分析
影響搶修工單數(shù)量變化的擾動(dòng)因素很多,,天氣,、氣溫,、設(shè)備老化、負(fù)荷率,、用戶(hù)設(shè)備,、用戶(hù)管理等都能引起工單數(shù)量的波動(dòng),有時(shí)波動(dòng)幅度甚至很大,。在這些擾動(dòng)因素當(dāng)中,,天氣和氣溫的影響最為明顯,而且還會(huì)擴(kuò)大其他擾動(dòng)因素的作用,,例如,,惡劣天氣會(huì)導(dǎo)致負(fù)荷增加,而負(fù)荷增加又會(huì)讓設(shè)備老化的問(wèn)題更為嚴(yán)重,,綜上分析,,這里只討論天氣和溫度對(duì)工單數(shù)量的影響。
根據(jù)歷史天氣預(yù)報(bào)數(shù)據(jù),,單獨(dú)挑選出了惡劣天氣時(shí)的數(shù)據(jù),,如表4~表6所示,表中的變化率是惡劣天氣當(dāng)天的工單數(shù)量與基值的比值,,這里只列出了部分單位的統(tǒng)計(jì)結(jié)果,。
· 市級(jí)供電公司
· 區(qū)縣級(jí)供電單位
· 搶修部門(mén)
由表可見(jiàn),天氣變化對(duì)工單數(shù)量有著直接的影響,,工單數(shù)量的變化與天氣惡劣程度相對(duì)應(yīng),,天氣越惡劣,工單數(shù)量越多,。
② 擾動(dòng)系數(shù)Dco的計(jì)算
定義H為天氣惡劣程度,,惡劣程度是雨、雪,、風(fēng),、氣溫的綜合考量,取值范圍為0~100,,那么擾動(dòng)系數(shù)Dco的計(jì)算公式為:
3 風(fēng)險(xiǎn)預(yù)警等級(jí)劃分
國(guó)家電網(wǎng)電力安全事故等級(jí)劃分是將電網(wǎng)運(yùn)行風(fēng)險(xiǎn)預(yù)警分為4個(gè)等級(jí):一級(jí)紅色預(yù)警,、二級(jí)橙色預(yù)警、三級(jí)黃色預(yù)警和四級(jí)藍(lán)色預(yù)警,。參照這一劃分原則,,按照供電單位日搶修工單數(shù)量多少,對(duì)搶修工作所面臨的壓力進(jìn)行風(fēng)險(xiǎn)預(yù)警,,也可分為4個(gè)等級(jí),,分別是一級(jí)紅色預(yù)警、二級(jí)橙色預(yù)警、三級(jí)黃色預(yù)警和四級(jí)藍(lán)色預(yù)警,。預(yù)警等級(jí)劃分的定義可以考慮兩種方式:正態(tài)分布劃分和絕對(duì)值分布劃分,。
3.1 正態(tài)分布劃分
正態(tài)分布是自然界、人類(lèi)社會(huì),、心理和教育等領(lǐng)域連續(xù)隨機(jī)變量概率分布的一種,,尤其是從管理學(xué)角度來(lái)看,正態(tài)分布的兩端小,、中間多的規(guī)律滿(mǎn)足人們的心理預(yù)期,。根據(jù)正態(tài)分布原理,假定一級(jí)預(yù)警占比例a%,、二級(jí)預(yù)警占比例b%,、三級(jí)預(yù)警占比例c%、四級(jí)預(yù)警占比例d%,,則17個(gè)市級(jí)供電單位預(yù)警情況如表7所示,,171個(gè)區(qū)縣級(jí)供電單位預(yù)警情況如表8所示,394個(gè)搶修部門(mén)預(yù)警情況如表9所示,。
3.2 絕對(duì)值分布劃分
絕對(duì)值分布劃分是根據(jù)日搶修單數(shù)量的絕對(duì)值多少劃分預(yù)警等級(jí),。表10~表12分別為地市級(jí)供電單位、區(qū)縣級(jí)供電單位和搶修單位等級(jí)劃分方法,,其中Y為日搶修工單數(shù)量,,N11、N12,、N13,、N21、N22,、N23,、N31,、N32,、N33為各等級(jí)區(qū)間邊界值。
4 算法模型驗(yàn)證
為驗(yàn)證預(yù)測(cè)算法的準(zhǔn)確性,,選取2017年除夕前后(2016年11月27日至2017年2月27日)的有效數(shù)據(jù)進(jìn)行驗(yàn)證,。
4.1 地市級(jí)供電單位
按正態(tài)分布劃分預(yù)警等級(jí),取a=20,,b=30,,c=30,d=20,,分別預(yù)測(cè)2017年1月1日,、2017年1月10日、2017年1月27日(除夕)和2017年2月22日的搶修工單數(shù)量,表13中的正確率是各等級(jí)預(yù)測(cè)值與當(dāng)日實(shí)際值的比較,。
4.2 區(qū)縣級(jí)供電單位
對(duì)部分區(qū)縣級(jí)供電單位進(jìn)行預(yù)測(cè),,選取了除夕特殊日類(lèi)型和晴天、惡劣天氣兩種不同的天氣類(lèi)型,,由于不是全部區(qū)縣,,因此不能劃分預(yù)警等級(jí),通過(guò)準(zhǔn)確率函數(shù)來(lái)進(jìn)行驗(yàn)證,,其計(jì)算為:
預(yù)測(cè)結(jié)果如表14所示,。
4.3 搶修單位
搶修單位的預(yù)測(cè)驗(yàn)證采用與區(qū)縣級(jí)供電單位相同的方法,結(jié)果如表15所示,。
5 結(jié)束語(yǔ)
本文利用大數(shù)據(jù)挖掘分析技術(shù)研究了一套具擾動(dòng)特性的滾動(dòng)基值法的配網(wǎng)搶修工單預(yù)測(cè)算法,,該方法利用歷史數(shù)據(jù)、天氣數(shù)據(jù),、特定時(shí)期等特征因子,,通過(guò)算法模型的不斷訓(xùn)練與完善,實(shí)現(xiàn)了對(duì)未來(lái)一天的搶修工單量的預(yù)測(cè),,準(zhǔn)確率高達(dá)80%,,對(duì)實(shí)際的電力故障搶修服務(wù)工作的開(kāi)展起到了強(qiáng)有力的指導(dǎo)作用,是進(jìn)一步提升電網(wǎng)企業(yè)供電服務(wù)質(zhì)量的催化劑,。
參考文獻(xiàn)
[1] 邵峰晶, 于忠清, 王金龍,,等. 數(shù)據(jù)挖掘原理與算法[M]. 北京: 中國(guó)水利水電出版社,2005.
[2] 趙志剛,張文杰,安宏宇,,等. 配網(wǎng)主動(dòng)搶修關(guān)鍵技術(shù)研究與應(yīng)用[J]. 科技創(chuàng)新與應(yīng)用,,2017(5):177.
[3] 蔡金錠,鄢仁武. 基于小波分析與隨機(jī)森林算法的電力電子電路故障診斷[J].電力科學(xué)與技術(shù)學(xué)報(bào),2011,26(2): 54-60.
[4] (美)P.M安德遜. 電力系統(tǒng)故障分析[M]. 王際強(qiáng),胡冰清,,任震,,等,譯. 電力工業(yè)出版社,1980.
作者信息:
刁柏青1,,姚 剛1,,潘 筠1,孟祥君1,,于善海2,,史雙雙2,李 劍2
(1. 國(guó)網(wǎng)山東省電力公司運(yùn)監(jiān)中心,,山東 濟(jì)南 250001,;
2. 山東魯能軟件技術(shù)有限公司,山東 濟(jì)南250001)