1 引言
近年來,,我國電力通信網(wǎng)絡(luò)的發(fā)展迅速。但是,,與此相對應(yīng)的監(jiān)視,、控制、維護(hù)能力卻較落后.電力通信網(wǎng)絡(luò)的運(yùn)行存在維護(hù)難度大,,響應(yīng)速度慢,,服務(wù)質(zhì)量差,人力成本和管理成本高,,維護(hù)工作不透明,不量化,,不主動等問題,,使之無法適應(yīng)現(xiàn)代化和自動化的總體需求,。為徹底解決上述問題,需要開發(fā)和建設(shè)綜合化,、集中化,、智能化的網(wǎng)管系統(tǒng),以提升電力通信網(wǎng)的綜合化集中維護(hù)水平,,變被動維護(hù)為主動維護(hù),,變面向設(shè)備為面向客戶、面向業(yè)務(wù),,從而有效提高客戶服務(wù)質(zhì)量,、業(yè)務(wù)響應(yīng)能力和網(wǎng)絡(luò)管控能力嘲。為了有效防止因采集和處理來自交換,、傳輸,、數(shù)據(jù)、動力環(huán)境等專業(yè)網(wǎng)的海量告警數(shù)據(jù),,保證關(guān)注告警,,確保快速發(fā)現(xiàn),、定位和處理故障,,必須設(shè)計和實(shí)施有效的告警過濾機(jī)制。為此,,通過詳細(xì)分析告警數(shù)據(jù),,提出了一種新的告警過濾模型和策略。將告警過濾規(guī)則以知識庫的形式存儲,,使網(wǎng)管人員直接參與規(guī)則的定制和維護(hù),,大大減少了綜合化集中維護(hù)系統(tǒng)的成本,提高系統(tǒng)的靈活性,。
2 告警相關(guān)性
2.1 告警相關(guān)性分析
告警相關(guān)性分析是指合并和轉(zhuǎn)化告警,,即將多個告警合并成一條具有更多信息量的告警,以確定能否反應(yīng)故障根本原因的告警,,并準(zhǔn)確定位故障,。告警事件關(guān)聯(lián)可形式化定義為告警事件a與告警事件集合{a1,a2,,…,,ak}關(guān)聯(lián),表示為:a=>a{a1,,a2,,…,ak},。
告警事件關(guān)聯(lián)的類型可形式化定義為:①告警壓縮,;②告警過濾,;③告警抑制;④告警記數(shù),;⑤告警泛化,;⑥告警特化;⑦告警時序關(guān)系,。其具體定義形式參見參考文獻(xiàn),。
2.2 告警相關(guān)性方法
傳統(tǒng)的告警相關(guān)性分析方法主要有:一是通過實(shí)驗(yàn),人為制造一些故障并記錄導(dǎo)致的告警信息,;二是充分利用電信領(lǐng)域?qū)<移綍r維護(hù)通信網(wǎng)積累的經(jīng)驗(yàn)和知識,。為了克服傳統(tǒng)方法人為因素不確定性的缺陷,目前采用的告警關(guān)聯(lián)方法有范例推理法,、模糊邏輯法,、貝葉斯網(wǎng)絡(luò)法、神經(jīng)網(wǎng)絡(luò)法,、規(guī)則法,、關(guān)聯(lián)規(guī)則挖掘法等。
2.3 知識庫
知識的獲取源自知識工程師,、智能編輯程序和歸納學(xué)習(xí)程序,。其一,領(lǐng)域?qū)<彝ㄟ^與知識工程師的反復(fù)接觸,、交談,,把自己擁有的知識告訴給知識工程師,由知識工程師和專家一起將這些知識歸納整理成專家系統(tǒng)知識,。其二,,通過智能編輯程序?qū)<业慕?jīng)驗(yàn)知識送到專家系統(tǒng)知識庫中。該程序應(yīng)具備靈活的人機(jī)對話能力和有關(guān)知識庫結(jié)構(gòu)方面的知識,。其三,,通過歸納和總結(jié)大量的實(shí)驗(yàn)數(shù)據(jù),得到一些新的規(guī)律和知識,。利用歸納學(xué)程序,,模擬人類思維過程,以便從有關(guān)知識庫中發(fā)現(xiàn)新知識,,然后將這些新知識添加到知識庫中,,供專家系統(tǒng)使用。在此,,基于歸納學(xué)習(xí)和知識工程師編寫智能程序,,自動形成關(guān)聯(lián)規(guī)則,將其寫入知識庫。
3 告警過濾機(jī)制設(shè)計
3.1 告警過濾功能和目標(biāo)
告警過濾的主要功能有支持告警收斂功能,、支持告警次數(shù)的閾值越界告警功能,、支持告警延時功能、支持制定網(wǎng)元和時間段進(jìn)行忽略性過濾功能,、支持屏蔽衍生告警功能及支持告警呈現(xiàn)過濾功能。
告警過濾機(jī)制的目標(biāo)是:①設(shè)計合理的告警過濾機(jī)制,,以實(shí)現(xiàn)快速,、準(zhǔn)確的過濾瞬斷告警、無效告警和次要告警,,從而有效防止告警風(fēng)暴,,保證關(guān)注告警,降低故障時延,,提高系統(tǒng)的穩(wěn)定性,、適應(yīng)性和軟件質(zhì)量,增強(qiáng)客戶滿意度,;②能快速地確定故障位置,,快速地進(jìn)行故障處理和故障恢復(fù);③改善網(wǎng)絡(luò)性能和網(wǎng)絡(luò)管理員工作,。
3.2 告警過濾模型
為保證告警過濾的正確性,、有效性和靈活性,系統(tǒng)采用多層過濾機(jī)制,。圖l給出多層過濾模型,。其中,采集層的過濾策略主要是抑制和忽略,。它依據(jù)設(shè)定的過濾規(guī)則,,對原始告警數(shù)據(jù)實(shí)施預(yù)過濾,屏蔽無用或無需關(guān)心的告警數(shù)據(jù),,以減輕數(shù)據(jù)處理負(fù)荷,。處理層過濾是整個過濾機(jī)制中的重點(diǎn)。主要用于建立高度收斂的告警過濾模型,。其基本流程是:原始告警數(shù)據(jù)經(jīng)過采集層過濾后開始分流,,并進(jìn)行延時、閉值,、歸并,、壓縮等處理.以對濾掉不關(guān)心的告警數(shù)據(jù)。過濾策略是可修正的,,經(jīng)過修正后的策略進(jìn)行前轉(zhuǎn),,對此后的告警數(shù)據(jù)實(shí)施新的策略。表現(xiàn)層過濾按照告警屬性域設(shè)定組合條件,,過濾出關(guān)心的告警類型,。發(fā)布層過濾根據(jù)設(shè)定的過濾規(guī)則,,從而決定相關(guān)信息的發(fā)布形式、時間及內(nèi)容等,。
4 實(shí)驗(yàn)與分析
告警壓縮率=(系統(tǒng)采集的告警總數(shù)一系統(tǒng)呈現(xiàn)的告警總數(shù))/系統(tǒng)采集的告警總數(shù),。采用告警壓縮率體現(xiàn)告警過濾效果。對某本地電力通信網(wǎng)網(wǎng)管綜合化集中維護(hù)系統(tǒng)的用戶提供的統(tǒng)計數(shù)據(jù)進(jìn)行測試,,測試時間為10 h,,測試規(guī)則滿足瞬斷告警不入庫,重復(fù)告警歸并,,較低級別告警不呈現(xiàn)的原則,。表1給出測試結(jié)果。需說明的是,,在計算告警壓縮率時,,關(guān)聯(lián)告警中只計算了根告警數(shù)量,而系統(tǒng)呈現(xiàn)的告警數(shù)量中沒有計入衍生告警數(shù)量,。
由實(shí)驗(yàn)結(jié)果可見,,經(jīng)過模型過濾后,電力通信網(wǎng)發(fā)布的告警數(shù)量明顯降低,,這說明了該方法的有效性,。另外,由此還可見,,告警主要來源于交換告警和數(shù)據(jù)方面,,因此應(yīng)關(guān)注這兩個方面告警數(shù)據(jù)的關(guān)聯(lián)性研究。
5 結(jié)語
采用數(shù)據(jù)挖掘技術(shù)獲取告警關(guān)聯(lián)規(guī)則,,構(gòu)建了告警規(guī)則知識庫,,形成了用于實(shí)際系統(tǒng)的較完整的告警過濾機(jī)制及實(shí)現(xiàn)方案。該過濾機(jī)制能依據(jù)告警的重要程度不同,,分別從采集層,、處理層、呈現(xiàn)層,、發(fā)布層對告警逐層收斂,,從而實(shí)現(xiàn)快速、準(zhǔn)確地過濾瞬斷告警,、無效告警和次要告警,,以防止告警風(fēng)暴,保證關(guān)注告警,,并快速發(fā)現(xiàn),、定位和處理故障,降低故障時延,提高客戶響應(yīng)速度,,改進(jìn)服務(wù)質(zhì)量,。實(shí)驗(yàn)證明了該告警過濾機(jī)制的實(shí)用性和有效性。