文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.191010
中文引用格式: 荊通,,丁文銳,劉春輝. 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法[J].電子技術(shù)應(yīng)用,,2020,,46(3):80-85.
英文引用格式: Jing Tong,Ding Wenrui,,Liu Chunhui. Multi-step spectrum occupancy prediction method based on association rule mining[J]. Application of Electronic Technique,,2020,46(3):80-85.
0 引言
認(rèn)知無線電技術(shù)提高了系統(tǒng)的頻譜利用率,,然而在傳統(tǒng)頻譜感知中,,認(rèn)知用戶對所有頻帶進(jìn)行感知會(huì)造成大量的能量損耗和處理時(shí)延,因此如何準(zhǔn)確預(yù)測空間頻譜占用情況,,即頻譜預(yù)測技術(shù),,受到研究人員的廣泛研究。頻譜預(yù)測技術(shù)能夠?yàn)檎J(rèn)知用戶提供更好的頻譜接入條件,,減少認(rèn)知用戶和主用戶之間產(chǎn)生的數(shù)據(jù)傳輸沖突,,避免對主用戶通信造成干擾,降低響應(yīng)時(shí)延,,增加網(wǎng)絡(luò)的吞吐量[1],。頻譜預(yù)測過程一般包含3個(gè)步驟:(1)數(shù)據(jù)采集,實(shí)際頻譜采集或建立仿真頻譜模型生成,;(2)數(shù)據(jù)預(yù)處理,,有效數(shù)據(jù)選取、信號(hào)與噪聲的分離,;(3)頻譜預(yù)測,,設(shè)計(jì)頻譜預(yù)測方法進(jìn)行預(yù)測。
設(shè)計(jì)有效的頻譜預(yù)測方法需考慮預(yù)測機(jī)制與預(yù)測方法兩方面:預(yù)測機(jī)制大多是采用時(shí)隙通信模式,,將每個(gè)時(shí)隙的頻譜占用或空閑情況定義為一個(gè)二元時(shí)間序列,,通過分析歷史數(shù)據(jù)獲取頻譜使用規(guī)律,進(jìn)而預(yù)測未來頻譜占用狀態(tài)[2],;頻譜預(yù)測方法主要有基于隱馬爾可夫(Hidden Markov Model,,HMM)的方法[3]、基于自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average,,ARIMA)的方法[4],、基于神經(jīng)網(wǎng)絡(luò)的方法[5]、基于關(guān)聯(lián)規(guī)則挖掘的方法等[6],?;陉P(guān)聯(lián)規(guī)則挖掘的方法在頻譜預(yù)測中性能表現(xiàn)較好,這類方法又包括基于部分周期模式挖掘的方法[6],、基于貝葉斯的方法[7],、應(yīng)用統(tǒng)計(jì)學(xué)習(xí)的方法[8]以及最大子模式命中[9]等,。
在實(shí)際頻譜預(yù)測應(yīng)用中,往往不僅需要預(yù)測下一個(gè)時(shí)隙的頻譜占用情況,,而且需要預(yù)測多個(gè)時(shí)隙一分鐘甚至一小時(shí)的頻譜占用情況,,進(jìn)而統(tǒng)計(jì)分析信道的可用性,避免頻繁切換信道?,F(xiàn)有方法只能保證下一個(gè)時(shí)隙的一步預(yù)測效果較為理想,,而多時(shí)隙多步預(yù)測存在效果下降較快的問題。針對這一問題,,本文借鑒Apriori算法中查找頻繁項(xiàng)集的思想,,提出基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測方法,通過采集真實(shí)數(shù)據(jù)對所提出方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,。
1 頻譜占用度
1.1 頻譜占用度預(yù)測用數(shù)據(jù)選取
信道頻譜占用度可以體現(xiàn)頻譜的活躍程度,,信道頻譜活躍程度對驗(yàn)證方法的可行性十分關(guān)鍵。若信道頻譜占用度極低(0%~5%),,數(shù)據(jù)處理后生成的信道狀態(tài)信息(Channel State Information,,CSI)序列將近似為全0序列;若信道頻譜占用度極高(95%~100%),,生成的CSI序列將近似為全1序列,,對這些信道進(jìn)行CSI序列預(yù)測得到的結(jié)果極為可觀,正確率可達(dá)到90%以上,,丟失率接近0,。但這兩種極端情況都將使得CSI信道活躍度降低,即0/1狀態(tài)的轉(zhuǎn)換頻率變低,,此時(shí)頻譜占用預(yù)測也將失去意義,。故本文選取頻譜占用度35%~94%的信道進(jìn)行預(yù)測分析。信道占用度計(jì)算方法如式(1)所示:
其中,,F(xiàn)co表示信道占用度,,Tf表示信道占用時(shí)間,T表示信道測量時(shí)間,。
1.2 頻譜占用度閾值選取
頻譜占用狀態(tài)只有兩種:占用和空閑,。通常,信道頻譜強(qiáng)度高于某門限,,則認(rèn)為信道處于被占用狀態(tài),,用“1”表示;相反,,認(rèn)為信道處于空閑狀態(tài),,用“0”表示,轉(zhuǎn)換原理如式(2)所示:
其中,,cs表示信道狀態(tài),,PC表示信道電平值,,PO表示預(yù)設(shè)門限值,。該過程中如果預(yù)設(shè)門限值設(shè)置較小,,則某些噪聲信號(hào)將被誤認(rèn)為是有用信號(hào);若門限設(shè)置較高,,則會(huì)遺漏有用信號(hào),,因此頻譜占用度閾值的選取是數(shù)據(jù)預(yù)處理過程較為關(guān)鍵的步驟。
本文采用動(dòng)態(tài)門限分割[10]的方法確定頻譜占用度門限,,方法流程如圖1所示,。
動(dòng)態(tài)門限分割方法涉及兩個(gè)參數(shù),一個(gè)是用于信噪分離的判別值,,另一個(gè)是噪聲曲線平滑處理的次數(shù),。在《超短波頻段占用度測試技術(shù)規(guī)范》中,建議門限電平設(shè)置為各頻段內(nèi)當(dāng)?shù)亟邮諜C(jī)平均功率電平或電壓指示以上5 dB,。在無線電監(jiān)測工作中,,一般把超過噪聲電平3 dB~5 dB的頻點(diǎn)視為信號(hào)?;谝陨蟽牲c(diǎn),,本文采用5 dB作為信噪分離的判別值,平滑處理次數(shù)取60,,動(dòng)態(tài)門限如圖2所示,。
圖2(a)信道編號(hào)為3,統(tǒng)計(jì)電平值較低,,多數(shù)集中在-76.45 dBm左右,,且處于動(dòng)態(tài)判決門限以下,被認(rèn)定為噪聲信道,;圖2(b)信道編號(hào)為61,,統(tǒng)計(jì)電平值較高,多數(shù)集中在-67.45 dBm左右,,且處于動(dòng)態(tài)判決門限以上,,被認(rèn)定為信號(hào)信道。
各個(gè)信道的幅度-頻率信號(hào)被動(dòng)態(tài)門限分割之后就形成了CSI矩陣,,如圖3所示(圖中黑色實(shí)心方塊表示當(dāng)前CSI=1,,空白處則表示CSI=0)。
2 算法原理
2.1 時(shí)間序列關(guān)聯(lián)規(guī)則挖掘算法
Apriori算法[6]是關(guān)聯(lián)規(guī)則挖掘算法中經(jīng)典的算法,,多用于非時(shí)序項(xiàng)集,。算法一般分為兩部,一是生成頻繁模式,,二是根據(jù)頻繁模式生成關(guān)聯(lián)規(guī)則,。而使用該算法處理時(shí)間序列數(shù)據(jù)時(shí),,必須對序列進(jìn)行模式劃分。對序列進(jìn)行模式劃分時(shí),,每次取一部分?jǐn)?shù)據(jù)進(jìn)行時(shí)間序列關(guān)聯(lián)規(guī)則計(jì)算,,然后向后滑動(dòng)一個(gè)窗口,產(chǎn)生一個(gè)新的事務(wù),,再次計(jì)算時(shí)間序列關(guān)聯(lián)規(guī)則,。保持每個(gè)事務(wù)窗口一致,這樣可以使當(dāng)前事務(wù)區(qū)別于上一個(gè)事務(wù),,同時(shí)又不會(huì)漏掉可能產(chǎn)生的時(shí)間序列特征組合,,如圖4所示。
時(shí)間序列關(guān)聯(lián)規(guī)則挖掘過程中有兩個(gè)重要判決條件:(1)當(dāng)模式出現(xiàn)次數(shù)N大于最小支持度時(shí),,生成頻繁模式,;(2)頻繁模式轉(zhuǎn)移率P大于最小置信度時(shí),生成關(guān)聯(lián)規(guī)則,,如圖5所示,。
2.2 基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測算法
本節(jié)將使用上文方法生成的關(guān)聯(lián)規(guī)則進(jìn)行多步長頻譜占用預(yù)測。
本文算法涉及概念和符號(hào)見表1,。
輸入:原始幅度頻率數(shù)據(jù)(File_level),。
輸出:預(yù)測的準(zhǔn)確率以及丟失率。
(1)將原始幅度頻率數(shù)據(jù)通過動(dòng)態(tài)門限分割,、信道分割,,生成由0和1組成的CSI序列。
(2)當(dāng)生成的CSI序列長度大于跨度L時(shí),,檢測序列中異常值的情況,,進(jìn)行基于關(guān)聯(lián)規(guī)則挖掘的多步長頻譜占用預(yù)測。
(3)對預(yù)測結(jié)果與實(shí)際監(jiān)測結(jié)果進(jìn)行對比,,統(tǒng)計(jì)預(yù)測準(zhǔn)確率和丟失率,。
算法中輸入的原始數(shù)據(jù)為401×n的矩陣(File_level),n為采集數(shù)據(jù)的時(shí)隙數(shù)(本文時(shí)隙間隔為1 s),,通過動(dòng)態(tài)門限分割以及信道編號(hào)(1~401)的選擇,,形成單一信道的CSI序列。頻繁項(xiàng)跨度(FrQ_length)限定了頻繁子序列長度的最大值,,取值范圍可設(shè)為1~n之中的任意整數(shù)值,,當(dāng)其設(shè)為1時(shí),算法可近似于兩狀態(tài)馬爾可夫過程,;當(dāng)其設(shè)置為接近n時(shí),,頻繁項(xiàng)數(shù)量太少,算法失效,,故本文取10%n,。最小支持度(Min_sup)與最小置信度(Min_conf)體現(xiàn)了頻繁項(xiàng)的頻繁程度以及規(guī)則的可靠性,。最小預(yù)測長度(Min_span)的設(shè)定可以減少頻繁子序列生成規(guī)則的數(shù)量,提升算法效率和精度,。
關(guān)聯(lián)規(guī)則是頻譜占用預(yù)測的主要依據(jù),。項(xiàng)集統(tǒng)計(jì)數(shù)大于Min_sup即為頻繁項(xiàng),若頻繁項(xiàng)A統(tǒng)計(jì)數(shù)為a,、頻繁項(xiàng)B統(tǒng)計(jì)數(shù)為b,,則轉(zhuǎn)移率Pab=a/b,當(dāng)Pab大于Min_conf時(shí)產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,,即當(dāng)前序列為A時(shí),預(yù)測結(jié)果為B的概率為Pab,。
圖6為多步長頻譜占用預(yù)測算法流程,。
在多步長預(yù)測過程中,算法沒有在規(guī)則中找到適合的規(guī)則,,則記為一次丟失,,輸出“-1”,即異常值,,異常值的出現(xiàn)會(huì)影響下一次的預(yù)測,,所以要進(jìn)行異常值替換,每個(gè)異常值“-1”都會(huì)分兩次替換成“0”或“1”,,例如序列[1 0 -1 0]會(huì)替換成[1 0 0 0]和[1 0 1 0],,由這兩個(gè)序列查找關(guān)聯(lián)規(guī)則中置信度最高的規(guī)則進(jìn)行預(yù)測或者繼續(xù)丟失,即如果有m個(gè)異常值,,則要進(jìn)行2m次替換,,最終由替換后的序列置信度最高值進(jìn)行預(yù)測或者繼續(xù)丟失。若Pred_length>1,,即多步長,,步長遞增過程如圖7所示,圖中標(biāo)注下劃線并加粗的字符為預(yù)測序列值,,算法使用預(yù)測結(jié)果更新CSI序列,,直至完成多步長預(yù)測算法。
若當(dāng)前序列滿足預(yù)測條件,,記預(yù)測次數(shù)(Predict)加1,;若預(yù)測結(jié)果與下一時(shí)隙狀態(tài)序列相同,記預(yù)測正確次數(shù)(Correct)加1,;若最終沒有找到滿足預(yù)測條件的關(guān)聯(lián)規(guī)則,,記丟失次數(shù)(Loss)加1,丟失率記為Loss_Rate,,公式如下:
3 實(shí)驗(yàn)及分析
3.1 數(shù)據(jù)采集與預(yù)處理
本文中的頻譜監(jiān)測數(shù)據(jù)來自北京航空航天大學(xué)學(xué)院路校區(qū)連續(xù)約48 h(2018年12月22日16時(shí)22分~2018年12月24日16時(shí)25分)頻段為88 MHz~108 MHz,,即調(diào)頻FM廣播業(yè)務(wù)頻段進(jìn)行監(jiān)測,,監(jiān)測設(shè)備包括是德公司E4407b頻譜分析儀、PC以及SAS-521F-2接收天線,,表2列出了監(jiān)測參數(shù),。
頻譜儀每次掃描空間頻譜獲得400個(gè)頻譜采樣點(diǎn),在監(jiān)測時(shí)間內(nèi)每一秒形成一個(gè)“場強(qiáng)-頻率”對應(yīng)關(guān)系的文本數(shù)據(jù)文件,,因此每小時(shí)產(chǎn)生3 600個(gè)數(shù)據(jù)集,。
數(shù)據(jù)的選取對預(yù)測模型的學(xué)習(xí)效果有著極為重要的影響,合適的數(shù)據(jù)能夠?yàn)樘岣哳A(yù)測模型的正確率提供良好的支持,。正常情況下,,頻譜的短期變化趨勢是連續(xù)的,而長期變化具有明顯的周期性,,周期性具體體現(xiàn)在日,、星期、年周期性以及節(jié)假日特性,。為了提高信道頻譜占用預(yù)測精度,,在數(shù)據(jù)選擇時(shí)應(yīng)考慮這一周期性特點(diǎn)。故本文采用第一天100時(shí)隙作為訓(xùn)練集,,第二天相同時(shí)間的100時(shí)隙作為測試集,。
圖8為對所采集到的頻譜數(shù)據(jù)進(jìn)行“場強(qiáng)-頻率-時(shí)間”三維可視化處理結(jié)果。
3.2 主要參數(shù)分析
3.2.1 多步長對預(yù)測結(jié)果的影響
圖9和圖10分別展示了13號(hào)和86號(hào)信道中預(yù)測步長對預(yù)測結(jié)果的影響,。
通過信道13和信道86的10步預(yù)測結(jié)果可見,,隨著預(yù)測步長的增加,預(yù)測丟失率逐漸減少,,雖然預(yù)測正確率也隨步長增加呈下降趨勢,,但下降趨勢較緩,總預(yù)測正確率由于丟失率的逐漸減少,,隨預(yù)測步長的增加呈略微上升的趨勢,。可見該算法在多步長預(yù)測中有效減少丟失率的同時(shí),,保持了較高的預(yù)測正確率,。
3.2.2 信道占用度對預(yù)測結(jié)果的影響
本實(shí)驗(yàn)中選取了占用度由35%到94%依次升高的6個(gè)信道。圖11展示了預(yù)測步長為1和10的結(jié)果,。
從圖11中可以看出,,總體上信道占用預(yù)測正確率保持較高的水準(zhǔn),其丟失率沒有隨著占用度的變化有正相關(guān)或者負(fù)相關(guān)的規(guī)律,。由此可見總體上算法體現(xiàn)出了良好的性能,,信道占用度的變化對預(yù)測結(jié)果的影響不大。
3.2.3 規(guī)則置信度對預(yù)測結(jié)果的影響
圖12(a)和圖12(b)分別展示了3個(gè)信道在最小置信度為0.7、0.8和0.9時(shí)的正確率和丟失率,。
從圖12中可以看出,,隨著最小置信度由0.7升高至0.9,丟失率由15%左右升高至40%左右,??梢姡钚≈眯哦鹊脑O(shè)置對丟失率影響很大,,這是由于隨著最小置信度的升高,,可用的關(guān)聯(lián)規(guī)則逐漸減少,即信道信息的可預(yù)測性降低,。預(yù)測正確率隨最小置信度的提高緩慢升高,,而預(yù)測丟失率則隨最小置信度的提高急劇升高,因此,,設(shè)置適合的最小置信度對CSI序列的可預(yù)測性至關(guān)重要,。
4 結(jié)論
本文提出類Apriori算法的頻繁模式關(guān)聯(lián)規(guī)則挖掘算法,實(shí)現(xiàn)對信道占用狀態(tài)的多步長預(yù)測,。實(shí)驗(yàn)表明,該算法在實(shí)際頻譜預(yù)測中相比隱馬爾科夫模型和神經(jīng)網(wǎng)絡(luò)模型等預(yù)測方法,,不需要任何先驗(yàn)知識(shí),,可根據(jù)歷史數(shù)據(jù)進(jìn)行快速預(yù)測,達(dá)到了較好的預(yù)測效果,。
參考文獻(xiàn)
[1] 劉鎮(zhèn)鳴,,龔曉峰.認(rèn)知無線電中頻譜預(yù)測方法[J].兵工自動(dòng)化,2017,,36(9):86-89.
[2] 尹斯星.認(rèn)知無線電中基于海量頻譜監(jiān)測數(shù)據(jù)挖掘的動(dòng)態(tài)頻譜接入策略研究[D].北京:北京郵電大學(xué),,2010.
[3] 張凱,齊麗娜.一種基于隱馬爾可夫模型的自適應(yīng)聯(lián)合頻譜預(yù)測方法[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),,2015,,35(1):79-83.
[4] 段洪濤,曾繁聲,,李景春.一種預(yù)測頻段占用度的時(shí)間序列分析方法[J].無線電工程,,2011,41(7):17-20,,64.
[5] 楊健,,趙杭生,陳曦.遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)頻譜預(yù)測模型訓(xùn)練[J].解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版),,2016,,17(6):505-511.
[6] 滿方微,石榮,,何彬彬.基于關(guān)聯(lián)規(guī)則挖掘的無線電頻譜占用預(yù)測[J].電訊技術(shù),,2016,,56(11):1183-1188.
[7] HUANG P,LIU C,,YANG X,,et al.Wireless spectrum occupancy prediction based on partial periodic pattern mining[J].IEEE Transactions on Parallel and Distributed Systems,2014,,25(7):1925-1934.
[8] JACOB J,,JOSE B R,MATHEW J.Spectrum prediction in cognitive radio networks: a bayesian approach[C].2014 Eighth International Conference on Next Generation Mobile Apps,,Services and Technologies,,Oxford,2014:203-208.
[9] MAN F,,SHI R,,HE B.The data mining in wireless spectrum monitoring application[C].2017 IEEE 2nd International Conference on Big Data Analysis(ICBDA),Beijing,,2017:223-227.
[10] 丁浩,,沈文靜.基于動(dòng)態(tài)門限電平的短波段頻譜占用度測量[C].2011全國無線及移動(dòng)通信學(xué)術(shù)大會(huì)論文集,2011:408-411.
作者信息:
荊 通1,,丁文銳1,,2,劉春輝2
(1.北京航空航天大學(xué) 電子信息工程學(xué)院,,北京100191,;2.北京航空航天大學(xué) 無人系統(tǒng)研究院,北京100191)