摘要:在深入研究Nios自定制指令的軟硬件接口的基礎(chǔ)上,,利用Matlab/DSP Builder建立快速傅里葉變換FFT核心運(yùn)算指令基本模型,,然后用Altera公司提供的Singacompiler工具對其進(jìn)行編譯,產(chǎn)生 QuartusⅡ能夠識別的VHDL源程序,,并將此程序在Nios中自定制成相關(guān)的FFT運(yùn)算指令,。利用自定制的FFT運(yùn)算指令,在Nios中利用C語言 編寫基于Nios的FFT算法程序,,實(shí)現(xiàn)了FFT運(yùn)算的軟硬件協(xié)同設(shè)計(jì),。經(jīng)測試表明,,將FFT算法加入到Nios嵌入式處理器指令集中,可以幫助系統(tǒng)完成 復(fù)雜的數(shù)據(jù)處理任務(wù),,增強(qiáng)Nios系統(tǒng)的實(shí)時(shí)處理能力,。該設(shè)計(jì)方法打破了軟硬件間的屏障,大大加快了系統(tǒng)的功能驗(yàn)證,。
關(guān)鍵詞:FFT,;自定制指令;軟硬件協(xié)同設(shè)計(jì),;EP2C5Q208C8
在自動(dòng)控制領(lǐng)域,,往往要對被控對象進(jìn)行狀態(tài)檢測,從而作出下一步的處理,,達(dá)到控制的目的,,因此自動(dòng)控制系統(tǒng)離不開對被控系統(tǒng)的狀態(tài)進(jìn)行監(jiān)測,以便對其進(jìn)行 處理,,例如滾動(dòng)軸承故障,、電動(dòng)機(jī)故障等均可以利用頻譜分析法對其進(jìn)行狀態(tài)監(jiān)測和故障診斷。要檢測被控對象的狀態(tài),,就離不開數(shù)字信號處理,,因此,數(shù)字信號處 理應(yīng)用廣泛,。并且FFT(快速傅里葉變換)促進(jìn)了數(shù)字信號處理的發(fā)展,,它可應(yīng)用傅里葉變換理論所能涉及的任何領(lǐng)域。對于FFT工程的實(shí)現(xiàn)方法有軟件法和硬 件法,,即通過軟件程序完成FFT運(yùn)算,,這種方法可適用于各種數(shù)字信號處理的應(yīng)用場合,很靈活,,但缺點(diǎn)是不能進(jìn)行實(shí)時(shí)處理,。而使用專用硬件完成數(shù)字信號處理 的方法能夠?qū)崿F(xiàn)實(shí)時(shí)處理,但外圍電路相對復(fù)雜,,不易擴(kuò)展,,靈活性差,且價(jià)格昂貴,。因此人們一方面尋求結(jié)構(gòu)簡單,、運(yùn)算速度快,存儲量小的FFI實(shí)現(xiàn)方法,,另 一方面采用先進(jìn)的VLSI技術(shù)改進(jìn)實(shí)現(xiàn)FFT的硬件結(jié)構(gòu),,將算法硬件化。
Nios嵌入式處理器是FPGA生產(chǎn)廠商Althera推出的軟核CPU,,它是一種面向用戶的,、可靈活定制的通用RISC嵌入式CPU,。用戶可以在 Nios指令系統(tǒng)中增加用戶自定義指令,以增強(qiáng)對強(qiáng)實(shí)時(shí)軟件算法的處理能力,,可以把一個(gè)復(fù)雜的標(biāo)準(zhǔn)指令序列簡化為一條用硬件實(shí)現(xiàn)的單個(gè)指令,。特別是在需要 使用大量FFT算法的場合,可以根據(jù)用戶的需要,,定制專門的FFT處理器硬件和定制一些諸如復(fù)數(shù)乘法或復(fù)數(shù)加法等傳統(tǒng)運(yùn)算指令,使Nios系統(tǒng)不但具有常 規(guī)數(shù)字信號處理器功能,,而且具有軟件實(shí)現(xiàn)FFT運(yùn)算處理的特點(diǎn),。
1 FFT算法原理
1.1 按時(shí)間抽取的基-2 FFT算法
設(shè)序列x(n)長度為N,且滿足N=2M,,M為正整數(shù),。按n的奇偶把x(n)分解為2個(gè)N/2點(diǎn)的子序列:
則可將DFT化為:
式中,X1(k)與X2(k)分別是x1(r)及x2(r)的N/2點(diǎn)DFT,。
由此可以看到,,一個(gè)N點(diǎn)DFT已分解成2個(gè)N/2點(diǎn)的DFT。這2個(gè)N/2點(diǎn)的DFT再按照式(4)組合成1個(gè)N點(diǎn)DFT,。這里應(yīng)該看到 X1(k),,X2(k)只有N/2個(gè)點(diǎn),即k=O,,1,,…,(N/2)-1,。而X(k)卻有N個(gè)點(diǎn),,即k=O,1,,…,,N-1,故用式(4)計(jì)算得到的只 是X(k)的前一半的結(jié)果,,要用X1(k),,X2(k)來表達(dá)全部的X(k)值,還必須應(yīng)用系數(shù)的周期性,,這樣可得到:
說明后半部分k值(N/2≤k≤N-1)所對應(yīng)的X1(k),,X2(k)分別等于前半部分k值(O≤k≤(N/2)-1)所對應(yīng)的X1(k),X2(k),。這樣,,就可將X(k)表達(dá)為前后兩部分:
其運(yùn)算關(guān)系可以利用蝶形運(yùn)算流程圖來形象地描述,圖l為按時(shí)間抽取法的蝶形運(yùn)算流程圖符號,。
1.2 按頻率抽取的基-2FFT算法
仍設(shè)序列點(diǎn)數(shù)為N=2M,,M為正整數(shù),。在把輸出X(k)按k的奇偶分組之前,先把輸入序列按前,、后各一半(不是按偶奇)分開,,把N點(diǎn)DFT寫成2部分,則可將DFT化為:
圖2為按頻率抽取法的蝶形運(yùn)算流程圖符號,,這樣,,就把1個(gè)N點(diǎn)DFT按k的奇偶分解為2個(gè)N/2點(diǎn)的DFT了。
由以上分析可知,,F(xiàn)FT算法中最核心的是蝶形運(yùn)算單元,。而一個(gè)蝶形運(yùn)算單元主要由一次復(fù)數(shù)乘法,兩次復(fù)數(shù)加法構(gòu)成,。為此整個(gè)FFT算法中,,復(fù)數(shù)乘法和復(fù)數(shù)加法是最為核心的運(yùn)算單元。
2 FFT算法軟硬件協(xié)同設(shè)計(jì)
軟硬件協(xié)同設(shè)計(jì)指對系統(tǒng)中的軟硬件部分使用統(tǒng)一的描述和工具進(jìn)行集成開發(fā),,完成全系統(tǒng)的設(shè)計(jì)驗(yàn)證并跨越軟硬件界面進(jìn)行系統(tǒng)優(yōu)化,。其基本的設(shè)計(jì)流程是先用 VHDL語言和C語言進(jìn)行系統(tǒng)描述并進(jìn)行模擬仿真和系統(tǒng)功能驗(yàn)證;然后對軟硬件實(shí)現(xiàn)進(jìn)行功能劃分,,分別用語言進(jìn)行設(shè)計(jì)并將其綜合起來進(jìn)行功能驗(yàn)證和性能預(yù) 測等仿真確認(rèn)(協(xié)調(diào)模擬仿真),;其次進(jìn)行軟件和硬件詳細(xì)設(shè)計(jì);最后進(jìn)行系統(tǒng)測試,。
根據(jù)上面的分析可知,,F(xiàn)FT算法中最核心的是蝶形運(yùn)算單元,而復(fù)數(shù)乘法和復(fù)數(shù)加法又是蝶形運(yùn)算單元的核心,,因此可以采取Nios的自定義指令功能,,定制一條復(fù)數(shù)乘法指令和一條復(fù)數(shù)加法指令,以便完成一次蝶形運(yùn)算,。
2.1 建立NiosⅡ嵌入式處理器系統(tǒng)
首先,,利用QuartusⅡ建立項(xiàng)目工程,選用的目標(biāo)器件為CycloneⅡEP2C5Q:再用SOPCBuider創(chuàng)建NiosⅡ組件 模型,,生成硬件描述文件,,鎖定引腳后進(jìn)行綜合與適配,生成NiosⅡ硬件系統(tǒng)下載文件,;然后建立NiosⅡ嵌入式系統(tǒng),,從SOPC Builder組件欄中加入所需的組件(如NiosⅡCPU核、定時(shí)器Timer,、JTAG_UART,、Avalon三態(tài)總線橋、鍵輸入I/O口和 Flash等),。另外,,為了實(shí)現(xiàn)NiosⅡ處理器對EPCS Flash存儲器的讀寫訪問,,還要加入EPCS Serial FlashController組件。通過此控制器將用于FPGA配置的SOF文件和CPU運(yùn)行的軟件一并存于EPCS器件中,,以便大大簡化硬件系統(tǒng)組成 結(jié)構(gòu),。為了保證所有組件的地址安排是合法的,要對各組件地址實(shí)行自動(dòng)分配,;最后進(jìn)行全程編譯(即分析,、綜合、適配和輸出文件裝配),,完成NiosⅡ硬件系 統(tǒng)的設(shè)計(jì),。
2.2 利用DSP Builder生成復(fù)數(shù)乘法模塊
使用DSP Builder在FPGA上進(jìn)行DSP模塊的設(shè)計(jì),可實(shí)現(xiàn)高速DSP處理,。但是,在實(shí)際應(yīng)用中,,除了要求DSP高速外,,由于DSP處理的算法往往比較復(fù) 雜,如果單純使用DSPBuilder來實(shí)現(xiàn)純硬件的DSP模塊,,會耗費(fèi)過多的硬件資源,,因此有時(shí)也無法完成許多算法復(fù)雜的模型。而NiosⅡ則是一個(gè)建 立在FPGA上的嵌入式微處理器軟核,,它有一個(gè)重要的特性是具有自定制指令,。在DSP算法中會反復(fù)出現(xiàn)一些運(yùn)算(如復(fù)數(shù)乘法器、整數(shù)乘法器,、浮點(diǎn)乘法器 等),,而在通用的CPU中都沒有專門用于復(fù)數(shù)乘法計(jì)算和浮點(diǎn)乘法計(jì)算的相關(guān)指令。在系統(tǒng)設(shè)計(jì)中,,利用MA-TLAB,、DSP Builder或者VHDL設(shè)計(jì)并生成復(fù)數(shù)乘法器、整數(shù)乘法器,、浮點(diǎn)乘法器等硬件模塊,。在QuartusⅡ環(huán)境中對上述文件做一些修正后,在SOPC Builder窗口中將它們定制為相應(yīng)的指令,,并可設(shè)定或修改執(zhí)行該指令的時(shí)鐘周期,。在進(jìn)行DSP算法運(yùn)算時(shí),可通過匯編或C語言,,甚至C++語言來運(yùn)用 這些自定義指令進(jìn)行嵌入式程序設(shè)計(jì),。
根據(jù)復(fù)數(shù)運(yùn)算,設(shè)2個(gè)復(fù)數(shù)為a+bj和c+dj,,則乘法表述為:
在MATLAB/Simulink下建立如圖3所示的復(fù)數(shù)乘法模型,,圖中的Dataal,、Databl和Resultl是DSP Builder中SOPCLibrary中Custom Ins-truction中的模塊,分別對應(yīng)Nios內(nèi)部ALU的2個(gè)輸入信號dataa和datab,,以及ALU的輸出信號result,。 Datareal、DataImag,、DatbReal,、Da-thlmag是一個(gè)總線位轉(zhuǎn)換模塊;BusConeatenation是總線復(fù)合模塊,。 Dataa toComplex和Datab to Complex是一個(gè)實(shí)數(shù)轉(zhuǎn)復(fù)數(shù)的模塊,,Com-plex Product是復(fù)數(shù)乘法模塊,Real Result是復(fù)數(shù)解出實(shí)部和虛部的模塊,。
該模型完成了1個(gè)16位的復(fù)數(shù)乘法,。在這個(gè)設(shè)計(jì)中,利用Nios32的32位數(shù)據(jù)位寬,,把32位分成2部分,,分別放入復(fù)數(shù)的實(shí)部和虛部,實(shí)部,、虛部的位寬 都是16位,,正好構(gòu)成1個(gè)32位數(shù),兩個(gè)16位復(fù)數(shù)進(jìn)行運(yùn)算后,,把結(jié)果設(shè)為16位復(fù)數(shù),,也用32位表示。設(shè)此模型的文件名為co-mplex.mdl,。并 點(diǎn)擊Signalcompiler,,對complex.mdl進(jìn)行轉(zhuǎn)換,在轉(zhuǎn)換窗口中分別作如下選擇:器件選擇CycloneⅡ,;綜合器選擇Quart- usⅡ,;“SOPC Info”的generate SOPC Builder PTF File項(xiàng)要選擇打勾。分別單擊轉(zhuǎn)換按鈕1-Convert和綜合按鈕2-Synthesis即可將其轉(zhuǎn)換成標(biāo)準(zhǔn)的VHDL語言,。
2.3 在Nios中加入復(fù)數(shù)乘法指令
在已建立的SOPC設(shè)計(jì)中,,雙擊CPU項(xiàng),點(diǎn)擊“Import”按紐,,點(diǎn)擊“ADD"按紐,,打開Complex_ei.vhd,再點(diǎn)擊 “Readport-list from files"按紐,,點(diǎn)擊“ADD to System”按紐,,加入該設(shè)計(jì)作為指令執(zhí)行模塊。最后再將整個(gè)項(xiàng)目重新編譯一次,鎖定引腳后,,再下載到目標(biāo)器件中,。為此即在Nios指令中定制了一條名 為COMP的復(fù)數(shù)乘法指令,在進(jìn)行C語言編程時(shí),,其調(diào)用格式為z=nm_comp(x,,y),其中x和y為兩個(gè)復(fù)數(shù),,其運(yùn)算結(jié)果放在z中,。用同樣的方法, 可以建立復(fù)數(shù)加法指令和復(fù)數(shù)減法指令,。由此可見,,利用DSP Builder很容易地實(shí)現(xiàn)了FFT算法中的復(fù)數(shù)運(yùn)算指令的定制。同時(shí)在定制指令時(shí),,對于浮點(diǎn)數(shù)的處理,,采用統(tǒng)一為幾位二進(jìn)制有效數(shù)字的辦法來解決的,比 如說:小數(shù)位數(shù)固定為4位,,整數(shù)位數(shù)固定為6位,,那么可以定義一個(gè)向量signal num:std_logic_vector(9down to 0);在做運(yùn)算的時(shí)候,,注意高6位是整數(shù)、低4位是小數(shù),,就可以達(dá)到實(shí)型數(shù)據(jù)的處理,。
2.4 FFT算法軟件設(shè)計(jì)
在NiosⅡ硬件系統(tǒng)設(shè)計(jì)完成后,將配置文件下載到指定的FPGA中,,通過SOPC Builder軟件窗口,,可進(jìn)入NiosⅡIDE軟件開發(fā)環(huán)境進(jìn)行軟件設(shè)計(jì)。
通過SOPC Buider軟件窗口,,啟動(dòng)NiosⅡIDE,,然后新建工程,在新建工程的過程中,,選擇剛才產(chǎn)生的CPU,,新工程產(chǎn)生后,在工程添加文件,,在文件中寫入程 序代碼,。在軟件編程時(shí)設(shè)計(jì)者可以使用多種方式使用自定制指令,為了簡化軟件開發(fā)者使用自定義指令的編程,,在生成的SDK中的.h文件中已經(jīng)包含了自定義指 令的宏定義,,可以直接用在C中。下面以基2,8點(diǎn)FFT為例加以說明,。在定制了兩條復(fù)數(shù)運(yùn)算指令后,,可以使用C語言編程實(shí)現(xiàn)FFT算法。由于有基本的復(fù)數(shù) 運(yùn)算指令和復(fù)數(shù)加法指令,,為此采用C語言編寫程序,,其算法變得相當(dāng)簡單,F(xiàn)FT核心算法如下:
2.5 系統(tǒng)測試
采用Altera公司的Cyclone Ⅱ系列芯片EP2C5Q208C8,。用Altera提供的Nios SDK,,將編譯后的可執(zhí)行代碼,通過計(jì)算機(jī)串口下載到FPGA上的Nios系統(tǒng)內(nèi)存中去并運(yùn)行,,將輸出結(jié)果與Matlab仿真結(jié)果進(jìn)行了比較,。比較結(jié)果如 表l所示,其中參考值是用MATLAB按FFT計(jì)算得到的結(jié)果,,測試值是在Nios中利用C語言編寫的FFT程序計(jì)算的結(jié)果,,表中某些數(shù)據(jù)誤差較大,是因 為本系統(tǒng)采用定點(diǎn)數(shù)據(jù)精度不夠,,只要增加定點(diǎn)數(shù)據(jù)的位數(shù)就可提高運(yùn)算的精度,。
3 結(jié)束語
Nios是一個(gè)性價(jià)比較高的微處理器,它是以軟核的方式提供給用戶,,并專為在Altera的FPGA上實(shí)現(xiàn)作了優(yōu)化,,用于SOPC(片上可編程系統(tǒng))集 成,最后在FPGA上實(shí)現(xiàn),,通過它可以創(chuàng)建Nios CPU設(shè)計(jì)項(xiàng)目,,從而為設(shè)計(jì)人員提供SOPC設(shè)計(jì)必需的軟硬件設(shè)計(jì)平臺。在定制的NiosCPU設(shè)計(jì)項(xiàng)目中利用Nios的用戶自定義指令功能,,可以達(dá)到 FFT運(yùn)算的軟硬件協(xié)同設(shè)計(jì),,實(shí)現(xiàn)了快速FFT的變換。由于軟件直接控制硬件,,所以編譯過后的軟件調(diào)試工作,,基本上都是軟硬件協(xié)同完成的。因此速度快,,占 用資源少,,容易擴(kuò)展。