1 引言
目前,,無線產(chǎn)品的廣泛應用使無線音頻和視頻的高質(zhì)量傳輸成為可能。藍牙,、無限局域網(wǎng)等無線傳輸設備比較復雜,,成本較高,急需開發(fā)一種簡便的,、僅用于流媒體的無線傳輸平臺,,將音頻數(shù)據(jù)實時地發(fā)送到移動終端。由于音頻數(shù)據(jù)的實時性,,不宜采用反饋重傳等造成很大時延的差錯控制方式,。前向糾錯碼(FEC)的碼字是具有一定糾錯能力的碼型,它在接收端解碼后不僅可以發(fā)現(xiàn)錯誤,,而且能夠判斷錯誤碼元所在的位置并自動糾錯,。這種糾錯碼信息不需要儲存,不需要反饋,,實時性好,,故可選擇前向糾錯來實現(xiàn)差錯控制。
筆者設計的系統(tǒng)指標如下:
●當信道誤碼率為3x10-3時,,經(jīng)過前向糾錯,,誤碼率降到10-7以下;
●數(shù)據(jù)源使用的是S/PDIF民用數(shù)字音頻格式標準[1],;
●信號時延遠小于人的分辨能力(40ms),;
●芯片資源耗用不超過20萬門;
RS碼即里德-所羅門碼,,它是能夠糾正多個錯誤的糾錯碼,,具有同時糾正突發(fā)性錯誤和隨機性錯誤的能力[2],而且編解碼相對簡單??紤]到系統(tǒng)的誤碼率和資源耗用,,擬采用RS碼作為前向糾錯碼。
在無線信道中,,比特差錯經(jīng)常成串發(fā)生,,這是由于持續(xù)時間
較長的衰落谷點會影響到幾個連續(xù)的比特,而信道編碼僅在檢測和校正單個差錯和不太長的差錯串時才最有效,。為了糾正這些成串發(fā)生的比特差錯及一些突發(fā)錯誤,,可以運用交織技術(shù)來分散這些錯誤,使長串的比特差錯變成短串差錯,,從而可以用前向碼對其糾錯,。
用本系統(tǒng)傳輸數(shù)據(jù)時,在發(fā)端先對數(shù)據(jù)進行RS編碼(外碼),,再進行交織處理,,最后再進行RS編碼(內(nèi)碼)。收端次序和發(fā)端相反,,先進行內(nèi)碼解碼,,接著進行去交積處理完成錯誤分散,最后進行外碼解碼,,糾正內(nèi)碼未能糾正的錯誤,。通過這種2維的RS編解碼,可以充分利用RS碼糾錯能力強的特點,,降低系統(tǒng)的誤碼率,。也可考慮使用迭代譯碼[3]。若1次2維譯碼的效果無法滿足需求,,則將譯碼后的數(shù)據(jù)反饋回譯碼器,,進行1次迭代譯碼。迭代次數(shù)的增加會帶來相應的資源開銷和時延的增加,。
2 系統(tǒng)結(jié)構(gòu)及實現(xiàn)
糾錯編碼使用2維RS碼。內(nèi)碼采用(10,,8)Rs碼,,q=4,每個碼字含32bit數(shù)據(jù),。外碼采用(20,,16)RS碼,q=8,,每個碼字含128個數(shù)據(jù),。交織器大小為1 280bit。以1 280bit為1幀,,幀之間預留信息時隙,。
下面詳細介紹交織器,,解交織器和(20,16)RS編碼器,,解碼器模塊的原理及FPGA實現(xiàn),。(10,8)RS編碼器,,解碼器的原理與(20,,16)RS編碼器,解碼器基本相同,。
2.1(20,,16)RS編碼器
RS碼是BCH碼的重要子類。由于具有同時糾正突發(fā)性錯誤和隨機性錯誤的能力,,且糾正突發(fā)性錯誤更有效,,因而被廣泛地應用。
(20,,16)RS編碼器完成RS編碼功能,,每輸入16個碼元,延遲1個時鐘原樣輸出,,并在其后添加4個校驗碼元,,構(gòu)成20個碼元的輸出碼字。因此數(shù)據(jù)輸入16個碼字后應預留至少4個碼字的空隙,,避免數(shù)據(jù)丟失,。
(20,16)RS是(255,,251)RS的縮短碼,,它是在有限域GF(28)上運算得到的,把(255,,251)RS的前235個碼元都當作0就得到(20,,16)RS碼。碼參數(shù)如下:
碼長N=20,,信息位個數(shù)K=16,,校驗位N-K=4,糾錯能力T=2,,碼距D=5,;
生成多項式:
其中,α是(20,,16)RS的本原域元素,。
編碼采用除法方式實現(xiàn),其原理如圖1所示。
整個電路實際上是GF(28)的除法電路,。圖中乘單元的系數(shù)是生成多項式G(x)的對應項系數(shù),,對應的除法電路的除數(shù)是被除數(shù)的系數(shù)是輸人數(shù)據(jù)的8bit碼元,按照輸入順序進行降冪排列,。第1個輸入碼元是x19的系數(shù),,最后1個輸入碼元是x4的系數(shù)。系數(shù)都是本原多項式P(x)生成的二元擴域GF(28)中的元素,。在16個碼字都輸入后,,寄存器D1-D4中保存的數(shù)據(jù)分別是常數(shù)項,x項,,x2項和x3項的系數(shù),,它們就是所得到的校驗碼。數(shù)據(jù)選擇電路用來對不同數(shù)據(jù)進行選擇輸出,。前16個時鐘,,輸人數(shù)據(jù)按照順序輸出,后4個時鐘輸出計算得到的校驗碼,。所有輸出數(shù)據(jù)較之輸入數(shù)據(jù)都要延遲1個時鐘周期,,時鐘上升沿同步輸出。電路中的主要部分就是GFf(28)中的乘法單元和模加單元,。
2.2(20,16)RS解碼器
該電路完成(20,,16)RS碼的解碼工作,將20個8bit碼元解碼為16個8bit的碼元,。同時輸出碼字起始信號,、數(shù)據(jù)有效信號和校驗位有效信號。解碼器的原理如圖2所示,。
RS碼時域譯碼法主要有P-G-z法,、B-M法[4]和歐氏法。由于P-G-Z法要求解有限域上的逆矩陣,,不利于實現(xiàn),,因此工程上很少使用。B-M法和歐氏法都是快速遞歸法,,二者等效[5],,易于硬件實現(xiàn),因此得到廣泛使用,。在本次設計中,采用的解碼算法是B-M算法,。
RS碼時域譯碼由以下幾步組成:
(1)伴隨式計算電路,。伴隨式S1-S4是用于查錯和糾錯的主要參數(shù)。在伴隨式計算模塊中,先進行余式計算,,然后根據(jù)余式計算伴隨式并輸出,。計算余式是指在GF(28)域中將以輸入碼元為系數(shù)的x的多項式作為被除數(shù),除以本原多項式得到余式,。1個碼元對應1個余式,。得到全部余式以后將各余式的x同冪次系數(shù)組合即得到伴隨式。
(2)差錯位置多項式系數(shù)計算電路,。R(x)的系數(shù)A1和A2的值,。為實現(xiàn)此目的,需要求解4個非線形方程,。在設計中采用迭代的方法來完成這一要求,。A1和A2是差錯位置多項式的2個系數(shù)。如果輸入數(shù)據(jù)無錯,,那么A1=A2=0,。如果有1個錯誤,則A2=0,,只需計算求得A1的值,。
(3)差錯位置計算電路。實現(xiàn)該過程時,,用存儲器Ds記錄多項式D1和D2分別記錄記錄A1x和A2x2的值,。每當1個新的數(shù)據(jù)到來時,D1和D2都乘α(位置變化1位),,再把得到的新值代入Ds以驗證是否是方程的根,。這樣,只需在每個數(shù)據(jù)到來的時刻判斷當前Ds=0是否成立,,就可判
斷當前數(shù)據(jù)是否有錯,。
(4)誤碼元錯誤幅度計算電路。此模塊的功能是當數(shù)據(jù)有錯時(由s進行判斷)計算錯誤碼元的錯誤幅度,。e是計算得到的錯誤幅度與相應碼元相異或得到的值,,可消除錯誤。如果當前碼元無錯,,那么e=0。
(5)輸入數(shù)據(jù)緩存FIFO,。此模塊的功能是將原始碼字延遲一定周期輸出,,以便與錯誤幅度的輸出同步。由雙端口RAM構(gòu)成的可復位,。FIFO實現(xiàn)此功能,。
(6)糾錯電路,。此模塊完成最后的糾錯功能,,通過與誤碼錯誤幅度e異或來實現(xiàn),。data_temp是從FIFO輸出的數(shù)據(jù),。data_out即為糾正錯誤后的數(shù)據(jù)輸出,。以上整個糾錯過程有43個時鐘的延時,。
(7)數(shù)據(jù)輸出電路,。此模塊主要完成2項功能:生成糾錯失敗信號fail和輸出最終數(shù)據(jù),。fail信號的生成過程其實就是再求1次伴隨式s。的過程,。若計算出的s1不為0,,則說明糾錯不成功,將原始輸入數(shù)據(jù)原樣輸出,,同時fail信號輸出高電平,。否則,說明糾錯成功,,將糾錯后的碼字輸出,,。fail保持低電平,。本過程有20個時鐘的延時,。
上面設計的解碼電路的關(guān)鍵就是GF(28)域中乘除法單元的硬件實現(xiàn)[6],?;贔PGA存儲器資源豐富的特點,,設計中采用了查:ROM表的辦法來實現(xiàn)乘除功能。
整個電路系統(tǒng)都在同一系統(tǒng)時鐘CLK下工作,,高電平復位,。
2.3交織器組
本設計中,,外編碼器的輸出按行進入1280bit的交織器,,1個交織器存儲32個外碼碼字,,然后對交織器的內(nèi)容按列讀出,。根據(jù)交織器的特性,,需要將數(shù)據(jù)完全裝入后才能讀出,。在讀出時,,不能向交織器內(nèi)寫數(shù)據(jù),。數(shù)據(jù)的輸入是連續(xù)的,,需要具有緩存功能的模塊對數(shù)據(jù)進行緩存,。采用1組2個交織器輪流讀寫的方法來保證數(shù)據(jù)的連續(xù)性,。2個交織器的輸出也是輪流進行的,當1個交織器填充完畢進行輸出時,,來自外碼編碼器的數(shù)據(jù)將被存儲到另1個交織器中,。交織器組的架構(gòu)如圖3所示。
本設計中,,交織器的大小是1280bit,,這主要是基于以下幾方面的考慮。
(1)交織器不宜過大,。由于必須完全寫滿后再讀出,,數(shù)據(jù)通過交織器的延遲與交織器大小成正比。因此,,較大的交織器會影響整個系統(tǒng)的延時,。所以,在保證效果的前提下,,交織器要設計得盡量小,。
(2)交織器的大小存在下限,即交織器有交織深度的最小限制[7],。以本設計為例,,接收時第1級解碼為(20,16),,第2級為(10,8),,則第2級的每個碼字中不應有2個碼元來自于第1級解碼器的輸出,。否則,如果第1級解碼器有未成功的解碼(多于2個錯誤碼元),,則第2級解碼器的輸入碼元中存在多于1個的錯誤碼元的概率大大增加,。因此,在本設計中,,交織器的下限為第1級解碼器的輸出碼字的10倍,,也就是160字節(jié),。設計采用的交織器大小恰為下限。
3 系統(tǒng)驗證及結(jié)論
系統(tǒng)的整體實現(xiàn)與時序驗證均使用Altera0uartusIl4.2和Modelsim5.7完成,。FEC系統(tǒng)中各個模塊及頂層控制部分全部使用VerilogHDI,。設計。實現(xiàn)時選擇的目標器件是Altera Cyclone公司的EPlC20F400C7,。
對整個測試系統(tǒng)的編譯結(jié)果如下:
在各種信道誤碼率和不同頻率下進行了電路測試,,測試結(jié)果如表1所示。
根據(jù)以上分析,,本設計達到了性能指標。當誤碼率適當降低時,,糾錯效果的提升非常明顯,。該系統(tǒng)在對S/PDIF格式的音頻數(shù)據(jù)進行編碼和解碼時共延時3ms。若工作于更高頻率,,則延時可按比例減小,。采用雙相標識碼串行輸入作為數(shù)據(jù)來源時,數(shù)據(jù)吞吐量最大可達到32Mb/s,,若采用其他數(shù)據(jù)來源,,數(shù)據(jù)吞吐量最大可達178Mb/s。因此,,此系統(tǒng)不僅可對音頻信號進行前向糾錯編解碼,,還可應用于數(shù)據(jù)量更大的視頻信號等的其他數(shù)據(jù)傳輸。