123,123

TD-LTE系统中Turbo译码算法及DSP实现

来源：电子技术应用2012年第10期

彭德义，李小文

重庆邮电大学移动通信技术重点实验室，重庆 400065

摘要： 在TD-LTE系统中，Turbo码以其优异的纠错性能而备受关注。针对传统Log-Map算法译码复杂度大且时延长的缺点，提出一种简化的Log-Map算法。在高斯白噪声信道（AWGN）环境下，对各种Turbo译码算法性能进行了仿真比较，并对提出的简化译码算法在TMS320C64xDSP中进行实现。译码程序在CCS3.3的运行结果表明了该方案的实时性和有效性。

關(guān)鍵詞： 长期演进 Turbo译码 Log-Map算法 DSP实现

中圖分類號: TN929.5
文獻標識碼: A
文章編號： 0258-7998(2012)10-0106-03

Turbo decode algorithm and DSP realization in TD-LTE system

Peng Deyi, Li Xiaowen

School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications, Chongqing 400065,China

Abstract： Turbo code is highly accepted for its excellent rectifying performance in TD-LTE (Time Division-Long Term Evolution) system, concerning to the high decoding complexity and the long time delaying of traditional Log-Map algorithm, a simplified Log-Map algorithm was proposed. this paper compared a variety of Turbo decode algorithms through simulation in the atmosphere of AWGN, and realized the proposed simplified algorithm in the TMS320C64x DSP. The running results of the decoding program in CCS3.3 verify that the scheme is feasible and effective.

Key words : LTE(Long Term Evolution); Turbo decode; log-map algorithm; DSP realization

PCCCTurbo碼又稱為并行級聯(lián)碼（Parallel Concatenated Convolutional Code),在TD-LTE系統(tǒng)發(fā)送端編碼過程中引入隨機交織器,充分考慮Shannon編碼定理而獲得接近理論極限的性能[1]。故在接收端可以采用一種軟輸入軟輸出迭代譯碼算法，充分利用譯碼輸出的軟信息來逼近最大似然譯碼性能[2]。TD-LTE系統(tǒng)要求高速數(shù)據(jù)業(yè)務(wù)，傳輸數(shù)據(jù)業(yè)務(wù)量大，而軟迭代譯碼的計算復雜度隨著數(shù)據(jù)量的增加而快速增大。目前Turbo譯碼器中的分量譯碼器的實現(xiàn)算法有Log-Map算法和Max-Log-Map算法。前者能獲得最好的譯碼性能，但是其實現(xiàn)復雜度過高；后者對其進行改進，但是實現(xiàn)復雜度仍然很高。本文在Max-Log-Map算法的基礎(chǔ)上進行改進，提出一種簡化的Log-Map算法，該算法在滿足系統(tǒng)性能要求的前提下，大大降低了實現(xiàn)復雜度。

    TMS320C64x最初主要是為移動通信基站的信號處理而推出的超級處理芯片，該芯片屬于高速定點DSP,最高時鐘頻率為1 GHz，處理性能達8 000 MIPS，比傳統(tǒng)DSPs要快一個數(shù)量級，因此在測試儀表的開發(fā)領(lǐng)域有廣闊的應(yīng)用前景[3]。該系列DSP最主要的特點是在體系結(jié)構(gòu)上采用了甚長指令集VLIW(Very Long Instruction Word)，由一個超長的機器指令字來驅(qū)動內(nèi)部的多個功能單元。由于每條指令的字段之間相互獨立，故可單周期發(fā)射多條指令，從而實現(xiàn)更高的指令級并行效率。該系列DSP芯片的大容量、高運算能力等優(yōu)點使其在無線基站、終端等場合廣泛應(yīng)用，特別是運算精度能滿足測試儀表的開發(fā)條件。所以本文重點研究Turbo譯碼算法在TMS320C64x上的軟件實現(xiàn)。
1 傳統(tǒng)的Turbo譯碼算法
   針對Turbo譯碼,目前的軟輸入軟輸出迭代譯碼算法都是基于BCJR算法的推導過程，用于Turbo譯碼的MAP譯碼器就是求解下面的似然信息[4]。

導過程可以看出，本文所提的簡化算法的計算復雜度性能明顯優(yōu)于Max-Log-Map算法。
3 DSP實現(xiàn)及測試性能分析
3.1本文簡化算法的DSP實現(xiàn)
    輸入到Turbo譯碼模塊的是解子塊交織后的三路數(shù)據(jù)，且以軟信息的形式存放在內(nèi)存當中（每個軟信息占據(jù)8 bit的內(nèi)存空間）。具體函數(shù)調(diào)用如表1所示。

(2)迭代譯碼：將組裝得到的rec_s1和初始化為全零的L_a1調(diào)用Log-Map子函數(shù)計算得到該譯碼器的輸出對數(shù)似然比L_ma1，并對其進行交織處理得到L_a2，然后將rec_s2和L_a2調(diào)用Log-Map子函數(shù)計算得到第二個譯碼器的輸出對數(shù)似然比L_ma2，再將其進行解交織處理得到L_a1。判斷是否達到總的迭代次數(shù)，若未達到預設(shè)的迭代次數(shù)，則繼續(xù)進行該步驟；否則轉(zhuǎn)至(3)。
(3)譯碼判決:將迭代之后的對數(shù)似然信息進行判決，大于0則判為1；小于0則判為0。
3.2 CCS3.3環(huán)境下性能分析
　在進行DSP軟件設(shè)計時，需要對程序進行優(yōu)化，盡量減少或者消除程序中的“NOP”指令，特別是循環(huán)體內(nèi)的“NOP”指令。通過在CCS3.3上進行程序的仿真運行，從中頻接收數(shù)據(jù)，統(tǒng)計得到各種情況下譯碼過程的執(zhí)行結(jié)果，如表2所示。

表2僅列舉了幾種典型的數(shù)據(jù)長度，且不失一般性，總體性能基本不會受輸入數(shù)據(jù)長度的約束。通過分析可以看出，在相同的譯碼輸出長度的情況下，處理時間的耗費量與迭代次數(shù)是正相關(guān)的，迭代次數(shù)越大，譯碼性能越好，但處理時延越長；在相同的譯碼迭代次數(shù)的情況下，根據(jù)標準規(guī)定的傳輸塊大小與調(diào)制階數(shù)有關(guān)(本文僅以兩種不同調(diào)制方式下的傳輸塊大小為例)，16 QAM調(diào)制方式下的處理時間耗費明顯高于QPSK調(diào)制方式，這是由于16 QAM用于處理大傳輸塊，占用的內(nèi)存空間也相應(yīng)地增加。TMS320C64x芯片的主頻為1 GHz，一個指令周期耗時1 ns，故本文提出的譯碼算法DSP實現(xiàn)可以達到一定的譯碼速率，且誤比特率相當?shù)?，滿足TD-LTE綜合測試系統(tǒng)的性能要求。
本文從Turbo譯碼理論出發(fā),為適合TD-LTE綜合測試系統(tǒng)的傳輸數(shù)據(jù)業(yè)務(wù)量大且譯碼時延特性要求高的特點，針對傳統(tǒng)Turbo譯碼算法實現(xiàn)復雜度高的缺陷，提出一種簡化的Turbo譯碼算法。通過Matlab鏈路級仿真比較，所提簡化Turbo譯碼算法保證了良好的譯碼性能，同時對所提簡化算法在TMS320C64xDSP中進行實現(xiàn)。從譯碼程序運行的結(jié)果來看，該算法具有較低的誤碼率和較高的譯碼運行速率，能夠滿足TD-LTE系統(tǒng)的性能需求。由于其實現(xiàn)具有可行性和高效性，該實現(xiàn)方案已應(yīng)用于TD-LTE無線綜合測試儀器的開發(fā)當中,效果良好。
參考文獻
[1] (美)林舒，科斯特洛．差錯控制編碼（原書第二版）[M]．晏堅，何元智等，譯.北京：機械工業(yè)出版社，2004:515- 543.
[2] BERROU C, GLAVIEUX A, THITIMAJSHIMA P. Near shannon limit error-correcting coding and decoding: Turbo code[C]. in Proc. IEEE International Conference Communications, 1993：1064-1070.
[3] Texas Instruments Incorporated.TMS320C6000系列DSP編程工具與指南[M].田黎育，何佩琨，朱夢宇，譯.北京：清華大學出版社，2006：32-50
[4] 陳發(fā)堂，李小文，王丹,等.移動通信接收機設(shè)計理論與實現(xiàn)[M].北京：科學出版社,2011：121-135.
[5] LEE S J, SHANBHAG N R. Area-efficient high-thrughput MAP Decoder Architectures[J]. IEEE Transaction on Very Large Scale Integration(VLSI) Systems,2005,13(8):921-931.
[6] 冉靜，廖艷，鄭建宏. Turbo譯碼算法研究及其性能分析[J].重慶郵電學院學報,2001,13(3)：17-21.
[7] 3GPP TS 36.212 v9.0.0 Evolved Universal Terrestrial Radio Access (E-UTRA) Multiplexing and channel coding (Release 9)[S]. 2009-12：9-18.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容