4G空中接口通用的OFDMA和MIMO技術(shù)實(shí)現(xiàn)探討
本文將討論其中的前兩項(xiàng):具體地說,首ff先是介紹如何實(shí)現(xiàn)OFDMA的核心DSP算法,然后是被LTE用來實(shí)現(xiàn)上行鏈路的新技術(shù),最后簡要介紹用于WiMAX和LTE的MIMO(所有IP方面的內(nèi)容不在本文討論范圍內(nèi))。本文討論的前提條件是采用軟件定義的架構(gòu)。
OFDM使用大量緊鄰的正交子載波。每個(gè)子載波采用傳統(tǒng)的調(diào)制方案(如正交幅度調(diào)制)進(jìn)行低符號率調(diào)制,其數(shù)據(jù)速率保持與相同帶寬下的傳統(tǒng)單載波調(diào)制方案相同。增強(qiáng)性能的OFDMA技術(shù)允許通過給多個(gè)用戶分配特殊頻率并共享信道。
采用單載波方案的OFDM的主要優(yōu)點(diǎn)是無需復(fù)雜的均衡濾波器就能夠應(yīng)付多種信道條件。例如,很長的銅線中產(chǎn)生的高頻衰減,窄帶干擾以及由于多徑導(dǎo)致的頻率選擇性衰落。由于OFDM可以看作使用許多慢速調(diào)制的窄帶信號,而不是使用一個(gè)快速調(diào)制的寬帶信號,因此信道均衡可以得到簡化。低符號率可以充分利用符號間可提供的保護(hù)間隔,從而使得處理時(shí)域擴(kuò)展(time-spreading)成為可能,并能消除碼間干擾(ISI)。
在目前為止的大多數(shù)系統(tǒng)中,如WiFi、16d和16e WiMAX和LTE下行鏈路,核心算法一直是FFT。然而,LTE上行鏈路進(jìn)行了革新,要求使用更復(fù)雜的離散傅里葉變換(DFT)。
所有這些系統(tǒng)不僅需要高速FFT處理,而且要求靈活性。頻增的市場壓力要求供應(yīng)商發(fā)布的產(chǎn)品兼容較早的標(biāo)準(zhǔn),但也必須具備足夠的靈活性,以便能通過簡單的軟件升級而升級到最終版本,或者是讓同一個(gè)系統(tǒng)支持不同的模式或不同的標(biāo)準(zhǔn)(如用于LTE和WiMAX的公共平臺)。
然而,也可以采用可編程平臺,這種可編程平臺可以在靈活的軟件引擎上高效地實(shí)現(xiàn)面向硬件的算法。picoChip公司的高性能PC102就是一個(gè)很好的例子,它結(jié)合了軟件開發(fā)環(huán)境的面市時(shí)間和提取優(yōu)勢以及在算法中采用并行機(jī)制帶來的性能優(yōu)勢。
FFT其實(shí)就是離散傅里葉變換(DFT)的一種高效實(shí)現(xiàn)。對于一個(gè)N點(diǎn)DFT來說,直接實(shí)現(xiàn)要求N2次復(fù)雜的乘法與加法運(yùn)算,但作為一個(gè)提供難以置信的效率增益的完美例子,經(jīng)典的FFT只要求N 有兩種方法可以將DFT減少為一系列更簡單的運(yùn)算。一種方法是執(zhí)行頻域抽取,另一種方法是執(zhí)行時(shí)域抽取。這兩種方法需要相同數(shù)量的復(fù)雜乘法和加法運(yùn)算。兩者的主要區(qū)別是,時(shí)域抽取接受數(shù)字翻轉(zhuǎn)的輸入,產(chǎn)生正常順序的輸出,而頻域抽取則接受正常順序的輸入,產(chǎn)生數(shù)字翻轉(zhuǎn)的輸出。輸入和輸出運(yùn)算由所謂的蝶形運(yùn)算完成。每個(gè)蝶形運(yùn)算都要將輸入乘上復(fù)雜的旋轉(zhuǎn)因子e-j2πn/N。 流水線FFT可以采用對串行輸入流的實(shí)時(shí)連續(xù)處理進(jìn)行表征。面向硬件的方法通過盡量減少復(fù)雜乘法器的數(shù)量和所需的存儲空間來減少硅片的成本或面積。這樣可以在一定的面積上并行計(jì)算更多的單元。 FFT算法涉及到數(shù)據(jù)的暫時(shí)分離,這是由蝶形運(yùn)算執(zhí)行的一項(xiàng)任務(wù)。由于樣值要從輸入流中的不同點(diǎn)處獲取,因此流水線FFT需要對數(shù)據(jù)進(jìn)行緩存和重新排序。目前有許多不同的架構(gòu)可以解決這個(gè)問題。本文的FFT用例采用了標(biāo)準(zhǔn)的radix-4頻域抽取算法。 FFT的picoArray實(shí)現(xiàn)方案 picoChip PC102是一款高性能的多核DSP,專門針對無線做過優(yōu)化。它在單個(gè)裸片上集成了300多個(gè)種類略有不同的處理器(或“陣列單元”):每個(gè)處理器均是自帶存儲器的傳統(tǒng)16位哈佛結(jié)構(gòu)DSP,如表1所示。 picoArray編程模型使得組裝流水線結(jié)構(gòu)變得非常容易,這也是實(shí)現(xiàn)FFT所用的方法。舉例來說,每個(gè)radix-4蝶形運(yùn)算包括4個(gè)復(fù)雜的乘法(注意,第4個(gè)蝶形運(yùn)算只包含復(fù)雜的加法),并被映射到一個(gè)獨(dú)立的處理器。每個(gè)陣列單元都是從內(nèi)部總線獲取輸入數(shù)據(jù),經(jīng)過處理后再向流水線中的下一個(gè)DSP提供輸出。由于總的吞吐量受限于最慢的陣列單元,因此理想情況下陣列單元上的每個(gè)環(huán)回都應(yīng)花相同數(shù)量的周期才能實(shí)現(xiàn)最佳的性能。例如,如果每個(gè)陣列單元在8個(gè)周期內(nèi)處理每個(gè)樣值,那么最大吞吐量在160MHz時(shí)可達(dá)每秒20M個(gè)采樣。 FFT實(shí)現(xiàn)接收16+j16、左對齊、按順序輸入的數(shù)據(jù),提供16+j16、也按順序的輸出數(shù)據(jù)。在每個(gè)蝶形運(yùn)算中會發(fā)生位增加現(xiàn)象,其中2個(gè)位用于加法,16個(gè)位用于復(fù)雜的乘法,這種位增加在采用就近舍入策略的40位STNA2 AE累加器中很容易管理。這種機(jī)制可以保持中間值的最佳可能精度 ,從而達(dá)到較高的輸出數(shù)據(jù)信噪比。圖1a顯示了本實(shí)現(xiàn)中的單元。 表2總結(jié)了PC102上的256點(diǎn)FFT的性能。表2給出了復(fù)雜采樣速率在10MSps和80MSps之間的256點(diǎn)FFT所要求的資源,并給出了在PC102上能以每個(gè)速率點(diǎn)執(zhí)行的最大FFT數(shù)量。從表中可以看出,單個(gè)10MSps FFT需要約1.5%的資源。 從圖1b可以看出如何通過整合“構(gòu)建模塊”FFT來獲得更高的吞吐量--顯然并行架構(gòu)是非常適合的。 雖然目前大多數(shù)標(biāo)準(zhǔn)采用OFDM(WiFi、802.16d、Flash OFDM)或OFDMA(802.16e),但LTE選用的上行鏈路發(fā)送機(jī)制是最新的SC-FDMA(單載波FDMA),也稱為DFT擴(kuò)展OFDM。 與傳統(tǒng)OFDMA相比,SC-FDMA的優(yōu)點(diǎn)是信號具有更低的峰值/平均功率比(PAPR),因?yàn)樗捎昧斯逃械膯屋d波結(jié)構(gòu)。這在上行鏈路中尤其重要,因?yàn)樵谏闲墟溌分懈偷腜APR可以使移動終端在發(fā)送功效方面得到更大的好處,并進(jìn)而延長電池使用時(shí)間。因此一些人士認(rèn)為,SC-FDMA“集兩者之大成”,即單載波的低PAPR和多載波的魯棒性。當(dāng)然,天下沒有免費(fèi)的午餐,這些好處的代價(jià)是增加了數(shù)字處理的復(fù)雜性,如上所述。 SC-FDMA上行鏈路的實(shí)現(xiàn)如圖2所示,其中DFT位于OFDM調(diào)制器之前,這表明比標(biāo)準(zhǔn)OFDMA要多一些步驟。 眾所周知,如果變換點(diǎn)數(shù)可以分解成少量的數(shù)(素?cái)?shù)),就可以高效地實(shí)現(xiàn)DFT。分解時(shí)素?cái)?shù)越少,實(shí)現(xiàn)越簡單。當(dāng)然,經(jīng)典FFT使用單個(gè)素?cái)?shù)因子2。 LTE中的DFT預(yù)編碼器尺寸取決于為指定用戶的上行鏈路數(shù)據(jù)發(fā)送分配的子信道數(shù)量。 其中N是子載波的數(shù)量,a、b和c在 N ≤1320 條件下都大于等于0 (20MHz帶寬時(shí))。對于指定的用戶,N范圍可以從12個(gè)音 (a,b,c=0,即單個(gè)資源模塊)到1296,總共35個(gè)不同的選擇,這些音再一起經(jīng)過調(diào)制形成單載波上行鏈路。然而,這是在手機(jī)發(fā)送器側(cè),因?yàn)榛窘邮諜C(jī)要處理許多用戶,每個(gè)用戶從這些選項(xiàng)中作出選擇,針對所有可能的幀配置的總允許變換器數(shù)量是531、783、569。這種靈活性顯然增加了接收iDFT的復(fù)雜性。 用于分解iDFT的技術(shù)是“分而治之”,主要原理與大家熟悉的FFT相同,但iDFT的長列表無法被分解成單個(gè)素?cái)?shù)因子。相反,每個(gè)音可以被分解成長度為2、3和5的三個(gè)短iDFT。這些是iDFT的“引擎”。在本例實(shí)現(xiàn)中,一些iDFT已經(jīng)被分解成素?cái)?shù)因子(如4、8和9)以外的其他因子,以便將流水線級的最大數(shù)量減小至3,從而帶來縮短延遲的好處。 圖3顯示了LTE iDFT的邏輯結(jié)構(gòu),這種結(jié)構(gòu)可用來在PC102/PC20x上實(shí)現(xiàn)20MHz的LTE eNodeB。 流水線級必須能夠?qū)崿F(xiàn)所有35種可能的iDFT功能,并動態(tài)地重新配置和避免由于不同長度iDFT同時(shí)流過而造成的任何流水線危害。最簡單的架構(gòu)是重新排序+級緩沖對A、B和C都成為用來實(shí)現(xiàn)所有6個(gè)iDFT引擎的相同功能塊的實(shí)例(如果計(jì)算1點(diǎn)iDFT就是7臺引擎,即通過不變)。更優(yōu)化的解決方案確認(rèn)只有一級需要實(shí)現(xiàn)9點(diǎn)引擎,另外一級需要實(shí)現(xiàn)8點(diǎn)引擎,第三級需要4點(diǎn)引擎,加上2、3和5個(gè)引擎,因?yàn)槿魏蝘DFT長度都不需要超過一個(gè)9、8或4。 使事情復(fù)雜化的因素之一是,LTE是一個(gè)帶寬可擴(kuò)展的系統(tǒng)(簡言之,TDD/FDD都是1.25MHz~20MHz)。表3列出了不同模式時(shí)的不同實(shí)現(xiàn)方式。雖然與FFT相比靈活性有一定的代價(jià)(見表2),但值得注意的是,這種架構(gòu)在實(shí)現(xiàn)這些配置時(shí)效率仍然特別高:即使所需的20MHz+20MHz FDD(最壞情況)資源也仍只占PC102的10%。 MIMO是指在發(fā)送機(jī)和接收機(jī)上使用多幅天線以改善通信性能,它是所有4G系統(tǒng)的一個(gè)特點(diǎn)。 MIMO不需要增加帶寬或發(fā)送功率就能顯著地提高數(shù)據(jù)吞吐量和鏈路距離,并具有更高的頻譜效率(每秒每赫茲帶寬可傳更多的位)和鏈路可靠性或空間分集性能(降低了衰落)。 發(fā)送(TX)端有m幅天線,接收(RX)端有n幅天線,就形成了一個(gè)mn的MIMO,此時(shí)信道的數(shù)量就等于所有組合之和:例如一個(gè)22的MIMO就有4個(gè)“信道”(1-1,1-2,2-1,2-2),性能將達(dá)到SISO系統(tǒng)中香農(nóng)極限值的兩倍。你只能從4個(gè)“信道”中發(fā)送2倍的信息,因?yàn)槟阈枰敖忾_”信道矩陣才能提取信息。在實(shí)際應(yīng)用中,信道不是完全獨(dú)立的(存在一定的相關(guān)性),因此優(yōu)勢有所降低。事實(shí)上有個(gè)似是而非的結(jié)論,即信道越差(更多的多徑等),MIMO的用處就越大,因?yàn)樾诺老嚓P(guān)性越少。在自由空間中,由于4個(gè)信道非常相似,因此帶來的好處非常有限。 MIMO有多種不同的使用方式。拿WiMAX下行鏈路來說,它有兩種標(biāo)準(zhǔn)的MIMO模式:Matrix A和Matrix B。前者也被稱為空間時(shí)間編碼(STC),它通過兩幅發(fā)射天線以不同的形式發(fā)送相同的信號。由于發(fā)送的是相同的符號,數(shù)據(jù)速率在SISO上不會提高,但由于兩種形式(s和-s*)不同,接收機(jī)有更好的機(jī)會恢復(fù)數(shù)據(jù),因此魯棒性和范圍(針對指定的數(shù)據(jù)速率)得到了改善。為了在下行鏈路中實(shí)現(xiàn)這一技術(shù),雖然符號率塊不受影響(發(fā)送的一個(gè)符號),但現(xiàn)在有兩個(gè)突發(fā)鏈(burst chain),它們用不同調(diào)制形式的信息饋送到兩幅天線。 Matrix B則相反,它通過發(fā)送兩個(gè)不同的符號來獲得雙倍的數(shù)據(jù)速率。在這種情況下,共有兩個(gè)突發(fā)鏈(針對兩幅天線),每個(gè)鏈處理獨(dú)立的符號;在實(shí)際應(yīng)用中,它將不是簡單的復(fù)制,而是符號率部分將被設(shè)計(jì)得更加快速,然后將輸出信號交替發(fā)送給兩個(gè)TX分支。實(shí)際系統(tǒng)同時(shí)支持兩種模式,可以根據(jù)每個(gè)用戶要求選擇Matrix A或B:向條件較好的系統(tǒng)以較快的速度發(fā)送數(shù)據(jù),而使用STC能使蜂窩邊緣的系統(tǒng)受益。 這非常適合多核架構(gòu)。如圖4所示,有兩個(gè)獨(dú)立的突發(fā)鏈饋送倒兩幅天線:同樣的架構(gòu)被簡單地例示了兩次,這對工程師來說非常簡單。這個(gè)特殊的圖實(shí)際上稍微有些復(fù)雜,在實(shí)際應(yīng)用中,許多系統(tǒng)都結(jié)合使用MIMO和多種空間技術(shù),如波束成形、“調(diào)零”(null-steering)天線或SDMA。這個(gè)特殊設(shè)計(jì)共有8幅天線,配置為每個(gè)MIMO分支4幅,每個(gè)天線都可以獨(dú)立控制。 在接收機(jī)側(cè),信號處理相對更加復(fù)雜:不僅因?yàn)镸atrix B有更高的峰值數(shù)據(jù)速率,而且用于區(qū)分不同信號的接收機(jī)特別復(fù)雜。 本文小結(jié) 空中接口正變得越來越復(fù)雜,并且依賴于更復(fù)雜的算法才能獲得最佳的性能、效率和范圍?;贔FT的OFDMA已經(jīng)成為下一代無線的標(biāo)準(zhǔn)技術(shù)。但最新的技術(shù),如LTE,也在尋求做出更多的改善:它們采用更復(fù)雜的技術(shù),如SC-FDMA,并要求靈活的DFT技術(shù)。 我們可以使用軟件可編程架構(gòu)來模仿面向硬件的折中所具有的優(yōu)勢和靈活性,引導(dǎo)系統(tǒng)制造商更早地進(jìn)入需要WiMAX和LTE等算法的市場。這樣就能讓他們比競爭對手更早地推出產(chǎn)品,并仍確保與標(biāo)準(zhǔn)的兼容。事實(shí)上,一個(gè)合適的架構(gòu)可以實(shí)現(xiàn)從一個(gè)公共平臺開始的所有標(biāo)準(zhǔn)(如802.16d/e和LTE,以及下一代PHS或UMB)。擴(kuò)展這種架構(gòu)以支持MIMO相對比較簡單。
表1:PC102處理器變化和存儲器分布(*FFT的最大數(shù)量受限于可用MEM類AE的數(shù)量)。
圖1b:FFT內(nèi)部單元;并行FFT可實(shí)現(xiàn)LTE上行鏈路要求的更高吞吐量DFT。
表2:picoArray上的OFDMA采用的256點(diǎn) 16+j16 FFT的資源使用。
圖2:SC-FDMA或DFT擴(kuò)展OFDM。
圖3:LTE iDFT庫結(jié)構(gòu)。
表3:picoArray上可擴(kuò)展iDFT的資源使用。
圖4:具有兩個(gè)獨(dú)立突發(fā)鏈的MIMO下行鏈路系統(tǒng)。
評論