新聞中心

EEPW首頁 > 汽車電子 > 設(shè)計應用 > 基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計

基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計

——
作者: 時間:2007-07-23 來源:嵌入式世界 收藏

  近年來,計算機產(chǎn)品的應用領(lǐng)域越來越廣,數(shù)字信號處理器的發(fā)展表現(xiàn)得尤為明顯。芯片制造商和板開發(fā)商利用自身的優(yōu)勢不斷開發(fā)出多結(jié)構(gòu)的產(chǎn)品來滿足這種需求。通常的DSP設(shè)備是與系統(tǒng)相結(jié)合,來實時地完成某一特定任務(wù)。隨著信號采集速度和處理速度的要求越來越高,許多領(lǐng)域都需要進行多處理器運算,其中包括醫(yī)學、圖像處理、軍事、工業(yè)控制、電信等許多領(lǐng)域。多處理器系統(tǒng)可以根據(jù)所需實現(xiàn)的功能和處理器的性能來調(diào)節(jié)處理結(jié)點的數(shù)目,使系統(tǒng)達到最佳的性能價格比。

  實際上,只有從芯片開始仔細設(shè)計,才能方便地實現(xiàn)多處理器系統(tǒng)的調(diào)節(jié)功能。這里選用的是AD公司新出品的SHARC級處理器ADSP21160。

  ADSP21160具有很大的片內(nèi)存儲區(qū)、多重內(nèi)部總線結(jié)構(gòu)、獨立的I/O子系統(tǒng);具有構(gòu)造多處理器系統(tǒng)的所有特點,能夠真正支持處理器數(shù)目的可調(diào)節(jié)功能,十分適合組成高性能浮點的多DSP系統(tǒng)。

  是目前世界上用戶數(shù)量最大的實時操作系統(tǒng)。這使它除了具有優(yōu)越的技術(shù)性能之外,還具有豐富的應用軟件支持、良好的技術(shù)服務(wù)和可靠的系統(tǒng)穩(wěn)定性。由于它具有以上優(yōu)點,本系統(tǒng)中選用了作為MVME167的操作系統(tǒng)。

  一、ADSP21160的特點

  ADSP21160 是AD公司采用超級哈佛結(jié)構(gòu)的一種新產(chǎn)品。21160的匯編代碼與2106x兼容,處理器具有SIMD(單指令流多數(shù)據(jù)流)功能;而2106x只具有SISD(單指令流單數(shù)據(jù)流)功能。為了充分利用這種新的功能,一些指令做了一些改變。ADSP21160包括1個100/150MHz的運算核、雙端片內(nèi)SRAM、1個支持多處理器的集成在片內(nèi)的I/O處理器和多重內(nèi)部總線以消除I/O瓶頸。

  ADSP21160的匯編源代碼與2106x兼容。SIMD計算結(jié)構(gòu):2個32bit的計算單元,其中每一個單元包括乘法器、ALU、移位寄存器及寄存器文件。具有完備的與外圍設(shè)備接口功能。包括獨立的I/O處理器、4Mbit 的片內(nèi)雙端SRAM、可直接連接的多處理器特性及端口(串口、連接口、外總線及JTAG)。

  ADSP21160包括2個運算處理單元,具有SIMD功能。處理單元指的是PEX和PEY。PEX始終是有效的,而PEY的有效是通過設(shè)置MODE1寄存器中的PEYEN位來實現(xiàn)的。當PEY模式有效時,同一條指令在2個處理器單元中都得到執(zhí)行,但每一個處理器單元中的操作數(shù)不同。

  SIMD模式在存儲區(qū)和處理器單元之間的數(shù)據(jù)傳輸也是很有作用的。當使用SIMD模式,通過加倍數(shù)據(jù)帶寬來保證處理器單元的操作。在SIMD模式,當使用DAGs來傳輸數(shù)據(jù)時,存儲區(qū)每次訪問所傳輸?shù)氖莾蓚€數(shù)據(jù)值。

  ADSP21160包括4Mbit的片內(nèi)SRAM,分為兩塊,每一塊2Mbit??梢远x為不同字長的指令和數(shù)據(jù)存儲。每一個存儲塊的雙端口結(jié)構(gòu)可以使存儲塊獨立地被運算核處理和I/O處理器訪問。21160的存儲區(qū)最大可以容納128K的32bit數(shù)據(jù),或256K的16bit數(shù)據(jù),或85K的48bit指令,或其他混合字長的數(shù)據(jù),但總和最大為4Mbit。所有存儲區(qū)可以16、32、48、64bit字長的字訪問。 外端口支持處理器與片外存儲器及外設(shè)的接口,片外的4G地址空間屬于21160的統(tǒng)一地址空間。

  外端口支持同步、異步及同步BURST訪問。DMA控制器的操作相對處理器運算核是獨立和不可見的,即DMA操作可與執(zhí)行指令同時進行。DMA傳輸可以在內(nèi)部存儲區(qū)與外部存儲區(qū)、外圍設(shè)備或主機之間進行。21160共有14個DMA通道,其中:連接口(linkport)占6個;串口占4個;外端口(external port)占4個。21160可以通過DMA傳輸來下載程序,外圍異步設(shè)備也可以通過DMA請求/應答線來控制2個DMA通道。

  21160具有許多特點支持多DSP系統(tǒng)。外端口與連接口支持多處理器系統(tǒng)的直接連接,外端口支持統(tǒng)一的地址空間,允許DSP之間互相訪問。片內(nèi)具有分布式總線仲裁邏輯,最多支持6片21160和主機連接。外端口的最大數(shù)據(jù)傳輸率為400MB/s,廣播寫信號可以同時發(fā)送到各片21160。6個連接口提供了另一種方法實現(xiàn)多處理器之間的通信。連接口的最高傳輸速率為600MB/s。

  整個系統(tǒng)基于VME總線。VME總線系統(tǒng)作為最早的國際通用開放式總線,自1981年起,經(jīng)歷了近20年的發(fā)展。其影響不斷擴大,功能不斷完善,現(xiàn)已成為性能最好、應用最廣的國際總線標準之一。

  根據(jù)設(shè)計要求,采用了4片ADSP21160。片外共享內(nèi)存SRAM可以被主機和各片DSP直接訪問;EPROM用來存放初始化程序和各片DSP要運行的程序,在系統(tǒng)上電后這些程序被下載到各片DSP中;LEDs用來顯示插件的狀態(tài),如reset、normal等。每一片都有1個連接口連到插件的前面板,這樣前端采集來的數(shù)據(jù)就可以很方便地傳輸?shù)蕉郉SP上,而且也使數(shù)據(jù)的傳輸模式更加靈活。

  連接口(linkport)是SHARC系列DSP芯片的一個特點。ADSP21160共有6個8bit連接口提供額外的I/O服務(wù)。在100MHz時鐘下運行時,每個連接口可達100MB/s。連接口尤其適合多處理器間點到點的連接。連接口可以獨立地同時操作,通過連接口的數(shù)據(jù)封裝成48/32bit字長后,可以從片內(nèi)存儲區(qū)直接被運算核讀取或DMA傳輸。每一個連接口有它自己的雙緩沖I/O寄存器,數(shù)據(jù)傳輸可編程,硬件由時鐘/應答握手線控制。4片DSP使用連接口實現(xiàn)DSP間兩兩互連。

  21160的主機接口可以很方便地與標準微處理器總線(16/32bit)相連,幾乎不需要額外硬件。主機通過21160的外端口對其進行訪問,存儲區(qū)地址映射為統(tǒng)一的地址空間。4個DMA通道可以用于主機接口,代碼和數(shù)據(jù)傳輸?shù)能浖_銷很小,主處理器通過HBR、HBG和REDY信號線與21160進行通信,主機可以對片內(nèi)存儲區(qū)進行直接讀寫。

  二、開發(fā)環(huán)境Tornado

  的開發(fā)環(huán)境是WindRiver公司提供的Tornado。Tornado采用主機-目標機開發(fā)方式,主機系統(tǒng)可采用運行Sun Solaris、HP-UX以及Win95/NT的工作站或個人計算機,VxWorks則運行在Intel x86、MC68K、PowerPC或SPARC等處理器上。Tornado支持各種主機-目標機連接方式,如以太網(wǎng)、串行線、在線仿真器和ROM仿真器。

  Tornado的體系結(jié)構(gòu)使得許多強有力的開發(fā)工具可以用于各種目標機系統(tǒng)和各種主機-目標機連接方式下,而不受制于目標機的資源和通信機制。同時VxWorks具有良好的可剪裁性。因此它適用于各種環(huán)境的開發(fā),小到資源極其有限的個人手持式設(shè)備如PDA(Personal Digital Assistant);大到多處理機系統(tǒng),如VME系統(tǒng)。

  Tornado可提供一個直觀的、可視化的、用戶可擴充的開發(fā)環(huán)境,極大縮短了開發(fā)周期。同時,由于Tornado是一個完全的開放系統(tǒng),使得集成第三方開發(fā)工具變得十分容易。

  主機與目標機之間的通信是通過運行各自處理器上的代理進程來完成的,使主機上的開發(fā)工具和目標機的操作系統(tǒng)可以完全脫離相互連接的方式。

  為了擺脫主機-目標機通信帶寬和目標機資源的限制,Tornado將傳統(tǒng)的目標機方的工具遷移到主機上,如shell、loader和符號表等。這樣,系統(tǒng)不再需要額外的時間和帶寬在主機和目標機之間交換信息,降低了對連接帶寬的需求,也避免了目標機的資源(如內(nèi)存)被工具或符號表大量占用,使得應用程序擁有更多的系統(tǒng)資源。同時這種遷移也使得各種主機開發(fā)工具獨立于目標機存在,從而使同一主機平臺上的工具可以用于所有的目標機系統(tǒng)。

  作為一個應用軟件開發(fā)環(huán)境,Tornado提供了友好的可視化開發(fā)界面、交叉編譯環(huán)境、源碼級調(diào)試工具、目標機命令解釋器和目標機狀態(tài)監(jiān)視器等多種應用工具,為應用軟件開發(fā)提供了一個高效而可靠的平臺。

  三、程序設(shè)計

  我們選用的DSP開發(fā)工具是AD公司提供的VisualDSP。這是一個集成開發(fā)環(huán)境,支持對SHARC系列DSP芯片的開發(fā)。實時操作系統(tǒng)VxWorks的開發(fā)工具是WindRiver公司的Tornado集成開發(fā)工具。VisualDSP可以C語言或匯編語言編寫的DSP代碼,最新版本的VisualDSP還支持C++。它還有1個優(yōu)點,就是可以編譯多片DSP的源代碼,并產(chǎn)生下載文件,這就可以很方便地進行多DSP系統(tǒng)的軟件模擬。

  ADSP21160陣列的設(shè)計結(jié)構(gòu)使它既可以構(gòu)成單指令流多數(shù)據(jù)流(SIMD)的并行處理機,也可以構(gòu)成多指令流單數(shù)據(jù)流(MISD)或多指令流多數(shù)據(jù)流(MIMD)的流水線處理機,視用戶的要求而定。這兩種并行方案的選擇,簡單來說就是選擇分割數(shù)據(jù)流還是分割處理工序。SIMD方案的原理如圖1所示。

 

  以下介紹我們實驗室承擔的水聲信號處理系統(tǒng)。本系統(tǒng)以VME總線為系統(tǒng)開發(fā)平臺,前端調(diào)理模件、模數(shù)轉(zhuǎn)換模件和前端控制模件等為VME插件,采用SHARC級DSP芯片陣列完成聲納信號實時處理,基于實時操作系統(tǒng)VxWorks及X窗口系統(tǒng)的中央控制和顯示。

  圖2是4片DSP的任務(wù)分配圖。從前端采集來的信號,經(jīng)波束形成和復解調(diào),再經(jīng)過窄帶濾波后的信號分為兩路,一路送去進行幅度檢波,一路做頻域處理。幅度檢波就是對復信號求模,根據(jù)信號幅度判決有無目標存在。頻域處理分兩種情況:當發(fā)射信號為單頻脈沖時,進行功率譜估計,然后根據(jù)多普勒頻移估計目標速度;當發(fā)射信號為雙曲調(diào)頻信號時,進行相關(guān)處理。

 

  聲納綜合數(shù)據(jù)處理主要包括主動聲納信號處理和被動聲納信號處理。其中,主動聲納信號處理又根據(jù)發(fā)射信號的不同,分為非相干處理、相干處理、功率譜處理。聲納綜合數(shù)據(jù)處理主要完成:目標自動檢測、目標參數(shù)測定和動目標跟蹤。

  四、操作流水線

  操作流水線是模塊內(nèi)數(shù)據(jù)計算與I/O的流水線,物理上表現(xiàn)為CPU與I/O端口的DMA之間的并行。在前端處理中由于數(shù)據(jù)率高,通信開銷很大。以通信任務(wù)最為繁重的復解調(diào)和多普勒補償模塊為例,輸入數(shù)據(jù)率為2Mw/s,輸出數(shù)據(jù)率為4Mw/s,高速連接口LinkPort最高速率為100Mw/s,如果采用串行傳輸?shù)脑挘ㄐ艜r間就將占用60%以上的處理時間,計算時間顯然嚴重不足。所以必須采用并行執(zhí)行,流程圖如圖3所示。這也是一種異步流水線方式,每次傳送和計算完成都須要設(shè)置標志以通知下一操作。

 

  結(jié)束語

  在VxWorks實時操作系統(tǒng)下,4片ADSP21160上的程序已經(jīng)通過模擬輸入和系統(tǒng)測試。采用SHARC DSP 陣列能夠很好地完成聲納信號實時處理,每一片DSP至少有10%的計算裕量,基本達到設(shè)計要求。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

c語言相關(guān)文章:c語言教程


c++相關(guān)文章:c++教程




評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉