TMS320C67x DSP Library在程序開發(fā)中的應(yīng)用
同時(shí),該庫(kù)函數(shù)還有一個(gè)對(duì)應(yīng)的頭文件“dspf_sp_cfftr2_dit.h”,使用時(shí)可將其包含到調(diào)用該庫(kù)函數(shù)的程序中。此時(shí),該庫(kù)函數(shù)就可以像一般子程序一樣被其他程序調(diào)用,具體使用代碼如下:
為了便于比較,可使用歸檔器指令“ar6x”從該DSP Lib的源文件“dsp67x_c.src”中提取出庫(kù)函數(shù)的源代碼,以得到文件“sp_cfftr2_ dit.c”。所有歸檔器指令的命令文件都存儲(chǔ)在CCS的安裝目錄下,這里,“ar6x”的使用格式為:
ar6x-x dsp67x_c.src sp_cfftr2_dit.c
從“sp_cfftr2_dit.c”中可得到庫(kù)函數(shù)“DSPF_sp_cfftr2_dit()”的C語言源代碼,相應(yīng)的C程序?yàn)?ldquo;void sp_cfftr2_dit(float*x,float*w,short n)”,該程序可以像一般子程序一樣被主程序調(diào)用。源函數(shù)和庫(kù)函數(shù)的形式完全相同。實(shí)際上,庫(kù)函數(shù)就是對(duì)源函數(shù)的程序代碼進(jìn)行手工優(yōu)化的結(jié)果。
2.2 性能分析
分別使用庫(kù)函數(shù)和源函數(shù)可完成FFT運(yùn)算。并可用CCS自帶的剖析工具“Profiler”來分析兩個(gè)函數(shù)由于編程方式的不同所帶來的運(yùn)行時(shí)間上的差異。改變輸入數(shù)組的長(zhǎng)度,可得到如表1所列的一組數(shù)據(jù)。由表1可以看出,庫(kù)函數(shù)的效率遠(yuǎn)遠(yuǎn)高于源函數(shù),其效率的提高量隨著輸入數(shù)據(jù)長(zhǎng)度的變化而變化,最高的效率可提高40倍(40.98-1=39.98),最低仍在25倍左右,而且該DSP Lib的其他庫(kù)函數(shù)也有相近的測(cè)試結(jié)果。雖然用該DSP Lib的庫(kù)函數(shù)后,程序效率可以提高一個(gè)數(shù)量級(jí),對(duì)于時(shí)間限制較為嚴(yán)格的系統(tǒng),特別是實(shí)時(shí)系統(tǒng),這仍然是非常有用的。
庫(kù)函數(shù)和源函數(shù)相比,其效率有了很大提高,但這種提高是有代價(jià)的。它主要表現(xiàn)為通用性降低。其原因是為了最大限度的提高效率,在對(duì)代碼進(jìn)行手工優(yōu)化的過程中,引入了一些強(qiáng)假設(shè),同時(shí),使用了大量的操作合并、并行處理等簡(jiǎn)化手段,這必然導(dǎo)致庫(kù)函數(shù)的通用性降低。例如,庫(kù)函數(shù)“DSPF_sp_cfftr2_dit()”使用時(shí)就會(huì)受到以下條件的限制:
(1)輸入數(shù)組的長(zhǎng)度必須是2的冪級(jí)數(shù),且不得小于32;
(2)輸入數(shù)組x和旋轉(zhuǎn)因子數(shù)組w必須按雙字對(duì)齊方式存儲(chǔ),即數(shù)組起始地址的末3位必須是零;
(3)數(shù)據(jù)的存儲(chǔ)格式必須是小端模式(Little Endian);
(4)執(zhí)行期間可接收中斷,但不予響應(yīng),這可能導(dǎo)致一些實(shí)時(shí)事件得不到及時(shí)響應(yīng)。本文引用地址:http://butianyuan.cn/article/151334.htm
如果使用“DSPF_sp_cfftr2_dit()”時(shí)不考慮到這些限制,就有可能導(dǎo)致程序運(yùn)行異常。因此,庫(kù)函數(shù)的效率雖然高,但不能盲目的濫用,在程序開發(fā)時(shí),必須根據(jù)實(shí)際情況在通用性和效率之間進(jìn)行折衷,以合理的使用庫(kù)函數(shù)。
3 TMS320C67x Fast RTS Library的應(yīng)用
在DSP進(jìn)行數(shù)據(jù)處理時(shí),除了一些典型的操作外,還存在大量常規(guī)的操作,如除法操作、對(duì)數(shù)運(yùn)算、三角函數(shù)等,這些操作也是很費(fèi)時(shí)的,提高這些操作的代碼效率,也能顯著提高整個(gè)軟件的效率。TMS320C67x FastRTS Library就是這樣的一個(gè)DSP Lib,它通常由Lib文件夾、include文件夾和doc文件夾組成。其中l(wèi)ib文件夾內(nèi)含庫(kù)文件fastrts67x.lib(Little Endian)、fastrts67xe.lib(Big Endian)和源文件fastrts67x.src;include文件夾內(nèi)含頭文件fastrts67x.h和recip.h;而doc文件夾內(nèi)含幫助文件。
3.1 TMS320C67x FastRTS Library的使用
TMS320C67x FastRTS Library(以下簡(jiǎn)稱FastRTS Library)主要用于處理一些常規(guī)的操作。由于在通常情況下,CCS已經(jīng)有一個(gè)RTSLib-rary來完成這些操作(例如,“rts6700.lib”就是一個(gè)適用于TMS320C67x的RTS Library文件),因此,如果要使用FastRTS Library,就必須在編譯鏈接過程中先于“rts6700.lib”來編譯鏈接“fastrts67x.lib(或fastrts67xe.lib)”,相應(yīng)的編譯鏈接命令選項(xiàng)為:
-l fastrts67x.lib - rts6700.lib或 -l fastrts67xe.lib - rts6700.lib
FastRTS Library同樣需要注意頭文件的使用,它有兩個(gè)頭文件: “fastrts67x.h”和“recip.h”。如果使用FastRTS Library中的特殊函數(shù)(三角函數(shù),對(duì)數(shù)函數(shù)等),則必須包含“fastrts67x.h”;而如果使用求倒數(shù)操作,則必須包含“recip.h”。FastRTS Library的使用方式如下:
評(píng)論