DSP編程技巧之22---詳解浮點運(yùn)算的定點編程

作者：paradoxfx 時間：2014-09-29 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　我們使用的處理器一般情況下，要么直接支持硬件的浮點運(yùn)算，比如某些帶有FPU的器件，要么就只支持定點運(yùn)算，此時對浮點數(shù)的處理需要通過編譯器來完成。在支持硬件浮點處理的器件上，對浮點運(yùn)算的編程最快捷的方法就是直接使用浮點類型，比如單精度的float來完成。但是在很多情況下，限于成本、物料等因素，可供我們使用的只有一個定點處理器時，直接使用float類型進(jìn)行浮點類型的運(yùn)算會使得編譯器產(chǎn)生大量的代碼來完成一段看起來十分簡單的浮點數(shù)學(xué)運(yùn)算，造成的后果是程序的執(zhí)行時間顯著加長，且其占用的資源量也會成倍地增加，這就涉及到了如何在定點處理器上對浮點運(yùn)算進(jìn)行高效處理的問題。

本文引用地址：http://www.butianyuan.cn/article/263475.htm

　　既然是定點處理器，那么其對定點數(shù)，或者說字面意義上的“整數(shù)”進(jìn)行處理的效率就會比它處理浮點類型的運(yùn)算要高的多。所以在定點處理器上，我們使用定點的整數(shù)來代表一個浮點數(shù)，并規(guī)定整數(shù)位數(shù)和小數(shù)位數(shù)，從而方便地對定點數(shù)和浮點數(shù)進(jìn)行轉(zhuǎn)換。以一個32位的定點數(shù)為例，假設(shè)轉(zhuǎn)換因子為Q，即32位中小數(shù)的位數(shù)為Q，整數(shù)位數(shù)則為31-Q(有符號數(shù)的情況)，則定點數(shù)與浮點數(shù)的換算關(guān)系為：

　　定點數(shù)=浮點數(shù)×2^Q

　　例如，浮點數(shù)-2.0轉(zhuǎn)換到Q為30的定點數(shù)時，結(jié)果為：

　　定點數(shù)=-2×2^30=-2147483648

　　32位有符號數(shù)的表示范圍是：-2147483648到2147483647。如果我們把有符號定點數(shù)的最大值2147483647轉(zhuǎn)換為Q為30對應(yīng)的浮點數(shù)，則結(jié)果為：

　　浮點數(shù)2147483647/2^30=1.999999999

　　從上面的兩個計算例子中也可以看出，在Q30格式的情況下，最大的浮點數(shù)只能表示到1.999999999，如果我們想把浮點數(shù)2.0轉(zhuǎn)換為Q30的定點數(shù)，則產(chǎn)生了溢出，即造成了1e-9的截斷誤差。在此我們列出Q0到Q30對應(yīng)的范圍和分辨率如下表所示：

　　如果你嫌自己計算麻煩的話，可以借助Matlab的命令來求取它們的轉(zhuǎn)換，例如，在Matlab的命令窗口中輸入：

　　q = quantizer('fixed', 'ceil', 'saturate', [32 30]);

　　FixedNum=bin2dec(num2bin(q,1.999999999));

　　回車之后就可以看到1.999999999轉(zhuǎn)成Q30之后的定點數(shù)了。

　　弄清楚了單個浮點數(shù)和定點數(shù)之間的轉(zhuǎn)換關(guān)系，接下來就需要了解一下兩個定點數(shù)所代表的浮點數(shù)進(jìn)行運(yùn)算時，是如何轉(zhuǎn)換的了。根據(jù)乘法的結(jié)合律、分配率，浮點數(shù)轉(zhuǎn)換之后的定點數(shù)是可以直接運(yùn)算的，例如：

　　1. 不同Q格式的轉(zhuǎn)換

　　設(shè)有定點數(shù)Fixed1=Float1*2^Q1，如果把它用為Q2這個不同精度/表示范圍的定點數(shù)來表示，則有Fixed2=Float1*2^Q2。所以不同的Q格式直接的轉(zhuǎn)換為：

　　Fixed2=Fixed1*2^Q2/2^Q1=Fixed1*2^(Q2-Q1)

　　因為Fixed1、Fixed2都是定點數(shù)，所以在C編程的情況下，我們可以使用高效的左移、右移操作來完成這個乘以2^(Q2-Q1)的操作。

　　2. 兩個相同Q格式的定點數(shù):

　　Fixed1=Float1*2^Q

　　Fixed2=Float2*2^Q

　　則加法操作為：

　　Float1+Float2=Fixed1/2^Q+Fixed/2^Q=(Fixed1+Fixed2)/2^Q

　　對于上述的加法操作，如果定點數(shù)的和Fixed1+Fixed2超過了32位整數(shù)的極值，則會發(fā)生溢出現(xiàn)象，造成結(jié)果的不正確，此時我們只能先損失一倍的精度，把Float1、Float2的Q值變?yōu)镼-1.

　　乘法操作為：

　　Float1*Float2=Fixed1/2^Q*Fixed/2^Q= Fixed1*Fixed2/2^(2Q)

　　同樣的道理，如果Fixed1*Fixed2之后的定點數(shù)超過了32位整數(shù)的極值，則我們也需要提前對它們進(jìn)行一下折算，變換一下它們的Q值。這就涉及到對結(jié)果的一個預(yù)估問題，也是定點編程不如浮點編程簡單、高效的不足之一。

　　3. 兩個不同Q格式的定點數(shù):

　　Fixed1=Float1*2^Q1

　　Fixed2=Float2*2^Q2

　　運(yùn)算的規(guī)則是結(jié)合了前面的兩種情況，只不過多了額外的轉(zhuǎn)換工作：要么把其中的一個Q1格式的定點數(shù)先轉(zhuǎn)換為另一個Q2格式，要么把它們都轉(zhuǎn)換為一個中間值Q3格式的定點數(shù)，然后再進(jìn)行運(yùn)算。

　　這些運(yùn)算雖然并不復(fù)雜，但是如果在數(shù)學(xué)運(yùn)算比較多的情況下，一個個的進(jìn)行手工轉(zhuǎn)換還是比較麻煩的，還好在近些年的處理器特別是DSP芯片中，在其BootROM中都內(nèi)置了強(qiáng)大的數(shù)學(xué)表來幫助我們完成這些轉(zhuǎn)換工作，我們只要按照一定的格式進(jìn)行書寫，那么編譯器就會自動調(diào)用相關(guān)的庫函數(shù)來完成了。以TI的C28x系列DSP為例，我們可以使用現(xiàn)成的IQMath庫來完成這些繁瑣的工作。它的使用方法示例為

　　1)在工程屬性中引用IQmath.lib庫文件

　　2)在使用IQMath庫函數(shù)的主程序中引用相關(guān)的頭文件：

　　#include

　　#define PI 3.14159

　　_iq input, sin_out;

　　void main(void )

　　{

　　/* 0.25 x PI radians represented in Q29 format*/

　　input=_IQ29(0.25*PI);

　　sin_out =_IQ29sin(input);

　　}

　　其中，我們可以在頭文件中指定一個全局的Q格式，在不需要特別指定Q值的時候，使用默認(rèn)的值。

　　例如，在頭文件中#define Q 28，則我們在程序中調(diào)用IQMath庫函數(shù)時，

　　sin_out =_IQsin(input);//使用全局定義的Q28格式

　　sin_out =_IQ29sin(input); //特別指定使用Q29格式

　　默認(rèn)情況下，編譯器使用的Q格式是24，如果追求更高的精度，則可以使用更大的Q值，但是相應(yīng)地表示的浮點數(shù)的范圍也要小，此時可以考慮使用標(biāo)么值，使得大部分變量的值都處在-1到1的區(qū)間內(nèi)。

　　此外，在C語言編程時，調(diào)用方式是_IQsin(input)，在C++編程時，則直接使用IQsin(input)就可以了。

　　3)在CMD鏈接文件中指明IQMath數(shù)學(xué)表的位置：

　　例如，對于281x器件：

　　MEMORY

　　{

　　PAGE 0:

　　PRAMH0 (RW) : origin = 0x3f8000, length = 0x001000

　　PAGE 1:

　　IQTABLES (R) : origin = 0x3FF000, length = 0x000b50

　　DRAMH0 (RW) : origin = 0x3f9000, length = 0x001000

　　}

　　SECTIONS

　　{

　　IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

　　IQmathTablesRam : load = DRAMH0, PAGE = 1

　　IQmath : load = PRAMH0, PAGE = 0

　　}

　　對于2833x器件：

　　MEMORY

　　{

　　PAGE 0:

　　PRAML0 (RW) : origin = 0x008000, length = 0x001000

　　PAGE 1:

　　IQTABLES (R) : origin = 0x3FE000, length = 0x000b50

　　IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c

　　DRAML1 (RW) : origin = 0x009000, length = 0x001000

　　}

　　SECTIONS

　　{

　　IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

　　IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1

　　{

　　IQmath.lib (IQmathTablesRam)

　　}

　　IQmathTablesRam : load = DRAML1, PAGE = 1

　　IQmath : load = PRAML0, PAGE = 0

　　}

　　對于280x器件：

　　MEMORY

　　{

　　PAGE 0:

　　PRAML0 (RW) : origin = 0x008000, length = 0x001000

　　PAGE 1:

　　IQTABLES (R) : origin = 0x3FE000, length = 0x000b50

　　IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c

　　IQTABLES3 (R) : origin = 0x3FEBDC, length = 0x0000AA

　　DRAML1 (RW) : origin = 0x009000, length = 0x001000

　　}

　　SECTIONS

　　{

　　IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

　　IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1

　　{

　　IQmath.lib (IQmathTablesRam)

　　}

　　IQmathTables3 > IQTABLES3, type = NOLOAD, PAGE = 1

　　{

　　IQmath.lib (IQmathTablesRam)

　　}

　　IQmath : load = PRAML0, PAGE = 0

　　}

　　為了方便數(shù)學(xué)運(yùn)算的高效處理，IQMath庫中還包含了常用的數(shù)學(xué)運(yùn)算函數(shù)，包括：

　　1. 格式轉(zhuǎn)換

　　IQN浮點轉(zhuǎn)定點，IQNtoF定點轉(zhuǎn)浮點，atoIQN字符串轉(zhuǎn)定點，IQNtoa定點轉(zhuǎn)字符串，IQNint返回定點數(shù)的整數(shù)部分，IQNfrac返回定點數(shù)的小數(shù)部分，IQtoIQN和IQNtoIQ為指定Q格式與全局Q格式的互轉(zhuǎn)，IQtoQN和QNtoIQ為32位與16位互轉(zhuǎn)，IQmpy2, 4, 8..64即左移，IQdiv2, 4, 8..64即右移

　　2. 算數(shù)運(yùn)算

　　IQNmpy和IQNrmpy：乘法，IQNrsmpy為帶飽和的乘法。IQNmpyI32和IQNmpyI32int為定點數(shù)與32位整數(shù)的乘法，IQNmpyI32frac可返回結(jié)果的小數(shù)位數(shù)。QNmpyIQX：不同Q格式的定點數(shù)相乘。

　　IQNdiv：除法運(yùn)算。

　　3. 三角運(yùn)算

　　包括IQNasin，IQNsin，IQNsinPU，IQNacos，IQNcos，IQNcosPU，IQNatan2，IQNatan2PU，IQNatan。

　　其中，PU的含義在該函數(shù)中π已經(jīng)折算為1。例如：

　　sin(0.25*π)=sinPU(0.25)。

　　4. 代數(shù)運(yùn)算

　　包括IQNexp，IQNlog，IQNsqrt，IQNisqrt，IQNmag，IQNabs，IQsat