C語言嵌入式系統(tǒng)編程修煉之性能優(yōu)化篇

——

作者：時間：2006-12-19 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

使用宏定義

　　在C語言中，宏是產(chǎn)生內(nèi)嵌代碼的唯一方法。對于嵌入式系統(tǒng)而言，為了能達(dá)到性能要求，宏是一種很好的代替函數(shù)的方法。

　　寫一個"標(biāo)準(zhǔn)"宏MIN ，這個宏輸入兩個參數(shù)并返回較小的一個：

　　錯誤做法：

#define MIN(A,B) 　( A <= B ? A : B )

　　正確做法：

#define MIN(A,B) （（A）<= (B) ? (A) : (B) )

　　對于宏，我們需要知道三點：

　　(1)宏定義"像"函數(shù)；

　　(2)宏定義不是函數(shù)，因而需要括上所有"參數(shù)"；

　　(3)宏定義可能產(chǎn)生副作用。

　　下面的代碼：

least = MIN(*p++, b);

　　將被替換為：

( (*p++) <= (b) ?(*p++):(b) )

　　發(fā)生的事情無法預(yù)料。

　　因而不要給宏定義傳入有副作用的"參數(shù)"。

使用寄存器變量

　　當(dāng)對一個變量頻繁被讀寫時，需要反復(fù)訪問內(nèi)存，從而花費大量的存取時間。為此，C語言提供了一種變量，即寄存器變量。這種變量存放在CPU的寄存器中，使用時，不需要訪問內(nèi)存，而直接從寄存器中讀寫，從而提高效率。寄存器變量的說明符是register。對于循環(huán)次數(shù)較多的循環(huán)控制變量及循環(huán)體內(nèi)反復(fù)使用的變量均可定義為寄存器變量，而循環(huán)計數(shù)是應(yīng)用寄存器變量的最好候選者。

　　(1) 只有局部自動變量和形參才可以定義為寄存器變量。因為寄存器變量屬于動態(tài)存儲方式，凡需要采用靜態(tài)存儲方式的量都不能定義為寄存器變量，包括：模塊間全局變量、模塊內(nèi)全局變量、局部static變量；

　　(2) register是一個"建議"型關(guān)鍵字，意指程序建議該變量放在寄存器中，但最終該變量可能因為條件不滿足并未成為寄存器變量，而是被放在了存儲器中，但編譯器中并不報錯（在C++語言中有另一個"建議"型關(guān)鍵字：inline）。

　　下面是一個采用寄存器變量的例子：

/* 求1+2+3+….+n的值 */
WORD Addition(BYTE n)
{
　register i,s=0;
　for(i=1;i<=n;i++)
　
　return s;
}

　　本程序循環(huán)n次，i和s都被頻繁使用，因此可定義為寄存器變量。

內(nèi)嵌匯編

　　程序中對時間要求苛刻的部分可以用內(nèi)嵌匯編來重寫，以帶來速度上的顯著提高。但是，開發(fā)和測試匯編代碼是一件辛苦的工作，它將花費更長的時間，因而要慎重選擇要用匯編的部分。

　　在程序中，存在一個80-20原則，即20%的程序消耗了80%的運(yùn)行時間，因而我們要改進(jìn)效率，最主要是考慮改進(jìn)那20%的代碼。

　　嵌入式C程序中主要使用在線匯編，即在C程序中直接插入_asm{ }內(nèi)嵌匯編語句：

/* 把兩個輸入?yún)?shù)的值相加，結(jié)果存放到另外一個全局變量中 */
int result;
void Add(long a, long *b)
{
　_asm
　{
　　MOV AX, a
　　MOV BX, b
　　ADD AX, [BX]
　　MOV result, AX
　}
}

利用硬件特性

　　首先要明白CPU對各種存儲器的訪問速度，基本上是：

CPU內(nèi)部RAM　>　外部同步RAM　>　外部異步RAM　>　FLASH/ROM

　　對于程序代碼，已經(jīng)被燒錄在FLASH或ROM中，我們可以讓CPU直接從其中讀取代碼執(zhí)行，但通常這不是一個好辦法，我們最好在系統(tǒng)啟動后將FLASH或ROM中的目標(biāo)代碼拷貝入RAM中后再執(zhí)行以提高取指令速度；

　　對于UART等設(shè)備，其內(nèi)部有一定容量的接收BUFFER，我們應(yīng)盡量在BUFFER被占滿后再向CPU提出中斷。例如計算機(jī)終端在向目標(biāo)機(jī)通過RS-232傳遞數(shù)據(jù)時，不宜設(shè)置UART只接收到一個BYTE就向CPU提中斷，從而無謂浪費中斷處理時間；

　　如果對某設(shè)備能采取DMA方式讀取，就采用DMA讀取，DMA讀取方式在讀取目標(biāo)中包含的存儲信息較大時效率較高，其數(shù)據(jù)傳輸?shù)幕締挝皇菈K，而所傳輸?shù)臄?shù)據(jù)是從設(shè)備直接送入內(nèi)存的（或者相反）。DMA方式較之中斷驅(qū)動方式，減少了CPU 對外設(shè)的干預(yù)，進(jìn)一步提高了CPU與外設(shè)的并行操作程度。

活用位操作

　　使用C語言的位操作可以減少除法和取模的運(yùn)算。在計算機(jī)程序中數(shù)據(jù)的位是可以操作的最小數(shù)據(jù)單位，理論上可以用"位運(yùn)算"來完成所有的運(yùn)算和操作，因而，靈活的位操作可以有效地提高程序運(yùn)行的效率。舉例如下：

/* 方法1 */
int i,j;
i = 879 / 16;
j = 562 % 32;
/* 方法2 */
int i,j;
i = 879 >> 4;
j = 562 - (562 >> 5 << 5);

　　對于以2的指數(shù)次方為"*"、"/"或"%"因子的數(shù)學(xué)算，轉(zhuǎn)為移位運(yùn)算"<< >>"通?？梢蕴岣咚惴ㄐ?。因為乘除運(yùn)算指令周期通常比移位運(yùn)算大。

　　C語言位運(yùn)算除了可以提高運(yùn)算效率外，在嵌入式系統(tǒng)的編程中，它的另一個最典型的應(yīng)用，而且十分廣泛地正在被使用著的是位間的與（&）、或（|）、非（~）操作，這跟嵌入式系統(tǒng)的編程特點有很大關(guān)系。我們通常要對硬件寄存器進(jìn)行位設(shè)置，譬如，我們通過將AM186ER型80186處理器的中斷屏蔽控制寄存器的第低6位設(shè)置為0（開中斷2），最通用的做法是：

#define INT_I2_MASK 0x0040
wTemp = inword(INT_MASK);
outword(INT_MASK, wTemp &~INT_I2_MASK);

　　而將該位設(shè)置為1的做法是：

#define INT_I2_MASK 0x0040
wTemp = inword(INT_MASK);
outword(INT_MASK, wTemp | INT_I2_MASK);

　　判斷該位是否為1的做法是：

#define INT_I2_MASK 0x0040
wTemp = inword(INT_MASK);
if(wTemp & INT_I2_MASK)
{
… /* 該位為1 */
}

　　上述方法在嵌入式系統(tǒng)的編程中是非常常見的，我們需要牢固掌握。

結(jié)

　　在性能優(yōu)化方面永遠(yuǎn)注意80-20準(zhǔn)備，不要優(yōu)化程序中開銷不大的那80%，這是勞而無功的。

　　宏定義是C語言中實現(xiàn)類似函數(shù)功能而又不具函數(shù)調(diào)用和返回開銷的較好方法，但宏在本質(zhì)上不是函數(shù)，因而要防止宏展開后出現(xiàn)不可預(yù)料的結(jié)果，對宏的定義和使用要慎而處之。很遺憾，標(biāo)準(zhǔn)C至今沒有包括C++中inline函數(shù)的功能，inline函數(shù)兼具無調(diào)用開銷和安全的優(yōu)點。

　　使用寄存器變量、內(nèi)嵌匯編和活用位操作也是提高程序效率的有效方法。

　　除了編程上的技巧外，為提高系統(tǒng)的運(yùn)行效率，我們通常也需要最大可能地利用各種硬件設(shè)備自身的特點來減小其運(yùn)轉(zhuǎn)開銷，例如減小中斷次數(shù)、利用DMA傳輸方式等。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

新聞中心

C語言嵌入式系統(tǒng)編程修煉之性能優(yōu)化篇

評論

相關(guān)推薦

技術(shù)專區(qū)