Keil C51中對雙數(shù)據(jù)指針的支持情況及代碼生成
在8051體系中,數(shù)據(jù)指針DPTR作為一個特殊的16位寄存器,用于尋址64 KB的XDATA或CODE空間,通常它被當(dāng)作一個16位指針,指向一個常數(shù)表。雙數(shù)據(jù)指針可以改善同時有兩個16位指針使用時的性能。作為一種增強特性,有許多8051派生型器件支持雙數(shù)據(jù)指針。以宏晶科技STC89系列的產(chǎn)品為例,DPTR被增強為DPTR0和DPTR1兩個,仍然使用原來的地址,用另外一個SFR AUXR1的0位DPS來切換。當(dāng)DPS位為0時,所有對DPTR的操作使用DPTR0;當(dāng)DPS位為1時,所有對DPTR的操作使用DPTR1。這樣,通過一個簡單的INC AUXR1指令,就可以來回切換兩個數(shù)據(jù)指針。
1 Keil C51對雙數(shù)據(jù)指針的支持情況
作為一個常用的C51編譯器,Keil C51是支持雙數(shù)據(jù)指針的,但并不是直接支持。如果要在C51程序中使用雙數(shù)據(jù)指針,有一些特別的要求。
首先來看Keil C51是如何支持雙數(shù)據(jù)指針的。
在Keil C51的編譯器手冊中指出:#pragma modp2可以打開Philips或Atmel WM系列器件中有雙DPTR的型號,并且可以提升以下庫函數(shù)的性能,包括:memcpy,memmove,memcmp,strcpy,strcmp。
Keil公司也提供了一個對照表,對比性能的提升。對比的型號是8051和Dallas 320,函數(shù)是memcpy塊拷貝。對照表如下:
看起來似乎使用庫函數(shù)就可以大幅度提高程序性能,但實際上這樣做并不能保證一定可以提高程序性能。首先Dallas 320是4T的CPU,本身就比12T的8051快。其次,以memcpy為例,它的原型是void*memcpy(void*s1,const void*s2,int len),其傳人參數(shù)有3個,合計8字節(jié),要使用數(shù)據(jù)段來傳送。在數(shù)據(jù)量少的情況下,參數(shù)傳遞的開銷就有可能大過數(shù)據(jù)傳遞的開銷。如果想要在數(shù)據(jù)塊拷貝或移動的同時對數(shù)據(jù)加以處理,比如在一個目的數(shù)據(jù)塊后面加上一個校驗和,那么使用庫函數(shù)是辦不到的,只有通過循環(huán)來進行。當(dāng)數(shù)據(jù)塊的源和目都是16位地址時,每一次循環(huán)都會有兩次對數(shù)據(jù)指針的賦值,在源地址和目地址之間來回切換,這時采用雙數(shù)據(jù)指針會有效地提高程序性能。
如果要在程序中直接生成使用雙數(shù)據(jù)指針的代碼,目前沒有直接的編譯指令。Keil公司在它的網(wǎng)站上曾說過多數(shù)據(jù)指針支持庫函數(shù),并且目前也未打算在編澤器中直接支持多數(shù)據(jù)指針。
2 Keil C中直接生成雙數(shù)據(jù)指針的代碼
實際上,Keil C51編譯器還是可以直接生成使用雙數(shù)據(jù)指針的代碼的,只要沒定好適當(dāng)?shù)膬?yōu)化級別,安排好適當(dāng)?shù)腃51語句,編譯器就會生成使用雙數(shù)據(jù)指針的代碼。下面給出一個例子,使用雙數(shù)據(jù)指針將CODE區(qū)的一個16字節(jié)的數(shù)組拷貝到XDATA區(qū)。 編譯后其中for循環(huán)的匯編代碼主體如下:
評論