關于C51精確延時問題
一些朋友提出使用C語言編寫51單片機延時程序的精度不夠,事實上的確如此,由于C語言最終要編譯成匯編語言運行,因此,匯編程序會很大,從而影響到延時的精度,在此,貼出一些網上資料供大家參考借鑒。 以下位轉載內容: 51單片機 Keil C 延時程序的簡單研究 by: InfiniteSpace Studio/isjfk, 1.21.2004 任何人都可以在注明原作者和出處的前提下隨意轉載這篇文章,但不得用于商業(yè)目的。 應用單片機的時候,經常會遇到需要短時間延時的情況。需要的延時時間很短,一般都是幾十到幾百微妙(us)。有時候還需要很高的精度,比如用單片機驅動DS18B20的時候,誤差容許的范圍在十幾us以內,不然很容易出錯。這種情況下,用計時器往往有點小題大做。而在極端的情況下,計時器甚至已經全部派上了別的用途。這時就需要我們另想別的辦法了。 以前用匯編語言寫單片機程序的時候,這個問題還是相對容易解決的。比如用的是12MHz晶振的51,打算延時20us,只要用下面的代碼,就可以滿足一般的需要: mov r0, #09h loop: djnz r0, loop 51單片機的指令周期是晶振頻率的1/12,也就是1us一個周期。mov r0, #09h需要2個極其周期,djnz也需要2個極其周期。那么存在r0里的數就是(20-2)/2。用這種方法,可以非常方便的實現256us以下時間的延時。如果需要更長時間,可以使用兩層嵌套。而且精度可以達到2us,一般來說,這已經足夠了。 現在,應用更廣泛的毫無疑問是Keil的C編譯器。相對匯編來說,C固然有很多優(yōu)點,比如程序易維護,便于理解,適合大的項目。但缺點(我覺得這是C的唯一一個缺點了)就是實時性沒有保證,無法預測代碼執(zhí)行的指令周期。因而在實時性要求高的場合,還需要匯編和C的聯(lián)合應用。但是是不是這樣一個延時程序,也需要用匯編來實現呢?為了找到這個答案,我做了一個實驗。 用C語言實現延時程序,首先想到的就是C常用的循環(huán)語句。下面這段代碼是我經常在網上看到的: void delay2(unsigned char i) { for(; i != 0; i--); } 到底這段代碼能達到多高的精度呢?為了直接衡量這段代碼的效果,我把 Keil C 根據這段代碼產生的匯編代碼找了出來: ; FUNCTION _delay2 (BEGIN) ; SOURCE LINE # 18 ;---- Variable i assigned to Register R7 ---- ; SOURCE LINE # 19 ; SOURCE LINE # 20 0000 ?C0007: 0000 EF MOV A,R7 0001 6003 JZ ?C0010 0003 1F DEC R7 0004 80FA SJMP ?C0007 ; SOURCE LINE # 21 0006 ?C0010: 0006 22 RET ; FUNCTION _delay2 (END) 真是不看不知道~~~一看才知道這個延時程序是多么的不準點~~~光看主要的那四條語句,就需要6個機器周期。也就是說,它的精度頂多也就是6us而已,這還沒算上一條 lcall 和一條 ret。如果我們把調用函數時賦的i值根延時長度列一個表的話,就是: i delay time/us 0 6 1 12 2 18 ... 因為函數的調用需要2個時鐘周期的lcall,所以delay time比從函數代碼的執(zhí)行時間多2。順便提一下,有的朋友寫的是這樣的代碼: void delay2(unsigned char i) { unsigned char a; for(a = i; a != 0; a--); } 可能有人認為這會生成更長的匯編代碼來,但是事實證明: ; FUNCTION _delay2 (BEGIN) ; SOURCE LINE # 18 ;---- Variable i assigned to Register R7 ---- ; SOURCE LINE # 19 ; SOURCE LINE # 21 ;---- Variable a assigned to Register R7 ---- 0000 ?C0007: 0000 EF MOV A,R7 0001 6003 JZ ?C0010 0003 1F DEC R7 0004 80FA SJMP ?C0007 ; SOURCE LINE # 22 0006 ?C0010: 0006 22 RET ; FUNCTION _delay2 (END) 其生成的代碼是一樣的。不過這的確不是什么好的習慣。因為這里實在沒有必要再引入多余的變量。我們繼續(xù)討論正題。有的朋友為了得當更長的延時,甚至用了這樣的代碼: void delay2(unsigned long i) { for(; i != 0; i--); } 這段代碼產生的匯編代碼是什么樣子的?其實不用想也知道它是如何恐怖的$#^%&%$......讓我們看一看: ; FUNCTION _delay2 (BEGIN) ; SOURCE LINE # 18 0000 8F00 R MOV i+03H,R7 0002 8E00 R MOV i+02H,R6 0004 8D00 R MOV i+01H,R5 0006 8C00 R MOV i,R4 ; SOURCE LINE # 19 ; SOURCE LINE # 20 0008 ?C0007: 0008 E4 CLR A 0009 FF MOV R7,A 000A FE MOV R6,A 000B FD MOV R5,A 000C FC MOV R4,A 000D AB00 R MOV R3,i+03H 000F AA00 R MOV R2,i+02H 0011 A900 R MOV R1,i+01H 0013 A800 R MOV R0,i 0015 C3 CLR C 0016 120000 E LCALL ?C?ULCMP 0019 601A JZ ?C0010 001B E500 R MOV A,i+03H 001D 24FF ADD A,#0FFH 001F F500 R MOV i+03H,A 0021 E500 R MOV A,i+02H 0023 34FF ADDC A,#0FFH 0025 F500 R MOV i+02H,A 0027 E500 R MOV A,i+01H 0029 34FF ADDC A,#0FFH 002B F500 R MOV i+01H,A 002D E500 R MOV A,i 002F 34FF ADDC A,#0FFH 0031 F500 R MOV i,A 0033 80D3 SJMP ?C0007 ; SOURCE LINE # 21 0035 ?C0010: 0035 22 RET ; FUNCTION _delay2 (END) ,這倒是的確可以延遲很長時間~~~但是毫無精度可言了。 那么,用C到底能不能實現精確的延時呢?我把代碼稍微改了一下: void delay1(unsigned char i) { while(i--); } 因為根據經驗,越簡潔的C代碼往往也能得出越簡潔的機器代碼。那這樣結果如何呢?把它生成的匯編代碼拿出來看一看就知道了。滿懷希望的我按下了“Build target”鍵,結果打擊是巨大的: ; FUNCTION _delay1 (BEGIN) ; SOURCE LINE # 13 ;---- Variable i assigned to Register R7 ---- ; SOURCE LINE # 14 0000 ?C0004: ; SOURCE LINE # 15 0000 AE07 MOV R6,AR7 0002 1F DEC R7 0003 EE MOV A,R6 0004 70FA JNZ ?C0004 ; SOURCE LINE # 16 0006 ?C0006: 0006 22 RET ; FUNCTION _delay1 (END) 雖說生成的代碼跟用for語句是不大一樣,不過我可以毫無疑問的說,這兩種方法的效率是一樣的。似乎到此為止了,因為我實在想不出來源程序還有什么簡化的余地。看來我就要得出來這個結論了:“如果需要us級的延時精度,需要時用匯編語言。”但是真的是這樣嗎?我還是不甘心。因為我不相信大名鼎鼎的 Keil C 編譯器居然連 djnz 都不會用???因為實際上程序體里只需要一句 loop: djnz r7, loop。近乎絕望之際(往往人在這種情況下確可以爆發(fā)出來,哦呵~~~),我隨手改了一下: void delay1(unsigned char i) { while(--i); } 心不在焉的編譯,看源碼: ; FUNCTION _delay1 (BEGIN) ; SOURCE LINE # 13 ;---- Variable i assigned to Register R7 ---- ; SOURCE LINE # 14 0000 ?C0004: ; SOURCE LINE # 15 0000 DFFE DJNZ R7,?C0004 ; SOURCE LINE # 16 0002 ?C0006: 0002 22 RET ; FUNCTION _delay1 (END) 天~~~奇跡出現了......我想這個程序應該已經可以滿足一般情況下的需要了。如果列個表格的話: i delay time/us 1 5 2 7 3 9 ... 計算延時時間時,已經算上了調用函數的lcall語句所花的2個時鐘周期的時間。 終于,結果已經明了了。只要合理的運用,C還是可以達到意想不到的效果。很多朋友抱怨C效率比匯編差了很多,其實如果對Keil C的編譯原理有一個較深入的理解,是可以通過恰當的語法運用,讓生成的C代碼達到最優(yōu)化。即使這看起來不大可能,但還是有一些簡單的原則可循的:1.盡量使用unsigned型的數據結構。2.盡量使用char型,實在不夠用再用int,然后才是long。3.如果有可能,不要用浮點型。4.使用簡潔的代碼,因為按照經驗,簡潔的C代碼往往可以生成簡潔的目標代碼(雖說不是在所有的情況下都成立)。5...想不起來了,哦呵~~~ |
51單片機 Keil C 延時程序的再次研究! 作者: SEE 來源:www.waveshare.net 上文是延時程序的簡單研究,從精度考慮,它得研究結果是: void delay2(unsigned char I) { while(--I); } 為最佳方法。 分析:假設外掛12M(之后都是在這基礎上討論) 我編譯了下,傳了些參數,并看了匯編代碼,觀察記錄了下面的數據: delay2(0):延時518us 518-2*256=6 delay2(1):延時7us(原帖寫“5us”是錯的,^_^) delay2(10):延時25us 25-20=5 delay2(20):延時45us 45-40=5 delay2(100):延時205us 205-200=5 delay2(200):延時405us 405-400=5 見上可得可調度為2us,而最大誤差為6us。 精度是很高了! 但這個程序的最大延時是為518us,顯然不能滿足實際需要,因為很多時候需要延遲比較長的時間。 那么,接下來討論將t分配為兩個字節(jié),即uint型的時候,會出現什么情況。 Void delay8(uint t) { while(--t); } 我編譯了下,傳了些參數,并看了匯編代碼,觀察記錄了下面的數據: delay8(0):延時524551us 524551-8*65536=263 delay8(1):延時15us delay8(10):延時85us 85-80=5 delay8(100):延時806us 806-800=6 delay8(1000):延時8009us 8009-8000=9 delay8(10000):延時80045us 80045-8000=45 delay8(65535):延時524542us 524542-524280=262 如果把這個程序的可調度看為8us,那么最大誤差為263us,但這個延時程序還是不能滿足要求的,因為延時最大為524.551ms。 那么用ulong t呢? 一定很恐怖,不用看編譯后的匯編代碼了。。。 那么如何得到比較小的可調度,可調范圍大,并占用比較少得RAM呢?請看下面的程序: /*------------------------------------------------------------------ 函數全稱:50us 延時 注意事項:基于1MIPS,AT89系列對應12M晶振,W77、W78系列對應3M晶振 例子提示:調用delay_50us(20),得到1ms延時 輸 入: 返 回:無 ------------------------------------------------------------------*/ void delay_50us(uint t) { uchar j; for(;t>0;t--) for(j=19;j>0;j--) ; } 我編譯了下,傳了些參數,并看了匯編代碼,觀察記錄了下面的數據: delay_50us(1):延時63us 63-50=13 delay_50us(10):延時513us 503-500=13 delay_50us(100):延時5013us 5013-5000=13 delay_50us(1000):延時50022us 50022-50000=22 赫赫,延時50ms,誤差僅僅22us,作為C語言已經是可以接受了。再說要求再精確的話,就算是用匯編也得改用定時器了。 /*------------------------------------------------------------------ 函數全稱:50ms 延時 注意事項:基于1MIPS,AT89系列對應12M晶振,W77、W78系列對應3M晶振 例子提示:調用delay_50ms(20),得到1s延時 全局變量:無 返回: 無 ------------------------------------------------------------------*/ void delay_50ms(uint t) { uint j; for(;t>0;t--) for(j=6245;j>0;j--) ; } 我編譯了下,傳了些參數,并看了匯編代碼,觀察記錄了下面的數據: delay_50ms(1):延時50 010 10us delay_50ms(10):延時499 983 17us delay_50ms(100):延時4 999 713 287us delay_50ms(1000):延時4 997 022 2.978ms 赫赫,延時50s,誤差僅僅2.978ms,可以接受! 上面程序沒有采用long,也沒采用3層以上的循環(huán),而是將延時分拆為兩個程序以提高精度。應該是比較好的做法了。 如果想要得到更高精度的延時,可以這么做: void delay_50us(uint t) { uchar j; if(t>255) { 針對性給于延時補償; } if(t<255) { 針對性給于延時補償; } for(;t>0;t--) for(j=18;j>0;j--) //根據實際,將原來19改為18或者更小 ; } void delay_50ms(uint t) { uint j; if(t>…) { 針對性給于延時補償; } if(t>…) { 針對性給于延時補償; } if(t>…) { 針對性給于延時補償; } …… …… for(;t>0;t--) for(j=6244;j>0;j--) //根據實際,將原來6245改為6244或者更小 ; } |
評論