高效的C編程之: 函數(shù)調(diào)用
14.9函數(shù)調(diào)用
函數(shù)設(shè)計(jì)的基本原則是使其函數(shù)體盡量的小。這樣編譯器可以對(duì)函數(shù)做更多的優(yōu)化。
14.9.1減少函數(shù)調(diào)用開銷
ARM上的函數(shù)調(diào)用開銷比非RISC體系結(jié)構(gòu)上的調(diào)用開銷?。?/p>
·調(diào)用返回指令“BL”或“MOVpc,lr”一般只需要6個(gè)指令周期(ARM7上)。
·在函數(shù)的入口和出口使用多寄存器加載/存儲(chǔ)指令LDM和STM(Thumb指令使用PUSH和POP)提高函數(shù)體的執(zhí)行效率。
ARM體系結(jié)構(gòu)過(guò)程調(diào)用標(biāo)準(zhǔn)AAPCS定義了如何通過(guò)寄存器傳遞參數(shù)和返回值。函數(shù)中的前4個(gè)整型參數(shù)是通過(guò)ARM的前4個(gè)寄存器r0、r1、r2和r3來(lái)傳遞的。傳遞參數(shù)可以是與整型兼容的數(shù)據(jù)類型,如字符類型char、半字類型short等。
注意 | 如果是雙字類型,如longlong型,只能通過(guò)寄存器傳遞兩個(gè)參數(shù)。 |
不能通過(guò)寄存器傳遞的參數(shù),通過(guò)函數(shù)堆棧來(lái)傳遞。這樣不論是函數(shù)的調(diào)用者還是被調(diào)用者都必須通過(guò)訪問(wèn)堆棧來(lái)訪問(wèn)參數(shù),使程序的執(zhí)行效率下降。
下面的例子顯示了函數(shù)調(diào)用是傳遞4個(gè)參數(shù)和多于4個(gè)參數(shù)的區(qū)別。
傳遞4個(gè)參數(shù)的函數(shù)調(diào)用源文件如下。
intfunc1(inta,intb,intc,intd)
{
returna+b+c+d;
}
intcaller1(void)
{
returnfunc1(1,2,3,4);
}
編譯的結(jié)果如下。
func1
ADDr0,r0,r1
ADDr0,r0,r2
ADDr0,r0,r3
MOVpc,lr
caller1
MOVr3,#4
MOVr2,#3
MOVr1,#2
MOVr0,#1
Bfunc1
如果程序需要傳遞6個(gè)參數(shù),變?yōu)槿缦滦问健?/p>
intfunc2(inta,intb,intc,intd,inte,intf)
{
returna+b+c+d+e+f;
}
intcaller2(void)
{
returnfunc1(1,2,3,4,5,6);
}
則編譯后的匯編文件如下。
func2
STRlr,[sp,#-4]!
ADDr0,r0,r1
ADDr0,r0,r2
ADDr0,r0,r3
LDMIBsp,{r12,r14}
ADDr0,r0,r12
ADDr0,r0,r14
LDRpc,{sp},#4
caller2
STMFDsp!,{r2,r3,lr}
MOVr3,#6
MOVr2,#5
STMIAsp,{r2,r3}
MOVr3,#4
MOVr2,#3
MOVr1,#2
MOVr0,#1
BLfunc2
LDMFDsp!,{r2,r3,pc}
綜上所述,為了在程序中高效的調(diào)用函數(shù),最好遵循以下規(guī)則。
·盡量限制函數(shù)的參數(shù),不要超過(guò)4個(gè),這樣函數(shù)調(diào)用的效率會(huì)更高。
·當(dāng)傳遞的參數(shù)超過(guò)4個(gè)時(shí),要將多個(gè)相關(guān)參數(shù)組織在一個(gè)結(jié)構(gòu)體中,用傳遞結(jié)構(gòu)體指針來(lái)代替多個(gè)參數(shù)。
·避免將傳遞的參數(shù)定義為longlong型,因?yàn)閭鬟f一個(gè)longlong型的數(shù)據(jù)將會(huì)占用兩個(gè)32位寄存器。
·函數(shù)中存在浮點(diǎn)運(yùn)算時(shí),避免使用double型參數(shù)。
評(píng)論