STM32F4xx FPU的設(shè)置

作者：時間：2016-11-27 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

浮點運(yùn)算一直是定點CPU的難題，比如一個簡單的1.1+1.1，定點CPU必須要按照IEEE-754標(biāo)準(zhǔn)的算法來完成運(yùn)算，對于8位單片機(jī)來說已經(jīng)完全是噩夢，對32為單片機(jī)來說也不會有多大改善。雖然將浮點數(shù)進(jìn)行Q化處理能充分發(fā)揮32位單片機(jī)的運(yùn)算性能，但是精度受到限制而不會太高。對于有 FPU（浮點運(yùn)算單元）的單片機(jī)或者CPU來說，浮點加法只是幾條指令的事情。

現(xiàn)在又FPU或者硬件浮點運(yùn)算能力的主要有高端DSP（比如TI F28335/C6000/DM6XX/OMAP等)，通用CPU（X87數(shù)學(xué)協(xié)處理器）和高級的ARM+DSP處理器等。

本文引用地址：http://butianyuan.cn/article/201611/322518.htm

STM32-F4屬于Cortex-M4F構(gòu)架，這和M0、M3的最大不同就是多了一個F-float，即支持浮點指令集，因此在處理數(shù)學(xué)運(yùn)算時能比M0/M3高出數(shù)十倍甚至上百倍的性能，但是要充分發(fā)揮FPU的數(shù)學(xué)性能，還需要一些小小的設(shè)置：

1.編譯控制選項：雖然STM32F4XX固件庫的例程之system_stm32f4XXX.c文件中添加了對應(yīng)的代碼，但給用戶評估使用的 STM32F4-Discovery例程中卻沒有，因此MDK4.23編寫浮點運(yùn)算程序時，雖然編譯器正確產(chǎn)生了V指令來進(jìn)行浮點運(yùn)算，但是因為 system_stm32f4XXX.c文件沒有啟用FPU，因此CPU執(zhí)行時只認(rèn)為是遇到非法指令而跳轉(zhuǎn)到HardFault_Handler()中斷中原地踏步。因此要保證這個錯誤不發(fā)生，必須要在system_init()函數(shù)里面添加如下代碼：

#if (__FPU_PRESENT == 1) && (__FPU_USED == 1)
SCB->CPACR |= ((3UL << 10*2)|(3UL << 11*2));
#endif

因為這個選項是有條件編譯控制的，因此需要在工程選項（Project->Options for target "XXXX"）中的C/C++選項卡的Define中加入如下的語句：__FPU_PRESENT=1,__FPU_USED =1。這樣編譯時就加入了啟動FPU的代碼，CPU也就能正確高效的使用FPU進(jìn)行簡單的加減乘除了。

但這還遠(yuǎn)遠(yuǎn)不夠。對于復(fù)雜運(yùn)算，比如三角函數(shù)，開方等運(yùn)算，如果編程時還是使用math.h頭文件，那是沒法提升效率的：因為math.h頭文件是針對所有ARM處理器的，其運(yùn)算函數(shù)都是基于定點CPU和標(biāo)準(zhǔn)算法（IEEE-754），并沒有預(yù)見使用FPU的情況，需要很多指令和復(fù)雜的過程才能完成運(yùn)算，也就增加了運(yùn)算時間。因此要充分發(fā)揮M4F的浮點功能，就需要使用固件庫自帶的arm_math.h，這個文件根據(jù)編譯控制項（__FPU_USED == 1）來決定是使用那一種函數(shù)方法：如果沒有使用FPU，那就調(diào)用keil的標(biāo)準(zhǔn)math.h頭文件中定義的函數(shù)；如果使用了FPU，那就是用固件庫自帶的優(yōu)化函數(shù)來解決問題。

在arm_math的開頭部分是有這些編譯控制信息：

#ifndef _ARM_MATH_H
#define _ARM_MATH_H

#define __CMSIS_GENERIC

#if defined (ARM_MATH_CM4)
#include "core_cm4.h"
#elif defined (ARM_MATH_CM3)
#include "core_cm3.h"
#elif defined (ARM_MATH_CM0)
#include "core_cm0.h"
#else
#include "ARMCM4.h"
#warning "Define either ARM_MATH_CM4 OR ARM_MATH_CM3...By Default building on ARM_MATH_CM4....."
#endif

#undef__CMSIS_GENERIC
#include "string.h"
#include "math.h"

就是說如果不使用CMSIS的，就會調(diào)用keil自帶的標(biāo)準(zhǔn)庫函數(shù)。否則就用CMSIS的定義。這里因為是用的STM32F4，所以應(yīng)該要 ARM_MATH_CM4控制，即加入core_cm4.h，否則就用使用ARMCM4.h——但在編譯時keil會提示找不到這文件。因此需要在工程選項之C/C++選項卡的define中繼續(xù)加入語句ARM_MATH_CM4。

加入上述編譯控制項之后，高級數(shù)學(xué)函數(shù)的使用基本沒問題了，比如正余弦三角函數(shù)的計算。但需要注意，如果你直接使用sin()、cos()、sqrt() 這樣的函數(shù)，那結(jié)果還算調(diào)用keil的math.h，你可以在debug時看對應(yīng)的代碼，其匯編指令為BL.W __hardfp_xxx。因此這時要完成三角函數(shù)的計算就要使用arm_sin_f32()或者arm_cos_f32()，用法不變，這兩個函數(shù)的原型分別在arm_sin_f32.c和arm_cos_f32.c中。通過對256點三角函數(shù)表的查詢和插值算法得到任意角度的精確函數(shù)值，這就比“原裝”的sin()、cos()快多了。

當(dāng)然有些例外的是開發(fā)函數(shù)sqrt()，在arm_math.h中是這么定義的：

static __INLINE arm_statusarm_sqrt_f32(float32_t in, float32_t *pOut)
{
if(in > 0)
{
//#if __FPU_USED
#if (__FPU_USED == 1) && defined ( __CC_ARM)
*pOut = __sqrtf(in);
#else
*pOut = sqrtf(in);
#endif
return (ARM_MATH_SUCCESS);
}
else
{
*pOut = 0.0f;
return (ARM_MATH_ARGUMENT_ERROR);
}
}

即開方用的函數(shù)是arm_sqrt_f32()，其中首先判斷被開發(fā)的書是否大于0，只有大于0的才能進(jìn)行運(yùn)算，否則輸出結(jié)果為0并返回“錯誤”標(biāo)志。如果大于0，并且實用了FPU和__CC_ARM控制項，那調(diào)用__sqrtf()來完成編譯，否則調(diào)用sqrtf()——這個sqrtf()是能在 keil的math.h中找到的，即調(diào)用子函數(shù)來完成運(yùn)算，而__sqrtf()呢？新出現(xiàn)的，相信大家都能猜到是什么玩意兒：對，就是VSQRT指令！因此要把這點性能也要發(fā)揮出來，就需要工程選項之C/C++選項卡的define中繼續(xù)加入語句__CC_ARM才行。大家可以比較一下是否加入 __CC_ARM編譯后會匯編代碼的差別巨大差別。

當(dāng)然，對于arm_sqrt_f32()函數(shù)還是有些麻煩，如果你確認(rèn)被開方的書是大于等于0的，那就直接使用__sqrtf()函數(shù)完成運(yùn)算，即一條簡單的VSQRT指令。

STM32F4固件庫還提供了其他很有用的數(shù)學(xué)函數(shù)，都位于DSP_Lib文件夾，請大家慢慢探索，Discovery！

新聞中心

STM32F4xx FPU的設(shè)置

評論

相關(guān)推薦

技術(shù)專區(qū)