STM32學(xué)前班教程之一：為什么選擇STM32？

作者：時間：2016-11-27 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

為什么是它——我選擇STM32的原因。

--------首先聲明一下：該教程由思蛻盟論壇原創(chuàng)，本人一是為了自己學(xué)習(xí)，自我感覺此對stm32入門很有幫助，二是為了給更多的初學(xué)者帶來方便，所以決定轉(zhuǎn)載。轉(zhuǎn)載中糾正其中的部分錯誤，盡量加入最新的信息，并增加本人的部分見解和學(xué)習(xí)的感受，希望對閱讀者帶來點點閱讀價值！真誠歡迎讀者提出疑問，而后共同交流，共同進(jìn)步！

本文引用地址：http://butianyuan.cn/article/201611/322408.htm

我對未來的規(guī)劃是以功能性為主的，在功能和面積之間做以平衡是我的首要選擇，而把運算放在第二位，這根我的專業(yè)有關(guān)系。里面的運算其實并不復(fù)雜，在入門階段想盡量減少所接觸的東西。

不過說實話，對DSP的外設(shè)并和開發(fā)環(huán)境不滿意，這是為什么STM32一出就轉(zhuǎn)向的原因。下面是我自己做過的兩塊DSP28的全功能最小系統(tǒng)板，在做這兩塊板子的過程中發(fā)現(xiàn)要想盡力縮小DSP的面積實在不容易（目前只能達(dá)到50mm×45mm，這還是沒有其他器件的情況下），尤其是雙電源的供電方式和1.9V的電源讓人很頭疼。

后來因為一個項目，接觸了LPC2148并做了一塊板子，發(fā)現(xiàn)小型的ARM7在外設(shè)夠用的情況下其實很不錯，于是開始搜集相關(guān)芯片資料，也同時對小面積的AVR和51都進(jìn)行了大致的比較，這個時候發(fā)現(xiàn)了CortexM3的STM32，比2148擁有更豐富和靈活的外設(shè)，性能幾乎是2148兩倍（按照MIPS值計算）。正好2148我還沒上手，就直接轉(zhuǎn)了這款STM32F103。

與2811相比較（核心1.8V供電情況下），135MHz×1MIPS?，F(xiàn)在用STM32F103，72MHz×1.25MIPS，性能是DSP的66%，STM32F103R型（64管腳）芯片面積只有2811的51%，STM32F103C型（48管腳）面積是2811的25%，最大功耗是DSP的20%，單片價格是DSP的30%。且有更多的串口，CAP和PWM，這是有用的。高端型號有SDIO，理論上比SPI速度快。

由以上比較，準(zhǔn)備將未來的擁有操作系統(tǒng)的高端應(yīng)用交給DSP的新型浮點型單片機(jī)28335，而將所有緊湊型小型、微型應(yīng)用交給STM32。

ARM Cortex-M3相比于ARM其他系列微控制器，具有以下優(yōu)勢或特點：
1.三級流水線+分支預(yù)測
ARM Cortex-M3與ARM7內(nèi)核一樣，采用適合于微控制器應(yīng)用的三級流水線，但增加了分支預(yù)測功能。

現(xiàn)代處理器大多采用指令預(yù)取和流水線技術(shù)，以提高處理器的指令執(zhí)行速度。流水線處理器在正常執(zhí)行指令時，如果碰到分支（跳轉(zhuǎn)）指令，由于指令執(zhí)行的順序可能會發(fā)生變化，指令預(yù)取隊列和流水線中的部分指令就可能作廢，而需要從新的地址重新取指、執(zhí)行，這樣就會使流水線“斷流”，處理器性能因此而受到影響。特別是現(xiàn)代C語言程序，經(jīng)編譯器優(yōu)化生成的目標(biāo)代碼中，分支指令所占的比例可達(dá)10-20%，對流水線處理器的影響會的更大。為此，現(xiàn)代高性能流水線處理器中一般都加入了分支預(yù)測部件，就是在處理器從存儲器預(yù)取指令時，當(dāng)遇到分支（跳轉(zhuǎn)）指令時，能自動預(yù)測跳轉(zhuǎn)是否會發(fā)生，再從預(yù)測的方向進(jìn)行取指，從而提供給流水線連續(xù)的指令流，流水線就可以不斷地執(zhí)行有效指令，保證了其性能的發(fā)揮。
ARM Cortex-M3內(nèi)核的預(yù)取部件具有分支預(yù)測功能，可以預(yù)取分支目標(biāo)地址的指令，使分支延遲減少到一個時鐘周期。

2.哈佛結(jié)構(gòu)
從內(nèi)核訪問指令和數(shù)據(jù)的不同空間與總線結(jié)構(gòu)，可以把處理器分為哈佛結(jié)構(gòu)和普林斯頓結(jié)構(gòu)（或馮.諾伊曼結(jié)構(gòu)）。馮.諾伊曼結(jié)構(gòu)的機(jī)器指令、數(shù)據(jù)和I/O共用一條總線，這樣內(nèi)核在取指時就不能進(jìn)行數(shù)據(jù)讀寫，反之亦然。這在傳統(tǒng)的非流水線處理器（如MCS51）上是沒有什么問題的，它們?nèi)≈?、?zhí)行分時進(jìn)行，不會發(fā)生沖突。但在現(xiàn)代流水線處理器上，由于取指、譯碼和執(zhí)行是同時進(jìn)行的（不是同一條指令），一條總線就會發(fā)生總線沖突，必須插入延遲等待，從而影響了系統(tǒng)性能。ARM7TDMI內(nèi)核就是這種結(jié)構(gòu)的。
而哈佛結(jié)構(gòu)的處理器采用獨立的指令總線和數(shù)據(jù)總線，可以同時進(jìn)行取指和數(shù)據(jù)讀寫操作，從而提高了處理器的運行性能。ARM Cortex-M3、ARM966E、ARM926EJ、ARM1136JF等內(nèi)核都采用了哈佛結(jié)構(gòu)。

3.內(nèi)置嵌套向量中斷控制器（NVIC）
針對業(yè)界對ARM處理器中斷響應(yīng)的問題，Cortex-M3首次在內(nèi)核上集成了嵌套向量中斷控制器（NVIC）。Cortex-M3的中斷延遲只有12個時鐘周期(ARM7需要24-42個周期)；Cortex-M3還使用尾鏈技術(shù)，使得背靠背（back-to-back）中斷的響應(yīng)只需要6個時鐘周期(ARM7需要大于30個周期)。以STM32運行在75MHz為例，中斷延遲只有80ns-160ns。另外，Cortex-M3采用了基于棧的異常模式，使得芯片初始化的封裝更為簡單。
ARM7TDMI內(nèi)核不帶中斷控制器，具體MCU的中斷控制器是各芯片廠商自己加入的，這使得各廠商的ARM7 MCU中斷控制部分都不一樣，給用戶使用及程序移植帶來了很大麻煩。Cortex-M3內(nèi)核集成NVIC，各廠商生產(chǎn)的基于Cortex-M3內(nèi)核的MCU都具有統(tǒng)一的中斷控制器，對用戶使用各種Cortex-M3 MCU，特別是中斷編程帶來了很大的便利。

4.支持位綁定操作
以前的ARM內(nèi)核不支持位操作，當(dāng)需要對一個變量或端口的某一位操作時，先要用邏輯與/或指令屏蔽其他的位，使位操作需要較多的指令和時鐘周期。ARM
Cortex-M3采用了一種特殊的方法——位綁定：把一個地址單元的32位變量中的每一位，通過一個簡單的地址轉(zhuǎn)換算法，映射到另一個地址空間，每一位占用一個地址，對此地址空間的操作，只有數(shù)據(jù)的最低一位是有效的，其余高31位的值被忽略。相當(dāng)于把一個“橫”的32位字給“豎”起來。這樣對新的映射空間操作時，就可以不用屏蔽操作，優(yōu)化了RAM和I/O寄存器的讀寫，提高了位操作的速度。
這種方法粗看起來好像損失了很多地址空間，其實對于32位的ARM處理器而言，總共可以尋址4GB的空間，而對于一個MCU來說，一般只用到幾百KB的空間。所以這種處理方法絲毫不會影響一個MCU的正常使用，又大大簡化了處理器的設(shè)計，可以說是一種良策。

5.支持串行調(diào)試（SWD）
ARM處理器一般都使用JTAG調(diào)試接口，使得仿真、調(diào)試工具統(tǒng)一而廉價，方便了用戶開發(fā)。但JTAG調(diào)試接口至少要占用芯片的5-6個引腳，這對于一些引腳較少的MCU來說，有時會對仿真調(diào)試和I/O使用帶來麻煩。
ARM
Cortex-M3在保持原來JTAG調(diào)試接口的基礎(chǔ)上，還支持串行調(diào)試（SWD）。使用SWD時，只占用2個引腳，就可以進(jìn)行所有的仿真和調(diào)試，節(jié)省了調(diào)試用引腳，用戶就可以使用更多的引腳。
另外，Cortex-M3支持8個硬件斷點（ARM7、ARM9只支持2個硬件斷點），可以減少斷點調(diào)試時對代碼的影響，保證仿真、調(diào)試的時序準(zhǔn)確性。

6.內(nèi)核支持低功耗模式
ARM內(nèi)核已經(jīng)是一個高性能、低功耗的內(nèi)核，但ARM7、ARM9等內(nèi)核本身只有運行/停止模式，沒有其他模式。各芯片廠商只能在內(nèi)核基礎(chǔ)上，對各自加入的外設(shè)定義各種低功耗模式。Cortex-M3加入了類似于8位處理器的內(nèi)核低功耗模式，支持3種功耗管理模式：通過一條指令立即睡眠；異常/中斷退出時睡眠；深度睡眠。使整個芯片的功耗控制更為有效。以STM32為例，其RAM和寄存器狀態(tài)保持的停機(jī)模式耗電僅為14uA，從此狀態(tài)的啟動時間僅為7us。
Cortex-M3的運行功耗（Active Mode）也很低。以STM32系列微控制器為例，其典型功耗約為500uA/MHz，也只是目前業(yè)界超低功耗單片機(jī)MSP430系列（約為250uA/MHz）的2倍。但MSP430是16位處理器，而STM32是32位處理器。

7.高效的Thumb2 16/32位混合指令集
ARM7、ARM9等內(nèi)核使用不同的處理器狀態(tài)分別執(zhí)行32位的ARM指令和16位的Thumb指令，使用狀態(tài)切換指令完成ARM狀態(tài)和Thumb狀態(tài)的切換。Cortex-M3使用更高效的Thumb2指令集，它是一種16/32位混合編碼指令，兼容Thumb指令。對于一個應(yīng)用程序編譯生成的Thumb2代碼，以接近Thumb編碼的代碼尺寸，達(dá)到了接近ARM編碼的運行性能。Thumb2是一種緊湊、高效的新一代指令集。
Thumb2指令集是面向高級語言的指令集，適合于C語言編程，由編譯器生成目標(biāo)代碼，不建議直接使用Thumb2匯編語言編程。

8. 32位硬件除法和單周期乘法
以往的ARM處理器沒有除法指令，在某些除法密集型應(yīng)用中性能不盡如意。Cortex-M3加入了32位除法指令，彌補(bǔ)了這一缺陷，使Cortex-M3可以和其他通用處理器一樣，完成各種數(shù)學(xué)運算操作。
Cortex-M3還改進(jìn)了乘法運算部件，32結(jié)果的32位x32位乘法操作只要一個時鐘周期。這一性能使得使用Cortex-M3來進(jìn)行乘、乘加運算時，已逼近DSP的性能，因此特別適合一些需要簡單DSP的應(yīng)用領(lǐng)域，如電機(jī)控制、數(shù)字濾波、FFT變換等。
需要指出的是，32位的乘/除運算，對于一個8位機(jī)而言，已經(jīng)是一段比較復(fù)雜的程序，而對于32位的Cortex-M3而言，只需一句指令。因此，即使二者工作主頻一樣，實際運行性能也不是一個數(shù)量級的。

新聞中心

STM32學(xué)前班教程之一：為什么選擇STM32？

評論

相關(guān)推薦

技術(shù)專區(qū)