哪種ARM Cortex內(nèi)核更適合我的應用:A系列、R系列、還是M系列?
最新成員Cortex-A50系列將Cortex-A系列的應用范圍擴大至低功耗服務器領域。這些處理器基于ARMv8架構,支持AArch64——高效能64位運行態(tài)且可以與現(xiàn)行32位運行態(tài)共存。升級到64位的原因之一顯而易見是為了支持大于4GB的物理內(nèi)存,盡管Cortex-A15和Cortex-A7已經(jīng)具備此能力。在這種情況下,升級到64位其實是為服務器應用提供更好的支持,服務器中越來越多的操作系統(tǒng)和應用程序都采用64位,當然,Cortex-A50系列為上述情況提供了功耗優(yōu)化的解決方案。對于臺式機市場而言,情況也大體相同,支持64位意味著Cortex-A50系列能夠更廣泛地應用到這一細分市場,而且某種程度證明了未來64位操作系統(tǒng)最終將遷移到移動應用。
本文引用地址:http://butianyuan.cn/article/275077.htm介紹過Cortex-A,下面介紹Cortex-R系列——衍生產(chǎn)品中體積最小的ARM處理器,這一點也最不為人所知。Cortex-R處理器針對高性能實時應用,例如硬盤控制器(或固態(tài)驅(qū)動控制器)、企業(yè)中的網(wǎng)絡設備和打印機、消費電子設備(例如藍光播放器和媒體播放器)、以及汽車應用(例如安全氣囊、制動系統(tǒng)和發(fā)動機管理)。Cortex-R系列在某些方面與高端微控制器(MCU)類似,但是,針對的是比通常使用標準MCU的系統(tǒng)還要大型的系統(tǒng)。例如,Cortex-R4就非常適合汽車應用。Cortex-R4主頻可以高達600MHz(具有2.45DMIPS/MHz),配有8級流水線,具有雙發(fā)送、預取和分支預測功能、以及低延遲中斷系統(tǒng),可以中斷多周期操作而快速進入中斷服務程序。Cortex-R4還可以與另外一個Cortex-R4構成雙內(nèi)核配置,一同組成一個帶有失效檢測邏輯的冗余鎖步(lock-step)配置,從而非常適合安全攸關的系統(tǒng)。
Cortex-R5能夠很好的服務于網(wǎng)絡和數(shù)據(jù)存儲應用,它擴展了Cortex-R4的功能集,從而提高了效率和可靠性,增強了可靠實時系統(tǒng)中的錯誤管理。其中的一個系統(tǒng)功能是低延遲外設端口(LLPP),可實現(xiàn)快速外設讀取和寫入(而不必對整個端口進行“讀取-修改-寫入”操作)。Cortex-R5還可以實現(xiàn)處理器獨立運行的“鎖步(lock-step)”雙核系統(tǒng),每個處理器都能通過自己的“總線接口和中斷”執(zhí)行自己的程序。這種雙核實現(xiàn)能夠構建出非常強大和靈活的實時響應系統(tǒng)。
Cortex-R7極大擴展了R系列內(nèi)核的性能范圍,時鐘速度可超過1GHz,性能達到3.77DMIPS/MHz.Cortex-R7上的11級流水線現(xiàn)在增強了錯誤管理功能,以及改進的分支預測功能。多核配置也有多種不同選項:鎖步、對稱多重處理和不對稱多重處理。Cortex-R7還配有一個完全集成的通用中斷控制器(GIC)來支持復雜的優(yōu)先級中斷處理。不過,值得注意的是,雖然Cortex-R7具有高性能,但是它并不適合運行那些特性豐富的操作系統(tǒng)(例如Linux和Android)的應用,Cortex-A系列才更適合這類應用。
最后,我們來討論Cortex-M系列,特別設計針對競爭已經(jīng)非常激烈的MCU市場。Cortex-M系列基于ARMv7-M架構(用于Cortex-M3和Cortex-M4)構建,而較低的Cortex-M0+基于ARMv6-M架構構建。首款Cortex-M處理器于2004年發(fā)布,當一些主流MCU供應商選擇這款內(nèi)核,并開始生產(chǎn)MCU器件后,Cortex-M處理器迅速受到市場青睞。可以肯定的說,Cortex-M之于32位MCU就如同8051之于8位MCU——受到眾多供應商支持的工業(yè)標準內(nèi)核,各家供應商采用該內(nèi)核加之自己特別的開發(fā),在市場中提供差異化產(chǎn)品。例如,Cortex-M系列能夠?qū)崿F(xiàn)在FPGA中作為軟核來用,但更常見的用法是作為集成了存儲器、時鐘和外設的MCU.在該系列產(chǎn)品中,有些產(chǎn)品專注最佳能效、有些專注最高性能、而有些產(chǎn)品則專門應用于諸如智能電表這樣的細分市場。
Cortex-M3和Cortex-M4是非常相似的內(nèi)核。二者都具有1.25DMIPS/MHz的性能,配有3級流水線、多重32位總線接口、時鐘速率可高達200MHz,并配有非常高效的調(diào)試選項。最大的不同是,Cortex-M4的內(nèi)核性能針對的是DSP.Cortex-M3和Cortex-M4具有相同的架構和指令集(Thumb-2)。然而,Cortex-M4增加了一系列特別針對處理DSP算法而優(yōu)化的飽和運算和SIMD指令。以每0.5秒運行一次的512點FFT為例,如果分別在同類量產(chǎn)的Cortex-M3 MCU和Cortex-M4 MCU上運行,完成同樣的工作,Cortex-M3所需功耗約是Cortex-M4所需功耗的三倍。此外,也有在Cortex-M4上實現(xiàn)單精度浮點單元(FPU)的選項。如果應用涉及到浮點計算,那在Cortex-M4上完成比在Cortex-M3上完成要快得多。也就是說,對于不使用Cortex-M4上DSP或FPU功能的應用而言,其性能和功耗與Cortex-M3相同。換句話說,如果使用DSP功能,那就選擇Cortex-M4.否則,就選擇Cortex-M3完成工作。
對于成本特別敏感的應用或者正在從8位遷移到32位的應用而言,Cortex-M系列的最低端產(chǎn)品可能是最佳選擇。雖然Cortex-M0+的性能為0.95DMIPS/MHz,比Cortex-M3和Cortex-M4的性能稍稍低一些,但仍可與同系列其他高端產(chǎn)品兼容。Cortex-M0+采用Thumb-2指令集的子集,而且這些指令大都是16位操作數(shù)(雖然所有數(shù)據(jù)運行都是32位的),這使得它們能夠很好的適應Cortex-M0+所提供的2級流水線服務。通過減少分支映射,系統(tǒng)就能節(jié)約一些整體功耗,而且在大多數(shù)情況下,流水線將保留接下來的四個指令。Cortex-M0+還具有專用的總線用于單周期GPIO,這意味著你能夠利用位控制的GPIO實現(xiàn)確定接口,就像8位MCU那樣,但卻以32位內(nèi)核的性能來處理該數(shù)據(jù)。
Cortex-M0+的另外一個重要的不同特點是增加了微型跟蹤緩沖器(MTB)。該外設可使設計人員在調(diào)試過程中使用一些片上RAM來存儲程序分支。這些分支隨后能夠回傳到集成開發(fā)環(huán)境中,而且可以重建程序流程。這一功能提供了一種初步的指令跟蹤能力,這對于不具備擴展跟蹤宏單元(ETM)功能的Cortex-M3和Cortex-M4來說比較有意義。從Cortex-M0+中提取的調(diào)試信息等級顯著高于8位MCU,這就意味著那些難以解決的調(diào)試問題變得更加容易解決。
綜上所述,Cortex處理器系列產(chǎn)品為滿足你的應用性能需求而提供了多種選項。無需勞神費力,也無論針對高端平板電腦還是物聯(lián)網(wǎng)中超低成本的無線傳感器節(jié)點,你都能夠發(fā)現(xiàn)一款適合應用所需的處理器。
評論