32位嵌入式處理器技術與應用
清華大學Motorola單片機應用開發(fā)中心 邵貝貝
本文引用地址:http://butianyuan.cn/article/2933.htm“8位單片機對我的應用來說足夠好了。”另一個聲音是:“有更好的32位機,又不貴,為什么不用呢?”觀念正在變化,市場需求在發(fā)展。冰箱用上了DSP,汽車電子全面走向32位,通信相關產品本來就是32位處理器的天下。國內單片機應用的開發(fā)大軍已經開始把目光投向32位嵌入式產品的開發(fā)。
32位嵌入式處理器一般都可以通過JTAG接口調試,不需要使用仿真器,幾乎不需要什么開發(fā)環(huán)境方面的硬件投入。而軟件的開發(fā)則應以C語言為主。如果能配上嵌入式實時操作系統(tǒng)(RTOS),則如虎添翼。根據(jù)不同的應用,RTOS的價格可以從50美元到3萬美元不等。
目前,ARM系列32位處理器在低功耗移動通信設備方面占有絕對優(yōu)勢。Power PC為核心的單片機則用在非便攜的通信設備上。Motorola傳統(tǒng)的M683××系列以及RISC級CPU ColdFire主要用在工控與汽車電子方面。NEC、HITACHI、EPSON也有各自的32位處理器產品。值得注意的是,系統(tǒng)芯片(SoC)技術使應用系統(tǒng)的開發(fā)越來越傾向于以32位CPU為核心,設計一個專用芯片來實現(xiàn)SoC。
M.Core 是Motorola 的一款RISC級低功耗CPU,性能優(yōu)于ARM7。以M200系列為例,在1.8V 供電,33MHz主頻下,可達31.4MIPs,功耗僅13.6mW。M.Core 僅用了8萬個晶體管, 0.25mm工藝下面積只有1.1mm2,成本低。M.Core 有較高的碼密度和編程效率,應用程序比其他32位CPU少占用約30%存儲空間。以M.Core 為CPU的MMC2107單片機集成了8K SRAM,128K FLASH, 8路10位A/D 以及SCI、PWM、定時器等。此外還有2103、2111等產品。
目前流行的諸多32位嵌入式處理器,尚無一款是中國人自己的??上驳氖?,蘇州成立的“國芯公司”,擬在研究和消化Motorola 的低功耗32位M.Core的基礎上,設計有中國人自己知識產權的“中國芯”——C.Core。屆時,國人就真的在32位嵌入式應用領域“占有一席之地”了。(中芯微系統(tǒng)公司7月10日已發(fā)布了改位Arca嵌入式芯片,見另報道——編者)。
Infineon(澳洲)有限公司 陳騏
在汽車電子控制部分的設計中,無論是從支持新的設計方法和開發(fā)工具的角度,還是從微控制器本身的功能出發(fā),都對新一代微控制器提出了挑戰(zhàn)。有鑒于此,汽車半導體器件生產廠家之一——億恒科技(Infineon )已經并計劃在今后兩年內,陸續(xù)推出一系列32位的AUDO微控制器系列,以滿足下一代汽車中發(fā)動機動力系統(tǒng)、安全系統(tǒng)及車身系統(tǒng)等各種嵌入式控制系統(tǒng)應用的需求,其中第一個成員TC-1775業(yè)已問世。
AUDO-TC1775的系統(tǒng)結構如圖1所示。它的設計中心是圍繞著如何實現(xiàn)汽車中各電子控制系統(tǒng)的高實時性,同時又兼顧到這些系統(tǒng)開發(fā)過程中各個環(huán)節(jié)的特點。其核心部分是Infineon的Tricore內核。系統(tǒng)的應用軟件的開發(fā)主要是基于它進行的,而驅動器程序的執(zhí)行是圍繞著獨立的片內外設控制器(PCP),并由各片內外設來完成與時間有關的任務控制、與外部模擬信號和各種接口相連接等其它任務。
Tricore是業(yè)界第一個具有統(tǒng)一的32位MCU-DSP結構的微控制器核心,集合了普通微控制器的高實時性、RISC處理器“裝載/存儲(load/store)”結構的高性價比以及DSP結構的高數(shù)據(jù)處理能力為一體。其指令集結構(ISA)支持統(tǒng)一的32位地址空間及多個指令流水線同時運作的超級標量結構,并使它能適用于多種不同應用。這種實施和系統(tǒng)層次上的靈活性,可以讓設計者及時地控制系統(tǒng)性能和成本之間的平衡。
AUDO結構上層次分明,這樣很容易將它定義在正確的抽象層上,然后可以在不同的領域內(如A/D、熱學/機械學等)對嵌入式系統(tǒng)進行各種仿真和性能分析。這支持了新一代系統(tǒng)設計中日益普及的“虛擬樣機”的概念。
下面將部分介紹AUDO及Tricore內核的主要功能和特點:
數(shù)據(jù)類型:汽車應用系統(tǒng)的軟件中需支持各種的數(shù)據(jù)類型,微控制器必須有效地對它們進行管理以減少數(shù)據(jù)和代碼的長度。Tricore指令集支持的操作類型有:布爾、位、字符、帶符號的分數(shù)、地址、帶或不帶符號的整數(shù)及單精度的浮點數(shù)。
算術和DSP性能:隨著汽車控制系統(tǒng)功能的日趨復雜,許多控制策略中對DSP計算的要求也越來越迫切。除了普通與狀態(tài)機、查表及通訊協(xié)議有關的基本操作之外,高速執(zhí)行器的魯棒控制及運用在電磁閥、交流感應電機、汽車動態(tài)控制等方面的閉環(huán)自適應控制方案的日趨普及,也帶來大量的DSP運算。此外,汽車系統(tǒng)中的傳感器輸入也在不斷地增加。有些應用中(例如加速度表等),傳感器的輸入信號采樣后必須經過一定的DSP如濾波、頻譜分析等,才可以傳輸?shù)较到y(tǒng)控制器中去。
Tricore具有強大的DSP功能,這在提高汽車的駕駛特性、減少油耗和污染排放等方面是至關重要的。
浮點運算:在汽車各系統(tǒng)設計中,新的設計方法和控制策略對浮點計算能力的要求大增,主要原因是隨著新的仿真工具和代碼自動生成器的出現(xiàn),系統(tǒng)工程師將精力從程序的編寫和實施轉移到控制策略的設計和算法的優(yōu)化上,給系統(tǒng)控制策略從傳統(tǒng)的影射控制向魯棒和自適應控制等方向轉化創(chuàng)造了條件。在影射控制方法中,浮點數(shù)僅用在非線性表達式的內插和賦值等運算中,而在魯棒和自適應控制等方案中,浮點數(shù)的使用則可以極大地減少矩陣和矢量的操作,從而增加系統(tǒng)的計算效率。
理想的浮點數(shù)運算單元(FPU)需通過浮點乘和加指令有效地支持矩陣和矢量運算,并減少上下文切換造成的軟件開銷。將一個浮點單元增加到非浮點內核中去的方法有幾種,Tricore中所采用的方案是將具有自己獨立的寄存器的浮點協(xié)處理器緊密地與內核耦合,這既縮短了浮點運算所耗費的周期,也不需在FPU的設計上花太大的精力。
片內外設:AUDO中的片內外設通過統(tǒng)一的內部總線與CPU、片上存儲器和外設控制器建立通訊聯(lián)系;另一方面,這些片內外設和存儲器又通過一個統(tǒng)一的外部總線單元與外部器件(如外部存儲器或外設)聯(lián)系,該外部總線在復用或非復用地址/數(shù)據(jù)總線的情況下均支持各種外部存儲器類型。例如,TC1775中集成了許多發(fā)動機控制單元中常用到的外設模塊,包括功能強大的通用定時器和PWM模塊;高精度的A/D和D/A轉換模塊;各種高速同步/異步串行口;汽車行業(yè)內被廣泛用來進行內部通訊的控制器局部網(wǎng)(CAN)/J1850模塊;通過JTAG接口進行系統(tǒng)調試的片上調試模塊;高效的芯片功耗管理模塊;靈活的時鐘生成單元等等。這些外設模塊的引入,既符合行業(yè)內SoC的趨勢,又加強了AUDO對各種汽車電子控制應用的支持能力,從而進一步奠定了AUDO系列產品作為下一代主流汽車用微控制器的地位。
北京理工大學計算機系 馬忠梅
1985年第一個ARM原型在英國劍橋誕生。1990年成立Advanced RISC Machines Limited(后簡稱為ARM)。目前,ARM已擴展到世界范圍,占據(jù)高性能、低功耗、低成本的嵌入式應用領域。作為32位嵌入式RISC微處理器業(yè)界的領先供應商,占有大于75%的市場。
ARM處理器的三大特點是:耗電少功能強、16位/32位雙指令集和眾多合作伙伴。
ARM商品模式的強大之處在于它在世界范圍有超過100個的合作伙伴(Partners)。ARM 是設計公司,本身不生產芯片。采用轉讓許可證制度,由合作伙伴生產芯片。
當前ARM體系結構的擴充包括:
·Thumb 16位指令集,為了改善代碼密度;
·DSP DSP應用的算術運算指令集;
·Jazeller 允許直接執(zhí)行Java字節(jié)碼。
ARM處理器系列提供的解決方案有:
·無線、消費類電子和圖像應用的開放平臺;
·存儲、自動化、工業(yè)和網(wǎng)絡應用的嵌入式實時系統(tǒng);
·智能卡和SIM卡的安全應用。
ARM處理器本身是32位設計,但也配備16位指令集。一般來講存儲器比等價32位代碼節(jié)省達35%,然而保留了32位系統(tǒng)的所有優(yōu)勢。ARM的Jazelle技術使Java加速得到比基于軟件的Java虛擬機(JVM)高得多的性能,和同等的非Java加速核相比功耗降低80%。CPU功能上增加DSP指令集提供增強的16位和32位算術運算能力,提高了性能和靈活性。ARM還提供兩個前沿特性來輔助帶深嵌入處理器的高集成SoC器件的調試,它們是嵌入式ICE-RT邏輯和嵌入式跟蹤宏核(ETMS)系列。
當前有5個產品系列——ARM7、ARM9、ARM9E、ARM10和SecurCore。
1、ARM7系列
優(yōu)化用于對價位和功耗敏感的消費應用的低功耗32位核,有:
·嵌入式ICE-RT邏輯;
·非常低的功耗;
·三段流水線和馮·諾依曼結構,提供0.9MIPS/MHz。
2、SecurCore SC100特為安全市場設計,帶特定的抗拒竄改和反工程的特性。還帶靈活的保護單元確保操作系統(tǒng)和應用數(shù)據(jù)的安全。
3、ARM9系列
高性能和低功耗領先的硬宏單元,帶有:
·5段流水線;
·哈佛結構提供1.1MIPS/MHz。
ARM920T和ARM922T內置全性能的MMU、指令和數(shù)據(jù)cache和高速AMBA總線接口。AMBA片上總線是一個開放標準,已成為SoC構建和IP庫開發(fā)的事實標準。AMBA先進的高性能總線(AHB)接口現(xiàn)由所有新的ARM核支持,提供開發(fā)全綜合設計系統(tǒng)。
ARM940T內置指令和數(shù)據(jù)cache、保護單元和高速AMBA總線接口。
4、ARM9E系列
可綜合處理器,帶有DSP擴充和緊耦合存儲器(TCM)接口,使存儲器以完全的處理器速度運轉,可直接連接到內核上。
ARM966E-S用于硅片尺寸重要,而對cache沒要求的實時嵌入式應用,可配置TCM大?。?、4K、8K、16K,最大達64M。
ARM946E-S內置集成保護單元,提供實時嵌入式操作系統(tǒng)的cache核方案。
ARM926ET-S帶Jazelle擴充、分開的指令和數(shù)據(jù)高速AHB接口及全性能MMU。
VFP9 向量浮點可綜合協(xié)處理器進一步提高ARM9E處理器性能,提供浮點操作的硬件支持。
5、ARM10系列
硬宏單元,帶有:
·64位AHB指令和數(shù)據(jù)接口;
·6段流水線;
·1.25MIPS/MHz;
·比同等的ARM9器件性能提高50%。
兩種新的先進的節(jié)能方式得到了異常低的耗電。VFP10協(xié)處理器完善地依從ARM10器件提供高性能的浮點解決方案。
清華大學電機工程與應用電子技術系 沈永林
日立亞洲(香港)有限公司 郭海濤
日立單片機有各種各樣的系列,其中4位的H400系列主要用于低檔家電;8位的H8/300L、H8/300主要用于中高檔家電,如錄像機、無繩電話以及計算機鍵盤、汽車剎車控制;而16位的H8/300H、H8S/2000、H8/500等主要用于工程控制、蜂窩電話、CD驅動器、打印機等。本文僅對高檔32位的SH系列作一些分析。
SH系列是32位高檔的、RISC型單片機系列,到現(xiàn)在為止,已經推出了6種類型的單片機系列:基本型的SH1,改進型的SH2,低功耗的SH3,增強型的SH4,以及和DSP結合的SH2-DSP和SH3-DSP。
SH系列的CPU采用RISC結構,也就是采用硬連線的控制器,以及簡化的指令系統(tǒng),在流水線技術的支持下,減少執(zhí)行指令的平均周期數(shù),以提高系統(tǒng)的整體性能。SH系列的CPU指令格式是固定的,只一個字長,絕大多數(shù)指令是單周期完成的,即使是復雜的乘加指令也僅需2個時鐘周期。為了克服內存訪問的瓶頸,SH的CPU簡化尋址方式,采用Load/Store(裝載/存儲)結構,并且在片內設置高速緩存Cache,以減少訪問內存的時間。
SH系列的CPU內部有16個32位通用寄存器,用于數(shù)據(jù)處理、地址計算、堆棧指針;3個32位控制寄存器,即狀態(tài)寄存器SR、全局寄存器GBR、向量基址寄存器VBR,分別用于處理器狀態(tài)的控制和片內功能電路及程序的尋址;4個32位系統(tǒng)寄存器,即乘加寄存器MAC(用于乘法后累加的指令MAC,存放運算結果)、過程寄存器PR(存放斷點地址,以便返回)和程序計數(shù)器PC。
1、SH1片內有16位硬件乘法器,并有4~8KB的RAM、16~64KB的ROM,還有DRAM接口與片外的DRAM相連。在時鐘20MHz時,其性能可達26MIPS。
2、SH2在SH1的基礎上性能有所改進,片內的ROM、RAM移到了片外,而增加了高速緩存Cache,以提高其性能,乘法器、除法器為32位,還增加了用戶斷點控制器UBC。用戶利用UBC可以編程設置地址或數(shù)據(jù)斷點進行調試,在開發(fā)時把它作為簡單的調試工具。它的性能可達到52MIPS。
3、SH3系列是低功耗、高性能的RISC結構,在時鐘133MHz時,性能可以達到173MIPS。在2.25V工作時,功耗僅為400mW。SH3的SH7709,其消耗功率每瓦運行的指令數(shù)達到315MIPS,能源利用效率很高。圖2是SH3的結構框圖。它比SH2增加了存儲管理部件MMU,這種以前高性能計算機中才具備的存儲管理部件,有效地提高了整個系統(tǒng)的性能。
4、SH4是增強型的單片機系統(tǒng),它的功能更多、更強,在時鐘167MHz時,性能達到300MIPS,而能源利用率更是達到每瓦1000MIPS,在世界上是最高效的一種單片機。
5、SH-DSP是單片機發(fā)展的新一代的產品,它綜合了RISC結構處理器和DSP的優(yōu)點,形成了高性能、低功耗、便攜式的新產品,以適應機器人、系統(tǒng)控制、圖形圖像、聲音、通信等新的更高性能的需要。例如它的乘加指令執(zhí)行僅需1個時鐘周期,大大方便了它在信號處理中的應用。
據(jù)報道,1999年底,SH系列累計生產達1.18億片。SH系列投入市場后,用量最多的是工業(yè),占總量的36%,第二位是辦公自動化,占總量的26%;第三位是消費領域;再其次的是通信領域。此外,汽車導航、定位、控制系統(tǒng),也是SH系列不小的一個市場。在美國,SH系列占有很大的市場份額。
圖3是一個利用SH3-DSP的芯片SH7727構成PDA的框圖,SH7727通過它的接口電路和ROM、RAM、鍵盤、液晶顯示器等相連,就構成了一個小巧的PDA系統(tǒng)。
EPSON 97年推出一款32位微控制器E0C33,它采用RISC核心,哈佛結構。其性能參數(shù)為3.3V時50MIPS,8位或16位外部總線。主要用于高速數(shù)據(jù)處理用QA設備,可分為三大類:消費類產品,象便攜式信息終端、數(shù)碼相機、DVD等;OA產品,如打印機、掃描儀、傳真機等;其他,如游戲、教育玩具、數(shù)據(jù)銀行等。
E0C33的特點為:CPU尺寸很小(0.35mm工藝時只有1.44mm2),更高的編譯效率。另外在低功耗方面下了很多工夫,如采用低電壓,芯片設計上采用多渠道的電源管理方式,時鐘方式是雙時鐘,低速和高速可相互切換。
E0C33更象ASIC,例如可用于激光打印機的驅動電路。因為如果是標準芯片,就要把所有的功能都放在芯片中,芯片會非常大,成本也上去了。因此EPSON的很多芯片采用靈活的方式——ASIC,省略了很多功能,同時它也是可開發(fā)的(圖4)?!? (王瑩)
存儲器相關文章:存儲器原理
矢量控制相關文章:矢量控制原理 三維掃描儀相關文章:三維掃描儀原理
評論