一種以DMA控制器為基礎(chǔ)的SoC系統(tǒng)設(shè)計(jì)
引言
本文引用地址:http://butianyuan.cn/article/151516.htmDMA(Direct Memory Access,直接存儲器存取)是一種快速傳送數(shù)據(jù)的機(jī)制。DMA控制器能夠有效替代微處理器的加載/存儲指令,顯著提高系統(tǒng)的并行能力。DMA是在存儲器與輸入/輸出設(shè)備間直接傳送數(shù)據(jù),是一種完全由硬件完成輸入/輸出操作的方式。數(shù)據(jù)傳遞可以從外設(shè)到內(nèi)存,從內(nèi)存到外設(shè)。但DMA控制器的引入也引進(jìn)了影響系統(tǒng)響應(yīng)速度的因素。本文講述以包含單個AHB master接口的DMA控制器為基礎(chǔ)的SoC系統(tǒng)架構(gòu)藍(lán)本,分析存在的不足之處,并引入一種以新型DMA控制器為基礎(chǔ)的SoC系統(tǒng)架構(gòu)的設(shè)計(jì),解決提出的問題。
1 對異步事件響應(yīng)速度
系統(tǒng)實(shí)時性是指能在限定時間內(nèi)完成任務(wù),并對外部異步事件作出及時響應(yīng)。限定時間根據(jù)應(yīng)用的要求不同而變化。實(shí)時系統(tǒng)的實(shí)時性與使用的軟硬件平臺有關(guān)。嵌入式系統(tǒng)的中斷服務(wù)響應(yīng)時間是指從某一個中斷源發(fā)出中斷服務(wù)請求,到處理器響應(yīng)這個中斷源的中斷服務(wù)請求,并開始執(zhí)行這個中斷源的中斷服務(wù)程序所用的這一段時間。嵌入式操作系統(tǒng)中的進(jìn)程調(diào)度是靠中斷實(shí)現(xiàn)的,處理器對系統(tǒng)中或系統(tǒng)外發(fā)生的異步事件的響應(yīng)速度是決定系統(tǒng)響應(yīng)速度的關(guān)鍵因素。中斷響應(yīng)時間是一個非常重要的指標(biāo)。特別是在實(shí)時計(jì)算機(jī)系統(tǒng)中,中斷響應(yīng)時間是整個計(jì)算機(jī)系統(tǒng)的一個關(guān)鍵性指標(biāo)。影響中斷服務(wù)響應(yīng)的因素有很多,如中斷源本身相對于其他中斷源的優(yōu)先級設(shè)置。在內(nèi)核不適合或不可能使用中斷技術(shù)期間,不能進(jìn)行中斷響應(yīng)。因此這段時間也相當(dāng)于一段中斷響應(yīng)延時,DMA操作就是其中一個因素。因?yàn)镈MA傳輸也相當(dāng)于一種中斷,只不過它向處理器申請的是總線控制權(quán),而不是處理器本身。在DMA傳輸期間,由于處理器要把總線控制權(quán)讓給DMA而失去總線控制權(quán),盡管處理器可以做些不使用總線的工作,但肯定不會馬上響應(yīng)來自總線的外部中斷請求,因此會造成較大的中斷延時。
2 包含DMA的SoC系統(tǒng)架構(gòu)
2.1 DMA結(jié)構(gòu)介紹
一般而言,DMA控制器的功能與結(jié)構(gòu)是由系統(tǒng)結(jié)構(gòu)決定的。但是作為IP而言,DMA控制器又要有其一般性。DMA是指外部設(shè)備直接對計(jì)算機(jī)存儲器進(jìn)行讀寫操作的I/O方式。這種方式下數(shù)據(jù)的讀寫無需處理器執(zhí)行指令,也不經(jīng)過處理器內(nèi)部寄存器,而是利用系統(tǒng)的數(shù)據(jù)總線,由外設(shè)直接對存儲器寫入或讀出,從而達(dá)到極高的傳輸效率。DMA技術(shù)的重要性在于,利用它進(jìn)行數(shù)據(jù)存取時不需要處理器進(jìn)行干預(yù),可提高系統(tǒng)執(zhí)行應(yīng)用程序的效率。利用DMA傳送數(shù)據(jù)的另一個好處是數(shù)據(jù)直接在源地址和目的地址之間傳送,不需要中間媒介。在大部分基于AMBA總線的SoC:系統(tǒng)中,當(dāng)需要進(jìn)行DMA操作時,DMA控制器先向處理器發(fā)出占用總線的請求,當(dāng)總線請求成功后,處理器將總線使用權(quán)交給DMA控制器,可以進(jìn)行數(shù)據(jù)傳輸,當(dāng)此次DMA傳輸完成后DMA控制器釋放總線控制權(quán)。
AMBA是ARM公司提出的用于微處理器片上通信的先進(jìn)的總線結(jié)構(gòu)。一種典型的AMBA總線由AHB和APB總線分段構(gòu)成??偩€上的設(shè)備可以分為能夠主動讀寫的主設(shè)備(master)與只能接收來自master請求的從設(shè)備(slave)。針對DMA控制器的研究引出了新的SoC架構(gòu),如使用分布式Fly-by DMA結(jié)構(gòu),為數(shù)據(jù)吞吐量大的模塊預(yù)設(shè)專用通道等。從功耗的角度看,當(dāng)系統(tǒng)中存在較多master模塊時,總線仲裁器的負(fù)擔(dān)加重,而仲裁器正是AMBA總線功耗的主要來源。
2.2 包含AHB主從接口DMA控制器的SoC系統(tǒng)架構(gòu)
為了緩解在同一系統(tǒng)中需要同時實(shí)現(xiàn)大批量的數(shù)據(jù)傳輸,提出如圖1所示的基于AMBA總線的SoC系統(tǒng)架構(gòu)。從圖中可以看出,系統(tǒng)處理器的數(shù)據(jù)接口與指令接口都是作為AHB的master掛接在AHB總線上。主存通過slave接口掛接在AHB總線上,而DMA控制器同時包含master與slave接口,掛接在AHB總線上。slave接口用來對DMA控制器內(nèi)部寄存器進(jìn)行配置,master用來向AHB申請AHB總線控制權(quán),并進(jìn)行DMA傳輸。
在圖1中Memory是通過AHB的slave接口掛在AHB總線上。DMA控制器包含的2個接口,slave接口完成DMA內(nèi)部寄存器的配置后,master接口可申請AHB總線使用權(quán),當(dāng)獲得許可后,開始占用AHB總線,實(shí)現(xiàn)DMA數(shù)據(jù)傳輸。如此使處理器從外設(shè)間的大批量數(shù)據(jù)傳輸解放出來,直接由DMA來完成,提高了數(shù)據(jù)傳輸放率。但也因此而產(chǎn)生了一個問題:當(dāng)DMA占用AHB總線時處理器不能通過AHB接口去實(shí)現(xiàn)取指及讀寫數(shù)據(jù)。雖然在現(xiàn)在大部分處理器內(nèi)部或外部配備了容量較大的高速緩存(Cache),當(dāng)DMA控制器占用內(nèi)存時,處理器仍可利用Cache中的程序和數(shù)據(jù)繼續(xù)運(yùn)行;但Cache是利用程序的局部性原理,當(dāng)處理器執(zhí)行的操作有良好的局部性時,在DMA占用AHB總線期間可以利用Cache里的指令和數(shù)據(jù)繼續(xù)運(yùn)行,但若此時有設(shè)備產(chǎn)生中斷,此時處理器的PC指針就會產(chǎn)生跳轉(zhuǎn),從而會產(chǎn)生Cache不能命中的情況。而AHB總線又被DMA控制器占據(jù),處理器不能對外取指,而且Cache的容量因成本問題不可能太大,從而影響處理器的效率。
2.3 包含2個AHB從接口DMA控制器的新型SoC系統(tǒng)架構(gòu)
為了解決因圖1所示架構(gòu)大批量數(shù)據(jù)傳輸而引入DMA產(chǎn)生的問題,提出了包含2個AHB接口的DMA控制器的SoC系統(tǒng)架構(gòu)。在AHB總線上的sla-ve接口都是不能發(fā)起傳輸?shù)?,它的一切操作都是被動的。因此圖2中的DMA控制器的主要功能是提供需要進(jìn)行DMA傳輸?shù)耐庠O(shè)接口與處理器讀寫主存的通道以及它們間優(yōu)先級設(shè)定。在此雙AHB從接口的DMA控制器中處理器優(yōu)先級永遠(yuǎn)最高,其他外設(shè)通道都可以相互設(shè)置優(yōu)先級,而且除處理器外,為了防止同一個外設(shè)長期占用DMA總線的使用權(quán),可對外設(shè)DMA通道設(shè)置回退(暫時釋放DMA總線)。如當(dāng)通道2需要與Memory進(jìn)行數(shù)據(jù)傳輸時,先向DMA控制申請總線使相應(yīng)通道2的REQ信號有效,若DMA控制器允許通道2進(jìn)行數(shù)據(jù)傳輸,則向通道2響應(yīng)ACK應(yīng)答信號。當(dāng)通道2傳輸完,DMA控制回退長度的寄存器設(shè)定的值進(jìn)入回退階段,若數(shù)據(jù)傳輸完成,則使REQ信號無效,否則繼續(xù)使REQ信號有效,并在回退期后當(dāng)DMA總線空閑時參于DMA總線競爭。在總線空閑時只有不處于回退期間的最高優(yōu)先級的通道才能獲得DMA總線使用權(quán),對Memory進(jìn)行讀寫。
經(jīng)過Design Compiler邏輯綜合,DMA控制器在SMIC0.18μm的工藝下,能夠達(dá)到AHB時鐘域90MHz。能滿足所設(shè)計(jì)SoC系統(tǒng)時鐘的要求。
評論