Cache在嵌入式處理器中的使用問題
隨著嵌入式計(jì)算機(jī)應(yīng)用的發(fā)展,嵌入式cpu的主頻不斷提高,這就造成了慢速系統(tǒng)存儲器不能匹配高速cpu處理能力的情況。為了解決這個(gè)問題,許多高性能的嵌入式處理器內(nèi)部集成了高速緩存cache。其中,三星公司的s3c44b0x內(nèi)部就集成了8
kb空間統(tǒng)一的指令和數(shù)據(jù)cache。
cache即高速緩沖存儲器,是位于cpu與主存之間一種容量較小,但速度很高的存儲器。由于cpu在進(jìn)行運(yùn)算時(shí),所需的指令和數(shù)據(jù)都是從主存中提取的,而cpu運(yùn)算速度要比主存讀寫速度快得多,這樣極其影響整個(gè)系統(tǒng)的性能。采用cache技術(shù),即在cache中存放cpu常用的指令和數(shù)據(jù),然后將這些數(shù)據(jù)和指令以一定的算法和策略從主存中調(diào)入,使cpu可以不必等待主存數(shù)據(jù)而保持高速操作。這樣就滿足了嵌入式系統(tǒng)實(shí)時(shí)、高效的要求。但cache的使用也帶來了一致性的問題,在應(yīng)用中應(yīng)特別注意。
1 cache一致性問題的發(fā)現(xiàn)
本項(xiàng)目的目標(biāo)板為:處理器采用arm芯片s3c44b0x,存儲器采用2片flash和1片sdram,在調(diào)試的時(shí)候輸入采用鍵盤,輸出采用顯示器,用rs232串口實(shí)現(xiàn)通信。
在項(xiàng)目的開發(fā)過程中,經(jīng)軟件仿真調(diào)試成功的程序,燒入目標(biāo)板后,程序卻發(fā)生異常中止。通過讀存儲器的內(nèi)容發(fā)現(xiàn),程序不能正常運(yùn)行在目標(biāo)板上,是因?yàn)榇鎯ζ髦袑懭氲臄?shù)據(jù)與程序編譯生成的數(shù)據(jù)不一致,總是出現(xiàn)一些錯(cuò)誤字節(jié)。
經(jīng)過一段時(shí)間的調(diào)試發(fā)現(xiàn),只要在程序中禁止cache的使用,存儲器中寫入的數(shù)據(jù)將不再發(fā)生錯(cuò)誤,程序可以正常運(yùn)行,但速度明顯減慢。經(jīng)過分析,認(rèn)為問題是由于cache數(shù)據(jù)與主存數(shù)據(jù)的不一致性造成的。
cache數(shù)據(jù)與主存數(shù)據(jù)不一致是指:在采用cache的系統(tǒng)中,同樣一個(gè)數(shù)據(jù)可能既存在于cache中,也存在于主存中,兩者數(shù)據(jù)相同則具有一致性,數(shù)據(jù)不相同就叫做不一致性。如果不能保證數(shù)據(jù)的一致性,那么,后續(xù)程序的運(yùn)行就要出現(xiàn)問題。
2 分析cache的一致性問題
要解釋cache的一致性問題,首先要了解cache的工作模式。cache的工作模式有兩種:寫直達(dá)模式(writethrough)和寫回模式(writeback)。寫直達(dá)模式是,每當(dāng)cpu把數(shù)據(jù)寫到cache中時(shí),cache控制器會立即把數(shù)據(jù)寫入主存對應(yīng)位置。所以,主存隨時(shí)跟蹤cache的最新版本,從而也就不會有主存將新數(shù)據(jù)丟失這樣的問題。此方法的優(yōu)點(diǎn)是簡單,缺點(diǎn)是每次cache內(nèi)容有更新,就要對主存進(jìn)行寫入操作,這樣會造成總線活動(dòng)頻繁。s3c44b0x中的cache就是采用的寫直達(dá)模式(writethrough)。在寫直達(dá)模式下,數(shù)據(jù)輸出時(shí),系統(tǒng)會把數(shù)據(jù)同時(shí)寫入高速緩沖存儲器cache和主存中,這樣就保證了輸出時(shí)高速緩沖存儲器的一致性。但該模式下,卻無法保證輸入時(shí)的高速緩沖存儲器的一致性。
下面再看一下cache的組織方式。按照主存和cache之間的映像關(guān)系,cache有三種組織方式。全相聯(lián)方式、直接映像方式和組相聯(lián)方式。其中,直接映像方式的原理如圖1所示。
按照cache的行數(shù)m,把主存分為n/m個(gè)區(qū)域,每個(gè)區(qū)中有m個(gè)存儲塊。各區(qū)中的0~(m-1)塊一一對應(yīng)地固定映射到cache中l(wèi)0~lm-1行。這樣,標(biāo)簽只要給定區(qū)地址(區(qū)號),就能唯一確定cache行與存儲器的對應(yīng)關(guān)系。當(dāng)cpu發(fā)出存儲器訪問時(shí),以存儲器地址作為行索引,尋址到一高速緩沖行,檢測該行的標(biāo)簽。若標(biāo)簽與存儲器的相應(yīng)地址匹配,則cache命中。該高速緩存行當(dāng)前即為欲訪問存儲塊的唯一映像。從上面的分析可以看出,在寫直達(dá)模式下,由于每次cache內(nèi)容有更新,就要對主存進(jìn)行寫入操作,造成總線活動(dòng)頻繁。在cache命中的過程中,如果總線遇到干擾,就會出現(xiàn)數(shù)據(jù)不一致的現(xiàn)象。
3 cache一致性問題的解決方法
該問題可以從軟件及硬件兩方面著手解決。
3.1 軟件解決的方法
s3c44b0x的cache提供完整的cache使能和禁止操作模式。能夠通過設(shè)置syscfg寄存器中cm域中的值為01或11來使能cache(其中,01為使能4
kb cache, 11為使能8 kb cache),而通過清除syscfg寄存器中[2:1]域?yàn)?來禁止cache功能。用禁止cache的方法來消除數(shù)據(jù)不一致性問題,具體代碼如下:
#define rsyscfg(*(volatile unsigned *)0x1c00000)
#define wrbufopt (0x8) //write_buf_on
#define syscfg_0kb (0x0|wrbufopt)
#define syscfg_4kb (0x2|wrbufopt)
#define syscfg_8kb (0x6|wrbufopt)
#define cachecfgsyscfg_0kb
rsyscfg= cachecfg; //禁止cache
另外,s3c44b0x還提供了2個(gè)不能cache訪問的區(qū)域(noncacheable area)。每個(gè)區(qū)域要求兩個(gè)cache控制域,用來表明每一個(gè)不能cache訪問區(qū)域的起始和結(jié)束地址。在不能cache訪問的區(qū)域,當(dāng)cache沒有命中,一個(gè)讀的時(shí)候,cache不能更新。在已知影響到數(shù)據(jù)不一致的地址情況下,可以在使能cache的條件下,用設(shè)定不能cache訪問區(qū)域的方法,防止產(chǎn)生數(shù)據(jù)不一致現(xiàn)象。有時(shí),如果數(shù)據(jù)區(qū)域被安排在不能cache區(qū)域,程序執(zhí)行速度更高,因?yàn)槎鄶?shù)變量是不能重用的。對于不能重用的變量,刷新16
b的cache存儲器是浪費(fèi)的。本系統(tǒng)中設(shè)定不能cache訪問的區(qū)域?yàn)?x2000000~0xc000000,就可以解決數(shù)據(jù)不一致問題。代碼如下:
#define rsyscfg(*(volatile unsigned *)0x1c00000)
#define wrbufopt (0x8) //write_buf_on
#define syscfg_0kb (0x0|wrbufopt)
#definesyscfg_4kb (0x2|wrbufopt)
#define syscfg_8kb (0x6|wrbufopt)
#define cachecfg syscfg_8kb
#define rncachbe0 (*(volatile unsigned *)0x1c00004)
#define rncachbe1 (*(volatile unsigned *)0x1c00008)
#define non_cache_start(0x2000000)
//不能cache訪問的區(qū)域開始地址
#define non_cache_end(0xc000000)
//不能cache訪問的區(qū)域結(jié)束地址
rsyscfg= cachecfg;
// 8 kb cache,寫緩沖使能,data abort使能
rncachbe0= ((non_cache_end>>12)<<16)|(non_cache_start>>12);//在上面的數(shù)據(jù)區(qū)域不使用高速緩存cache
采用上述兩種方法,排除了數(shù)據(jù)不一致性的問題。但一個(gè)高性能的系統(tǒng)是需要cache的,禁止cache的使用會大大降低系統(tǒng)的性能。所以,在嵌入式系統(tǒng)的設(shè)計(jì)中,還應(yīng)從硬件方面考慮,從根本上防止數(shù)據(jù)不一致的產(chǎn)生。
3.2 硬件的解決方法
由于現(xiàn)在的嵌入式處理器,主頻越來越高,地址、數(shù)據(jù)線越來越多,所以在硬件的設(shè)計(jì)和焊接過程中應(yīng)特別注意高頻干擾的問題。因?yàn)楦哳l干擾可以引起信號的不完整性,這些不完整的信號會引起總線傳輸過程中出現(xiàn)一些壞字節(jié),所以高速pcb設(shè)計(jì)變得尤為重要。高速pcb設(shè)計(jì)中,對高速信號網(wǎng)絡(luò)的特征與走線控制的設(shè)計(jì)技術(shù),已成為高速數(shù)字設(shè)備成功與否的關(guān)鍵。在設(shè)計(jì)中應(yīng)注意下列問題:
① 在成本允許的條件下, pcb盡量采用多層板布線。
② 高頻電路布線的引線最好采用全直線,需要轉(zhuǎn)折時(shí),可以用45°折線或圓弧轉(zhuǎn)折。在高頻電路中,滿足這一要求可以減少高頻信號對外的發(fā)射和相互間的耦合。
③ 高頻電路器件引腳的引線層間的交替越少越好,過孔越少越好。據(jù)測,一個(gè)過孔可帶來約0.5 pf的分布電容,減少過孔數(shù)量能顯著提高速度。
④ 高頻電路布線要注意信號線近距離平行走線所引入的“交叉干擾”,若無法避免平行分布,可在平行信號線的反面布置大面積“地”來減少干擾。同一層內(nèi)的平行走線幾乎無法避免,但是在相鄰的兩個(gè)層,走線的方向務(wù)必取為相互垂直。
⑤ 每個(gè)集成電路塊的附近應(yīng)設(shè)置一個(gè)高頻退耦電容。
⑥ 模擬電路和數(shù)字電路部分,應(yīng)有各自獨(dú)立的地線。
⑦ 對特別重要的信號線或局部單元實(shí)施地線包圍的措施,各類信號走線不能形成環(huán)路,地線也不能形成電流環(huán)路。
在注意了上面的設(shè)計(jì)規(guī)則之后,制作出的pcb基本上可以滿足高速信號的要求。
最后,就是在焊接時(shí)要注意焊點(diǎn)一定要圓滑。因?yàn)楹更c(diǎn)的尖峰會產(chǎn)生很強(qiáng)的高頻干擾。
有了上述各條規(guī)則,就保證了在信號傳輸過程中,總線上不會出現(xiàn)不必要的干擾,防止了數(shù)據(jù)不一致的發(fā)生。
結(jié)語
嵌入式處理器已經(jīng)被廣泛應(yīng)用。本文提到的對s3c44b0x中cache數(shù)據(jù)不一致性的處理方法同樣適用于其他型號的高頻嵌入式處理器。掌握一些設(shè)計(jì)、調(diào)試的基本經(jīng)驗(yàn),可以大大提高工作效率,減小系統(tǒng)開發(fā)過程中不必要的麻煩。
評論