基于ARM體系的嵌入式系統(tǒng)BSP的程序設(shè)計(jì)方案
BSP(Board Support Package)板級(jí)支持包介于主板硬件和操作系統(tǒng)之間,其功能與PC機(jī)上的BIOS相類似,主要完成硬件初始化并切換到相應(yīng)的操作系統(tǒng)。BSP是相對(duì)于操作系統(tǒng)而言的,不同的操作系統(tǒng)對(duì)應(yīng)于不同定義形式的BSP,例如VxWorks的BSP和Linux的BSP相對(duì)于某一CPU來(lái)說(shuō),盡管實(shí)現(xiàn)的功能一樣,可是寫法和接口定義是完全不同的。另外,仔細(xì)研究所用的芯片資料也十分重要,例如盡管ARM在內(nèi)核上兼容,但每家芯片都有自己的特色。所以這就要求BSP程序員對(duì)硬件、軟件和操作系統(tǒng)都要有一定的了解。
本文介紹基于ARM體系的嵌入式應(yīng)用系統(tǒng)初始化部分BSP的程序設(shè)計(jì)。本文引用的源碼全部是基于HMS320C7202芯片設(shè)計(jì),并已成功運(yùn)行。
1 初始化過(guò)程
盡管各種嵌入式應(yīng)用系統(tǒng)的結(jié)構(gòu)及功能差別很大,但其系統(tǒng)初始化部分完成的操作有很大一部分是相似的。嵌入式系統(tǒng)的啟動(dòng)流程如圖1所示。
1.1 設(shè)置入口指針
啟動(dòng)程序首先必須定義指針,而且整個(gè)應(yīng)用程序只有一個(gè)入口指針。一般地,程序在編譯鏈接時(shí)將異常中斷向量表鏈接在0地址處,并且作為整個(gè)程序入口點(diǎn)。入口點(diǎn)代碼如下:
ENTRY(_start) ;開(kāi)始
1.2 設(shè)置異常中斷向量表
ARM要求中斷向量表必須放置在從0開(kāi)始、連續(xù)8×4字節(jié)的空間內(nèi)。各異常中斷向量地址以及中斷的算是優(yōu)先級(jí)如表1:
表1 各異常中斷的中斷向量地址以及中斷的處理優(yōu)先級(jí)
中斷向量地址 異常中斷類型 異常中斷模式 優(yōu)先級(jí)(6最低)
0x0 復(fù)位 特權(quán)模式(SVC) 1
0x4 未定義中斷 未定義指令中止模式(Undef) 6
0x8 軟件中斷(SWI) 特權(quán)模式(SVC) 6
0x0c 指令預(yù)取中止 中止模式 5
0x10 數(shù)據(jù)訪問(wèn)中止 中止模式 2
0x14 保留 未使用 未使用
0x18 外部中斷請(qǐng)求(IRQ) 外部中斷(IRQ)模式 4
0x1c 快速中斷請(qǐng)求(FIQ) 快速中斷(FIQ)模式 3
每當(dāng)一個(gè)中斷發(fā)生后,ARM處理器便強(qiáng)制把程序計(jì)數(shù)器(PC)指針置為向量表中對(duì)應(yīng)中斷類型的地址值。因?yàn)槊總€(gè)中斷向量?jī)H占據(jù)放置1條ARM指令的空間,所以通常放置1條跳轉(zhuǎn)指令或向程序計(jì)數(shù)器(PC)寄存器賦值的數(shù)據(jù)訪問(wèn)指令,使程序跳轉(zhuǎn)到相應(yīng)的異常中斷處理程序執(zhí)行。如果異常中斷處理程序起始地址小于32MB,使用B跳轉(zhuǎn)指令;如果跳轉(zhuǎn)范圍大于32MB,使用LDR指令。
另外,對(duì)于各未用中斷,可使其指向一個(gè)只含返回指令的啞函數(shù),以防止錯(cuò)誤中斷引起系統(tǒng)的混亂。
1.3 初始化存儲(chǔ)系統(tǒng)
初始化存儲(chǔ)系統(tǒng)的編程對(duì)象是系統(tǒng)的存儲(chǔ)器控制器,一個(gè)系統(tǒng)可能存在多種存儲(chǔ)器類型的接口,不同的存儲(chǔ)系統(tǒng)的設(shè)計(jì)不盡相同。Flash和SRAM同屬于靜態(tài)存儲(chǔ)器類型,可以合用一個(gè)存儲(chǔ)器端口;而DRAM因?yàn)橛袆?dòng)態(tài)刷新和地址線復(fù)用等特性,通常配有專用的存儲(chǔ)器端口。其中,SDRAM必須在初始化階段進(jìn)行設(shè)置,因?yàn)榇蟛糠值某绦虼a和數(shù)據(jù)都要在SDRAM中運(yùn)行。
在HMS30C7202中,與SDRAM配置有關(guān)的寄存器有4個(gè):配置寄存器、刷新定時(shí)寄存器、寫緩沖寫回寄存器和等待驅(qū)動(dòng)寄存器,需要根據(jù)實(shí)際的系統(tǒng)設(shè)計(jì)對(duì)此分別加以正確配置。
SDRAM的初始化過(guò)程如下:加電→延遲10ms(各具體SDRAM器件延時(shí)時(shí)間可能不同)→設(shè)置配置寄存器參數(shù)→延時(shí)→寫刷新定時(shí)寄存器,設(shè)置刷新周期→延時(shí)→使能自動(dòng)刷新→延時(shí)→設(shè)置模式寄存器(位于SDRAM內(nèi)部)。
1.4 存儲(chǔ)器地址分布重映射(remap)和MMU
系統(tǒng)一上電,程序?qū)⒆詣?dòng)從0地址處開(kāi)始執(zhí)行。因此,必須保證在0地址處存在正確的代碼,即要求0地址開(kāi)始入是非易失性的ROM或Flash等。但是因?yàn)镽OM或Flash的訪問(wèn)速度相對(duì)較慢,每次中斷響應(yīng)發(fā)生后,都要從讀取ROM或Flash上面的向量表開(kāi)始,影響了中斷響應(yīng)速度。一般程序執(zhí)行后將SDRAM映射為地址0,并把系統(tǒng)程序加載到SDRAM中運(yùn)行,其具體步驟可以采用以下的方案:
(1)上電后,從0地址的ROM開(kāi)始往下執(zhí)行;
(2)根據(jù)映射前的地址,對(duì)SDRAM進(jìn)行必要的代碼和數(shù)據(jù)拷貝;
(3)拷貝完成后,進(jìn)行重映射操作;
(4)因?yàn)镽AM在重映射前準(zhǔn)備好了內(nèi)容,使得PC指針能繼續(xù)在RAM里取得正確的指令。
在這種地址映射的變化過(guò)程中,程序員需要仔細(xì)考慮的是:程序的執(zhí)行流程不能被這種變化所打斷,注意保證程序流程在重映射前后的承接關(guān)系。
存儲(chǔ)器的地址分配是很靈活的,可以將I/O操作映射成內(nèi)存操作,也可以通過(guò)映射對(duì)某些不可訪問(wèn)的地址空間進(jìn)行保護(hù)等。進(jìn)行存儲(chǔ)器初始化設(shè)計(jì)時(shí),一定要根據(jù)應(yīng)用程序的具體要求來(lái)完成地址分配。對(duì)地址管理通過(guò)MMU即存儲(chǔ)器管理單元實(shí)現(xiàn)。
在ARM系統(tǒng)中,MMU通過(guò)頁(yè)式虛擬存儲(chǔ)管理,將虛擬空間和物理空間分別分成一個(gè)個(gè)固定大小的頁(yè),并建立兩者之間的映射關(guān)系,從而實(shí)現(xiàn)虛擬地址到物理地址的轉(zhuǎn)換。MMU還可完成存儲(chǔ)器訪問(wèn)權(quán)限的控制和虛擬存儲(chǔ)器空間緩沖特性的設(shè)置。
以下是實(shí)現(xiàn)MMU的部分代碼:
for=(i=1;i0x1000;i++){
pagetable[i]=(i20)|MMU_SECDESC;
} //建立頁(yè)表,每頁(yè)大小為1MB,頁(yè)表偏移序號(hào)是物理地址的高12位;
for(addr=SDRAM_BASE;addr(SDRAM_BASE+SDRAM_SIZE/2);addr+=SIZE_1M)
pagetable[addr>>20]=addr|MMU_SECDESE|
MMU_CACHEABLE|MMU_BUFFERABLE;
//將SDRAM_BASE至(SDRAM_BASE+SDRAM_SIZE/2)空間的設(shè)置為不可CACHE和不可BUFFER的
for(addr=SDRAM_BASE+SDRAM_SIZE/2;addr(SDRAM_BASE+SDRAM_SIZE);addr+=SIZE_1M)
pagetable[addr>>20]=(addr+0x1000000)|
MMU_SECDESC|MMU_CACHEABLE|MMU_BUFFERABLE;
//將這段空間的地址映射關(guān)系設(shè)置為VA(虛擬地址)=PA(物理地址)+0x1000000
pagetable[0]=(0x42f00000)|MMU_SECDESC|MMU_CACHEABLE|MMU_BUFFERABLE;
//將SDRAM的虛擬地址0x42f00000映射到0處
1.5 初始化各模式下的堆棧指針
因?yàn)锳RM處理器有7種執(zhí)行狀態(tài),每一種狀態(tài)的堆棧指針寄存器(SP)都是獨(dú)立的(System和User三項(xiàng)式使用相同SP寄存器)。因此,對(duì)程序中需要用到的每一種模式都要給SP寄存器定義一個(gè)堆棧地址。方法是改變狀態(tài)寄存器(CPSR)內(nèi)的狀態(tài)位,使處理器切換到不同的狀態(tài),然后給SP賦值。這里列出的代碼定義了三種模式的SP指針,其中,I_Bit表示IRQ的中斷禁止位;F_Bit表示FIQ的中斷禁止位:
@;Set up SVC stack to be 4K on top of zero-init data
LDR r1,=installStack
ADDsp,r1,#2048
@;Set up IRQ and FIQ stacks
MOV r0,#(Mode_IRQ32|I_Bit)
MSRcpsr,r0
MOV r0,r0
ADDsp,r1,#2048*2
MOV r0,#(Mode_FIQ32|I_Bit |F_Bit)
MSR cpsr,r0
MOV r0,r0
ADDsp,r1,#2048*3
一般堆棧的大小要根據(jù)需要而定,但是要盡可能給堆棧分配快速和高帶寬的存儲(chǔ)器。堆棧性能的提高對(duì)系統(tǒng)性能的影響是非常明顯的。
1.6 初始化有特殊要求的端口、設(shè)備
有些關(guān)鍵的I/O部件必須在使能IRQ和FIQ之前進(jìn)行初始化。因?yàn)槿绻谑鼓躀RQ和FIQ之前沒(méi)有進(jìn)行初始化,可以產(chǎn)生假的異常中斷信號(hào)。程序中初始化了HMS30C7202的串口1用來(lái)調(diào)試程序與其它設(shè)備通信。串口1是一個(gè)通用全雙工異步接收/發(fā)送器(UART),它支持16C550的大部分功能。UART有接收緩沖/發(fā)送保持寄存器、波特率除數(shù)鎖存器、中斷允許寄存器等9個(gè)寄存器。對(duì)串口1的初始化主要是對(duì)各寄存器的設(shè)置,其實(shí)現(xiàn)代碼如下所示:
_outb(ser_base+0x30,1);
_outw(0x8002301c,0xffff9f9f) ;GPIO PORT A Enable
Register
_outw(0x800230A4,0x6060) ;GPIO PORT A MultiFunction elect-Register
serial_outb(SERIAL_LCR,0x80);
serial_outb(SERIAL_LCR,0x80);
serial_outb(SERIAL_DLL,baud_data[cur_baud]);
serial_outb(SERIAL_DLM,0x0);
serial_outb(SERIAL_LCR,0x03);
seial_outb(SERIAL_FCR,0x01);
serial_outb(SERIAL_IER,0x00);
serial_outb(SERIAL_MCR,0x03);
1.7 切換處理器模式,開(kāi)中斷
最后轉(zhuǎn)換到應(yīng)用程序運(yùn)行所需的最終模式,一般是User模式。不要過(guò)早切換到User模式進(jìn)行User模式的堆棧設(shè)備。因?yàn)檫M(jìn)入U(xiǎn)ser模式后就不能再操作CPRS回到別的模式了,可能會(huì)對(duì)接下去的程序執(zhí)行造成影響。
這時(shí)才使能異常中斷,通過(guò)清除CPRS寄存器中的中斷禁止位實(shí)現(xiàn)。如果過(guò)早地開(kāi)中斷,在系統(tǒng)初始化之前就觸發(fā)了有效中斷,會(huì)導(dǎo)致系統(tǒng)的死機(jī)。
1.8 呼叫主應(yīng)用程序
當(dāng)所有的系統(tǒng)初始化工作完成后,就需要把程序流程轉(zhuǎn)入主應(yīng)用程序。
圖2
2 技術(shù)難點(diǎn)分析
2.1 多種語(yǔ)言的混合編程
ARM有兩種匯編指令集:16位THUMB指令集和32位ARM指令集。使用16位的寄存器可以降低成本,而且16位THUMB指令集整體執(zhí)行速度比ARM 32位指令集快,提高了代碼密度。為了滿足ARM子程序和Thumb子程序互相調(diào)用,必須保證編寫的代碼遵循ATPCS。ATPCS規(guī)定了子程序調(diào)用的基本規(guī)則。
ARM系統(tǒng)結(jié)構(gòu)也支持C、C++以及匯編語(yǔ)言的混合編程。匯編語(yǔ)言和C/C++語(yǔ)言的混合編程,在一個(gè)追求效率的程序中比較常見(jiàn)。許多人認(rèn)為像BSP這樣底層的程序應(yīng)該用純匯編語(yǔ)言編寫,其實(shí)不然。用匯編語(yǔ)言編寫的程序可讀性不高,而且不宜維護(hù),不便于向其它類型的CPU移植,而這些方面卻是C語(yǔ)言程序的優(yōu)勢(shì)。BSP能否用純C語(yǔ)言去寫呢?也不行。因?yàn)槟承┎僮魇怯肅實(shí)現(xiàn)不了的。例如操作特殊寄存器的指令、CP15寄存器的指令、中斷使能及堆棧地址的設(shè)定等。在匯編和C/C++之間的函數(shù)調(diào)用時(shí),也要遵循ATPCS的定義,還要注意的是用C語(yǔ)言編寫嵌入式程序時(shí),要避免使用不能被固化到ROM中的庫(kù)函數(shù)。
混合編程情況下的程序編譯及鏈接后的輸出代碼與沒(méi)有混合編程時(shí)是不同的。所以當(dāng)多個(gè)源文件如果使用了不同的設(shè)置進(jìn)行編譯,相互之間的調(diào)用可能產(chǎn)生兼容性問(wèn)題,對(duì)此一定要加以仔細(xì)考慮。編譯時(shí),要告訴編譯器和鏈接器足夠的信息,一方面,讓編譯器能夠使用正確的指令碼進(jìn)行編譯;另一方面,在不同的狀態(tài)之間發(fā)生函數(shù)調(diào)用時(shí),鏈接器將插入一段鏈接代碼(veneers)來(lái)實(shí)現(xiàn)狀態(tài)轉(zhuǎn)換。
2.2 MMU的實(shí)現(xiàn)過(guò)程
頁(yè)表是實(shí)現(xiàn)MMU的重要手段。頁(yè)表存放在內(nèi)存中,從虛擬地址到物理地址的變換過(guò)程其實(shí)就是查詢頁(yè)表的過(guò)程。大小為1MB的存儲(chǔ)塊通常被稱為段,圖2說(shuō)明了如何查表進(jìn)行段式尋址的全過(guò)程:32位的虛擬地址可分為12位的一級(jí)頁(yè)表序號(hào)和20位的段內(nèi)地址偏移。12位的一級(jí)頁(yè)表序號(hào)和CP15寄存器的C2中的18位變換表基址合并成一級(jí)描述符地址查表找出相應(yīng)的一級(jí)描述符;然后,段對(duì)應(yīng)的物理基地址與段內(nèi)地址偏移量合并成為真正的存儲(chǔ)器存取地址即物理地址,讀出相應(yīng)數(shù)據(jù)。
本文介紹的BSP程序已經(jīng)在以HMS30C7202為主芯片的開(kāi)發(fā)系統(tǒng)上運(yùn)行并測(cè)試通過(guò),并且成功地引導(dǎo)了Linux內(nèi)核,文中引用代碼可以直接使用。今后可以在此基礎(chǔ)上添加命令行解釋程序,在引導(dǎo)操作系統(tǒng)前進(jìn)行存存儲(chǔ)器的讀寫等,擴(kuò)展開(kāi)發(fā)系統(tǒng)的功能。
評(píng)論