嵌入式操作系統(tǒng)的調試
調試是開發(fā)過程中必不可少的環(huán)節(jié),通用的桌面操作系統(tǒng)與嵌入式操作系統(tǒng)在調試環(huán)境上存在明顯的差別。前者,調試器與被調試的程序往往是運行在同一臺機器、相同的操作系統(tǒng)上的兩個進程,調試器進程通過操作系統(tǒng)專門提供的調用接口(早期UNIX系統(tǒng)的ptrace調用、如今的進程文件系統(tǒng)等)控制、訪問被調試進程。后者(又稱為遠程調試),為了向系統(tǒng)開發(fā)人員提供靈活、方便的調試界面,調試器還是運行于通用桌面操作系統(tǒng)的應用程序,被調試的程序則運行于基于特定硬件平臺的嵌入式操作系統(tǒng)(目標操作系統(tǒng))。這就帶來以下問題:調試器與被調試程序如何通信,被調試程序產生異常如何及時通知調試器,調試器如何控制、訪問被調試程序,調試器如何識別有關被調試程序的多任務信息并控制某一特定任務,調試器如何處理某些與目標硬件平臺相關的信息(如目標平臺的寄存器信息、機器代碼的反匯編等)。
我們介紹兩種遠程調試的方案,看它們怎樣解決這些問題。
調試方案
一 插樁(stub)
第一種方案是在目標操作系統(tǒng)和調試器內分別加入某些功能模塊,二者互通信息來進行調試。上述問題可通過以下途徑解決:
調試器與被調試程序的通信調試器與目標操作系統(tǒng)通過指定通信端口(串口、網卡、并口)遵循遠程調試協(xié)議進行通信。被調試程序產生異常及時通知調試器目標操作系統(tǒng)的所有異常處理最終都要轉向通信模塊,告知調試器當前的異常號;調試器據此向用戶顯示被調試程序產生了哪一類異常。
調試器控制、訪問被調試程序 調試器的這類請求實際上都將轉換成對被調試程序的地址空間或目標平臺的某些寄存器的訪問,目標操作系統(tǒng)接收到這樣的請求可以直接處理。對于沒有虛擬存儲概念的簡單的嵌入式操作系統(tǒng)而言,完成這些任務十分容易。
調試器識別有關被調試程序的多任務信息并控制某一特定任務由目標操作系統(tǒng)提供相關接口。目標系統(tǒng)根據調試器發(fā)送的關于多任務的請求,調用該接口提供相應信息或針對某一特定任務進行控制,并返回信息給調試器。
調試器處理與目標硬件平臺相關的信息 第2條所述調試器應能根據異常號識別目標平臺產生異常的類型也屬于這一范疇,這類工作完全可以由調試器獨立完成。支持多種目標平臺正是GNU GDB的一大特色。
綜上所述,這一方案需要目標操作系統(tǒng)提供支持遠程調試協(xié)議的通信模塊(包括簡單的設備驅動)和多任務調試接口,并改寫異常處理的有關部分。另外目標操作系統(tǒng)還需要定義一個設置斷點的函數;因為有的硬件平臺提供能產生特定調試陷阱異常(debug trap)的斷點指令以支持調試(如X86的INT 3),而另一些機器沒有類似的指令,就用任意一條不能被解釋執(zhí)行的非法(保留)指令代替。目標操作系統(tǒng)添加的這些模塊統(tǒng)稱為"插樁"(見下圖),駐留于ROM中則稱為ROM monitor。通用操作系統(tǒng)也有具備這類模塊的:編譯運行于Alpha、Sparc或PowerPC平臺的LINUX內核時若將kgdb開關打開,就相當于加入了插樁。
運行于目標操作系統(tǒng)的被調試的應用程序要在入口處調用這個設置斷點的函數以產生異常,異常處理程序調用調試端口通信模塊,等待主機(host)上的調試器發(fā)送信息。雙方建立連接后調試器便等待用戶發(fā)出調試命令,目標系統(tǒng)等待調試器根據用戶命令生成的指令。這一過程如下圖所示。
{{分頁}}
這一方案的實質是用軟件接管目標系統(tǒng)的全部異常處理(exception handler)及部分中斷處理,在其中插入調試端口通信模塊,與主機的調試器交互。它只能在目標操作系統(tǒng)初始化,特別是調試通信端口初始化完成后才起作用,所以一般只用于調試運行于目標操作系統(tǒng)之上的應用程序,而不宜用來調試目標操作系統(tǒng),特別是無法調試目標操作系統(tǒng)的啟動過程。而且由于它必然要占用目標平臺的某個通信端口,該端口的通信程序就無法調試了。最關鍵的是它必須改動目標操作系統(tǒng),這一改動即使沒有對操作系統(tǒng)在調試過程中的表現(xiàn)造成不利影響,至少也會導致目標系統(tǒng)多了一個不用于正式發(fā)布的調試版。
二 片上調試(On Chip Debugging)及Embedded PowerPC Background Debug Mode
片上調試是在處理器內部嵌入額外的控制模塊,當滿足了一定的觸發(fā)條件時進入某種特殊狀態(tài)。在該狀態(tài)下,被調試程序停止運行,主機的調試器可以通過處理器外部特設的通信接口訪問各種資源(寄存器、存儲器等)并執(zhí)行指令。為了實現(xiàn)主機通信端口與目標板調試通信接口各引腳信號的匹配,二者往往通過一塊簡單的信號轉換電路板連接(如下圖所示)。內嵌的控制模塊以基于微碼的監(jiān)控器(microcode monitor)或純硬件資源的形式存在,包括一些提供給用戶的接口(如斷點寄存器等)。具體產品有Motorola CPU16、CPU32、Coldfire系列的BDM(Background Debug Mode),Motorola PowerPC 5xx、8xx系列的EPBDM(Embedded PowerPC Background Debug Mode),IBM、TI的JTAG(Joint Test Action Debug,IEEE標準),還有OnCE、MPSD等等。下面以MPC860的EPBDM為例介紹片上調試方式?!?BR>
EPBDM的運作相當于用處理器內嵌的調試模塊接管中斷及異常處理。用戶通過設置調試許可寄存器(debug enable register)來指定哪些中斷或異常發(fā)生后處理器直接進入調試狀態(tài),而不是操作系統(tǒng)的處理程序。進入調試狀態(tài)后,內嵌調試模塊向外部調試通信接口發(fā)出信號,通知一直在通信接口監(jiān)聽的主機調試器,然后調試器便可通過調試模塊使處理器執(zhí)行任意系統(tǒng)指令(相當于特權態(tài))。所有指令均通過調試模塊獲取,所有l(wèi)oad/store 均直接訪問內存,緩存(cache)及存儲管理單元(MMU)均不可用;數據寄存器被映射為一個特殊寄存器DPDR,通過mtspr和mfspr指令訪問。調試器向處理器送rfi(return from interrupt)指令便結束調試狀態(tài),被調試程序繼續(xù)運行。
與插樁方式的缺點相對應,OCD不占用目標平臺的通信端口,無需修改目標操作系統(tǒng),能調試目標操作系統(tǒng)的啟動過程,大大方便了系統(tǒng)開發(fā)人員。隨之而來的缺點是軟件工作量的增加:調試器端除了需補充對目標操作系統(tǒng)多任務的識別、控制等模塊,還要針對使用同一芯片的不同開發(fā)板編寫各類ROM、RAM的初始化程序。
下面就以調試運行于MPC860的LINUX為例,說明用OCD方式調試OS 啟動的某些關鍵細節(jié)。
首先,LINUX內核模塊以壓縮后的zImage形式駐留于目標板的ROM,目標板上電后先運行ROM中指定位置的程序將內核移至RAM并解壓縮,然后再跳轉至內核入口處運行。要調試內核,必須在上電后ROM中的指令執(zhí)行之前獲得系統(tǒng)的控制權,即進入調試狀態(tài)、設斷點,這樣才能開展調試過程。MPC860的EPBDM提供了這一手段。
MPC860沒有類似X86的INT 3那樣能產生特定調試陷阱異常的指令,而操作系統(tǒng)內核往往具有針對非法指令的異常處理;為了使對內核正常運行的干擾降至最小,調試時應盡量設置硬件斷點,而不是利用非法指令產生異常的"軟"斷點。
LINUX實現(xiàn)了虛存管理,嵌入式LINUX往往也有這一功能。地址空間從實到虛的轉換在內核啟動過程中便完成了,不論調試內核還是應用程序,調試器都無法回避對目標系統(tǒng)虛地址空間的訪問,否則斷點命中時根本無法根據程序計數器的虛地址顯示當前指令,更不用說訪問變量了。由于調試狀態(tài)下轉換旁視緩沖器(Translation Lookaside Buffer)無法利用,只能仿照LINUX內核TLB失效時的異常處理程序,根據虛地址中的頁表索引位訪問特定寄存器查兩級頁表得出物理頁面號,從而完成虛實地址的轉換。MPC860采用哈佛結構(Harvard architecture),指令和數據緩存分離設置(因為程序的指令段和數據段是分離的,這種結構可以消除取指令和訪問數據之間的沖突),二者的TLB也分離設置;然而TLB失效時查找頁表計算物理地址的過程是相同的,因為頁表只有一個,不存在指令、數據分離的問題。虛實地址轉換這一任務雖然完全落在了調試器一方,由于上述原因,再加上調試對象是嵌入式系統(tǒng),一般不會有外存設備,不必考慮內存訪問缺頁的情況,所以增加的工作量并不大。
深入話題
傳統(tǒng)的調試方法可概括為如下過程:設斷點--程序暫停--觀察程序狀態(tài)--繼續(xù)運行。被調試的如果是實時系統(tǒng),即使調試器支持批處理命令避免了用戶輸入命令、觀察結果帶來的延遲,它與目標系統(tǒng)之間的通信也完全可能錯過對目標平臺外設信號的響應。于是,針對某些調試器(如GDB)提供的監(jiān)視點(trace point)這一特殊調試手段,目標方的插樁在原有的基礎上被改進,稱為代理(agent)。調試時用戶首先在調試器設置監(jiān)視點,以源代碼表達式的形式指定感興趣的對象名。為了減少代理解析表達式的工作,調試器將表達式轉換為簡單的字節(jié)碼,傳送至代理。程序運行后命中監(jiān)視點、喚醒代理,代理根據字節(jié)碼記錄用戶所需數據存入特定緩沖區(qū)(不僅僅是表達式的最終結果,還有中間結果),令程序繼續(xù)運行;這一步驟無需與調試器通信。當調試器再度得到控制時,就可以發(fā)出命令,向代理查詢歷次監(jiān)視記錄。較之于插樁,代理增加了對接受到的字節(jié)碼的分析模塊,相應的目標代碼體積只有大約3K字節(jié);當然,監(jiān)視記錄緩沖區(qū)也要占用目標平臺的存儲空間,不過緩沖區(qū)的大小可在代理生成時由用戶決定??傊?,這一改進以有限的目標系統(tǒng)資源為代價,為實時監(jiān)視提供了一個低成本的可行方案。
{{分頁}}
調試并不僅僅意味著設斷點--程序暫停--觀察--繼續(xù)這一過程,往往還需要profiling、跟蹤(trace)等多種手段,而現(xiàn)代微處理器的技術進步卻為這些調試手段的實行帶來了困難。以跟蹤為例,其目的無非是記錄真實的程序運行流;可現(xiàn)代處理器指令緩存都集成于芯片內(RISC處理器尤為如此),運行指令時"取指"這一操作大多在芯片內部針對指令緩存進行,芯片外部總線上只能觀察到多條指令的預?。╬refetch),預取的指令并不一定執(zhí)行(由于跳轉等原因);另外,指令往往經過動態(tài)調度后在流水線中亂序執(zhí)行,如何再現(xiàn)其原始順序也是個問題。解決方案大致有以下三種:
有的處理器除了正常運行外,還能以串行方式運行,所有的取指周期都可呈現(xiàn)于片外總線(相當于禁用緩存與流水線)。這樣一來,跟蹤容易多了,處理器性能也大大降低了,根本不適用于實時要求嚴格的系統(tǒng)。
編譯器自動在指定的分支及函數出入口插入對特定內存區(qū)域的寫指令(與gprof等profiling工具采用的手段類似),它們都是不通過緩存而直接向內存寫的,這就能反映于芯片外總線從而被外接的邏輯分析儀記錄,最終由主機端的調試工具分析并結合符號表重構程序流。這種方法雖被廣泛使用,但畢竟是干擾式的(intrusive),對系統(tǒng)性能也有影響。
像上文所述的片上調試那樣,也有處理器在片內附加了跟蹤電路,收集程序流運行時的"不連貫"(discontinuities)信息(分支和異常處理的跳轉目的及源地址等),壓縮后送至特定端口,再由邏輯分析儀捕獲送至主機端調試工具重構程序流。該方案對系統(tǒng)性能影響最小。
總之,處理器廠家提供集成于片內的調試電路為高檔嵌入式系統(tǒng)開發(fā)提供各種非干擾式的調試手段早已是大勢所趨。為了解決該領域標準化的需要,一些處理器廠家、工具開發(fā)公司和儀器制造商于1998年組成了Nexus 5001 Forum,這是一個旨在為嵌入式控制應用產生和定義嵌入式處理器調試接口標準的聯(lián)合組織,以前的名稱是Global Embedded Processor Debug Interface Standard Consortium(全球嵌入式處理器調試接口標準協(xié)會)。Nexus現(xiàn)在有24個成員單位,包括創(chuàng)始成員Motorola、Infineon Technologies、日立、ETAS和HP等公司。該組織首先處理的是汽車動力應用所需要的調試,現(xiàn)在已發(fā)展成為調試數據通信、無線系統(tǒng)和其他實時嵌入式應用的通用接口。
參考資料
MPC860 PowerQUICC User's Manual MOTOROLA
http://www.vas-gmbh.de/software/mpcbdm/
http://www.metrowerks.com/tools/documentation/embedded/zenofbdm
http://www.redhat.com/support/wpapers/cygnus_heinsenberg/trace.html
http://www.ednmag.com/reg/2000/05112000/10tt.htm
關于作者
熊競,任職于中科院計算所嵌入式系統(tǒng)軟件組。主要從事開發(fā)嵌入式操作系統(tǒng)的仿真器、調試器及集成開發(fā)環(huán)境。您可以通過電子郵件 jxiong@ict.ac.cn與他聯(lián)系。
評論