嵌入式Linux系統(tǒng)小型化技術(shù)
作者Email: zhh@httc.cn
介紹了Linux在嵌入式領(lǐng)域中的應(yīng)用和宿主機(jī)、目標(biāo)機(jī)開發(fā)模式,詳細(xì)地給出了精簡內(nèi)核的實(shí)現(xiàn)過程。分析了glibc系統(tǒng)庫和ELF文件格式的結(jié)構(gòu)和其中的共享庫裁剪技術(shù)的原理,提出并實(shí)現(xiàn)了一種庫裁剪方案。
關(guān)鍵詞嵌入式;Linux;小型化
一、 概述
嵌入式Linux一般是指對標(biāo)準(zhǔn)Linux發(fā)行版本進(jìn)行小型化裁剪處理之后,適合于特定嵌入式應(yīng)用場合的專用Linux操作系統(tǒng)。嵌入式系統(tǒng)通常是資源受限的系統(tǒng),無論是處理器計(jì)算能力還是RAM或其他存儲器容量都比較“小”。因此,如何創(chuàng)建一個(gè)小型化的Linux作為操作系統(tǒng)開發(fā)成為首先需要考慮的問題。嵌入式Linux系統(tǒng)中普遍采用三層結(jié)構(gòu):核心層主要是Linux內(nèi)核和模塊;調(diào)用接口層是以glibc庫為主的系統(tǒng)庫;應(yīng)用層是根據(jù)用戶需求設(shè)計(jì)的應(yīng)用程序。為了實(shí)現(xiàn)資源的高利用率,后兩層都以ELF文件形式存在,在運(yùn)行過程中對外部功能代碼動態(tài)加載。
一般來說,建立交叉平臺開發(fā)環(huán)境是進(jìn)行嵌入式軟件開發(fā)的第一步。宿主機(jī)與目標(biāo)機(jī)硬件平臺的異構(gòu)(處理器體系結(jié)構(gòu)不同)是采用交叉開發(fā)的根本原因。另外,由于資源有限,直接在嵌入式系統(tǒng)的硬件平臺上開發(fā)軟件不方便、甚至不可能。因此,通常采用Host/Target開發(fā)模式,如表l。
宿主機(jī)(Host) | 目標(biāo)機(jī)(Target) | |
硬件 | PC 或者工作站,其中x86CPU占優(yōu)勢 | 嵌入式系統(tǒng)硬件,處理器多樣化(x86,ARM,PowerPC,MIPS,68K等) |
軟件 | Windows、Linux等桌面操作系統(tǒng),豐富的集成開發(fā)環(huán)境(如WindRiver 的Tornado) | 軟件資源有限,開發(fā)階段通常從宿主機(jī)下載 |
表1 交叉平臺發(fā)環(huán)境的特點(diǎn)
交叉平臺開發(fā)環(huán)境包括交叉編譯器、交叉調(diào)試器和系統(tǒng)仿真器,比如嵌入式Linux開發(fā)經(jīng)常用的GNU工具鏈。開發(fā)者需要根據(jù)目標(biāo)平臺來選擇合適的GNU交叉編譯器,然后在宿主機(jī)上面重新編譯內(nèi)核和其他軟件,這樣得到的目標(biāo)代碼才能拿到目標(biāo)機(jī)上面運(yùn)行。這個(gè)過程相當(dāng)繁瑣且容易出錯(cuò)。宿主機(jī)和目標(biāo)機(jī)一般通過以太網(wǎng)或者串口連接。目前,世界上出現(xiàn)了數(shù)以百計(jì)的嵌入式Linux開發(fā)計(jì)劃和發(fā)行版本,比如:ETLinux,LPR,μC-Linux,ThinLinux等開發(fā)源代碼的項(xiàng)目,如表2所示。
名稱 | 特點(diǎn) |
ETLinux | 設(shè)計(jì)用于在小型工業(yè)計(jì)算機(jī),尤其足PC/104模塊上運(yùn)行 |
Linux Router Project | LPR 的目標(biāo)是用于路由器、接入服務(wù)器、瘦服務(wù)器等網(wǎng)絡(luò)沒備和嵌入式系統(tǒng),可以安裝在一張軟盤上。類似的項(xiàng)目還有Linux On A Floppy(LOAF) |
μC-Linux | 在沒有MMU 的系統(tǒng)L運(yùn)行的Linux。同前支持Motorola DragonBall (M68EZ328), M68328,M68EN322, ColdFire, QUICC, ARM7TDMI,MC68EN302,Axis ETRAX,Inte]i960,PRISMA,Atari 68k等微處理器 |
ThinLinux | 一個(gè)為嵌入式和特定應(yīng)用制作的Linux發(fā)行版,運(yùn)行在Intel和PC兼容硬件上 |
表2 幾種開放源代碼的嵌入式Linux發(fā)行版
另外,還有:Coventive XLinux,LineoEmbedix,LynuxWorks BlueCat,MontaVista Linux等商業(yè)公司的發(fā)行版。同時(shí),針對實(shí)時(shí)環(huán)境,有RT-Linux、RTAI等實(shí)時(shí)擴(kuò)展。近年來,越來越多的目標(biāo)系統(tǒng)選擇了性價(jià)比不斷提高的x86處理器和成熟的PC架構(gòu)作為硬件平臺。LinuxDevices.com網(wǎng)站進(jìn)行的調(diào)查顯示,嵌入式系統(tǒng)開發(fā)者在過去2年和未來2年選擇x86處理器作為目標(biāo)平臺的比例分別為3l%和35%,高居首位。
對于宿主機(jī)和目標(biāo)機(jī)都是PC兼容平臺的開發(fā)者來說,除了沿用上述模式之外,有更簡單的創(chuàng)建小型化Linux系統(tǒng)的方法:以一個(gè)常規(guī)的Linux發(fā)行版為基礎(chǔ),編譯內(nèi)核、復(fù)制所需的文件,并利用初始化RAM盤(initrd:INITial Ram Disk)機(jī)制創(chuàng)建根文件系統(tǒng),就可以快速實(shí)現(xiàn)一個(gè)小型化Linux系統(tǒng)。
二、 小型化技術(shù)
Linux已經(jīng)越來越廣泛地應(yīng)用于各種嵌入式設(shè)備中。但是一般的Linux發(fā)行版都非常龐大,很難用于只有有限存儲空間的嵌入式設(shè)備。所以我們必須對Linux系統(tǒng)進(jìn)行裁剪。Linux系統(tǒng)大致有以下4種主要的裁剪技術(shù),使用這些技術(shù)可以有效地減小系統(tǒng)的尺寸且不會影響系統(tǒng)的性能。① 刪除冗余文件。一般的Linux發(fā)行版中都包含很多幫助文檔、輔助程序、配置文件和數(shù)據(jù)模板,在嵌入式系統(tǒng)中這些文件都是不必要的,完全可以刪除。甚至連配置文件中的大量注釋也都可以被去掉。② 共享庫裁剪。嵌入式系統(tǒng)的應(yīng)用程序是有限的,共享庫中就可能有很多永遠(yuǎn)不會被用到的冗余代碼,這些代碼就可以被刪除。③ 采用具有同樣功能的替代軟件包。Linux上有許多具有相似功能的軟件包,可以選擇其中占存儲空間較小的軟件包并其移植到嵌入式設(shè)備上,用來代替原來占空間較大那些的軟件包。④ 修改源碼。包括重新配置、編譯軟件包,去掉不需要的功能;增加軟件的模塊性,從而有利于提高裁剪效率;重新配置內(nèi)核,去掉不需要的驅(qū)動和模塊。
1、精簡內(nèi)核
與傳統(tǒng)嵌入式操作系統(tǒng)的微內(nèi)核(Micro-kerne1)體系結(jié)構(gòu)不同,Linux內(nèi)核采用的是整體式結(jié)構(gòu)(Monolithic),整個(gè)內(nèi)核是一個(gè)單獨(dú)的、非常大的程序。其優(yōu)點(diǎn)是能夠使系統(tǒng)的各個(gè)部分直接溝通,有效地縮短任務(wù)之間的切換時(shí)間,提高系統(tǒng)響應(yīng)速度。缺點(diǎn)也是明顯的,即內(nèi)核尺寸比較大,因?yàn)長inux內(nèi)核不僅包括如任務(wù)調(diào)度、內(nèi)存管理、中斷處理等基本的操作系統(tǒng)功能,同時(shí)還包括文件系統(tǒng)、網(wǎng)絡(luò)協(xié)議、沒備驅(qū)動程序等功能。
Linux內(nèi)核是高度模塊化、可配置的,通過配置使內(nèi)核具有不同的功能,從而減小內(nèi)核的大小。例如,Linux支持的文件系統(tǒng)種類很多,包括ext2、ext3、FAT、Reiserfs、JFS等??梢愿鶕?jù)實(shí)際情況選擇所需的文件系統(tǒng),比如僅僅把ext2文件系統(tǒng)編譯進(jìn)內(nèi)核。編譯內(nèi)核的主要步驟如下(“#”代表命令提示符):
# cd/usr/src/1inux-2.4
# make menuconfig
# make dep;make clean;make bzlmage
編譯成功的內(nèi)核文件為arch/i386/boot/bzlmage。具體方法參考內(nèi)核源代碼包中的README文件。為了進(jìn)一步增加靈活性、減小內(nèi)核尺寸,Linux還提供了可加載內(nèi)核模塊機(jī)制,內(nèi)核中的很多功能可以編譯為模塊,在內(nèi)核運(yùn)行時(shí)動態(tài)加載,而不是直接編譯進(jìn)內(nèi)核。然而在嵌入式Linux系統(tǒng)中更傾向于根據(jù)需要編譯一個(gè)獨(dú)立的內(nèi)核,較少使用模塊機(jī)制。這樣得到的內(nèi)核通常在幾百kB甚至1MB左右,相對傳統(tǒng)的嵌入式操作系統(tǒng)內(nèi)核來說是比較大的(比如包含文件系統(tǒng)和網(wǎng)絡(luò)支持的VxWorks內(nèi)核大約250kB)。在進(jìn)行內(nèi)核配置時(shí),開發(fā)者要比較了解各功能模塊之間的依賴關(guān)系,否則有可能造成編譯失敗。而在VxWorks內(nèi)核的配置過程中,如果破壞了依賴關(guān)系,有比較明確的指示,從而避免這種錯(cuò)誤。
2、共享庫裁剪
在小型化技術(shù)中,共享庫裁剪容易用軟件實(shí)現(xiàn),做成自動裁剪工具,效果最明顯。下面重點(diǎn)介紹共享庫小型化技術(shù),共享庫小型化的基本思想是通過提取和解析系統(tǒng)庫內(nèi)目標(biāo)文件、符號的依賴關(guān)系,通過對這些依賴構(gòu)造關(guān)系模型進(jìn)行關(guān)系演算,根據(jù)應(yīng)用程序中的符號信息,在庫目標(biāo)文件一級實(shí)現(xiàn)系統(tǒng)庫的小型化.實(shí)現(xiàn)上分為四步:a、確定待調(diào)函數(shù)集。在ELF文件內(nèi)部,存在一個(gè)Elf32-Sym 數(shù)組結(jié)構(gòu)的符號表,用于內(nèi)部符號定義和外部符號引用,通過對這個(gè)符號表的分析可以將ELF應(yīng)用程序中待調(diào)符號(系統(tǒng)函數(shù))抽取出來,從而建立一個(gè)應(yīng)用程序-待調(diào)函數(shù)符號的多對多關(guān)系。b、確定系統(tǒng)庫函數(shù)與目標(biāo)文件的對應(yīng)關(guān)系。系統(tǒng)庫邏輯上分成:庫、目標(biāo)文件、符號三個(gè)層次,庫和目標(biāo)文件都是ELF格式,通過對庫的映像文件*_pic.a和每個(gè)目標(biāo)文件中的符號表分析得到庫。目標(biāo)文件的定義關(guān)系、目標(biāo)文件-符號定義關(guān)系和目標(biāo)文件-符號調(diào)用關(guān)系。c、確定系統(tǒng)庫目標(biāo)文件之間的相互依賴關(guān)系。通過對步驟b中相關(guān)關(guān)系的關(guān)系演算得到目標(biāo)文件-目標(biāo)文件的完全依賴關(guān)系。d、生成小型化系統(tǒng)庫。通過對應(yīng)用程序-待調(diào)符號表和目標(biāo)文件-目標(biāo)文件依賴表的關(guān)系演算得到待調(diào)函數(shù)所依賴的目標(biāo)文件集合,將它們進(jìn)行重新鏈接即可得到最小化的庫文件。
2.1、共享庫裁剪技術(shù)的原理
共享庫中保存著預(yù)先編譯好的目標(biāo)代碼,一般是被應(yīng)用程序反復(fù)使用的公用代碼。在Linux系統(tǒng)中,應(yīng)用程序與庫之間可以靜態(tài)鏈接或動態(tài)鏈接。靜態(tài)鏈接時(shí),鏈接器從庫中選取應(yīng)用程序需要的代碼,然后復(fù)制到生成的可執(zhí)行文件中。顯然,當(dāng)靜態(tài)庫被多個(gè)程序使用時(shí),磁盤上、內(nèi)存中都是多份冗余拷貝。動態(tài)鏈接時(shí),鏈接器并不真的把庫代碼復(fù)制到可執(zhí)行文件中;僅當(dāng)可執(zhí)行文件運(yùn)行時(shí),加載器才檢查該庫是否已經(jīng)被其它可執(zhí)行文件加載進(jìn)內(nèi)存,如果內(nèi)存中不存在才從磁盤上加載該庫。這樣多個(gè)應(yīng)用程序就可以共享庫中的代碼的同一份拷貝,節(jié)約了存儲空間。這也是嵌入式Linux系統(tǒng)使用共享庫的主要原因。
當(dāng)使用靜態(tài)鏈接庫時(shí),鏈接器會自動地只把庫中被使用的模塊鏈接到可執(zhí)行文件中。但是這種方法沒有用在共享庫中,主要是因?yàn)樵趹?yīng)用程序執(zhí)行之前鏈接器并不知道應(yīng)用程序最終用到了庫中的哪些部分。因此要對共享庫進(jìn)行裁剪必須先分析動態(tài)鏈接的原理。
共享庫和可執(zhí)行文件中都有若干個(gè)符號表,其中定義了一些外部符號,分為導(dǎo)出(export)符號和導(dǎo)入(import)符號這兩種。導(dǎo)出符號是指在該文件中定義但可以被其它文件使用的符號,一般是可以由其它文件調(diào)用的函數(shù);導(dǎo)入符號是指被該文件使用了但并沒有定義的符號,一般是被該文件調(diào)用的函數(shù),而且導(dǎo)入符號一般指明了定義該符號的共享庫。加載器在加載可執(zhí)行文件或共享庫之前會先遍歷它的每個(gè)導(dǎo)入符號,檢查該符號的相關(guān)代碼是否已在內(nèi)存中,否則先查找并加載定義該符號的共享庫。由于嵌入式Linux系統(tǒng)中的應(yīng)用程序和共享庫一般都是確定的,共享庫中就可能存在永遠(yuǎn)不會被別的文件調(diào)用到的導(dǎo)出符號,將這些符號的相應(yīng)代碼從共享庫中刪除不會影響到系統(tǒng)的正常運(yùn)行。
現(xiàn)有裁剪技術(shù)都是以上述原理實(shí)現(xiàn)的。下面則具體分析它的實(shí)現(xiàn)方法。
2.2、ELF文件符號提取
ELF格式是UNIX實(shí)驗(yàn)室作為應(yīng)用程序二進(jìn)制接口而開發(fā)和發(fā)布的,ELF是目前廣泛應(yīng)用于Linux系統(tǒng)中的一種文件格式。
2.2.1、 ELF文件進(jìn)程映像加載
ELF文件開頭部分是一個(gè)ELF Header結(jié)構(gòu),它包含兩個(gè)指針,分別指向兩個(gè)數(shù)組結(jié)構(gòu):Program header table和Section header
table,Program header table中的數(shù)組元素對文件內(nèi)部的可執(zhí)行代碼段進(jìn)行定位;Section header table中的數(shù)組元素保存相關(guān)重定位和動態(tài)鏈接信息.裝載器通過控制這兩類數(shù)組實(shí)現(xiàn)進(jìn)程映像的加載。
2.2.2、 ELF文件的符號表和重定位過程
ELF文件的Section header table中有一個(gè)類型為SHT_DYNSYM的Section,該Section記錄了創(chuàng)建進(jìn)程映像所需要的所有符號。
a、符號值確定和符號定位,ELF文件中字符串ection(.shstrtab)用于保存所有字符串,ELF頭通過e_shstrndx域保存節(jié)頭名字字符串表(.shstrtab)的節(jié)索引。ELF文件中符號名字域值是.shstrtab節(jié)的一個(gè)字符索引:Syrnbol結(jié)構(gòu)中St_name對應(yīng)相應(yīng)的字符串表一個(gè)索引,在相應(yīng)的字符串表中對應(yīng)其符號值,St_value對應(yīng)兩類不同地址:對于文件內(nèi)部定義符號,對應(yīng)該符號內(nèi)容的文件內(nèi)部相對地址;對于外部調(diào)用符號,對應(yīng)待調(diào)符號的地址(已解析)或重定位表中的一個(gè)入口(未解析)。St_info保存符號的類型和相應(yīng)的屬性。
b、被調(diào)符號重定位。符號表中,STT-SEC-TION對應(yīng)重定位入口信息表。重定位入口以數(shù)組的形式存在于ELF文件中,其中的R_offset保存著應(yīng)用于重定位行為的地址,而R_addend對應(yīng)一個(gè)偏移用于計(jì)算要存儲于重定位域中的值。R_info中給出受重定位影響的符號索引和重定位應(yīng)用的類型。例如:當(dāng)類型為R_386_JMP_SLOT時(shí),符號值就對應(yīng)一個(gè).plt(過程連接表)入口的位置.
c、外部符號裝載。對于外部符號代碼的裝載,裝載器通過lazy MODE裝載方式將外部符號代碼加載到進(jìn)程映像中:首次調(diào)用外部符號通過PLT[0]中的裝載代碼和PLT[1]中出棧參數(shù)將待調(diào)符號代碼加載到.got表中;以后對此待調(diào)符號的調(diào)用通過對應(yīng).got表入口進(jìn)行控制傳輸。
2.2.3、 ELF文件符號提取實(shí)現(xiàn)
對每個(gè)參與動態(tài)鏈接的共享目標(biāo)文件來說,其程序頭表(Program header table)有一個(gè)類型為PT_DYNAMIC的入口元素。該入口所指向的段.dynamic section是一個(gè)Elf32_Dyn的結(jié)構(gòu)數(shù)組.Elf32_Dyn結(jié)構(gòu)中有一個(gè)屬性標(biāo)志d_tag和一個(gè)聯(lián)合結(jié)構(gòu)d_un,d_tag控制d_un中的解釋。數(shù)組中下標(biāo)為DT_SYMTAB的入口指向符號表。通過對符號表、重定位表、過程連接表、全局過程表的相關(guān)控制結(jié)構(gòu)進(jìn)行分析,完成文件定義符號和待調(diào)符號的分離提取,算法如下:
symtab=.dynamic[DT_SYMTAB]->d_un. d->ptr
∥根據(jù)DT_SYMTAB找到符號表的地址
for(int i=0;symtab[i]!=NULL;i++)
∥對符號表中所有入口進(jìn)行掃描
{swith((symtab[i] ->st_info)>>4) ∥根據(jù)符號類型進(jìn)行操作
}…
case STB_WEAK:
case STB_GLOBOL:/*對全局性的和弱符號可用于外部文件調(diào)用*/
if(對應(yīng)入口指向過程連接表入口)/*如果其指向的地址為.plt入口則在創(chuàng)建進(jìn)程映像的時(shí)候需要重定位*/
loadrequest(symtab[i]->st_name);/*重定位并將該符號的名字在字符表找到relocate(symtab[i]->st_value)相應(yīng)的值,并將其名字放人相應(yīng)的關(guān)系表*/
else
loadprovide(symtab[i]->st_name);/*如果是內(nèi)部定義,那么此符號名是供其它的應(yīng)用程序調(diào)用*/
… }}
ELF文件中定義符號和待調(diào)符號由其st_value所指的目標(biāo)進(jìn)行區(qū)分:對應(yīng)于.plt表的待調(diào)符號需要重定位;對應(yīng)于內(nèi)部符號,如果是弱類型(WEAK)或全局類型(GL0BOL)則用于其它文件調(diào)用。通過對ELF格式中的待調(diào)符號的提取,建立起應(yīng)用程序和符號的依賴關(guān)系。
2.3、嵌入式系統(tǒng)小型化結(jié)果與分析
對各個(gè)表進(jìn)行連接得到應(yīng)用程序依賴的目標(biāo)文件集合。將集合中的目標(biāo)文件無重復(fù)記錄并重新連接從而得到最小化庫。前后庫中各數(shù)據(jù)對比見表3。小型化后,系統(tǒng)庫內(nèi)各組成部分顯著減少,庫被縮減近50%。對于日益龐大的嵌入式系統(tǒng)中的應(yīng)用程序,根據(jù)庫文件內(nèi)部的依賴關(guān)系,在其基礎(chǔ)上對應(yīng)用程序進(jìn)行優(yōu)化裁減,對一般性應(yīng)用可以使系統(tǒng)庫減小40%~50%。
小型化前 | 小型化后 | |
目標(biāo)文件(個(gè)) | 1183 | 544 |
符號(個(gè)) | 9118 | 4861 |
顯性依賴(條) | 3819 | 1887 |
間接依賴(條) | 120273 | 55425 |
庫大小 | 1242480byte | 685032byte |
表3 系統(tǒng)庫小型化前后對照
三、 結(jié)束語
近年來嵌入式Linux技術(shù)迅速發(fā)展,各種商業(yè)和開放源碼的Linux發(fā)行版為不同的硬件平臺、不同的應(yīng)用環(huán)境提供了多種選擇。Linux的文件系統(tǒng)事實(shí)上非常的龐大。構(gòu)造一個(gè)嵌入式的Linux文件系統(tǒng)是一個(gè)很復(fù)雜的過程。如何讓文件系統(tǒng)在保證安全的前提下精簡得更緊湊、運(yùn)行得更有效率,是需要深入探索的一個(gè)課題。特別是,共享庫裁剪技術(shù)能將庫中大部分冗余代碼裁剪掉,但要求庫的源碼編寫比較規(guī)范,不同體系結(jié)構(gòu)需要有不同的處理等。但畢竟庫裁剪領(lǐng)域才發(fā)展不久,還不是很成熟。經(jīng)過對該技術(shù)長時(shí)間的測試,相信我們能夠彌補(bǔ)它的不足,使它能夠在嵌入式Linux領(lǐng)域廣泛使用。通過以上方法,我們構(gòu)造了一個(gè)精簡的嵌入式版本的Linux文件系統(tǒng),它使得內(nèi)核在系統(tǒng)盡量精簡的情況下能夠運(yùn)行起來.并滿足產(chǎn)品和系統(tǒng)各方面的要求。
評論