新聞中心

EEPW首頁(yè) > 手機(jī)與無(wú)線通信 > 設(shè)計(jì)應(yīng)用 > 網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)模型的研究

網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)模型的研究

作者: 時(shí)間:2005-04-04 來(lái)源:網(wǎng)絡(luò) 收藏

摘要:的高速處理和靈活的可編程性,使它成為當(dāng)今中數(shù)據(jù)處理的有效解決方案。本文深入探討。首先,介紹Intel IXP2400網(wǎng)絡(luò)硬件結(jié)構(gòu)和平臺(tái),然后給出基于網(wǎng)絡(luò)處理器的路由轉(zhuǎn)發(fā)系統(tǒng)的設(shè)計(jì)實(shí)例,闡述網(wǎng)絡(luò)處理器開(kāi)發(fā)的關(guān)鍵環(huán)節(jié),最后提出網(wǎng)絡(luò)處理器所面臨的主要問(wèn)題和挑戰(zhàn)。

關(guān)鍵詞:網(wǎng)絡(luò)處理器 軟件開(kāi)發(fā) 微引擎 微模塊 核心組件

引言

隨著當(dāng)今網(wǎng)絡(luò)規(guī)模和性能迅速增長(zhǎng),Internet主干網(wǎng)絡(luò)流量的指數(shù)性增長(zhǎng)及新業(yè)務(wù)接連的出現(xiàn),這就要求網(wǎng)絡(luò)設(shè)備具有線速和智能的處理能力。網(wǎng)絡(luò)處理器NP(Network Processor)便是一種新興、有效的統(tǒng)一解決方案。它適用于各層網(wǎng)絡(luò)處理,具有ASIC高速處理性能和可編程特性,既能保證系統(tǒng)靈活性,又能完成線速處理數(shù)據(jù)包所要求的高性能硬件功能。目前,網(wǎng)絡(luò)處理器已經(jīng)涌現(xiàn)出了一些成功的應(yīng)用范例。這些應(yīng)用主要包括:基于網(wǎng)絡(luò)處理器的路由交換設(shè)備、智能安全設(shè)備和入侵檢測(cè)設(shè)備等。比如,北京聯(lián)想使用IBM的PowerNP構(gòu)成了電信級(jí)的防火墻設(shè)備。與此同時(shí),圍繞著網(wǎng)絡(luò)處理器應(yīng)用展開(kāi)的相關(guān)也得到了飛速發(fā)展,一些企業(yè)和科研機(jī)構(gòu)也給予了足夠重視。例如,Intel專門投資支持全球100所大學(xué)進(jìn)行網(wǎng)絡(luò)處理器及其相關(guān)應(yīng)用的

由于網(wǎng)絡(luò)處理器特殊的體系結(jié)構(gòu),它的軟件編程與傳統(tǒng)網(wǎng)絡(luò)應(yīng)用/嵌入式應(yīng)用開(kāi)發(fā)有較大不同,更為復(fù)雜。本文將以Intel IXP2400網(wǎng)絡(luò)處理器為例,對(duì)網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)模型進(jìn)行較為詳細(xì)地探討。

1 網(wǎng)絡(luò)處理器硬件架構(gòu)

在一般程序設(shè)計(jì)中,可以不考慮操作系統(tǒng)和編譯程序、線程調(diào)度的細(xì)節(jié)、寄存器的數(shù)量和容量,而在網(wǎng)絡(luò)處理器的程序設(shè)計(jì)中,忽略這些因素就不能編寫出優(yōu)化的程序。在對(duì)網(wǎng)絡(luò)處理器,尤其是微引擎編程之前,需要仔細(xì)了解網(wǎng)絡(luò)處理器的系統(tǒng)結(jié)構(gòu)和硬件平臺(tái)。下面以Intel的IXP2400為例來(lái)說(shuō)明。

IXP2400網(wǎng)絡(luò)處理器是Intel在2002年推出的第二代互聯(lián)網(wǎng)交換架構(gòu)(IXA)網(wǎng)絡(luò)處理器。其中,IXP2400是面向中高端應(yīng)用的網(wǎng)絡(luò)處理器,可用于實(shí)現(xiàn)OC-48的網(wǎng)絡(luò)路由交換設(shè)備。

Intel的IXP2400網(wǎng)絡(luò)處理器結(jié)構(gòu)允分體現(xiàn)了SoC(System on Chip)的思想。如圖1所示,它的內(nèi)部主要包括8個(gè)完全可編程的4線程微引擎(Mev2)和1個(gè)XScale核。此外,還有用于連接外部MAC設(shè)備的MSF單元、連接各種存儲(chǔ)器和總線的接口單元等。這些單元通過(guò)內(nèi)部的高速數(shù)據(jù)總線和控制總線彼些協(xié)作。

XScale核(core)是ARM系列處理器的一種,它在IXP2400中起控制和管理作用。具體包括:對(duì)系統(tǒng)初始化;提供系統(tǒng)的時(shí)鐘;建立并管理路由表;提供一個(gè)對(duì)應(yīng)于IXP2400各寄存器、存儲(chǔ)器和外部存儲(chǔ)器的地址映射表等。XScale核在系統(tǒng)啟動(dòng)時(shí),從BootROM開(kāi)始執(zhí)行引導(dǎo)程序,對(duì)整個(gè)IXP2400系統(tǒng)進(jìn)行初始化。

IXP2400中的每一個(gè)微引擎其它就是一個(gè)32位RISC處理器,可以由4個(gè)并行硬件線程共享。數(shù)據(jù)包的接收、處理和發(fā)送等任務(wù),均由微引擎中的各線程并行執(zhí)行微引擎指令存儲(chǔ)區(qū)中的微代碼程序來(lái)完成。網(wǎng)絡(luò)處理器數(shù)據(jù)的高速轉(zhuǎn)發(fā)正是因?yàn)槌浞掷昧擞布牟⑿行?,?lái)彌補(bǔ)線速轉(zhuǎn)發(fā)中的內(nèi)存訪問(wèn)的延遲。

IXP2400嵌在開(kāi)發(fā)板的中心,周圍通過(guò)數(shù)據(jù)線連接著各種設(shè)備,如SRAM,SDRAM等。SDRMA主要用來(lái)存放需要處理和轉(zhuǎn)發(fā)的數(shù)據(jù)包等,也作為XScale核的內(nèi)存;SRAM主要存放對(duì)數(shù)據(jù)包包頭進(jìn)行處理所需的重要信息和數(shù)據(jù)包的隊(duì)列描述等內(nèi)容。通過(guò)IXP2400的數(shù)據(jù)單元是一個(gè)64字節(jié)的MAC包(MPKT),在每收到一個(gè)包的時(shí)候,MAC將一個(gè)數(shù)據(jù)分成若干個(gè)MPKT,MPKT就是網(wǎng)絡(luò)處理器處理數(shù)據(jù)的單位。

綜上所述,IXP2400擁有網(wǎng)絡(luò)處理的一般特點(diǎn),從系統(tǒng)角度看,IXP2400屬于一個(gè)并行式的多算是器共享總線的計(jì)算機(jī)系統(tǒng)。對(duì)于網(wǎng)絡(luò)處理器的程序設(shè)計(jì)和一般計(jì)算機(jī)的程序設(shè)計(jì)有很大不同。

2 網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)模型

網(wǎng)絡(luò)設(shè)備性能和可編程能力最終由運(yùn)行在網(wǎng)絡(luò)處理器平臺(tái)上的軟件決定,其中,選擇何種編程模式是關(guān)鍵。評(píng)價(jià)網(wǎng)絡(luò)處理器編程模式有兩個(gè)基本準(zhǔn)則:一個(gè)是編程模式所能涉及的層,即哪些功能能夠編程以及編程能達(dá)到的層;另一個(gè)重要方面就是處理器襯淫的編程模型。由于網(wǎng)絡(luò)處理器平臺(tái)服務(wù)于軟件功能需要,所以編程方法的關(guān)鍵是在不犧牲設(shè)備性能的前提下,使用成熟技術(shù)和現(xiàn)有軟件模式,保證產(chǎn)品的可靠性,加快開(kāi)發(fā)速度。

基于運(yùn)行在核心處理器和協(xié)處理器的不同硬件之上,網(wǎng)絡(luò)處理器可分成數(shù)據(jù)平面與控制平臺(tái)。

數(shù)據(jù)平面主要運(yùn)行在微引擎處理之上,是實(shí)現(xiàn)輸入端口和輸出端口間高速轉(zhuǎn)發(fā)數(shù)據(jù)包的處理功能,具有線速執(zhí)行特點(diǎn),并充分利用數(shù)據(jù)包的無(wú)關(guān)性,采取并行處理方式??刂破矫嬉话氵\(yùn)行在網(wǎng)絡(luò)處理器核上,處理路由表更新、管理數(shù)據(jù)平面任務(wù)與狀態(tài)、完成高層的QoS控制等。這些操作的性能要求低于數(shù)據(jù)層面,因此通常采用高性能通用處理器硬件平臺(tái)。為了有效支持網(wǎng)絡(luò)處理功能,控制平面與數(shù)據(jù)平面之間存在復(fù)雜的信息交互與依賴關(guān)系。

IXP2400的軟件開(kāi)發(fā)也分為內(nèi)核程序和微代碼兩部分。XScale內(nèi)核的開(kāi)發(fā)通常可以使用基于ARM平臺(tái)嵌入式操作系統(tǒng)開(kāi)發(fā)工具鏈,如WindRiver公司的Tornado或基于GNU的Linux工具鏈等;另一部分是對(duì)微引擎的編程,這部分使用Intel公司提供的Developer Workbench開(kāi)發(fā)環(huán)境,主要使用微代碼來(lái)進(jìn)行編程。Developer Workbench提供了完善的編譯、鏈接、仿真和調(diào)試功能。為了方便開(kāi)發(fā)人員開(kāi)發(fā),消除平面之間通信等一些細(xì)節(jié),Intel提供了它的網(wǎng)絡(luò)處理器開(kāi)發(fā)模型,稱為IXA可移植框架(portability framework)如圖2所示。

Intel IXA可移植框架中最重要的組成部分就是在微引擎上和XScale核上開(kāi)發(fā)的代碼模型?;诓煌布祥_(kāi)發(fā)的代碼模塊分別為微模塊(microblock)和核心組件(core component)。每一個(gè)模塊都代表了一個(gè)進(jìn)行包處理的代碼單元。這里實(shí)際上引入了構(gòu)件的思想,開(kāi)發(fā)人員將各種模塊以一定的順序組織在一起,組成一個(gè)特定的應(yīng)用。下面分別對(duì)框架中的各個(gè)層次進(jìn)行討論。

(1)微模塊

數(shù)據(jù)平面的微引擎在邏輯上分成一個(gè)或多個(gè)微模塊(microblock)。每一個(gè)微模塊都是一個(gè)宏或者一個(gè)微引擎或由Intel提供的一些底層庫(kù)寫成的函數(shù)。微模塊之間彼此獨(dú)立,這些就提高了代碼的可重用性,同時(shí)也簡(jiǎn)化了微引擎手代碼的編寫。微引擎與Intel XScale核共享一部分內(nèi)存,大部分網(wǎng)絡(luò)包的處理都通過(guò)微引擎來(lái)進(jìn)行,一些例外的包將傳遞給Intel XScale核心組件來(lái)處理。微模塊從功能上一般包括與一些高層協(xié)議相關(guān)包的處理微模塊和與硬件緊密相關(guān)的微模塊。前者包括IPv4轉(zhuǎn)發(fā)、網(wǎng)橋、網(wǎng)絡(luò)地址轉(zhuǎn)換(NAT)等;后者包括包的接收和發(fā)送模塊及分組隊(duì)列管理模塊等。

(2)核心組件

核心組件(Core Component)運(yùn)行在XScale核上,實(shí)現(xiàn)了相關(guān)微模塊的配置、管理和例外處理等工作。一個(gè)核心組件可能管理著多于一個(gè)微模塊。具體來(lái)講,核心組件主要完成以下一些功能:配置微模塊(通過(guò)引入變量的靜態(tài)配置和控制模塊的動(dòng)態(tài)配置);初始化維護(hù)一些可能被其它應(yīng)用程序修改的數(shù)據(jù)結(jié)構(gòu);提供了一個(gè)例外處理和控制消息處理機(jī)制來(lái)處理微模塊發(fā)送過(guò)來(lái)的包和消息。

(3)微引擎數(shù)據(jù)平面優(yōu)化庫(kù)

微引擎數(shù)據(jù)平面優(yōu)化庫(kù)(optimized microengine data plane library)包括一些底層的微引擎宏指令和用微引擎的特殊C語(yǔ)言寫的函數(shù)庫(kù),用來(lái)編寫微模塊和一些微引擎的代碼。這些為是經(jīng)過(guò)Intel優(yōu)化的,非常高效,代碼的占用小,同時(shí)也是非常底層的。庫(kù)主要包含三信方面:對(duì)處理器硬件單元的操作,比如對(duì)微引擎內(nèi)部的本地內(nèi)存(local memory)、臨界區(qū)(critical sections)操作等;協(xié)議頭的解析函數(shù),如IPv4、IPv6協(xié)議等;哈希單元的查找,CRC等。

(4)微模塊基本設(shè)施庫(kù)

微模塊基本設(shè)施庫(kù)(microblocks infrastructure library)提供了訪問(wèn)暫存包描述符的API,Dispatch Loop的實(shí)現(xiàn)是通過(guò)它來(lái)完成的。一個(gè)Dispatch Loop將運(yùn)行在一個(gè)微引擎內(nèi)部線程之間的多個(gè)微模塊組成一個(gè)microblock組。關(guān)鍵的地方是,Dispatch Loop提供了一種多個(gè)微模塊之間高效共享包的描述符、包頭信息等重要數(shù)據(jù)結(jié)構(gòu)的方式,實(shí)現(xiàn)了多個(gè)微模塊間的數(shù)據(jù)傳遞。Dispatch Loop也提供了向其它Dispatch Loop也提供了向其它Dispatch Loop和XScale核之間發(fā)送和接收包的接口。

(5)資源管理庫(kù)

資源管理庫(kù)(resource management library)是XScale核的一個(gè)軟件組件,它向內(nèi)核提供了微引擎的API,比如硬件的資源管理接口,大大簡(jiǎn)化了硬件初始化的任務(wù),配置和資源的共享;微模塊與核心組件之間的通信API,開(kāi)發(fā)者屏蔽了微引擎與XScale核之間通道的一些細(xì)節(jié)。

(6)核心組件基本設(shè)施庫(kù)

核心組件基本設(shè)施庫(kù)(core components infrastructurelibrary)為XScale核心組件設(shè)計(jì)和構(gòu)造提供了一些底層的API,同時(shí)也提供了組件之間傳遞包和消息的機(jī)制。其于核心組件基本設(shè)施庫(kù)的一個(gè)核心組件一般都要包含以下函數(shù):1個(gè)初始化函數(shù);1個(gè)結(jié)束函數(shù);1個(gè)或多個(gè)包的處理名句柄;1個(gè)或多個(gè)消息處理句柄。

(7)操作系統(tǒng)服務(wù)層

操作系統(tǒng)服務(wù)層(operating system services layer)對(duì)運(yùn)行在XScale核上的代碼提供了一個(gè)抽象層。開(kāi)發(fā)人員編寫的XScale核心運(yùn)行代碼包括資源管理庫(kù)。應(yīng)該利用這一層,而不是直接去利用操作系統(tǒng)提供的API,從而提高系統(tǒng)的可移植性。OSSL主要提供了以下幾類接口:線程管理、同步原語(yǔ)、互斥操作、定時(shí)器、內(nèi)存管理和消息日志。

(8)控制平面平臺(tái)開(kāi)發(fā)工具包

控制平面的PDK(Platform Development Kit)為XScale核心組件與運(yùn)行控制平面的軟件之間提供了接口。它所提供的API編程接口現(xiàn)在是符合國(guó)際網(wǎng)絡(luò)處理器論壇(NPF)提出的標(biāo)準(zhǔn)的,各種控制平面的網(wǎng)絡(luò)協(xié)議棧和用它可以很方便的集成進(jìn)來(lái)。

3 網(wǎng)絡(luò)處理器應(yīng)用實(shí)例

利用Intel IXA可移植框架來(lái)實(shí)現(xiàn)Intel IXP2400的一個(gè)簡(jiǎn)單路由轉(zhuǎn)發(fā)系統(tǒng)。數(shù)據(jù)分組在IXP2400中的流動(dòng)過(guò)程如下:以太網(wǎng)MAC器件接收數(shù)據(jù),放入MSD單元的接收緩存當(dāng)中,向微引擎發(fā)出信號(hào),表示數(shù)據(jù)已經(jīng)收到,微引擎將接收緩存中數(shù)據(jù)傳輸?shù)絊DRAM,微引擎通過(guò)對(duì)MSF總線單元的訪問(wèn)命令將前幾個(gè)字節(jié)(分組頭)傳送到傳輸寄存器中,微引擎對(duì)分組的以太網(wǎng)頭進(jìn)行修改,而將數(shù)據(jù)分組寫入發(fā)送隊(duì)列,然后通知MSF單元將數(shù)據(jù)分組傳送給適當(dāng)?shù)腗AC器件。圖3所示為典型路由器應(yīng)用系統(tǒng)中的數(shù)據(jù)流。

在圖3所示的處理轉(zhuǎn)發(fā)結(jié)構(gòu)中,每一個(gè)模塊代表一個(gè)微模塊。發(fā)送和接收模塊和MSF硬件緊密相關(guān)。處理器芯片的MSF總線接口單元中有一對(duì)BUFFER,即輸入BUFFER和輸出BUFFER,分別用作接收和發(fā)送的緩沖區(qū)。開(kāi)發(fā)者通過(guò)用這些相應(yīng)的硬件寄存器,硬件設(shè)備可自動(dòng)進(jìn)行相應(yīng)的轉(zhuǎn)發(fā)處理。

圖3

接收線程將自己的信息寫入MSF的FREELIST單元控制豁口,其中包括了線程號(hào)、微引擎號(hào)與存放接收控制字(RSW)的寄存器地址,等待MSF的信號(hào)將數(shù)據(jù)從RBUFFER中移入SDRAM。發(fā)送微模塊要選擇并等待一個(gè)有效的TBUFFER,再將數(shù)據(jù)從SDRAM中移入TBUFFER,并寫入相應(yīng)的控制寄存器,標(biāo)識(shí)分組要發(fā)送的端口,分組的發(fā)送由TSM硬件自動(dòng)完成。

在中間處理包的各個(gè)模塊中,代碼首先從便存儲(chǔ)器(SCRATCHPAD MEMORY)中將接收線程放入的包信息取出,進(jìn)行以太網(wǎng)頭的有效性驗(yàn)證,根據(jù)IP頭的信息查找路由表,將以太網(wǎng)頭更新。其中每一個(gè)處理都是由一個(gè)微模塊來(lái)實(shí)現(xiàn)的。各個(gè)模塊合在一起構(gòu)成了一個(gè)Dispatch Loop,各個(gè)模塊在便存儲(chǔ)器中共享包描述符信息,其中dlNextBlock全局變量為下一個(gè)處理微模塊的標(biāo)識(shí)。Dispatch Loop的部分代碼如下(簡(jiǎn)略)。

while(1){

dl_source(); //從接收線程取下包描述符

if(dlBufHandle= =0){ //dlBufHandle是Dispatch

//Loop維護(hù)的一個(gè)全局變量

continue;

}

Ethernet_validate();//驗(yàn)證這個(gè)包是一個(gè)有效的以太網(wǎng)頭

Ethernet_strip_header();//去掉以太網(wǎng)頭

Ipv4_five_tuple_class();//進(jìn)行IPv4 classifier的轉(zhuǎn)發(fā)

If(dlNextBlock= =IX_DROP){//clNextBlock也是全局變量,表示下一個(gè)

Goto drop; //跳轉(zhuǎn)到丟棄包的處理模塊

}

Ethernet_add_header();//添加新的以太網(wǎng)頭

D1_sink(); //將處理后的包描述符放入發(fā)送緩沖區(qū)中

Drop:

Dl_BufDrop(dlBufHandle); //丟棄包的處理

}

Intel IXP2400開(kāi)發(fā)平臺(tái)中,微代碼的源文件是*.uc格式的,經(jīng)過(guò)預(yù)處理生成*.ucp的中間文件,進(jìn)而進(jìn)行匯編生成*.list匯編文件。微引擎程序的連接器將匯編程序的多個(gè)輸出文件轉(zhuǎn)變成一個(gè)可下載的微程序映像(image)。缺省情況下,連接器生成的微代碼映像文件的擴(kuò)展名為uof。連接器也可以生成C結(jié)構(gòu)的程序格式,這樣的輸出文件與內(nèi)核程序一起進(jìn)行編譯和連接。

Intel提供的資源管理庫(kù)中,對(duì)微引擎部分的函數(shù)提供了接口,可以將uof文件當(dāng)作Flash文件系統(tǒng)的一個(gè)普通文件進(jìn)行處理。在內(nèi)核代碼初始化時(shí),將uof文件讀入內(nèi)存,然后加載。但是如果要作成最終產(chǎn)品時(shí),Intel推薦采用.c格式的文件,并直接鏈入到所開(kāi)發(fā)的內(nèi)核工程中。

4 網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)的關(guān)鍵環(huán)節(jié)

基于網(wǎng)絡(luò)處理器開(kāi)發(fā)工作的重點(diǎn)是對(duì)數(shù)據(jù)平面代碼的開(kāi)發(fā),開(kāi)發(fā)者要在以下三個(gè)方面進(jìn)行設(shè)計(jì)和代碼優(yōu)化:多線程的任務(wù)分配和調(diào)度策略;數(shù)據(jù)結(jié)構(gòu)的定義和存儲(chǔ)分配;分組隊(duì)列的管理和調(diào)度。

(1)多線程的分配和調(diào)度策略

對(duì)微引擎和線程分配任務(wù)是否合理,是影響系統(tǒng)性能的一個(gè)很重要因素。開(kāi)發(fā)人員需要根據(jù)具體的網(wǎng)絡(luò)應(yīng)用和硬件平臺(tái)的特點(diǎn)來(lái)科學(xué)合理的分配任務(wù)。比如,對(duì)一個(gè)一般的網(wǎng)絡(luò)應(yīng)用來(lái)說(shuō),可以分為包的接收、處理、發(fā)送幾個(gè)階段。對(duì)于包的處理階段來(lái)說(shuō),又可以分成多個(gè)階段來(lái)執(zhí)行,每一個(gè)階段可以由一個(gè)微模塊來(lái)執(zhí)行。這多個(gè)微模塊是如何在每個(gè)微引擎中分配,就是一個(gè)任務(wù)分配的問(wèn)題。如果分配才能使負(fù)載盡可能的達(dá)到平衡,處理器的資源得到最大效率的利用,這些都要進(jìn)行、分析和實(shí)驗(yàn)。

網(wǎng)絡(luò)處理器微引擎基于硬件的靜態(tài)多線程調(diào)度基礎(chǔ)上,即在一個(gè)微引擎內(nèi)部中的線程調(diào)度是由硬件來(lái)實(shí)現(xiàn)的,通常采用輪詢的策略。不同策引擎的線程間存在多種通信方法,線程之間在數(shù)據(jù)包處理過(guò)程中的同步方式也有多種。因此,開(kāi)發(fā)者根據(jù)具體不同應(yīng)用功能特點(diǎn),不同數(shù)據(jù)處理相關(guān)功能需求,對(duì)圍繞處理器的多個(gè)微引擎的并行調(diào)度算法進(jìn)行選擇,以盡可能達(dá)到系統(tǒng)負(fù)載的平衡。

Intel IXP2400提出了三種網(wǎng)絡(luò)處理器數(shù)據(jù)平面的多線程編程模型:流水模型(context pipeline)、并行處理模型的順序模式(ordered mode)和亂序的模式(unordered mode)。在任務(wù)的分配方面,Intel正在考慮對(duì)現(xiàn)有的微引擎編程語(yǔ)言進(jìn)行擴(kuò)展,提出了新的微引擎自動(dòng)分配任務(wù)的編程模型,以加快網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)的效率。

(2)數(shù)據(jù)結(jié)構(gòu)的這義和存儲(chǔ)分配

影響網(wǎng)絡(luò)處理器線速轉(zhuǎn)發(fā)的一個(gè)最關(guān)鍵問(wèn)題是存儲(chǔ)器的訪問(wèn)延遲。網(wǎng)絡(luò)處理器中往往有多層不同的存儲(chǔ)體(在IXP2400中,就存在寄存器、Local Memory、Scratchpad Memory、SRAM、SDRAM等不同級(jí)別的存儲(chǔ)器,它們的速度差別很大),不同層次的內(nèi)存用于滿足不 同數(shù)據(jù)結(jié)構(gòu)的需要。另一方面,定義在網(wǎng)絡(luò)處理器中的數(shù)據(jù)結(jié)構(gòu)是非常精密的,比如,一個(gè)包頭的描述符(packet descriptor metadata)。但同時(shí)也是非常龐大和復(fù)雜,比如包體的信息、路由表和隊(duì)列管理的數(shù)據(jù)結(jié)構(gòu)。舉例來(lái)說(shuō),開(kāi)發(fā)者在微引擎中定義多個(gè)線程共享的變量時(shí),應(yīng)最先考慮使用全局寄存器,但有時(shí)全局寄存器的容量有限,可以考慮Local Memory。多微引擎共享的變量存放在SRAM中,而Dispatch Loop變量存放在便(Scartch pad)中。不同數(shù)據(jù)結(jié)構(gòu)定義和分配的不同策略都會(huì)對(duì)系統(tǒng)性能產(chǎn)生較大的影響。

(3)分組調(diào)度

網(wǎng)絡(luò)處理器是典型的RISC內(nèi)核的并行實(shí)時(shí)處理結(jié)構(gòu),同時(shí)存在著大量共享資源,比如內(nèi)存、總線、SHAC等一些特殊硬件單元,這就必然需要系統(tǒng)對(duì)這些共享資源進(jìn)行調(diào)度和仲裁。未來(lái)計(jì)算機(jī)網(wǎng)絡(luò)的趨勢(shì)是能夠提供多種不同服務(wù),支持多種不同應(yīng)用需求。提高網(wǎng)絡(luò)集成服務(wù)支持能力的一個(gè)很重要問(wèn)題就是分組調(diào)度算法問(wèn)題,分組隊(duì)列的管理還是實(shí)現(xiàn)QoS的基礎(chǔ)。

分組調(diào)度及處理算法的核心是鏈路層調(diào)度器的算法設(shè)計(jì)。在一般分組處理的存儲(chǔ)-轉(zhuǎn)發(fā)過(guò)程中,設(shè)計(jì)調(diào)度器必然要對(duì)分組處理時(shí)間進(jìn)行預(yù)測(cè),但處理器在調(diào)度器中要精確的獲取并更新這些虛擬時(shí)間是十分困難的。這就要根據(jù)具體的應(yīng)用,通過(guò)研究數(shù)據(jù)包的長(zhǎng)度、數(shù)據(jù)類型、處理方式與處理時(shí)間之間的關(guān)系,提出合理的數(shù)據(jù)包處理時(shí)間預(yù)測(cè)方案,選擇適當(dāng)?shù)姆纸M調(diào)度算法,達(dá)到比較好的系統(tǒng)性能。

5 網(wǎng)絡(luò)處理器面臨的挑戰(zhàn)

當(dāng)今的網(wǎng)絡(luò)處理咕嘟仍面臨著許多挑戰(zhàn),例如采用什么技術(shù)擴(kuò)展,如何簡(jiǎn)化編程模式等問(wèn)題都需要進(jìn)一步研究。數(shù)據(jù)平面上運(yùn)行的軟件開(kāi)發(fā)通常僅提供微代碼匯編和低通讀C語(yǔ)言技術(shù),這大大限制了網(wǎng)絡(luò)處理器技術(shù)的發(fā)展和應(yīng)用。因?yàn)槿狈Ω咝У能浖_(kāi)發(fā)支持,軟件問(wèn)題已經(jīng)成為網(wǎng)絡(luò)處理器應(yīng)用的一大障礙,必須研究面向網(wǎng)絡(luò)處理器系統(tǒng)的高效系統(tǒng)軟件平臺(tái)。

網(wǎng)絡(luò)處理器微引擎指令的提供非常有限,僅有不足40條,這遠(yuǎn)遠(yuǎn)不能滿足開(kāi)發(fā)人員的需求,僅用它去構(gòu)造一些復(fù)雜的網(wǎng)絡(luò)處理任務(wù)不太現(xiàn)實(shí)。在Intel提出的網(wǎng)絡(luò)處理器開(kāi)發(fā)框架中,給出了一些非常底層的數(shù)據(jù)平面的函數(shù)庫(kù),還給開(kāi)發(fā)者提供了一些面向特定應(yīng)用的更優(yōu)化的接口和宏指令集。

目前,開(kāi)發(fā)環(huán)境主要由各NP生產(chǎn)廠商提供,微引擎上運(yùn)行的數(shù)據(jù)平面只提供微代碼匯編和C語(yǔ)言編譯器支持,有代表性的產(chǎn)品是Intel Workbench??刂破矫嫔系奶幚砥鲀?nèi)核,普遍采用Linux或VxWorks作為操作系統(tǒng)。兩個(gè)平面的開(kāi)發(fā)相對(duì)獨(dú)立,沒(méi)有一種統(tǒng)一的開(kāi)發(fā)手段,這給開(kāi)發(fā)者帶來(lái)了很大的不便。目前,也沒(méi)有特別針對(duì)網(wǎng)絡(luò)處理特點(diǎn)的操作系統(tǒng),常見(jiàn)的RTOS由于并不是特別針對(duì)網(wǎng)絡(luò)處理器的操作系統(tǒng),因此并不能充分發(fā)揮網(wǎng)絡(luò)處理器的潛能。

為了滿足下一代Internet服務(wù)需求,網(wǎng)絡(luò)處理器除了要滿足局域網(wǎng)和廣域網(wǎng)對(duì)帶寬的需求增長(zhǎng)外,還要能夠以線速對(duì)數(shù)據(jù)、語(yǔ)音以及視頻信號(hào)進(jìn)行排序和處理。網(wǎng)絡(luò)處理器官方論壇(Network Processing Forum)的成立,加快了網(wǎng)絡(luò)處理器接口標(biāo)準(zhǔn)的制定和軟件發(fā)展的步伐。

結(jié)語(yǔ)

網(wǎng)絡(luò)處理器通過(guò)十分靈活的體系結(jié)構(gòu)和強(qiáng)大的處理能力,將可編程能力和ASIC的處理能力有機(jī)的結(jié)合在一起,它的出現(xiàn)是網(wǎng)絡(luò)設(shè)備開(kāi)發(fā)的一次革命,它的發(fā)展必須對(duì)傳統(tǒng)ASIC和MPU造成前所未有的沖擊。在今后幾年里,網(wǎng)絡(luò)處理器將有著非常巨大的發(fā)展空間。本文以Intel IXP2400網(wǎng)絡(luò)處理器為例,全面討論了網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)技術(shù),并提出網(wǎng)絡(luò)處理器軟件開(kāi)發(fā)中的關(guān)鍵環(huán)節(jié)及面臨的主要問(wèn)題和挑戰(zhàn)。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉