基于LWIP的ICMP路由重定向改進(jìn)
1 LWIP設(shè)計(jì)思路
與許多其他的TCP/IP實(shí)現(xiàn)一樣,LWIP也是以分層的協(xié)議為參照來(lái)設(shè)計(jì)實(shí)現(xiàn)TCP/IP。大部分的TCP/IP實(shí)現(xiàn)在應(yīng)用層和底層協(xié)議層之間進(jìn)行了嚴(yán)格的劃分,底層協(xié)議之間可以進(jìn)行或多或少的交叉存??;而LWIP在應(yīng)用層與低層協(xié)議則使用了內(nèi)存共享這種比較松散的通信機(jī)制。每一個(gè)協(xié)議作為一個(gè)模塊被實(shí)現(xiàn)。LWIP采取將所有協(xié)議駐留在同一個(gè)進(jìn)程的方式,以便獨(dú)立于操作系統(tǒng)內(nèi)核之外。應(yīng)用程序既可以駐留在LWIP的進(jìn)程中,也可以使用一個(gè)單獨(dú)的進(jìn)程。應(yīng)用程序與TCP/IP協(xié)議棧通信可以采用兩種方法:一種是函數(shù)調(diào)用,適用于應(yīng)用程序與LWIP使用同一個(gè)進(jìn)程的情況;另一種是使用更抽象的API。整個(gè)協(xié)議??驁D如圖1所示。
由于在傳輸層UDP比TCP協(xié)議要簡(jiǎn)單得多,故僅以TCP為例。
在接收數(shù)據(jù)方面,鏈路層的ethernetifinpuIt()函數(shù)在收到數(shù)據(jù)包后,將IP包交付ip_input()函數(shù),ARP包交付etharp_arp_input()函數(shù)處理。ip_input()則負(fù)責(zé)拆解IP包,將ICMP包交付icmp_input()函數(shù)處理,將TCP包交付tcp_input處理。tcp_input()負(fù)責(zé)收到的TCP包,完成TCP頭部驗(yàn)證,放入相應(yīng)的狀態(tài)鏈,并交付tcp_process()處理。tcp_process完成TCP無(wú)限狀態(tài)機(jī)的處理。tcp_receive()將收到的包放在接收隊(duì)列中,這些接收隊(duì)列中的數(shù)據(jù)最終被應(yīng)用程序使用。
在發(fā)送數(shù)據(jù)方面,tcp_write()檢查是否允許發(fā)送數(shù)據(jù),當(dāng)允許發(fā)送時(shí),就調(diào)用tcp_enqueue()進(jìn)行發(fā)送。tcp_enqueue()將數(shù)據(jù)放入發(fā)送隊(duì)列。tcp_output()發(fā)送數(shù)據(jù)并在可能時(shí)捎帶確認(rèn)。ip_output_if()在接到數(shù)據(jù)后,填充IP頭,交付netif一>output,即etharp_output()處理。etharp_output()判斷是單播地址后,交付etharp_query()。etharp_query()填入源、目標(biāo)mac地址,并最終交付low_level_output()發(fā)送。
2 ICMP層的不足
LWIP在ICMP層的處理流程如圖2所示。
ICMP模塊僅實(shí)現(xiàn)了echo_reply包的回應(yīng)處理,顯得過(guò)于簡(jiǎn)單。對(duì)小型的協(xié)議棧而言,其所在的網(wǎng)絡(luò)環(huán)境相對(duì)簡(jiǎn)單,因而在大多數(shù)情況下都是適用的。
LWIP一般使用在終端設(shè)備上。終端設(shè)備所在的情形可作如下的劃分:一是單網(wǎng)卡、單網(wǎng)關(guān)的情形;二是單網(wǎng)卡、多網(wǎng)關(guān)的情形;三是多網(wǎng)卡、多網(wǎng)關(guān)的情形。單網(wǎng)卡、單網(wǎng)關(guān)的情形是LWIP最適合的情形。因?yàn)長(zhǎng)WIP本身沒(méi)有實(shí)現(xiàn)路由緩存,單網(wǎng)關(guān)的情形恰好不需要路由緩存,因?yàn)榇饲樾蜗戮W(wǎng)關(guān)總是唯一的,下一跳總是不變的。多網(wǎng)卡、多網(wǎng)關(guān)的情形可以看成是單網(wǎng)卡、多網(wǎng)關(guān)的特殊情形。
在單網(wǎng)卡、多網(wǎng)關(guān)的情形下,如果默認(rèn)網(wǎng)關(guān)的下一跳不是最優(yōu)下一跳,那么終端會(huì)收到一個(gè)路由重定向ICMP消息,告訴終端去往這個(gè)方向上,這個(gè)下一跳不是最優(yōu)的,并給出最優(yōu)下一跳。這就是所謂的路由重定向。如果終端一直不采用這個(gè)最優(yōu)下一跳,那么每一個(gè)發(fā)出的非最優(yōu)下一跳IP包都會(huì)收到路由器發(fā)來(lái)的一個(gè)重定向包。LWIP由于沒(méi)有實(shí)現(xiàn)路由緩存,不能記錄下網(wǎng)關(guān)發(fā)來(lái)的最優(yōu)下一跳,故對(duì)此消息的處理是忽略。忽略的結(jié)果是LWIP源源不斷地收到重定向包,這個(gè)包會(huì)經(jīng)過(guò)數(shù)據(jù)鏈路層、IP層,最終在ICMP層被丟棄,引起不必要的開(kāi)銷。
3 改進(jìn)思路
改進(jìn)的思路是在多網(wǎng)關(guān)情況下,處理ICMP包;但LWIP并沒(méi)有路由緩存功能,所以需要引入路由緩存功能,將此重定向的路由記錄下來(lái),以使得下次可使用。為降低內(nèi)存開(kāi)銷,可以在收到ICMP重定向包的情況下(此時(shí)表明是多網(wǎng)關(guān)情形,下一跳非最優(yōu)),再開(kāi)啟緩存,緩存這個(gè)下一跳地址。如果一段時(shí)間不用這個(gè)緩存,則清理出去。當(dāng)最后一條緩存也被清理后,就關(guān)閉緩存功能。這相當(dāng)于一個(gè)自適應(yīng)功能的路由緩存。在沒(méi)有重定向消息時(shí),使用原有的LWIP工作方式,不會(huì)引起額外的開(kāi)銷;在收到重定向消息時(shí),開(kāi)啟這個(gè)緩存功能,以避免重定向消息引起的額外處理開(kāi)銷。當(dāng)IP包的流向在一定時(shí)間內(nèi)集中于少數(shù)幾個(gè)目的地時(shí),這種方法會(huì)特別有效。
對(duì)路由緩存的更新,可采用一種類似于LFU(LeastFrequently Used)的算法。為此引入一個(gè)計(jì)數(shù)器,跟蹤當(dāng)前條目被使用的情況,定義MAX_CA_COUNT表示已經(jīng)過(guò)期,O~MAX_CA_COUNT之間的數(shù)字表示當(dāng)前計(jì)數(shù)值,同時(shí)每隔一段時(shí)間增加這個(gè)計(jì)數(shù)值。當(dāng)這個(gè)計(jì)數(shù)值增至MAx_CA_COUNT時(shí),認(rèn)為這個(gè)條目已經(jīng)過(guò)時(shí)。同時(shí)在插入條目時(shí),可利用這個(gè)計(jì)數(shù)器,總是選用這個(gè)數(shù)值最大的條目作為被替換對(duì)象(LFU算法)。
考慮到LWIP是個(gè)小型協(xié)議棧,不應(yīng)設(shè)置過(guò)于復(fù)雜的數(shù)據(jù)結(jié)構(gòu)及針對(duì)此種數(shù)據(jù)結(jié)構(gòu)的操作,把路由緩存的數(shù)據(jù)結(jié)構(gòu)定義為結(jié)構(gòu)體數(shù)組。數(shù)組的條目也不宜過(guò)多,以免占用過(guò)多資源;另外作為終端設(shè)備,在一小段既定的時(shí)間內(nèi),與其通信的對(duì)端具有一定的確定性,一般來(lái)說(shuō)比較少,重定向的條目也比較少,這也為使用較小的數(shù)組提供了一個(gè)理由。
tcp/ip相關(guān)文章:tcp/ip是什么
評(píng)論