基于動(dòng)態(tài)可重構(gòu)FPGA的容錯(cuò)技術(shù)研究
先將整個(gè)系統(tǒng)在減少模塊間布線難度的情況下按照算法分塊。然后將每個(gè)模塊所使用的資源在有2/9以9等分為例,冗余資源的情況下進(jìn)行9等分,這為第二級(jí)劃分。如圖5所示。現(xiàn)在需要解決的是配置文件的設(shè)計(jì)以及布局的問題。設(shè)計(jì)時(shí),對(duì)實(shí)現(xiàn)相同功能的每—個(gè)算法模塊進(jìn)行多種不同的布局,每—個(gè)布局都留出其中2/9的冗余資源。當(dāng)然其算秸結(jié)構(gòu)可以不同,而實(shí)現(xiàn)相同功能的不同算法也可能會(huì)達(dá)到容錯(cuò)的效果,這將提高系統(tǒng)的容錯(cuò)能力。相同功能算法的不同布局結(jié)構(gòu)如圖6所示。本文引用地址:http://butianyuan.cn/article/191243.htm
基于算法和資源兩級(jí)分塊的容錯(cuò)結(jié)構(gòu),在系統(tǒng)出現(xiàn)異常的情況下,首先采用相同的配置文件對(duì)電路進(jìn)行重構(gòu)。重構(gòu)后如果異常消除,那么容錯(cuò)過程完成,而且出現(xiàn)的錯(cuò)誤屬于暫態(tài)錯(cuò)誤。在系統(tǒng)工作的過程中,需要周期性地記錄電路的狀態(tài),當(dāng)出現(xiàn)故障然并進(jìn)行重構(gòu)后應(yīng)該將記錄的狀態(tài)進(jìn)行裝載,以保持系統(tǒng)連續(xù)性及電路工作的正確性。如果這樣的重構(gòu)仍然沒有解決問題,那么改變配置文件,利用布局不同的配置文件進(jìn)行部分動(dòng)態(tài)重構(gòu),用以解決永久性的故障。重構(gòu)前后算法的功能應(yīng)該保持不變,通過不同布局的重構(gòu)使電路可以繞開硬件故障區(qū),達(dá)到容錯(cuò)的目的。
為解決重構(gòu)前后的通信問題,采取類似總線宏(Bus Macro)的通信結(jié)構(gòu),保持模塊間重構(gòu)前后通信布線不變。而且每一次重構(gòu),必須保證4個(gè)方向的通信端口和內(nèi)部模塊連接也不變,重構(gòu)后的電路都接在原有對(duì)外接口上。總線宏只能用于相鄰的兩個(gè)模塊間的通信,對(duì)于不相鄰的模塊間的通信,采用稱作可重構(gòu)多路總線(Recongigurable Multiple Bus)的動(dòng)態(tài)開關(guān)信號(hào)的通信結(jié)構(gòu)。以一維結(jié)構(gòu)為例,即現(xiàn)有模塊分布在一條線上。當(dāng)一個(gè)模塊Mk需要和另一個(gè)不與自己相鄰的模塊通信時(shí),它向與自己相鄰的且與要通信的模塊在相同方向上的模塊Mk+1發(fā)出請(qǐng)求,Mk+1再向Mk+2發(fā)出請(qǐng)求,如是依次下去直到需要通信的模塊Mk+i收到信號(hào),接著它以相反的路徑返回一個(gè)應(yīng)答信號(hào),當(dāng)Mk收到應(yīng)答信號(hào)后,兩者開始通信。
2.2 方法分析
假設(shè)在第二級(jí)劃分時(shí)將每一個(gè)模塊所占用的資源分成N2等分,稱N為等分?jǐn)?shù),冗余資源為N-1,每一個(gè)資源單位出錯(cuò)概率為P(N),則系統(tǒng)正常工作的概率為
由仿真結(jié)果可知,隨著每一個(gè)模塊所占資源等分?jǐn)?shù)的增加,系統(tǒng)容錯(cuò)能力提高,而同時(shí)冗余資源所占的比例卻下降??梢钥吹剑谒惴ê唾Y源的兩級(jí)分塊容錯(cuò)結(jié)構(gòu),相對(duì)于以往基于模塊的重構(gòu)方法,進(jìn)一步降低了系統(tǒng)的容錯(cuò)粒度,提高了系統(tǒng)的容錯(cuò)率和冗余資源的使用效率,而且在容錯(cuò)的同時(shí)起到了檢錯(cuò)和定位的作用。省去了實(shí)際用于檢錯(cuò)和定位的硬件或軟件開銷,而且系統(tǒng)也不需要在線計(jì)算配置文件等,提高了系統(tǒng)的連續(xù)性和可靠性。
由于重構(gòu)前后模塊對(duì)外功能接口都不變,相當(dāng)于一個(gè)電路黑盒子,節(jié)省了外部布局布線的時(shí)間和計(jì)算時(shí)間,系統(tǒng)容錯(cuò)時(shí)開銷降低。其他的一些冗余方法,例如以CLB為最小單元,每次利用冗余資源繞過故障區(qū)需要復(fù)雜的布局布線,而這樣的布局布線所造成的延遲是難以避免的,只有通過降低芯片工作頻率來(lái)保證系統(tǒng)時(shí)序的穩(wěn)定。而現(xiàn)在所采取的結(jié)構(gòu)雖然在布局上進(jìn)行了兩次劃分,但是對(duì)于每一個(gè)模塊的外部仍然是基于功能模塊的容錯(cuò),每次都是以經(jīng)過測(cè)試的成熟的功能算法為單元的,不存在算法內(nèi)部重新布線后造成延遲的問題,保證了系統(tǒng)的高速運(yùn)行,這也是本方法的主要特點(diǎn)。
采用逐級(jí)劃分的方法可以合理的選擇所需的容錯(cuò)粒度,以及容錯(cuò)能力。可是隨著級(jí)數(shù)和對(duì)每一個(gè)模塊等分?jǐn)?shù)目的增加,預(yù)編譯的配置文件數(shù)量將增大,這樣系統(tǒng)需要較多的存儲(chǔ)資源來(lái)存儲(chǔ)這些文件。如果采用遺傳算法,根據(jù)硬件資源與工作模塊的分級(jí)分塊結(jié)構(gòu)進(jìn)行在線計(jì)算,那么這個(gè)問題將得到解決。
3 結(jié)束語(yǔ)
文章對(duì)基于FPGA的動(dòng)態(tài)可重構(gòu)技術(shù)在容錯(cuò)領(lǐng)域的應(yīng)用進(jìn)行了研究。針對(duì)重構(gòu)文件的大小,動(dòng)態(tài)容錯(cuò)時(shí)隙的長(zhǎng)短、資源利用率、實(shí)現(xiàn)的復(fù)雜性、模塊間通信方式、冗余資源的比例與布局等方面的問題分析了一些方法的優(yōu)缺點(diǎn),針對(duì)突出的問題,提出了一種基于算法和資源多級(jí)分塊的容錯(cuò)方法,可以在不影響系統(tǒng)工作的情況下完成基于動(dòng)態(tài)重構(gòu)的容錯(cuò)。這種方法結(jié)構(gòu)簡(jiǎn)單,多項(xiàng)參數(shù)可以選擇,尤其是粒度的可變性。冗余資源比例較低,重構(gòu)時(shí)沒有對(duì)模塊外進(jìn)行布線的要求,不會(huì)因重構(gòu)造成延遲而降低系統(tǒng)的工作頻率。
評(píng)論