基于WDM的精確定時器及其在冗余技術(shù)中的應(yīng)用
摘 要: 現(xiàn)代軍用電子設(shè)備和某些控制系統(tǒng)對設(shè)備的可靠性要求越來越高。針對此情況利用設(shè)備冗余原理, 提出一種基于WDM 的精確定時器實(shí)現(xiàn)設(shè)備冗余的方法。利用此方法設(shè)計了雙冗余CAN 總線板卡及其在Windows XP 系統(tǒng)下的驅(qū)動程序, 給出了部分驅(qū)動實(shí)現(xiàn)細(xì)節(jié)和相關(guān)流程。結(jié)果表明該方法可成功實(shí)現(xiàn)雙CAN 接口卡在總線故障情況下的冗余切換,提高了設(shè)備可靠性。
本文引用地址:http://butianyuan.cn/article/149707.htm0 引 言
高可靠性是現(xiàn)代軍用電子設(shè)備和某些控制系統(tǒng)的首要需求。冗余技術(shù)是計算機(jī)系統(tǒng)可靠性設(shè)計中常采用的一種技術(shù), 是提高計算機(jī)系統(tǒng)可靠性的最有效方法之一。合理的冗余設(shè)計將大大提高系統(tǒng)的可靠性, 但同時也增加了系統(tǒng)的復(fù)雜度和設(shè)計的難度, 應(yīng)用冗余配置的系統(tǒng)還增加了用戶投資。因此, 如何對冗余設(shè)計進(jìn)行合理有效的設(shè)計, 是值得深入研究的課題。
1:1 熱冗余也就是所謂的雙重化, 是其中一種有效的冗余方式, 但它并不是兩個部件簡單的并聯(lián)運(yùn)行,而是需要硬件、軟件、通信等協(xié)同工作來實(shí)現(xiàn)。將互為冗余的兩個部件構(gòu)成一個有機(jī)的整體, 通常包括以下多個技術(shù)要點(diǎn): 信息同步技術(shù)、故障檢測技術(shù)、故障仲裁技術(shù)和切換技術(shù)、熱插拔技術(shù)和故障隔離技術(shù)等。
本文將WDM 的定時器功能應(yīng)用在冗余技術(shù)中,為系統(tǒng)的故障檢測和切換技術(shù)提供了一種解決方案, 并以雙冗余CAN 總線接口板為例測試本設(shè)計的可行性。
1 冗余技術(shù)
冗余技術(shù)有兩種方式: 工作冗余和后備冗余。工作冗余是對關(guān)鍵設(shè)備以雙重或三重的原則來重復(fù)配置, 這些設(shè)備同時處于工作運(yùn)行狀態(tài), 工作過程中若某一臺設(shè)備出現(xiàn)故障, 它會自動脫離系統(tǒng), 但并不影響系統(tǒng)的正常工作。后備冗余方式是使一臺設(shè)備投入運(yùn)行, 另一臺冗余設(shè)備處于熱備用狀態(tài), 但不投入運(yùn)行, 在線運(yùn)行設(shè)備一旦出現(xiàn)故障, 后備設(shè)備立即投入運(yùn)行。常用的冗余系統(tǒng)按其結(jié)構(gòu)可分為并聯(lián)系統(tǒng)、備用系統(tǒng)和表決系統(tǒng)三種。最簡單的冗余設(shè)計是并聯(lián)裝置, 其他方法還有串并聯(lián)或并串聯(lián)混合裝置和多數(shù)表決裝置等。當(dāng)某部分可靠性要求很高, 但目前的技術(shù)水平和方法很難滿足時, 冗余技術(shù)可能成為惟一較好的設(shè)計方法。但是冗余設(shè)計往往使系統(tǒng)的體積、重量、費(fèi)用和復(fù)雜度均相應(yīng)增加。因此, 除了重要的關(guān)鍵設(shè)備, 對于一般產(chǎn)品不宜采用冗余技術(shù)。
冗余配置雖然增加系統(tǒng)的投資, 但它提高了整個用戶系統(tǒng)的平均無故障時間( MTBF) , 縮短了平均故障修復(fù)時間( MT TR) 。因此, 在重要場合的控制系統(tǒng)中, 冗余技術(shù)的采用可有效提高系統(tǒng)的可靠性。
一個冗余系統(tǒng)要工作通常是硬件與軟件的配合完成的。在硬件上需要有幾個相同的, 可獨(dú)立工作的設(shè)備。在軟件上來說, 就是在實(shí)現(xiàn)系統(tǒng)功能的同時, 要有錯誤檢測功能和動態(tài)切換功能, 并且要在盡可能短的時間內(nèi)完成切換動作。下面以雙CAN 總線接口卡為例,主要從軟件方面詳述本后備冗余設(shè)計的實(shí)現(xiàn)細(xì)節(jié)。
2 硬件設(shè)計
CAN 控制器采用Philips 的SJA1000, 工作于BasicCAN 模式或PeliCAN 模式下, PeliCAN 模式支持CAN 2. 0B 協(xié)議, 采用8 位地址/ 數(shù)據(jù)復(fù)用總線接口。
如圖1 所示, PCI 總線雙CAN 接口卡由2 片SJA1000 提供兩路獨(dú)立的CAN 接口, 每片芯片的8 位地址/ 數(shù)據(jù)總線和讀寫控制信號、鎖存信號直接與PCI9052 相連。SJA1000 輸出信號經(jīng)過光耦到CAN 收發(fā)器PCA82C250, PCA82C250 供電電源為隔離電源,由隔離電源轉(zhuǎn)換模塊提供。CAN 總線的復(fù)位信號由FPGA 提供, CAN 控制器SJA1000 的中斷信號輸出到FPGA。
圖1 CAN 冗余模塊系統(tǒng)結(jié)構(gòu)圖。
3 軟件設(shè)計
3. 1 WDM 模式驅(qū)動程序
在Window s XP 操作系統(tǒng)中, 運(yùn)行于用戶模式的應(yīng)用程序訪問硬件資源是通過Win32 API 調(diào)用內(nèi)核模式的驅(qū)動程序?qū)崿F(xiàn)的。這種內(nèi)核模式的驅(qū)動程序就是WDM(Window s Driver Model) 驅(qū)動程序, 它是微軟在Window s XP 操作系統(tǒng)中提出的新的驅(qū)動程序模式, 支持即插即用、電源管理和I/ O 管理等功能。圖2 是Window s XP 的系統(tǒng)結(jié)構(gòu)。
如圖2 所示設(shè)備驅(qū)動程序是操作系統(tǒng)的一個組成部分, 它由I/ O 管理器( I/ O Manager ) 管理和調(diào)動。
I/ O管理器每收到一個來自用戶應(yīng)用程序的請求就創(chuàng)建一個I/ O 請求包( IRP) 的數(shù)據(jù)結(jié)構(gòu), 并將其作為參數(shù)傳遞給驅(qū)動程序。驅(qū)動程序通過識別IRP 中的物理設(shè)備對象( PDO) 來區(qū)別是發(fā)送給哪一個設(shè)備。IRP 結(jié)構(gòu)中存放請求的類型、用戶緩沖區(qū)的首地址、用戶請求數(shù)據(jù)的長度等信息。驅(qū)動程序處理完這個請求后, 在該結(jié)構(gòu)中填入處理結(jié)果的有關(guān)信息, 調(diào)用IoCompleteRequeST 將其返回給I/ O 管理器, 用戶應(yīng)用程序的請求隨即返回。訪問硬件時, 驅(qū)動程序通過調(diào)用硬件抽象層的函數(shù)實(shí)現(xiàn)。
圖2 Windows XP 系統(tǒng)結(jié)構(gòu)。
WDM 的開發(fā)可采用DDK, DriverWorks 等開發(fā)工具。以下重點(diǎn)描述在此WDM 驅(qū)動實(shí)例中采用定時查詢實(shí)現(xiàn)CAN 總線冗余功能。
3. 2 驅(qū)動冗余設(shè)計
本設(shè)計中, CAN 通路采用2 路冗余, 使得當(dāng)一個CAN 總線接口出現(xiàn)故障時, 可以很方便地切換到另一個CAN 總線接口。
故障檢測在定時器中實(shí)現(xiàn)。在DriverWorks 中有兩種定時器對象, 即附屬于設(shè)備對象的1 Hz 定時器和KTimedCallback 類定義的定時器, WDM 定時方法是通過它們實(shí)現(xiàn)的。KT imedCal lback 是KTimer 的派生類, KTimer 封裝了系統(tǒng)定時器, 構(gòu)成分發(fā)對象定時器類, 可用于同步目的。KT imedCal lback 類包含了系統(tǒng)延時過程調(diào)用( DPC) 對象, 當(dāng)定時器超時后系統(tǒng)就調(diào)用DPC。KTimedCallback 的成員函數(shù)主要是Set 和SetPeriodic, Set 用于設(shè)置一次有效定時器參數(shù), SetPeriodie 設(shè)置周期性定時器參數(shù), Set 和SetPeriodic 在設(shè)置定時參數(shù)時同時啟動定時器并建立與回調(diào)函數(shù)的關(guān)聯(lián),定時器超時后調(diào)用回調(diào)函數(shù)。
具體的切換工作放在DPC 中完成。DPC 為推遲過程調(diào)用, 一些操作不適合在ISR 中處理需放入限制較少的DPC 中, 如通知事件置標(biāo)記等等。DPC 是一個通用機(jī)制, 但通常都用在中斷處理中。在最普通的情況下, ISR 決定當(dāng)前請求的完成并請求一個DPC。之后,內(nèi)核在DISPATCH_LEVEL 級上調(diào)用這個DPC 例程。
因此DPC 中的代碼要比ISR 中的代碼有更少的限制。
特別是, DPC 例程可以調(diào)用像IoCompleteRequest 或Io StartNextPacket 這樣的例程, 在一個I/ O 操作的結(jié)尾處調(diào)用這些例程在邏輯上是必要的。圖3 描述了具體DPC 調(diào)用處理過程。
圖3 DPC 處理過程。
冗余切換查詢時間可以在設(shè)備屬性中添加切換時間周期項, 通過修改設(shè)備屬性的方式在線修改, 修改后設(shè)備管理器自動更新驅(qū)動。
在雙CAN 冗余系統(tǒng)中, 較之硬件結(jié)構(gòu)而言, 軟件設(shè)計相對復(fù)雜得多, 其關(guān)鍵之處在于CAN 系統(tǒng)故障檢測及CAN 系統(tǒng)自動切換。由于采用兩套完全獨(dú)立的傳輸介質(zhì)、總線驅(qū)動器和總線控制器, 因此它們能分別獨(dú)立檢測到自己通道的故障, 比如CANH 與CANL 短路, CANH 或CANL 斷開、CANH 與地短路、CANL 與電源短路、總線驅(qū)動器損壞等。實(shí)際調(diào)試中發(fā)現(xiàn), 如果CANH 、CANL 斷開或只有一個發(fā)送器在總線上, 均會造成發(fā)送/ 接收錯誤計數(shù)器不斷增加到128, 使節(jié)點(diǎn)處于忽略錯誤態(tài); 而CANH 與CANL 短路、CANH 與地短路或CAN L 與電源短路均會造成發(fā)送/ 接收錯誤計數(shù)器不斷增加到256, 使節(jié)點(diǎn)處于總線脫離態(tài)。所以,通過節(jié)點(diǎn)狀態(tài)改變中斷子程序中調(diào)用CAN 冗余模塊,可以達(dá)到實(shí)現(xiàn)上述故障自動檢測及CAN 系統(tǒng)自動切換的目的。
3. 3 冗余測試
測試時采用一個有兩個通道CAN 分析儀分別連接本CAN 板的A, B 通道上, 在從A 通道連續(xù)發(fā)送數(shù)據(jù)至分析儀的過程中, 手動斷開此鏈接, 則備用通道B開始工作, 切換成功。對冗余切換時間的測試可以通過比較發(fā)送端和接收端間數(shù)據(jù)量的差值來判斷。具體方法是在發(fā)送端以10 ms 為周期不停發(fā)送數(shù)據(jù)包, 正常情況下發(fā)送端的數(shù)據(jù)包數(shù)量與接收端的數(shù)據(jù)包數(shù)量是相等的。在切換動作時, 會有一些數(shù)據(jù)包被丟棄, 這時通過計算發(fā)送端與接收端數(shù)據(jù)包的差值乘以10 ms, 即為此次切換的切換時間。在本例中, 通過多次這樣的測試, 得出平均切換時間在30 ms 左右, 完全能滿足對計算機(jī)系統(tǒng)高可靠性的要求。
4 結(jié) 論
提出一種設(shè)備冗余的系統(tǒng)設(shè)計方法, 為系統(tǒng)的故障檢測和切換技術(shù)提供了一種解決方案。利用此方法設(shè)計了雙冗余CAN 總線板卡以及在Window s XP 系統(tǒng)下的WDM 驅(qū)動。該模塊工作穩(wěn)定, 數(shù)據(jù)傳輸可靠, 冗余切換切實(shí)可行。并可依據(jù)實(shí)際使用要求在線修改定時查詢時間。這種冗余實(shí)現(xiàn)方法在提高設(shè)備可靠性方面具有一定的實(shí)用價值。
評論