SAF-TE技術(shù)在磁盤陣列背板中的實(shí)現(xiàn)
摘 要:在磁盤陣列中,一般使用背板方式連接硬盤,這樣服務(wù)器可在不關(guān)機(jī)的情況下直接更換損壞的硬盤。在背板設(shè)計(jì)中采用SAF-TE監(jiān)控技術(shù)不僅可以隨時(shí)監(jiān)控硬盤的好壞、對(duì)損壞的硬盤提供LED指示并報(bào)警,同時(shí)還可以實(shí)現(xiàn)對(duì)系統(tǒng)風(fēng)扇、溫度及電壓的實(shí)時(shí)監(jiān)控。本文將以SAF-TE控制器GEM318為例,介紹其在曙光2U服務(wù)器硬盤熱插拔背板設(shè)計(jì)中的具體應(yīng)用。
關(guān)鍵詞:SAF-TE;GEM318;I2C;PCB布線
SAF-TE控制技術(shù)
SAF-TE(SCSI Accessed Fault-Tolerant Enclosure) 是Intel公司提出的一種標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)定義了一組命令,這些命令可用于設(shè)置RAID陣列和獲得陣列中磁盤的狀態(tài)信息,并在實(shí)現(xiàn)對(duì)熱插拔磁盤進(jìn)行管理的同時(shí),為用戶提供磁盤陣列的環(huán)境狀態(tài)信息。這樣就在主機(jī)、RAID控制器、存儲(chǔ)設(shè)備、背板、電源及其它設(shè)備間建立了有效的通信途徑。
與以往的背板相比,采用SAF-TE控制技術(shù)的熱插拔背板,具有以下優(yōu)點(diǎn):可進(jìn)行驅(qū)動(dòng)器狀況監(jiān)控并在熱插拔底板上顯示磁盤驅(qū)動(dòng)器的狀態(tài)信息。這就允許客戶快速地確認(rèn)并更換一個(gè)已經(jīng)無效的或者可能有故障的磁盤驅(qū)動(dòng)器。在更換了損壞的硬盤后,RAID的重建可自動(dòng)進(jìn)行,而無須再經(jīng)手動(dòng)操作RAID控制器來完成。在硬盤的恢復(fù)過程中,不影響系統(tǒng)的服務(wù)。如果沒有SAF-TE,自動(dòng)重建工作只能是在有備用磁盤存在的情況下方可完成。由于不需在陣列中放置備用磁盤,使用SAF-TE可實(shí)現(xiàn)磁盤陣列中適用磁盤數(shù)量的最大化。
電路設(shè)計(jì)
GEM318 是一款低成本、自完備的熱插拔硬盤背板管理控制器,只需簡單的外圍器件就可實(shí)現(xiàn)SAF-TE管理功能。由于其低成本和小封裝的特點(diǎn),使其成為1U和2U服務(wù)器節(jié)點(diǎn)背板設(shè)計(jì)中首選的解決方案。
硬件電路設(shè)計(jì)
GEM318具有LVDS接口,作為SCSI的一個(gè)目標(biāo)設(shè)備存在,并占一個(gè)ID號(hào),支持SAF-TE 1.0規(guī)范。具有一個(gè)I2C接口,當(dāng)工作在主方式下,可以讀取外部的溫度傳感器LM75和NVRAM AT24C01里面的組態(tài)數(shù)據(jù)。最多支持8個(gè)SCSI設(shè)備,具有8個(gè)LED控制引腳。支持兩個(gè)LM75溫度傳感器,具體設(shè)計(jì)電路如圖1所示。
硬盤插拔檢測
該背板支持6塊SCSI硬盤,所以只需將GEM318的DEV_INS5~0這6個(gè)引腳分別連接到背板上6個(gè)SCSI插槽的MATED引腳即可。該引腳正常為高電平,當(dāng)某個(gè)槽中有硬盤插入時(shí),硬盤的MATED引腳會(huì)將相應(yīng)的DEV_INS引腳電平拉低。這樣,GEM318就依此來判斷每個(gè)SCSI插槽上硬盤的插拔狀態(tài)。
當(dāng)GEM318檢測到某個(gè)DEV_INS引腳出現(xiàn)由高到低的電平跳變后,會(huì)立即使能SCSI總線上的復(fù)位信號(hào),使得SCSI設(shè)備處于復(fù)位狀態(tài)(如圖2所示)。這樣就有效的“屏蔽”了硬盤插入瞬間對(duì)SCSI總線信號(hào)的干擾,從而保證了SCSI總線信號(hào)的可靠性傳輸。
故障報(bào)警及LED指示
GEM318可以把SAF-TE命令寄存器記錄的錯(cuò)誤信息及時(shí)傳遞給報(bào)警輸出引腳FAULT_IN。這樣,GEM318就可隨時(shí)把出錯(cuò)信息以聲光報(bào)警的方式通知給用戶。
設(shè)計(jì)中將溫度、風(fēng)扇和電壓檢測電路的邏輯輸出,通過7411三輸入與門芯片輸出給GEM318的外部故障輸入引腳G_ALARM(低電平有效),以實(shí)現(xiàn)監(jiān)控盤陣工作環(huán)境的目的。
LED7~0輸出引腳用來驅(qū)動(dòng)外部的LED,分別顯示相對(duì)應(yīng)的硬盤狀態(tài)信息。
LVDS信號(hào)接口與ID設(shè)置
GEM318支持LVDS信號(hào)接口方式,LVDS是電流驅(qū)動(dòng)模式,350mV的低電壓擺幅可以提供幾百兆比特的信號(hào)傳輸率。使用差分傳輸?shù)姆绞娇梢允闺姶鸥蓴_互相抵消,消除共模噪聲,減少EMI。
GEM318有兩個(gè)ID可選:ID6或ID8。目的是為了當(dāng)盤陣中一個(gè)SCSI通道的硬盤數(shù)超過8時(shí),可采用兩個(gè)GEM318。設(shè)計(jì)時(shí)將GEM318的ID_ON1+/ID_ON1- 連到SCSI總線上的DB6+/DB6-,將GEM318的ID號(hào)設(shè)為6。
通過硬件電路跳線和NVRAM組態(tài)GEM318
GEM318具有很大的設(shè)計(jì)靈活性,可以在上電時(shí)通過讀取輸出引腳的電平狀態(tài)和NVRAM中的數(shù)據(jù)來配置GEM318的特性。
LED7~0引腳在系統(tǒng)上電時(shí),在GEM318的RESET信號(hào)有效期間作為輸入引腳使用。要求RESET信號(hào)至少要保持5個(gè)時(shí)鐘周期。
LED7~0上電初期的引腳電平設(shè)計(jì)時(shí)由上拉或下拉電阻決定,此期間要求驅(qū)動(dòng)LED顯示的供電電源LED_VDD暫停供電,以便GEM318能讀到準(zhǔn)確的低電平信息。LED_VDD延遲上電的時(shí)間t可通過調(diào)整C31和R22的值來決定。設(shè)計(jì)電路如圖3所示,電源時(shí)序如圖4所示。
設(shè)計(jì)時(shí)NVRAM選用的是AT24C01,上電時(shí)GEM318將從AT24C01的40H存儲(chǔ)單元讀取信息。通過對(duì)AT24C01編程可設(shè)置以下選項(xiàng):Slot的數(shù)目,每個(gè)Slot的SCSI ID號(hào),設(shè)置溫度傳感器的數(shù)目及溫度報(bào)警上下限值等。
串行通信設(shè)計(jì)
GEM318的串行通信接口兼容I2C規(guī)范,即可工作在主方式下也可工作在從方式下。工作在主方式下時(shí)可支持多主競爭,在背板設(shè)計(jì)上預(yù)留了I2C插針,這就為外部的控制設(shè)備訪問盤陣信息提供了可能。當(dāng)工作在從方式下時(shí),GEM318有兩個(gè)從地址可選。設(shè)計(jì)時(shí)將ID_ON1接到SCSI總線上,把GEM318的從地址設(shè)為E1H。如果將ID_ON0接到總線則從地址為E3H。
PCB設(shè)計(jì)
背板要求支持320Mbps的SCSI總線傳輸速率,SCSI總線采用LVDS信號(hào)傳輸技術(shù),為保證信號(hào)的可靠傳輸,PCB布線至關(guān)重要。印制板的主要技術(shù)參數(shù)如下:
1. 尺寸是270mm X 84mm,板厚為2mm。
2. 采用六層板設(shè)計(jì),信號(hào)從頂層到底層的布局依次為TOP層,GND層,信號(hào)1層,信號(hào)2層,信號(hào)3層和BOTTOM層。其中信號(hào)2層布12V電源,信號(hào)3層鋪5V電源。
在布線中應(yīng)注意以下幾點(diǎn):
1. 優(yōu)先考慮電源和地在系統(tǒng)中的分布。
2. 使TTL信號(hào)和LVDS信號(hào)相互隔離,最好分布在不同的層。
3. 盡量多使用去耦電容。
4. 大電流回路布線盡量加粗,保持PCB地線層返回路徑盡量寬而短。
5. 對(duì)于差分布線采用手動(dòng)布線功能,使差分線對(duì)離開集成芯片后盡可能地相互靠近。每對(duì)差分線的間隔要盡量小,差分對(duì)間的長度要匹配。這樣能減少反射并能確保耦合到的噪聲為共模噪聲。
6. 進(jìn)行阻抗控制,通過阻抗設(shè)計(jì)軟件計(jì)算阻抗以確定差分線寬及線間距。
7. 背板上設(shè)計(jì)終結(jié)器電路,以吸收反射信號(hào)。
8. 走線時(shí)避免90洌ㄒ苑澇斐勺榪共渙沒∠呋?5畢嘰妗?
結(jié)語
采用SAF-TE控制技術(shù)設(shè)計(jì)的SCSI背板,已廣泛應(yīng)用在曙光的系列產(chǎn)品中。經(jīng)兩年多的實(shí)際運(yùn)行,證明系統(tǒng)工作可靠,性能穩(wěn)定,保證了熱插拔硬盤的安全穩(wěn)定運(yùn)行。該控制技術(shù)在產(chǎn)品中的采用,改變了傳統(tǒng)的熱插拔背板只能監(jiān)控溫度和風(fēng)扇信息,而不能與主機(jī),硬盤控制器通信的缺陷。為服務(wù)器存儲(chǔ)系統(tǒng)的安全穩(wěn)定運(yùn)行提供了有效的保障?!?/p>
參考文獻(xiàn)
1 SCSI Accessed Fault-Tolerant Enclosures Interface and Specification
2 GEM318 Guardian Enclosure Management Controller Data Sheet
3 GEM318 Guardian Management Controller Technical Manual
評(píng)論