關(guān) 閉

新聞中心

EEPW首頁 > 工控自動化 > 設(shè)計應(yīng)用 > 海量存儲機群系統(tǒng)中提高系統(tǒng)MTTF的設(shè)計和分析

海量存儲機群系統(tǒng)中提高系統(tǒng)MTTF的設(shè)計和分析

作者: 時間:2010-04-16 來源:網(wǎng)絡(luò) 收藏

下面,以m=3為例,求系統(tǒng)進入狀態(tài)m'的均值時間E3(T)。由一維生滅過程的瞬態(tài),可得以下方程組。其中,Pi(t)表示在t時刻系統(tǒng)處于狀態(tài)i的概率。


這是一個四元常系數(shù)線性微分方程組,可通過消元法消為一元線性微分方程,解之,然后可以求出其他各元的解。再根據(jù)邊界條件,可以求出各解中的系數(shù)。系統(tǒng)的邊界條件為

。 。

而E3(T)可表示為:

。。

為了求出E3(T)的具體值,還必須求出a3的值。限于篇幅,不加證明的給出如下求am的定理。

定理:如果一個擁有n個節(jié)點的,含kn個互不相同的數(shù)據(jù)塊,每個數(shù)據(jù)塊都有m個備份,每個備份隨機地分布于中不同的節(jié)點上,那么當(dāng)系統(tǒng)中出現(xiàn)有s-1個節(jié)點失效的時候,無數(shù)據(jù)塊丟失;而當(dāng)系統(tǒng)中出現(xiàn)有s個節(jié)點失效的時候,系統(tǒng)中出現(xiàn)某個數(shù)據(jù)塊無法挽回地丟失的概率為, 其中, 并且s>=1。

根據(jù)此定理,求出當(dāng)n=1000, m=3, k=100時a3=0.0006。

根據(jù)以上推導(dǎo),可求出E3(T)在不同條件下的值,得到在n=1000, l=1/(24*3600) (/秒)的配置下,當(dāng)lb=0.1(/秒)時,E3(T)=319天;當(dāng)lb=0.05(/秒)時,E3(T)=86天;當(dāng)lb=0.01(/秒)時,E3(T)=2天。類似地,可求出m=2時系統(tǒng)進入狀態(tài)m'的均值時間E2(T),得到在n=1000, l=1/(24*3600) (/秒)的配置下,當(dāng)lb=0.1(/秒)時,E2(T)=1.3小時;當(dāng)lb=0.05(/秒)時,E2(T)=0.73小時;當(dāng)lb=0.01(/秒)時,E2(T)=0.27小時。

以上數(shù)據(jù)可以得到兩個結(jié)論。第一,三個備份的系統(tǒng)比兩個備份的,能顯著地提升系統(tǒng)的。在通常配置下,三個備份的系統(tǒng)的可達幾十天;而兩個備份的系統(tǒng)的只能在1小時左右。第二,數(shù)據(jù)塊的轉(zhuǎn)移時間顯著地影響系統(tǒng)的MTTF,轉(zhuǎn)移時間越短,系統(tǒng)的MTTF越長。

4仿真實驗

下面,通過仿真實驗來驗證上面的結(jié)論。仿真實驗中的主要參數(shù)和限制條件如下。狀態(tài)塊總數(shù)與節(jié)點總數(shù)之比為rchunk=100,節(jié)點失效速率l=1/(24小時),節(jié)點恢復(fù)速率m=1/(24小時)。在進行狀態(tài)轉(zhuǎn)移時,源節(jié)點和目標(biāo)節(jié)點的選擇策略:源節(jié)點,必須包含該狀態(tài)塊的備份,同時其上正在進行拷貝的狀態(tài)塊數(shù)目必須最??;目標(biāo)節(jié)點,從所有不含該狀態(tài)塊的備份的節(jié)點中隨機選取,同時其上所存儲的狀態(tài)塊數(shù)目不能超過平均值的tcap=1.3。為保證狀態(tài)塊拷貝不影響系統(tǒng)的正常服務(wù),人為限制正在進行拷貝的節(jié)點數(shù)目不超過中節(jié)點總數(shù)的tratio=40%。為了同樣的目的,人為限制狀態(tài)塊拷貝只占用網(wǎng)絡(luò)帶寬的一半;若有多個狀態(tài)塊在向外輸出,則它們分享帶寬。網(wǎng)絡(luò)帶寬為100Mb/s,一個狀態(tài)塊大小為64M。為了使新加入的節(jié)點不在短時間里收到大量的新備份,人為限制每個節(jié)點正在進行拷貝的狀態(tài)塊數(shù)目不超過tcopy=1。實驗結(jié)果,如圖2所表示。這些限制條件均來自實際系統(tǒng)。


圖2不同備份數(shù)下的系統(tǒng)MTTF



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉