磁盤(pán)陣列技術(shù)原理學(xué)習(xí)
可靠性和可用性
這二個(gè)名詞雖然相互關(guān)連,事實(shí)上卻代表了硬盤(pán)故障的二個(gè)不同的方面,可靠性指的是硬盤(pán)在給定條件下發(fā)生故障的概率??捎眯灾傅氖怯脖P(pán)在某種用途中可能用的時(shí)間。利用這二個(gè)名詞,我們可以看到磁盤(pán)陣列是怎樣把我們的硬盤(pán)系統(tǒng)可靠性提高到接近百分之百的程度的。
磁盤(pán)陣列可以改善硬盤(pán)系統(tǒng)的可靠性。因?yàn)槟骋挥脖P(pán)中的數(shù)據(jù)可以從其它硬盤(pán)的數(shù)據(jù)中重新產(chǎn)生出來(lái)(例如RAID 5),所以很少會(huì)有機(jī)會(huì)使整個(gè)硬盤(pán)系統(tǒng)失效。硬盤(pán)子系統(tǒng)的可靠性因而大大改善了。
圖表9是RAID硬盤(pán)子系統(tǒng)與單個(gè)硬盤(pán)子系統(tǒng)的可靠性比較:
我們還必須考慮系統(tǒng)的可用性。單一硬盤(pán)系統(tǒng)的可用性比沒(méi)有數(shù)據(jù)冗余的磁盤(pán)陣列要好,而冗余磁盤(pán)陣列的可用性比單個(gè)硬盤(pán)的好得多。這是因?yàn)槿哂啻疟P(pán)陣列允許單個(gè)硬盤(pán)出錯(cuò),而繼續(xù)正常工作。此外,一個(gè)硬盤(pán)故障后的系統(tǒng)恢復(fù)時(shí)間也大大縮短(與從磁帶恢復(fù)數(shù)據(jù)相比)。最后,因?yàn)榘l(fā)生故障時(shí),硬盤(pán)上的數(shù)據(jù)是故障當(dāng)時(shí)的數(shù)據(jù),替后的硬盤(pán)也將包含故障時(shí)的數(shù)據(jù)(舉例說(shuō),前天晚上的備份數(shù)據(jù))。要得到完全的容錯(cuò)性能,計(jì)算器硬盤(pán)子系統(tǒng)的其它部件也必須有冗余例如提供二個(gè)電源,或者配備雙份硬盤(pán)控制器。沒(méi)有其它部件的冗余,即使有非??煽康挠脖P(pán)子系統(tǒng),還是不能完全防止計(jì)算機(jī)系統(tǒng)的失效。
最佳化的容錯(cuò)系統(tǒng)
如先前所述,直接分段的子系統(tǒng)(RAID 0)可以大大提高讀寫(xiě)速度(相對(duì)單個(gè)硬盤(pán)),因?yàn)閿?shù)據(jù)分散在多個(gè)硬盤(pán),硬盤(pán)操作可以同時(shí)進(jìn)行。
把二個(gè)直接分段的硬盤(pán)子系統(tǒng)組成鏡像,可以有效地構(gòu)成全冗余的快速硬盤(pán)子系統(tǒng)。這樣的子系統(tǒng),其硬盤(pán)操作甚至比直接分段的硬盤(pán)子系統(tǒng)還快,因?yàn)樵撓到y(tǒng)能同時(shí)執(zhí)行二個(gè)讀操作(每個(gè)硬盤(pán)一個(gè)讀操作),而寫(xiě)操作的速度則與非鏡像直接分段子系統(tǒng)幾乎一樣,因?yàn)榘褦?shù)據(jù)同時(shí)寫(xiě)入二個(gè)硬盤(pán)只需花費(fèi)很少的額外開(kāi)銷(xiāo)。
通過(guò)我們前面所述的概念,例如雙工:(雙控制器,雙電源等),可以進(jìn)一步改善有關(guān)冗余方面的問(wèn)題。雙控制器還使我們得到更高的數(shù)據(jù)傳輸速度,因?yàn)榭刂破鞒蔀樽酉到y(tǒng)性能瓶頸的可能性更小了。
磁盤(pán)陣列技術(shù)術(shù)語(yǔ)
硬盤(pán)鏡像(Disk Mirroring):硬盤(pán)鏡像最簡(jiǎn)單的形式是,一個(gè)主機(jī)控制器帶二個(gè)互為鏡像的硬盤(pán)。數(shù)據(jù)同時(shí)寫(xiě)入二個(gè)硬盤(pán),二個(gè)硬盤(pán)上的數(shù)據(jù)完全相同,因此一個(gè)硬盤(pán)故障時(shí),另一個(gè)硬盤(pán)可提供數(shù)據(jù)。
硬盤(pán)數(shù)據(jù)跨盤(pán)(Disk Spanning):利用這種技術(shù),幾個(gè)硬盤(pán)看上去像是一個(gè)大硬盤(pán);這個(gè)虛擬盤(pán)可以把數(shù)據(jù)跨盤(pán)存儲(chǔ)在不同的物理盤(pán)上,用戶不需關(guān)心哪個(gè)盤(pán)上存有他需要的數(shù)據(jù)。
硬盤(pán)數(shù)據(jù)分段(Disk Striping):數(shù)據(jù)分散存儲(chǔ)在幾個(gè)盤(pán)上。數(shù)據(jù)的第一段放在盤(pán)0,第2段放在盤(pán)1,……直至達(dá)到硬盤(pán)鏈中的最后一個(gè)盤(pán),然后下一個(gè)邏輯段將放在硬盤(pán)0,再下一個(gè)邏輯段放在盤(pán)1,如此循環(huán)直至完成寫(xiě)操作。
雙控(Duplexing):這里指的是用二個(gè)控制器來(lái)驅(qū)動(dòng)一個(gè)硬盤(pán)子系統(tǒng)。一個(gè)控制器發(fā)生故障,另一個(gè)控制器馬上控制硬盤(pán)操作。此外,如果編寫(xiě)恰當(dāng)?shù)目刂破鬈浖蓪?shí)現(xiàn)不同的硬盤(pán)驅(qū)動(dòng)器同時(shí)工作。
容錯(cuò)(Fault Tolerant):具有容錯(cuò)功能的機(jī)器有抗故障的能力。例如RAID 1鏡像系統(tǒng)是容錯(cuò)的,鏡像盤(pán)中的一個(gè)出故障,硬盤(pán)子系統(tǒng)仍能正常工作。
主機(jī)控制器(Host Adapter):這里指的是使主機(jī)和外設(shè)進(jìn)行數(shù)據(jù)交換的控制部件(如SCSI控制器)。
熱修復(fù)(Hot Fix):指用一個(gè)硬盤(pán)熱備份來(lái)替換發(fā)生的故障的硬盤(pán)。要注意故障盤(pán)并不是真正地被物理替換了。用作熱備份的盤(pán)被加載上故障盤(pán)原來(lái)的數(shù)據(jù),然后系統(tǒng)恢復(fù)工作。
熱補(bǔ)(Hot Patch):具有硬盤(pán)熱備份,可隨時(shí)替換故障盤(pán)的系統(tǒng)。
熱備份(Hot Spare):與CPU系統(tǒng)電連接的硬盤(pán),它能替換下系統(tǒng)中的故障盤(pán)。與冷備份的區(qū)別是,冷備份盤(pán)平時(shí)與機(jī)器不相連接,硬盤(pán)故障時(shí)才換下故障盤(pán)。
平均數(shù)據(jù)丟失時(shí)間(MTBDL-Mean Time Between Data Loss):發(fā)生數(shù)據(jù)丟失的事件間的平均時(shí)間。
平均無(wú)故障工作時(shí)間(MTBF-Mean Time Between Failure或MTIF):設(shè)備平均無(wú)故障運(yùn)行時(shí)間。
廉價(jià)冗余磁盤(pán)陣列(RAID-Redundant Array of Inexpensive Drives):一種將多個(gè)廉價(jià)硬盤(pán)組合成快速,有容錯(cuò)功能的硬盤(pán)子系統(tǒng)的技術(shù)。
系統(tǒng)重建(Reconstruction or Rebuild):一個(gè)硬盤(pán)發(fā)生故障后,從其它正確的硬盤(pán)數(shù)據(jù)和奇偶信息恢復(fù)故障盤(pán)數(shù)據(jù)的過(guò)程。
恢復(fù)時(shí)間(Reconstruction Time):為故障盤(pán)重建數(shù)據(jù)所需要的時(shí)間。
單個(gè)大容量硬盤(pán)(SLED-Singe Expensive Drive)。
傳輸速率(Transfer Rate):指在不同條件下存取數(shù)據(jù)的速度。
虛擬盤(pán)(Virtual Disk):與虛擬存儲(chǔ)器類(lèi)似,虛擬盤(pán)是一個(gè)概念盤(pán),用戶不必關(guān)心他的數(shù)據(jù)寫(xiě)在哪個(gè)物理盤(pán)上。虛擬盤(pán)一般跨越幾個(gè)物理盤(pán),但用戶看到的只是一個(gè)盤(pán)。
評(píng)論