新聞中心

EEPW首頁(yè) > 模擬技術(shù) > 設(shè)計(jì)應(yīng)用 > 重復(fù)數(shù)據(jù)刪除技術(shù)分析及分類

重復(fù)數(shù)據(jù)刪除技術(shù)分析及分類

作者: 時(shí)間:2012-04-03 來(lái)源:網(wǎng)絡(luò) 收藏
: 3em; PADDING-TOP: 0px; WHITE-SPACE: normal; LETTER-SPACING: normal; BACKGROUND-COLOR: rgb(255,255,255); orphans: 2; widows: 2; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px">從字節(jié)層次查找和刪除重復(fù)的內(nèi)容,一般通過(guò)差異壓縮策略生成差異部分內(nèi)容。字節(jié)級(jí)消冗的優(yōu)點(diǎn)是去重率比較高,缺點(diǎn)就是去重速度比較慢。

1.3 基于消冗執(zhí)行次序的分類

(1)在線式消冗

在線處理的刪除是指在數(shù)據(jù)寫(xiě)入磁盤(pán)之前執(zhí)行刪除。其最大的優(yōu)點(diǎn)是經(jīng)濟(jì)高效,可以降低對(duì)存儲(chǔ)容量的需求,并且不需要用于保存還未進(jìn)行刪除的數(shù)據(jù)集。在線處理的重復(fù)數(shù)據(jù)刪除減少了數(shù)據(jù)量,但同時(shí)也存在一個(gè)問(wèn)題,處理本身會(huì)減慢數(shù)據(jù)吞吐速度。正是因?yàn)橹貜?fù)數(shù)據(jù)刪除是在寫(xiě)入到磁盤(pán)之前進(jìn)行的,因此重復(fù)數(shù)據(jù)刪除處理本身就是一個(gè)單點(diǎn)故障。

(2)后處理式消冗

后處理的重復(fù)數(shù)據(jù)刪除,也被稱為離線重復(fù)數(shù)據(jù)刪除,是在數(shù)據(jù)寫(xiě)到磁盤(pán)后再執(zhí)行重復(fù)數(shù)據(jù)刪除。數(shù)據(jù)先被寫(xiě)入到臨時(shí)的磁盤(pán)空間,之后再開(kāi)始重復(fù)數(shù)據(jù)刪除,最后將經(jīng)過(guò)重復(fù)數(shù)據(jù)刪除的數(shù)據(jù)拷貝到末端磁盤(pán)。由于重復(fù)數(shù)據(jù)刪除是數(shù)據(jù)寫(xiě)入磁盤(pán)后再在單獨(dú)的存儲(chǔ)設(shè)備上執(zhí)行的,因此不會(huì)對(duì)正常業(yè)務(wù)處理造成影響。管理員可以隨意制訂重復(fù)數(shù)據(jù)刪除的進(jìn)程。通常先將備份數(shù)據(jù)保留在磁盤(pán)上再進(jìn)行重復(fù)數(shù)據(jù)刪除,企業(yè)在需要時(shí)可以更快速地訪問(wèn)最近存儲(chǔ)的文件和數(shù)據(jù)。而后處理方式的最大問(wèn)題在于它需要額外的磁盤(pán)空間來(lái)保存全部還未刪除的重復(fù)數(shù)據(jù)集。

1.4 基于實(shí)現(xiàn)層次的分類

(1)基于軟件的重復(fù)數(shù)據(jù)刪除

在軟件層次,重復(fù)數(shù)據(jù)刪除可以有兩種集成方式,即可以將軟件產(chǎn)品安裝在專用的服務(wù)器上實(shí)現(xiàn),也可以將其集成到備份/歸檔軟件中?;谲浖闹貜?fù)數(shù)據(jù)刪除的部署成本比較低;但是基于軟件的重復(fù)數(shù)據(jù)刪除在安裝中容易中斷運(yùn)行,維護(hù)也更加困難。

基于軟件的重復(fù)數(shù)據(jù)刪除產(chǎn)品有EMC公司的Avamar軟件產(chǎn)品、Symantec公司的Veritas NetBackup產(chǎn)品以及Sepaton公司的DeltaStor存儲(chǔ)軟件等。

(2)基于硬件的重復(fù)數(shù)據(jù)刪除

基于硬件的重復(fù)數(shù)據(jù)刪除主要由存儲(chǔ)系統(tǒng)自己完成數(shù)據(jù)的刪減,例如:在虛擬磁帶庫(kù)系統(tǒng)、備份平臺(tái)或者網(wǎng)絡(luò)附加存儲(chǔ)(NAS)等一般目的的存儲(chǔ)系統(tǒng)中融入重復(fù)數(shù)據(jù)刪除機(jī)制,由這些系統(tǒng)自身完成重復(fù)數(shù)據(jù)刪除功能。

基于硬件的重復(fù)數(shù)據(jù)刪除的優(yōu)點(diǎn)是高性能、可擴(kuò)展性和相對(duì)無(wú)中斷部署,并且重復(fù)數(shù)據(jù)刪除操作對(duì)上層的應(yīng)用都是透明的。這種設(shè)備的缺點(diǎn)就是部署成本比較高,要高于基于軟件的重復(fù)數(shù)據(jù)刪除。

目前基于硬件的重復(fù)數(shù)據(jù)刪除系統(tǒng)主要包括VTL和NAS備份產(chǎn)品兩大類,例如:Data Domain公司的DD410系列產(chǎn)品、Diligent Technologies公司的ProtecTier VTL、昆騰公司的DXi3500和DXi5500系列產(chǎn)品、飛康的VTL產(chǎn)品、ExaGrid Systems公司的NAS備份產(chǎn)品以及NetApp的NearStore R200和FAS存儲(chǔ)系統(tǒng)。


上一頁(yè) 1 2 下一頁(yè)

評(píng)論


技術(shù)專區(qū)

關(guān)閉