如何利用基于云的歸檔解決備份難題
這種解決方案的問題在于,它們給用戶造成了一種貌似安全的假象,導(dǎo)致用戶將大筆投資放在看似精密的解決方案和基礎(chǔ)架構(gòu)上。這個問題的根源是,有 大量的數(shù)據(jù)根本不需要進(jìn)行備份。根據(jù)最新的數(shù)據(jù)研究顯示,大多數(shù)數(shù)據(jù)中心的主存儲設(shè)備都保存著未來6個月到1年之內(nèi)不會被訪問的靜態(tài)數(shù)據(jù)。在 很多數(shù)據(jù)中心中,這種靜態(tài)數(shù)據(jù)所占比例甚至高達(dá)80%。
靜態(tài)數(shù)據(jù)問題的影響
大多數(shù)數(shù)據(jù)中心每周或者每個月對整個環(huán)境進(jìn)行一次完全備份。這意味著每次完全備份完成之后,網(wǎng)絡(luò)中遷移和在備份目標(biāo)中保存的數(shù)據(jù)中有80%在過 去一年都是沒有任何變化的。這個事實(shí)使得重復(fù)數(shù)據(jù)刪除設(shè)備在市場中脫穎而出,這種設(shè)備使用塊層級的認(rèn)證來刪除冗余信息。
然而有一個挑戰(zhàn)是,這些重復(fù)數(shù)據(jù)刪除設(shè)備并不能解決仍然要在網(wǎng)絡(luò)中遷移所有數(shù)據(jù)的問題。因此,實(shí)際上這些設(shè)備只能對備份存儲起到幫助作用。盡管 它們是基于磁盤的,但只能大幅度縮短備份所需的時(shí)間。除此之外仍然需要在網(wǎng)絡(luò)基礎(chǔ)架構(gòu)方面的投資,而這可能是很復(fù)雜且高成本的。
盡管人們在網(wǎng)絡(luò)基礎(chǔ)架構(gòu)方面有投資的預(yù)算和意向,但是仍然存在著為備份準(zhǔn)備所有文件的問題。在備份過程中,應(yīng)用需要對每份文件進(jìn)行檢查,看它自 最近一次備份以來是否發(fā)生過變更。這個過程是非常耗費(fèi)時(shí)間的,尤其是那些保存了大量文件的服務(wù)器。
另外還有保留方面的問題。在大多數(shù)備份系統(tǒng)中,“重要”數(shù)據(jù)中往往混合著真正“關(guān)鍵”的數(shù)據(jù),而真正“關(guān)鍵”的數(shù)據(jù)中又混合著法規(guī)遵從所需的數(shù) 據(jù)。在大多數(shù)環(huán)境中,不同形式的數(shù)據(jù)往往具有不同的價(jià)值。有時(shí)候我們保存這些數(shù)據(jù)是為了法規(guī)遵從,有時(shí)候是為了企業(yè)內(nèi)部監(jiān)管。當(dāng)所有這些數(shù)據(jù)與備份數(shù)據(jù)集混合在一起的時(shí)候,我們就很難制訂專 門的保留規(guī)劃。因此,大多數(shù)企業(yè)機(jī)構(gòu)決定將所有數(shù)據(jù)保存超過必須保存的時(shí)間期限,而這進(jìn)一步加重了負(fù)擔(dān)。這使得數(shù)據(jù)恢復(fù)就像是大海撈針。
最后是找回問題,這也是實(shí)時(shí)備份的最主要原因。所有靜態(tài)數(shù)據(jù)與動態(tài)數(shù)據(jù)都是混合在一起的,因此這就會延長恢復(fù)數(shù)據(jù)所需的時(shí)間。例如,將一臺服務(wù) 器恢復(fù)在初始狀態(tài)可能需要恢復(fù)1TB的數(shù)據(jù),而實(shí)際上真正需要的數(shù)據(jù)也許只有200GB。不管使用什么技術(shù),恢復(fù)200GB數(shù)據(jù)總要比恢復(fù)1TB數(shù)據(jù)快 吧。如果除去這些靜態(tài)數(shù)據(jù)的話,那么以前需要幾天時(shí)間的恢復(fù)現(xiàn)在可能只要幾小時(shí)就可以完成了。
利用歸檔解決靜態(tài)數(shù)據(jù)難題
解決靜態(tài)數(shù)據(jù)難題的最簡單方法就是去掉靜態(tài)數(shù)據(jù),也就是將靜態(tài)數(shù)據(jù)從主存儲中遷移出來。假設(shè)一個環(huán)境中的所有靜態(tài)數(shù)據(jù)被刪除,那么將會釋放大約 80%的空間。即使不會完全停止存儲采購,這種方法也可以大幅加快備份和恢復(fù)流程。對于上面那個1TB數(shù)據(jù)的例子來說,對200GB數(shù)據(jù)進(jìn)行掃描、遷移和 保存要比1TB數(shù)據(jù)容易得多了。
當(dāng)然對于大多數(shù)企業(yè)機(jī)構(gòu)來說,刪除80%的數(shù)據(jù)不僅是不切實(shí)際的,還有可能是非法的。這里我們需要其他的方法:歸檔存儲。通過創(chuàng)建一個歸檔存儲 層,IT經(jīng)理可以將靜態(tài)數(shù)據(jù)集從主存儲和備份流程中排除掉。因?yàn)槭菃为?dú)保存這些數(shù)據(jù)的,所以可以制訂單獨(dú)的保存策略。備份流程不再需要檢查那么多的文件來 決定他們的備份需求。這樣,不僅備份和恢復(fù)流程進(jìn)一步完善了,在備份硬件和網(wǎng)絡(luò)基礎(chǔ)架構(gòu)方面的投資也大幅度減少了。
歸檔并不是一個新理念。自從第一臺大型主機(jī)問世以來,歸檔就一直是卸載主存儲、減少備份流程負(fù)載的一種方法。開放存儲和Windows平臺很少 使用這種技術(shù)。最主要的挑戰(zhàn)是,大多數(shù)歸檔都是基于磁帶的。這種歸檔需要有復(fù)雜且定制的軟件以及客戶代理。而且,從歸檔中恢復(fù)數(shù)據(jù)以及在基于磁盤的歸檔中 分類數(shù)據(jù)也都是非常具有挑戰(zhàn)性的。
在最近幾年中,廠商們開發(fā)出來基于磁盤的歸檔技術(shù)來克服這種局限性。這種歸檔存儲便于訪問(通常通過NFS或者CFS加載點(diǎn))、易于索引并提供了磁帶系統(tǒng)無法做到的快速恢復(fù)。此外這種歸檔存儲還通過提供更高的可 擴(kuò)展性和可靠性解決了使用廉價(jià)磁盤陣列的局限性。
磁盤歸檔的挑戰(zhàn)
基于磁盤的歸檔也有自身的缺點(diǎn)。一些磁盤歸檔提供了“類似于磁帶”的可擴(kuò)展性,通過使用1U服務(wù)器或 者互連存儲組成的集群架構(gòu)實(shí)現(xiàn)了這種可擴(kuò)展性。典型的存儲集群在添加節(jié)點(diǎn)數(shù)量方面是有限制的,所有這些都需要電力、空間和冷卻資源的支持,而這會進(jìn)一步增 加成本。
另外,在很多情況下這些系統(tǒng)需要從一個相對大規(guī)模的節(jié)點(diǎn)部署起步。通常初始容量要求在25TB或者更高,而這對于小型和中型企業(yè)來說往往是不切實(shí)際的。
最后,在歸檔存儲中,磁盤或者磁帶仍然需要管理。我們需要創(chuàng)建、分配和監(jiān)控存儲來確保一切正常,不需要維護(hù)或者升級??紤]到目前IT人員的縮 減,盡管磁盤歸檔可以帶來諸多好處,但是企業(yè)機(jī)構(gòu)可能沒有足夠的人員來執(zhí)行這些任務(wù)。
利用云存儲作為歸檔
有一個可行的選擇,那就是云存儲。使用云存儲作為歸檔可以為用戶帶來很多好處。要想把云存儲作為歸檔的話,大多數(shù)企業(yè)機(jī)構(gòu)應(yīng)該尋找這樣的解決方案:即使用了本地設(shè)備將最近歸檔數(shù)據(jù)緩存在本地磁盤以便快速恢復(fù)、然后將數(shù)據(jù) 遷移到云存儲中作為長期保存。因?yàn)榇蠖鄶?shù)云歸檔解決方案都是付費(fèi)即用型的,所以這對于規(guī)模最小的企業(yè)也是一個可行的選擇。
此外,一些云歸檔系統(tǒng)可以直接從API集中寫入。例如,有些存儲廠商與獨(dú)立軟件供應(yīng)商合作,允許云歸檔直接與他們的應(yīng)用進(jìn)行集成。這是推動將數(shù) 據(jù)保存到歸檔存儲中的一個理想點(diǎn)。對于用戶來說,信息仍然保持最新,提供了關(guān)于歸檔數(shù)據(jù)集的智能性,同時(shí)應(yīng)用也可以起到幫助作用。
云歸檔還解決了其他歸檔形式可能給IT員工帶來的操作問題。因?yàn)樗形锢泶鎯Χ际峭獍模虼藬?shù)據(jù)集管理所需時(shí)間為零。此外,這也不需要消耗企 業(yè)機(jī)構(gòu)的能源、空間或者冷卻資源。單是這一點(diǎn)就證明了對云歸檔的投資是合理的,而其他歸檔解決方案則無法提供這項(xiàng)保證。
發(fā)布者:博子
評論