盤點網絡存儲技術 你都了解嗎
在以數據為中心的信息時代,存儲已成為IT基礎設施的核心之一。數據存儲已經成為繼互聯網熱潮之后的又一次技術浪潮,它將網絡帶入了以數據為中心的時代。
本文引用地址:http://butianyuan.cn/article/201808/385500.htm由于近年來C/S計算模型的廣泛采用,服務器都帶有自己的存儲系統(tǒng),信息分散到各個服務器上,形成了所謂的“信息孤島”,不利于信息整合與數據共享。而網絡存儲就是一種利于信息整合與數據共享,且易于管理的、安全的新型存儲結構和技術。目前,網絡存儲已經成為一種新的存儲技術,本文將從體系結構的角度簡述目前的存儲系統(tǒng)。
直接連接存儲DAS
直接連接存儲DAS(Direct Attached Storage)是對SCSI總線的進一步發(fā)展。它對外利用SCSI總線通道和多個主機連接,解決了SCSI卡只能連接到一個主機上的缺陷。對內利用SCSI總線通道或FC通道、IDE接口連接多個磁盤,并實現RAID技術,形成一個磁盤陣列,從而解決了數據容錯、大存儲空間的問題。
DAS是以服務器為中心的存儲體系結構,難以滿足現代存儲應用大容量、高可靠、高可用、高性能、動態(tài)可擴展、易維護和開放性等多方面的需求。解決這一問題的關鍵是將訪問模式從以服務器為中心轉化為以數據和網絡為中心,實現擴展容量、增加性能和延伸距離,尤其是實現多個主機數據的共享,這推動了存儲與計算的分離,即網絡存儲的發(fā)展。
網絡附屬存儲NAS
NAS(附網存儲系統(tǒng))系統(tǒng)是用一個裝有優(yōu)化的文件系統(tǒng)和瘦操作系統(tǒng)的專用數據存儲服務器,提供跨平臺的文件共享功能。NAS產品與客戶之間的通訊采用NFS(Network File System)協議、CIFS(Common Internet File System)協議,這些協議運行在IP之上。。
盡管NAS集成了系統(tǒng)、存儲和網絡技術,具有擴展性強、使用與管理簡單、跨平臺文件共享、性能優(yōu)化等特點。然而,NAS系統(tǒng)也有其潛在的局限性。首先是它受限的數據庫支持,NAS文件服務器不支持需大量依賴于數據庫處理結果的應用(塊級應用)。其次是缺乏靈活性,它是一種專用設備。最后,NAS備份與恢復的實現相當困難。
存儲區(qū)域網SAN
SAN(存儲區(qū)域網)是通過專用高速網將一個或多個網絡存儲設備(如磁盤陣列RAID)和服務器連接起來的專用存儲系統(tǒng)。
SAN以數據存儲為中心,采用可伸縮的網絡拓撲結構,提供SAN內部任意節(jié)點之間的多路可選擇的數據交換,并且將數據存儲管理集中在相對獨立的存儲區(qū)域網內,實現最大限度的數據共享和數據優(yōu)化管理,以及系統(tǒng)的無縫擴充。正是由于光纖通道技術的發(fā)展,使得SAN得以支持遠距離通信、易于擴展、能夠解決網絡數據的存儲備份、高可用性、災難恢復等有關問題,它可以提供高性能數據管道和共享的集中管理的存儲設備。因此采用網絡和通道技術相互融合的光纖通道接口的SAN將LAN上的存儲轉換到主要由存儲設備組成的專用網絡上,使得數據的訪問、備份和恢復不影響LAN的性能,在大量數據訪問時,不會大幅度降低網絡性能。
SAN主要用于存儲量大的工作環(huán)境,并且SAN的適用性和通用性較差,在系統(tǒng)的安裝和升級方面效率不高,且由于SAN使用專用網絡(一般為光纖網絡),相應的設備價格昂貴,總體實現費用較高,局限于大中型應用。
NAS和SAN技術都體現了數據存儲從傳統(tǒng)的服務器中獨立出來的思想,它們是網絡存儲領域中的兩個發(fā)展方向。隨著NAS和SAN之間的界限越來越模糊,其中更重要的區(qū)別可能就是在NAS/SAN混合系統(tǒng)中所采用的協議了:IP、光纖通道,或者iSCSI等。
IP存儲
傳統(tǒng)的SAN一般采用光纖通道技術,其成本高,距離受限制,因此基于IP的存儲正成為一個新的熱點,主要有FCIP(Fibre Channel over IP)、iFCP(Internet Fibre Channel Protocol)、mFCP(Metro Fibre Channel Protocol)、iSCSI(Internet SCSI)等技術。
上述協議有一個非常重要的共同點:都能充當SCSI命令集的傳輸機制。通過IP存儲介質與存儲設備通信的主機仍能表達SCSI的含意。而iSCSI則是從主機到存儲設備的整個傳輸鏈路就是一條IP鏈路,沒有采用光纖通道,基于主機的應用通過IP與網絡存儲設備通信。iSCSI保持了SCSI命令集的原狀,同時用IP取代了傳輸協議。但由于iSCSI通過映射至IP來保留SCSI命令集,存在延時問題,已有專門的iSCSI芯片組把轉換代碼部署在硬件當中。IP-SAN的優(yōu)勢在于:容易擴展成超大規(guī)模的存儲網絡;不必受光纖通道SAN的距離限制,連接在IP網絡上的服務器都能享用網絡存儲服務;連接靈活多樣,廉價成熟的網絡架構成本,使得高端也能達到Gbps速率,有較高的性能價格比。
集群存儲
由于目前一些存儲應用受容量可擴展性、性能可擴展性、可用性、可管理性的挑戰(zhàn),“催生”了許多存儲集群系統(tǒng)的產生。集群存儲是將每個存儲設備作為一個存儲節(jié)點,通過高速互聯網絡連接起來,將數據分散開存儲在多臺獨立的設備上,這些設備可以獨立運作,相互之間又可以合作。每個I/O節(jié)點不僅可以訪問本節(jié)點的存儲空間,還可以訪問其他節(jié)點的存儲空間。所有存儲節(jié)點的空間以一個虛擬磁盤的方式提供給客戶端用戶。組成集群存儲可以是塊級別的SAN集群、文件級別的NAS集群和并行文件系統(tǒng)的集群,它們的訪問、特征與適用環(huán)境參見表1。
集群存儲有效地提升了存儲設備的容量可擴展性、性能穩(wěn)定性及系統(tǒng)可管理性。集群存儲非常適合那些持續(xù)增長的所有規(guī)模的不同環(huán)境,實現即時供應(Just-in-time)存儲,避免破壞性升級和增加管理的復雜性。在大型數據中心或高性能計算中心的集群存儲解決方案,具有高性價比,簡單、易于維護,高可靠性/可用性,具有非常高的整合帶寬等優(yōu)點。集群存儲最典型系統(tǒng)是Google體系結構,它是大量機器內硬盤的組合,含899個機架(每架80臺PC,每臺PC有2個硬盤),共79,112臺PC機,有158,224個硬盤, 總容量為6180 TB。
對等(P2P)存儲
對等結構(P2P)從用戶的使用方式來看,系統(tǒng)中每個用戶既向其他用戶提供資源,也從其他用戶那里獲取資源。從體系結構來看,無中心結構,結點之間對等,通過互相合作來完成用戶任務。P2P結構的優(yōu)點表現在:沒有中心結點,不易形成系統(tǒng)瓶頸、不易受攻擊,可擴展性好,自組織性好。
用P2P的方式在廣域網中構建大規(guī)模分布式存儲系統(tǒng),將很多機器用對等的方式組織起來共同為用戶提供超大容量的數據存儲服務,存儲結點來自于存儲服務方,用戶使用存儲空間并付費,用戶還通過該平臺自主尋找其他結點進行數據備份和存儲空間交換。
P2P存儲與SAN的應用特點不同。前者主要強調可用性,而SAN主要面向的是高性能;P2P存儲易于維護、可擴展好、自配置功能強,特別是P2P存儲可以大量加盟的PC機和服務器中的存儲器來組合成存儲系統(tǒng),提供高帶寬的視頻服務和其他共享服務。
集群存儲與P2P存儲都是分布式存儲。前者多在大型數據中心或高性能計算中心使用,后者是構建更大規(guī)模的分布式存儲系統(tǒng),可以跨多個大型數據中心或高性能計算中心使用。
網格存儲
所有的存儲、服務器和網絡資源都被虛擬為一個資源池,并將其視作共享資源,這個資源池就是存儲網格。存儲網格的關鍵是虛擬化與統(tǒng)一性管理問題。
存儲網格既可應用于SAN環(huán)境,又可應用于NAS環(huán)境,它提供快速簡單的對于容量、性能、服務質量和/或連接協議的可升級性,可對公司所有數據進行統(tǒng)一查看和管理,遠遠超出當前有限的虛擬化實現途徑,還可優(yōu)化分布式企業(yè)遠程數據訪問的性能。存儲網格架構可實現數據庫和企業(yè)之間更緊密的應用整合,提供更高的數據保護,并可基于有關規(guī)定更簡單地管理數據資源。這些優(yōu)勢極大降低了用戶在購買、擴容和管理時的費用。
面向對象的存儲
對象存儲模型綜合了NAS和SAN結構的特點,存儲對象具有文件和塊二者的優(yōu)點:像數據塊一樣在存儲設備上被直接訪問,通過一個對象接口,像文件一樣,在不同操作系統(tǒng)平臺上實現數據共享。在SAN中,定位邏輯和文件系統(tǒng)都位于主機中。而在面向對象的存儲中,存儲空間不再需要運行在主機上的文件系統(tǒng)管理,而由存儲系統(tǒng)自己管理和分配。
一個存儲對象是關于一個存儲設備的邏輯字節(jié)集合,它有存儲方法、數據屬性和存儲安全策略等。因此,對象存儲系統(tǒng)在基于文件級的數據布局、服務質量的靈活性和可管理等方面有很大改善。另外,基于對象存儲的最直接效果是將空間管理從存儲應用中剝離,如圖2所示,存儲設備具有自管理特性,包括重新組織數據來提高性能、調用規(guī)則的備份和失敗恢復等。
未來存儲設備的特性可能包括自配置、自保護、自優(yōu)化、自恢復和自管理。將塊接口用對象來代替是一個發(fā)展方向。目前,面向對象的存儲仍然處在標準制定之中,還沒有得到廣泛的接受。
內容尋址存儲CAS
內容尋址存儲(Content Addressed Storage,CAS)是針對固定內容存儲需求的網絡存儲技術。CAS具有面向對象存儲特征,基于磁記錄技術,它按照所存儲數據內容的數字指紋尋址,具有良好的可搜索性、安全性、可靠性和擴展性。CAS、SAN和NAS的區(qū)別參見表2。CAS存儲技術的代表性產品是EMC公司的Centera 系統(tǒng),目前還具有非常多的局限性。
數據庫只針對的是結構化數據,而大量非結構化的數據管理有更大的存儲需求,而內容管理的對象是以各類非結構化數據為主的數字內容。CAS技術的出現使非結構化數據管理(包括企業(yè)的各種文檔、報表、賬單、網頁、圖片、傳真、掃描影像,以及大量的多媒體音頻、視頻信息等等的歸檔和查詢)成為存儲業(yè)新的熱點。未來需要一種新的基于內容管理的存儲系統(tǒng)平臺,它擴展了最新的對象存儲體系結構,支持對象倉儲和聯邦數據庫技術,支持關系和 XML作為主要數據模型,并緊密地集成了內容管理服務、工作流、消息傳遞、分析和其他企業(yè)應用程序服務。
基于IB的存儲
InfiniBand(IB)是針對處理器和智能I/O設備之間數據流而提出的一種新體系結構,用于在服務器中取代PCI總線。采用IB技術支持多處理器集群,將允許服務器提供更高的帶寬和可擴展能力,并增強了存儲設備擴充的靈活性,并用于支持遠程I/O和遠程存儲器,如圖3所示。IB作為一種能夠為系統(tǒng)與存儲之間提供低延遲和高帶寬的連接解決方案,已經為一些用戶所接受,預期基于IB的存儲將在存儲領域會占有一席之地。
評論