關 閉

新聞中心

EEPW首頁 > 工控自動化 > 設計應用 > 基于HDFS的云存儲在高校信息資源整合中的應用

基于HDFS的云存儲在高校信息資源整合中的應用

作者: 時間:2012-02-22 來源:網(wǎng)絡 收藏

摘要:研究如何將基于應用于整合高校,旨在通過合適的構建基于服務系統(tǒng),解決高校的海量數(shù)據(jù)存儲問題。通過對概念的解析,結合高校存儲的特點,構建了一個低成本、高效率、高安全性的分布式整合解決方案,并給出了系統(tǒng)結構圖。
關鍵詞:;;高校;分布式

海量的高校信息資源需要整合,這是當前不爭的事實,因為高校信息資源存在著資源分布不均衡、更新維護成本高、共享程度低和安全性差等一系列問題。整合需要解決的首要問題就是信息的合理存儲,以便實現(xiàn)對其高效、安全的訪問。與傳統(tǒng)的存儲方式相比,云存儲很好地解決了這個問題。
云存儲(Cloud Storage)是在云計算(Cloud Computing)概念上延伸和發(fā)展出來的一個新的概念,它是指通過集群應用、網(wǎng)格技術或分布式文件系統(tǒng)等功能,將網(wǎng)絡中大量各種不同類型的存儲設備通過應用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務訪問功能的一個系統(tǒng)。

1 存儲方式的比較
高可靠性:云存儲實現(xiàn)對信息的分布式存儲,信息被切分為多個數(shù)據(jù)塊分散存儲在云中的節(jié)點中,實現(xiàn)了多副本備份機制,因此安全性要遠高于傳統(tǒng)的單一甚至帶有鏡像服務器的信息存儲方式。
訪問的高效性:云中的控制節(jié)點通過“心跳檢測”不斷地監(jiān)視存儲節(jié)點的狀態(tài),當發(fā)現(xiàn)存儲節(jié)點已經(jīng)失效時,控制節(jié)點能夠?qū)⒐ぷ髫撦d交給那些運行正常的存儲節(jié)點來完成。同時,由于云中的數(shù)據(jù)是分布式的存儲,能夠很好地分擔存儲和訪問的壓力,這些都使得云存儲具有很高訪問的效率。
存儲成本低:原先的信息資源的存儲一般使用專業(yè)的存儲設備,價格不菲,使得資源存儲的成本也隨之提高。而云中的存儲設備都是廉價的商業(yè)機,跟單一的大容量專業(yè)存儲設備相比較,存儲容量更大,存儲成本更低。
管理便捷:云存儲能夠在軟件層做到自動容錯而不依賴硬件本身的容錯,而且將信息資源存儲在云中,有利于對資源進行統(tǒng)一的管理,提高資源的使用率。
另外,云存儲還具有超強的可擴展性、不受具體地理位置所限、基于商業(yè)組件、按照使用收費(如每G收15美分)、可跨不同應用等。所有這些充分體現(xiàn)了云存儲這種方式的優(yōu)越性。

2 基于HDFS的云存儲
2.1 HDFS的引入
目前各大公司都有自己的云存儲產(chǎn)品,如微軟公司的“Windows Live Sky Drive”網(wǎng)絡移動硬盤服務、Google公司的“Google Stora ge”的云計算存儲服務、亞馬遜的Amazon webservices等。
在眾多的云存儲產(chǎn)品技術中,HDFS技術可以實施運行在普通的PC集群上,有效降低存儲成本,該技術是Google文件系統(tǒng)(GFS)的開源實現(xiàn),是分布式計算開源框架Hadoop的底層實現(xiàn),Hadoop是Google集群系統(tǒng)的一個開源項目總稱,Google集群系統(tǒng)是使用低成本的成熟技術構建的一個穩(wěn)定、高性能、高可用性、可擴展的系統(tǒng)。Hadoop平臺雖然是一項新興的技術,但它的發(fā)展非常迅速,已開始被應用在企業(yè)、高
校、科研機構等各個行業(yè)。文中重點研究HDFS云存儲在高校信息整合中是如何應用的。
2.2 HDFS的理論剖析
Hadoop文件系統(tǒng)(Hadoop Distributed File System,HDFS)雖然和現(xiàn)有的文件系統(tǒng)有相似之處,也是可以運行在普通的硬件之上的分布式文件系統(tǒng),但是HDFS具有高容錯性,可以部署在低成本的硬件之上,可以以流的方式訪問文件數(shù)據(jù),從而高吞吐量地對應用程序進行訪問,這些還是和一般的文件系統(tǒng)有區(qū)別的。圖1是HDFS體系結構圖。

本文引用地址:http://butianyuan.cn/article/202391.htm

a.jpg


研究HDFS的體系結構圖可以得知,名稱節(jié)點上保存這控制數(shù)據(jù)節(jié)點信息的元數(shù)據(jù)??蛻舳丝梢酝ㄟ^名稱節(jié)點對元數(shù)據(jù)進行操作,也可以直接對數(shù)據(jù)節(jié)點進行讀寫。HDFS體系結構是個主從結構,這個主從結構常由單個的名稱節(jié)點和多個數(shù)據(jù)節(jié)點組成,名稱節(jié)點負責管理文件命名空間和客戶端訪問的主服務器,而數(shù)據(jù)節(jié)點則負責對存儲進行管理,下面來剖析一下體系結構各部分的功能。
2.2.1 名稱節(jié)點和數(shù)據(jù)節(jié)點的功能
名稱節(jié)點的功能包括4個方面:一是管理元數(shù)據(jù)和文件塊:二是管理文件系統(tǒng)的命名空間,包括記錄文件系統(tǒng)元數(shù)據(jù)被修改的情況:三是監(jiān)聽客戶端和數(shù)據(jù)節(jié)點請求和處理這些請求。客戶端事件比較復雜,比如名字空間的創(chuàng)建與刪除,文件的創(chuàng)建、刪除和修改等,數(shù)據(jù)節(jié)點的事件包括文件塊信息變化、心跳響應等:四是心跳檢測。所謂心跳檢測,就是數(shù)據(jù)節(jié)點會定期將自己的負載情況通過心跳信息向名稱節(jié)點匯報。
數(shù)據(jù)節(jié)點的功能包括3個方面:一是通過自身服務進程與文件系統(tǒng)客戶端打交道,完成數(shù)據(jù)塊的讀寫;二是周期性的向名稱節(jié)點發(fā)送信號,報告本節(jié)點的狀態(tài);三是執(zhí)行數(shù)據(jù)的流水線復制。
2.2.2 元數(shù)據(jù)和數(shù)據(jù)交互
HDFS體系結構中有三種類型的元數(shù)據(jù)保存在名稱節(jié)點的內(nèi)存中,分別是:文件(包含目錄)的名字空間、文件到文件塊的映射、文件塊的位置信息。這種數(shù)據(jù)結構對于數(shù)據(jù)訪問的效率和安全性都有很大的幫助。


上一頁 1 2 下一頁

評論


相關推薦

技術專區(qū)

關閉