云計(jì)算關(guān)鍵技術(shù)與研究問(wèn)題
云計(jì)算作為一種新的計(jì)算理念和模式,在技術(shù)上是將大型服務(wù)器集群,包括計(jì)算服務(wù)器,存儲(chǔ)服務(wù)器和網(wǎng)絡(luò)帶寬資源集中起來(lái),通過(guò)對(duì)各類可分配資源的虛擬化,利用專門(mén)軟件實(shí)現(xiàn)對(duì)資源的按需分配,支持各種應(yīng)用程序的運(yùn)行,使得用戶只需關(guān)注并提供業(yè)務(wù)相關(guān)的解決方案,無(wú)需在硬件平臺(tái)、綜合計(jì)算、安全存儲(chǔ)、信息的一致性等方面耗費(fèi)大量的人力、物力和財(cái)力,有利于提高系統(tǒng)的整體效率、降低成本,促進(jìn)技術(shù)創(chuàng)新。
本文引用地址:http://butianyuan.cn/article/201710/368625.htm盡管基于云計(jì)算模式的計(jì)算平臺(tái)或服務(wù)已被廣泛接受并逐步走進(jìn)應(yīng)用,但云計(jì)算的研究總體上還處于起步階段,許多現(xiàn)有的問(wèn)題還沒(méi)有被完全解決。本文提出了部分具有挑戰(zhàn)性的云計(jì)算關(guān)鍵技術(shù)和研究問(wèn)題。
1 虛擬機(jī)遷移
云計(jì)算通過(guò)允許虛擬機(jī)遷移實(shí)現(xiàn)整個(gè)數(shù)據(jù)中心負(fù)載平衡。此外,虛擬機(jī)遷移提高數(shù)據(jù)中心的健壯性和高度響應(yīng)。
虛擬機(jī)遷移是由進(jìn)程遷移演變而來(lái)的。最近Xen和VMWare已經(jīng)實(shí)現(xiàn)了虛擬機(jī)的實(shí)時(shí)遷移。文獻(xiàn)[1]指出遷移整個(gè)操作系統(tǒng)和它的所有應(yīng)用程序作為一個(gè)單元可以避免進(jìn)程級(jí)遷移方法要面對(duì)的許多困難,并分析了虛擬機(jī)實(shí)時(shí)遷移的優(yōu)勢(shì)。
虛擬機(jī)遷移的主要優(yōu)勢(shì)是避免熱點(diǎn),然而,這并不簡(jiǎn)單。目前,檢測(cè)工作負(fù)載熱點(diǎn)和啟動(dòng)一個(gè)遷移缺乏應(yīng)對(duì)突然的工作負(fù)載變化的靈活性。此外,虛擬機(jī)遷移時(shí)內(nèi)存中的狀態(tài)應(yīng)當(dāng)一致且高效地傳輸,同時(shí)還需綜合考慮應(yīng)用程序和物理服務(wù)器的資源負(fù)載。
2 服務(wù)器整合
服務(wù)器整合可以最大化資源的利用率,同時(shí)最小化能耗的有效方法。虛擬機(jī)遷移常用來(lái)整合駐留在多個(gè)很少使用的服務(wù)器的虛擬機(jī)到一個(gè)服務(wù)器,這樣剩余的服務(wù)器可以設(shè)置為節(jié)能狀態(tài)。在數(shù)據(jù)中心優(yōu)化整合服務(wù)器通常是一個(gè)NP難的變種裝箱優(yōu)化問(wèn)題。針對(duì)這個(gè)問(wèn)題已經(jīng)提出各種啟發(fā)式方法。
服務(wù)器整合不應(yīng)該影響應(yīng)用程序的性能。眾所周知,單個(gè)虛擬機(jī)資源的使用不停的在變化。對(duì)于虛擬機(jī)間共享的服務(wù)器資源(比如帶寬、內(nèi)存緩存和磁盤(pán)I/O),最大限度地整合服務(wù)器可能導(dǎo)致?lián)矶隆?/p>
因此,觀察虛擬機(jī)負(fù)載的波動(dòng)和使用這些信息有效的整合服務(wù)器是很重要的。最后,在資源擁塞發(fā)生時(shí),系統(tǒng)必須能快速響應(yīng)。
3 能耗管理
提高能源效率是云計(jì)算另一個(gè)主要問(wèn)題。據(jù)估計(jì),能耗成本占數(shù)據(jù)中心運(yùn)營(yíng)支出總額的53%。因此基礎(chǔ)設(shè)施提供商承受了巨大的壓力減少能源消耗。目標(biāo)是不僅要減少數(shù)據(jù)中心的能源成本,還要達(dá)到政府法規(guī)和環(huán)境標(biāo)準(zhǔn)。
設(shè)計(jì)節(jié)能數(shù)據(jù)中心最近受到越來(lái)越多的重視。這個(gè)問(wèn)題可以從多個(gè)方向解決。例如,節(jié)能的硬件架構(gòu)、減慢CPU速度和關(guān)閉部分硬件組件已成為研究者的共識(shí)。
有節(jié)能感知的作業(yè)調(diào)度和服務(wù)器整合兩種方式可以減少能源消耗。最近的研究也已開(kāi)始研究節(jié)能的網(wǎng)絡(luò)協(xié)議和基礎(chǔ)設(shè)施。
一個(gè)關(guān)鍵的挑戰(zhàn)是實(shí)現(xiàn)節(jié)省能源和應(yīng)用程序的性能之間達(dá)到一個(gè)好的平衡。在這方面,一些研究人員最近已經(jīng)開(kāi)始在一個(gè)動(dòng)態(tài)的云環(huán)境實(shí)現(xiàn)性能和能耗管理的協(xié)調(diào)解決方案[3]。
4 流量管理和分析
分析數(shù)據(jù)流量對(duì)于今天的數(shù)據(jù)中心是重要的。例如,許多web應(yīng)用程序依賴于分析數(shù)據(jù)流量來(lái)優(yōu)化用戶體驗(yàn)。網(wǎng)絡(luò)運(yùn)營(yíng)商還需要知道數(shù)據(jù)流量進(jìn)行許多管理和規(guī)劃決策。然而,把互聯(lián)網(wǎng)服務(wù)提供商(ISP)現(xiàn)有的流量測(cè)量和分析方法擴(kuò)展到云計(jì)算數(shù)據(jù)中心還存在一些挑戰(zhàn)性的問(wèn)題。首先,數(shù)據(jù)中心鏈接的密度要比ISP高得多;
其次,大多數(shù)現(xiàn)有的方法可以計(jì)算幾百臺(tái)主機(jī)的流量矩陣,但一個(gè)小型數(shù)據(jù)中心可能擁有幾千臺(tái)服務(wù)器;最后,現(xiàn)有的方法通?;谝恍㊣SP的流量模式,但是部署在數(shù)據(jù)中心應(yīng)用程序(比如MapReduce作業(yè))極大的改變了流量模式。
此外,在云計(jì)算中應(yīng)用程序的網(wǎng)絡(luò)使用、計(jì)算和存儲(chǔ)資源存在更緊密的耦合。
目前,并沒(méi)有很多工作在測(cè)量和分析數(shù)據(jù)中心的流量。文獻(xiàn) [4]報(bào)告了數(shù)據(jù)中心流量的特征,以及使用這些指導(dǎo)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的設(shè)計(jì)。
5 軟件框架
云計(jì)算提供了進(jìn)行大規(guī)模數(shù)據(jù)密集型應(yīng)用程序的平臺(tái)。通常這些應(yīng)用程序利用MapReduce框架(如Hadoop可伸縮的和容錯(cuò)數(shù)據(jù)處理)。研究表明MapReduce作業(yè)的性能和資源消耗的是高度依賴應(yīng)用程序的類型。例如,Hadoop任務(wù)sort是I/O密集型,而grep則要求大量CPU資源。
此外,分配在每個(gè)Hadoop節(jié)點(diǎn)的VM可能是異構(gòu)的。例如,一個(gè)VM可用帶寬依賴于配置在同一個(gè)服務(wù)器的其他VM。
因此,通過(guò)仔細(xì)選擇它的配置參數(shù)值和設(shè)計(jì)更高效的調(diào)度算法能優(yōu)化MapReduce應(yīng)用程序的性能和成本。通過(guò)緩解瓶頸資源,可以將應(yīng)用程序的執(zhí)行時(shí)間顯著提高。關(guān)鍵的挑戰(zhàn)包括Hadoop的性能建模(無(wú)論是在線還是離線)和動(dòng)態(tài)條件下自適應(yīng)調(diào)度。
另一個(gè)相關(guān)的方法認(rèn)為讓MapReduce框架有節(jié)能感知[5]。這種方法的基本思想是將完成工作且等待新任務(wù)的Hadoop節(jié)點(diǎn)進(jìn)入睡眠狀態(tài)。這就要求Hadoop和HDFS必須由有節(jié)能感知。此外,通常會(huì)在性能和節(jié)能感知之間進(jìn)行權(quán)衡。根據(jù)目標(biāo),找到一個(gè)理想的權(quán)衡點(diǎn)仍是一個(gè)沒(méi)有探索的研究課題。
6 存儲(chǔ)技術(shù)和數(shù)據(jù)管理
軟件框架MapReduce和它的不同實(shí)現(xiàn)(Hadoop和Dryad)針對(duì)分布式處理的數(shù)據(jù)密集的任務(wù)。這些框架通常運(yùn)行在網(wǎng)際文件系統(tǒng)(比如GFS和HDFS)。這些文件系統(tǒng)的存儲(chǔ)結(jié)構(gòu)、訪問(wèn)模式和應(yīng)用程序編程接口不同于傳統(tǒng)的分布式文件體系。特別是他們沒(méi)有實(shí)現(xiàn)標(biāo)準(zhǔn)POSIX接口,因此引入和傳統(tǒng)文件系統(tǒng)和應(yīng)用程序的兼容性問(wèn)題。目前的解決方法主要包括提支持MapReduce框架使用集群文件體系(如IBM的GPFS)方法和基于新的API原語(yǔ)支持可伸縮和并發(fā)數(shù)據(jù)訪問(wèn)等。
7 結(jié)束語(yǔ)
需求推動(dòng)、技術(shù)進(jìn)步和商業(yè)模式轉(zhuǎn)變共同促進(jìn)了云計(jì)算的快速發(fā)展,其核心是構(gòu)建了一種全新的信息與數(shù)據(jù)存儲(chǔ)、處理和服務(wù)模式。本文從云計(jì)算平臺(tái)建設(shè)與管理、應(yīng)用的構(gòu)建等多角度總結(jié)了這種新興計(jì)算模式存在關(guān)鍵技術(shù)及難點(diǎn),提出了未來(lái)云計(jì)算研究與應(yīng)用中所需解決的問(wèn)題。
評(píng)論