AWS和Azure頻頻中斷 可靠性讓公有云成為帶刺的玫瑰
為什么說公有云是帶刺的玫瑰呢?我想這應該從公有云的價值和可靠性問題兩方面來說。價廉,付費即用、彈性收縮,不用采購設備,不管運維,這就是公有云的價值,也是公有云發(fā)展的推動力;現(xiàn)在很多企業(yè)都把自己的業(yè)務系統(tǒng)搬到云上,當然大部分上云客戶都是選擇核心上私有云,邊沿業(yè)務上公有云。最近AWS、Azure頻頻事故,可靠性、數(shù)據(jù)控制力和安全一次次給用戶敲響警鐘,下面我們來談談公有云的可靠性和用戶應該如何應對。
本文引用地址:http://www.butianyuan.cn/article/201703/345447.htm說起公有云服務和市場,我們不得不提稱霸整個公有云市場的龍頭老大Amazon,它位于華盛頓州的西雅圖。亞馬遜成立于1995年,其云數(shù)據(jù)中心采用中心和邊緣架構,28個中心云數(shù)據(jù)中心,52個邊緣數(shù)據(jù)中心,目前向全球11個區(qū)域提供業(yè)務無差異體驗的公有云服務。
在云計算和公有云領域,Amazon很多服務都成了事實上的標準(主要包括S3和EC2),其云數(shù)據(jù)中心硬件設施(如數(shù)據(jù)機房、制冷、供電、存儲、服務器、網(wǎng)絡和監(jiān)控等) 規(guī)范也被當做教科書被不同云服務廠商參考,AWS服務業(yè)務涵蓋了整個IaaS、PaaS和SaaS層。
然而,從公有云出現(xiàn)到今天,市場的競爭局面雖未曾消減,但在激烈競爭和市場的洗禮之下,公有云的市場格局已日趨明顯。引領整個公有云市場的依次是Amazon的AWS、微軟的Azure、IBM的SoftLayer和Google的Cloud Platform,Oracle Cloud公有云服務業(yè)緊跟其后;阿里云也成為國內(nèi)本土云服務領導者。公有云服務和技術發(fā)展和市場份額增加,也使得傳統(tǒng)IT硬件廠商市場空間縮水。但是從目前來看公有云真的可靠嗎,離我們所需的可靠還有多遠路要走,包括成熟的公有云管理規(guī)范。
其實,公有云一直以來倍受爭議和競爭激烈的市場,公有云服務廠商包括IaaS、PaaS和SaaS服務猶如雨后春筍,在市場格局還沒有定格的情況下,客戶對服務的選擇也是一頭霧水。
2013年由于公有云服務提供商Nirvanix在競爭中失利,強迫近1000家客戶在短時間取回或遷移原來保存在Nirvanix云中的數(shù)據(jù),Nirvanix突然停業(yè)給客戶業(yè)務帶來不小動蕩和影響。
該說說公有云的可靠性了,我們就那老大Amazon來說,基本每年都有比較的可靠性事故發(fā)生。2017年3月,US-EAST-1地理區(qū)域的S3存儲服務發(fā)生中斷,依賴S3服務的Imgur、Medium和Docker Registry Hub,以及Runkeeper、Trello和雅虎網(wǎng)絡郵箱等紛紛發(fā)生中斷。
2016年3月云服務巨頭亞馬遜再一次發(fā)生了嚴重服務停機事故,前后維持了20分鐘,將造成巨大經(jīng)濟損失。在事故發(fā)生時,亞馬遜電子商務主網(wǎng)站無法訪問,其他的服務業(yè)受到了波及,其中包括對外部服務的亞馬遜云計算服務,以及面向包郵會員提供的音樂等數(shù)字內(nèi)容服務。
2015年7月亞馬遜Web服務(AWS)出現(xiàn)大規(guī)模宕機情況,導致Slack、Asana、Netflix、Pinterest等多款APP、以及多家使用AWS服務的網(wǎng)站出現(xiàn)無響應的情況。
2012年10月,亞馬遜位于北弗吉尼亞數(shù)據(jù)中心的云計算平臺再度宕機,導致多家知名網(wǎng)站長時間無法訪問,知名網(wǎng)站和信息服務商也受到這次宕機的影響。這是過去一年半中亞馬遜云計算的第五次宕機。
微軟云Azure公有云服務在3月16日也發(fā)生服務中斷,在全部28個數(shù)據(jù)中心中有26個受到影響。所影響區(qū)域的用戶無法創(chuàng)建、更新和刪除數(shù)據(jù)資源。但慶幸的是Azure云服務已恢復正常。2012年,Azure云服務也曾發(fā)生重大故障,當時持續(xù)了半天時間才恢復正常服務。
阿里云也是事故頻頻,2016年7月6號上午,藍鯨TMT曝出消息稱阿里云北京機房內(nèi)網(wǎng)發(fā)生故障,近一個小時才恢復正常,導致大量互聯(lián)網(wǎng)公司業(yè)務受到影響。阿里云的故障已有多次,2015年9月,阿里云由于客戶正常文件被誤隔離,導致所有基本命令都不能運行。2015年6月,阿里云在中國香港也發(fā)生超過12小時停止服務的事件。其實在此之前,阿里云發(fā)生過多起網(wǎng)絡故障問題。
種種停機事和服務中斷故說明,現(xiàn)階段共有云在可靠性上存在很大問題,當然用戶和服務商不能回避云計算自身的問題,不能因為一次故障就全盤否認;但也不應該過渡追捧云計算。為了使公有云能更好服務大眾,共有云服務商可以考慮從技術手段做出改進,用戶也要重新審視什么樣的業(yè)務才適合共有云。
對云服務提供商來說,除了要考慮數(shù)據(jù)備份、容災,針對不同業(yè)務提供不同等級服務外,也要考慮重大災難或停止服務時,提供有效的數(shù)據(jù)應急手段,確??蛻裟苋』鼗蜻w移重要的數(shù)據(jù)。通過安全技術保證數(shù)據(jù)被泄漏的風險。通過提供專業(yè)服務能力,制定數(shù)據(jù)回遷策略和優(yōu)先級。
此外,還要考慮如何短期內(nèi)給客戶找一個數(shù)據(jù)新家(新云服務提供商)來存儲、保護這些云上數(shù)據(jù);這也就要求云服務提供商首先是比較開放的,可以實現(xiàn)跨云數(shù)據(jù)共享和數(shù)據(jù)遷移。
對企業(yè)和組織客戶來說,在向公有云上部署業(yè)務、購買云服務時不能只依賴于一個服務商,需要介入多個云來實現(xiàn)更好的靈活性;確保數(shù)據(jù)在多個地區(qū)有多個副本,在保證數(shù)據(jù)可靠性的同時,享受數(shù)據(jù)本地化訪問的性能優(yōu)勢;建議數(shù)據(jù)通過混合云的方式連接公有云,公有云只作為備份或非關鍵業(yè)務。
公有云服務對企業(yè)、組織用戶來說確實是個好事物,它既能提供廉價、免運維的低成本投入,也能按需投入、按需分配滿足不同業(yè)務要求。但凡是都有兩面性、公有云也是一把雙刃劍。要更好的使用公有云服務,那對客戶和云服務廠商都比要承擔自己的責任和義務。
評論