我是盧松松,點點上面的頭像,歡迎關注我哦!
2012年6月,蘇格蘭皇家銀行在2012年6月份進行軟件升級以后,因為系統故障出現長達兩周的中斷,給銀行客戶帶來了重大的損失,最后不得不拿出1.25億英鎊進行賠付;
2017年12月,愛立信公司因軟件證書過期問題,在11個國家內引發將近1天的網絡停運問題——這直接導致日本3000萬軟銀移動客戶與2500萬英國移動客戶無法正常聯網,愛立信為此需要支付數千萬英鎊的賠償金;
2018年6月,美國航空公司旗下的全資子公司PSA航空公司的航班調度與追蹤系統就曾出現過問題,在7天之內導致接近3000次航班被迫取消,直接經濟損失高達3500萬美元……
以上發生在金融領域、通信領域、航空領域的這些事故,不過IT故障帶來損失案例中的冰山一角。除了上述列舉的這些領域外,網絡安全、醫療健康、警務管理、鐵路交通、零售服務等等,IT故障帶來的破壞可謂無處不在,根源就是這些事故中涉及的軟硬件高可用的不足。
就像車會拋錨,人會生病,服務器/線上應用等這些,硬件也好軟件也罷,都有無法保障100%可用性的時候。高可用架構設計的目的,就是為了保證服務器硬件故障時服務依然可用、數據依然保存并能夠被訪問。阿里云等云服務和應用就是極為重要的可對癥下藥的解決方案。
一、何為高可用?
隨著云計算的興起,阿里云等應用服務不斷普及,眾多企業進入云時代:云洽談、云招商、云簽約、云開工、云路演、云服務、云招聘……這一點,在三年新冠疫情期間,人們的體驗應當最為深刻:以阿里云等為代表的各種云服務,儼然成為無數企業和從業者在一次次的封控隔離期間,依然能夠保持運營效率和生產力的最終解決方案。這里面,保障一切服務、系統和線上應用之所以能夠順利正常持續運行,高可用是核心最關鍵的因素之一。
高可用幾乎涉及任何IT系統,小到一個微服務,大到一整個完整的系統都會要求高可用,尤其是在大型的業務系統中,因為不同的服務之間存在互相依賴,因此高可用會被反復提及,每一個小的組件都要求滿足高可用,才能確保大的系統不會被拖累。
對于普通人來說,想要完全搞懂和理解清楚其含義,其實也不是很復雜的問題:高可用,又叫高可用性,英文叫High Availability,即根據預定義的服務級別承受所有運行中斷并繼續提供處理能力。涵蓋的運行中斷可以包括計劃外事件,例如軟件故障、硬件故障、電源故障和災難等。更直白地說法就是,高可用是一種面向風險設計,使系統具備控制風險,提供更高程度的可用性的能力。
舉個例子,比如說一個系統它一直能夠為你提供服務,那它的系統可用性就是100%。但實際上目前大部分企業的高可用目標是4個9,也就是99.99%,有幾個 9,就代表了你有多高的可用性,9越多,出現故障的時間就越短:
2個9:基本可用,網站年度不可用時間小于 88 小時;
3個9:較高可用,網站年度不可用時間小于 9 小時;
4個9:具有自動恢復能力的高可用,網站年度不可用時間小于 53 分鐘。
二、為什么說云是高可用的最佳載體?
傳統的高可用實現方式主要包括主從方式 (非對稱方式)、雙機雙工方式(互備互援)、集群工作方式(多服務器互備方式)三種。而在云計算環境中,高可用的實現方式主要以第二種和第三種方式為主,在保證高可用的同時,利用多機分擔負載,也具有高的擴展性(Scalability)。通常來說,云計算的計算資源和存儲資源是以集群形式實現的,特別強調可擴展性。
而在大數據爆發的當下,云計算的這種可擴展性,正是眾多企業所迫切需要的,企業數字化轉型已成為必然趨勢。Gartner調查顯示,2/3的企業領導者相信,企業必須加快數字化進程,才能保持競爭優勢。為此,隨著數字化轉型進程的推進,數據量呈爆炸性增長,越來越多的行業用戶正在構建行業云,逐步將應用遷移至云上。
就目前而言,云架構已在各個領域大量運營,數據中心作為云資源的提供者承載了大量不同類型的應用,傳統單一的數據中心已發展成為內分布式云數據中心模式,因此對于分布式云數據中心構成一體化高可用能力的需求也越來越迫切。為此,云之所以被稱為是高可用的最佳展現載體,其根本原因就在于:
1、高可用云服務,能夠基于租戶級別的備份,實現租戶災備數據安全隔離;
2、高可用支持異構云平臺間的災難恢復,滿足不同云平臺之間的災難恢復需求;
3、高可用提供永久增量備份、多節點并發備份,可為Hadoop、SAP HANA等平臺提供高效保護,大幅縮短備份所需時間;
4、高可用云服務,能夠通過打造兩地三中心災備架構,滿足更高等級保護需求;
5、高可用云服務,能夠提供智能的災備運維,簡化管理復雜度;
三、高可用表現有在哪些層面?
高可用自下而上可分為三個層面。首先是資源高可用。就云平臺而言,這通常指的是 IaaS 資源的高可用。IaaS 即 Infrastructure as a Service(基礎設施即服務), 一般指的是云平臺為用戶提供的 IT 基礎架構服務,如計算、存儲、網絡等,類似于大家生活中使用的水和電一樣。
其次是應用高可用。就云平臺而言,這通常指的是 PaaS 服務高可用。PaaS 即 Platform as a Service(平臺即服務), 一般指的是云平臺為用戶提供的中間件服務、數據庫服務、日志服務、大數據處理服務等一系列應用支持服務。
最后是服務高可用。就云平臺和對用戶而言,這通常指的是 SaaS 服務高可用。SaaS 即 Software as a Service(軟件即服務),一般我們指的是由軟件提供商和服務商在互聯網上直接提供給客戶,通常是面向最終用戶的多租戶服務。
隨著云平臺建設從初期進入“深水區”,企業對云平臺建設考慮的也從應用遷移上云,轉向后續的運維、災備、安全等在前期建設中容易忽視的場景。這些支撐服務型技術、應用的引入,也將貫穿在這三大層面上,成為進一步提高企業優化“降本增效”效果的重要手段。
結束語
自2006云計算興起,到目前相關技術逐漸趨于成熟,高可用云平臺建設已初見成效。尤其是經過三年疫情的催化,市場需求激增,政策持續加碼,相應的數字化技術也不斷突破。我們有理由相信,隨著企業數字化轉型進程加深,以及“上云“概念的普及化,高可用云服務大發展大應用的趨勢必然勢不可擋。未來企業業務的轉型、迭代和突破,高可用云服務將是強大助力。屆時上下齊心,必有所成。
文章來源:盧松松博客,歡迎關注我的賬號哦!
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!