2024-03-04 分類: 網(wǎng)站建設(shè)
實現(xiàn)業(yè)務(wù)連續(xù)性是現(xiàn)代組織的首要關(guān)注點。停機可能會導(dǎo)致重大的財務(wù)影響,在某些情況下,還會導(dǎo)致無法恢復(fù)的數(shù)據(jù)丟失。
避免服務(wù)中斷和計劃外停機的解決方案是采用高可用性架構(gòu)。
因為每個企業(yè)都高度依賴互聯(lián)網(wǎng),所以每一分鐘都很重要。這就是公司計算機和服務(wù)器必須始終保持運行的原因。
無論您選擇容納自己的 IT 基礎(chǔ)架構(gòu)還是選擇在數(shù)據(jù)中心托管解決方案,在設(shè)置 IT 環(huán)境時必須首先考慮高可用性。
高可用性定義
高可用架構(gòu)涉及多個 組件協(xié)同工作,以確保在特定時間段內(nèi)不中斷服務(wù)。這還包括對用戶請求的響應(yīng)時間。也就是說,可用的系統(tǒng)不僅必須在線,而且還必須響應(yīng)。
實施能夠?qū)崿F(xiàn)這一目標的 云計算架構(gòu) 是確保關(guān)鍵應(yīng)用程序和服務(wù)持續(xù)運行的關(guān)鍵。即使發(fā)生各種組件故障或系統(tǒng)處于高壓力下,它們也能保持在線并做出響應(yīng)。
高度可用的系統(tǒng)包括在盡可能短的時間內(nèi)從意外事件中恢復(fù)的能力。 通過將流程轉(zhuǎn)移到備份組件,這些系統(tǒng)可以大限度地減少或消除停機時間。這通常需要持續(xù)維護、監(jiān)控和初步深入測試,以確認沒有弱點。
高可用性環(huán)境包括帶有系統(tǒng)軟件的復(fù)雜服務(wù)器集群,用于持續(xù)監(jiān)控系統(tǒng)性能。首要任務(wù)是避免計劃外的設(shè)備停機。如果某個硬件出現(xiàn)故障,則不得在生產(chǎn)期間導(dǎo)致服務(wù)完全停止。
對于大型組織而言,不間斷地保持運營尤為重要。在這種情況下,幾分鐘的損失可能會導(dǎo)致聲譽、客戶和數(shù)千美元的損失。只要可用性水平不影響業(yè)務(wù)運營,高度可用的計算機系統(tǒng)就允許出現(xiàn)故障。
高可用性基礎(chǔ)架構(gòu)具有以下特征:
硬件冗余
軟件和應(yīng)用程序冗余
數(shù)據(jù)冗余
消除單點故障
如何計算高可用性正常運行時間百分比?
可用性是通過特定系統(tǒng)在特定時期(通常是一年)內(nèi)保持完全運行的時間來衡量的。
它以百分比表示。請注意,正常運行時間不一定與可用性相同。系統(tǒng)可能已啟動并正在運行,但對用戶不可用。造成這種情況的原因可能是網(wǎng)絡(luò)或 負載平衡 問題。
正常運行時間通常用五個 9 的可用性等級來表示。
如果您決定采用托管解決方案,這將 在服務(wù)水平協(xié)議 (SLA) 中定義?!耙粋€九”的等級意味著保證的可用性為 90%。今天,大多數(shù)組織和企業(yè)至少需要“三個九”,即 99.9% 的可用性。
企業(yè)有不同的可用性需求。那些需要全年全天候運行的設(shè)備將瞄準“五個九”,即 99.999% 的正常運行時間??雌饋?0.1% 并沒有太大的區(qū)別。但是,當您將其轉(zhuǎn)換為小時和分鐘時,這些數(shù)字很重要。
如何實現(xiàn)高可用性
希望實施高可用性解決方案的企業(yè)需要了解系統(tǒng)獲得高可用性所需的多個組件和要求。為確保業(yè)務(wù)連續(xù)性和可操作性,關(guān)鍵應(yīng)用程序和服務(wù)需要全天候運行。實現(xiàn)高可用性的最佳實踐涉及需要滿足的某些條件。以下是實現(xiàn) 99.999% 可靠性和正常運行時間的 4 個步驟。
1. 消除單點故障高可用性與冗余
高可用性系統(tǒng)的關(guān)鍵要素是通過在所有級別上實現(xiàn)冗余來消除單點故障 。無論是自然災(zāi)害、硬件還是電源故障,IT 基礎(chǔ)設(shè)施都必須有備用組件來替換故障系統(tǒng)。
存在不同級別的組件冗余。其中最常見的是:
N+1 模型 包括保持系統(tǒng)正常運行所需的設(shè)備數(shù)量(稱為“N”)。 萬一發(fā)生故障,每個組件都有一個獨立的備份 組件。一個例子是為應(yīng)用服務(wù)器使用額外的電源,但這可以是任何其他 IT 組件。該模型通常是主動/被動的。備份組件處于待命狀態(tài),等待發(fā)生故障時接管。N+1 冗余也可以是主動/主動的。在這種情況下,即使主要組件正常運行,備用組件也能正常工作。請注意,N+1 模型并不是一個完全冗余的系統(tǒng)。
N+2 模型 類似于 N+1。不同之處在于該系統(tǒng)將能夠承受兩個相同組件的故障。這應(yīng)該足以讓大多數(shù)組織保持正常運轉(zhuǎn)。
2N 模型 包含雙倍數(shù)量的運行系統(tǒng)所需的每個單獨組件。該模型的優(yōu)點是您不必考慮是否存在單個組件或整個系統(tǒng)的故障。您可以將操作完全移至備份組件。
2N+1 型號 提供與 2N 相同級別的可用性和冗余,并添加了另一個組件以改進保護。
最終的冗余是通過地理冗余來實現(xiàn)的。
這是應(yīng)對自然災(zāi)害和其他完全停電事件的唯一機制。在這種情況下,服務(wù)器分布在不同區(qū)域的多個位置。
這些站點應(yīng)放置在不同的城市、國家甚至大洲。這樣,它們就完全獨立了。如果一個地方發(fā)生災(zāi)難性故障,另一個地方將能夠接手并保持業(yè)務(wù)運行。
這種類型的冗余往往非常昂貴。最明智的決定是從數(shù)據(jù)中心遍布全球的供應(yīng)商那里尋求托管解決方案。
除了停電,網(wǎng)絡(luò)故障是導(dǎo)致業(yè)務(wù)停機的最常見原因之一。
出于這個原因,網(wǎng)絡(luò)的設(shè)計必須使其保持 24/7/365 全天候運行。為了實現(xiàn) 100% 的網(wǎng)絡(luò)服務(wù)正常運行時間,必須有備用網(wǎng)絡(luò)路徑。他們每個人都應(yīng)該有冗余的企業(yè)級交換機和路由器。
2.數(shù)據(jù)備份與恢復(fù)
數(shù)據(jù)安全是每個企業(yè)最關(guān)心的問題之一。高可用性系統(tǒng)必須有完善的數(shù)據(jù)保護和 災(zāi)難恢復(fù)計劃。
絕對必須有適當?shù)膫浞?。另一個關(guān)鍵是在數(shù)據(jù)快速丟失、損壞或完全存儲故障的情況下恢復(fù)的能力。如果您的業(yè)務(wù)需要較低的 RTO 和 RPO ,并且您無法承受丟失數(shù)據(jù)的后果,那么可以考慮的最佳選擇是使用 數(shù)據(jù)復(fù)制。有許多備份計劃可供選擇,具體取決于您的業(yè)務(wù)規(guī)模、要求和預(yù)算。
數(shù)據(jù)備份和復(fù)制與 IT 高可用性齊頭并進。兩者都應(yīng)該仔細計劃。在冗余基礎(chǔ)架構(gòu)上創(chuàng)建完整備份對于確保數(shù)據(jù)彈性至關(guān)重要,不容忽視。
3. 帶故障檢測的自動故障轉(zhuǎn)移
在高度可用的冗余 IT 基礎(chǔ)架構(gòu)中,系統(tǒng)需要在發(fā)生故障時立即將請求重定向到備份系統(tǒng)。這稱為 故障轉(zhuǎn)移。早期故障檢測對于縮短故障轉(zhuǎn)移時間和確保大系統(tǒng)可用性至關(guān)重要。
我們推薦的高可用性軟件解決方案之一是 Carbonite Availability。它適用于任何基礎(chǔ)設(shè)施,無論是虛擬的還是物理的。
如需快速靈活的基于云的基礎(chǔ)架構(gòu)故障轉(zhuǎn)移和故障恢復(fù),您可以求助于 Cloud Replication for Veeam。故障轉(zhuǎn)移過程適用于整個系統(tǒng)或其可能發(fā)生故障的任何部分。每當組件發(fā)生故障或 Web 服務(wù)器停止響應(yīng)時,故障轉(zhuǎn)移必須是 無縫 的并且是實時發(fā)生的。
該過程如下所示:
機器 1 及其克隆 機器 2 ,通常 稱為 熱備用。
機器 2 持續(xù)監(jiān)控 機器 1 的狀態(tài)以發(fā)現(xiàn)任何問題。
機器 1 遇到問題。由于多種原因,它失敗或關(guān)閉。
機器 2 自動聯(lián)機。現(xiàn)在,每個請求都被路由到 Machine 2 而不是 Machine 1。這對最終用戶沒有任何影響。他們甚至不知道Machine 1有任何問題 。
修復(fù)故障組件的問題后, 機器 1 和 機器 2 恢復(fù)其初始角色
故障轉(zhuǎn)移過程的持續(xù)時間取決于系統(tǒng)的復(fù)雜程度。在許多情況下,這將需要幾分鐘。但是,它也可能需要幾個小時。
規(guī)劃高可用性必須基于所有這些考慮,以提供最佳結(jié)果。每個系統(tǒng)組件都需要符合實現(xiàn) 99.999% 可用性和縮短故障轉(zhuǎn)移時間的最終目標。
4.負載均衡
負載均衡器可以是硬件設(shè)備或軟件解決方案。其目的是跨多個服務(wù)器和組件分發(fā)應(yīng)用程序或網(wǎng)絡(luò)流量。目標是 提高整體運行性能和可靠性。
它通過有效管理負載和持續(xù)監(jiān)控后端服務(wù)器的運行狀況來優(yōu)化計算和網(wǎng)絡(luò)資源的使用。
負載均衡器如何決定選擇哪個服務(wù)器?
許多不同的方法可用于跨服務(wù)器池分配負載。為您的工作負載選擇一種將取決于多種因素。其中一些包括所服務(wù)的應(yīng)用程序類型、網(wǎng)絡(luò)狀態(tài)和后端服務(wù)器的狀態(tài)。負載均衡器根據(jù)當前傳入請求的數(shù)量決定使用哪種算法。
一些最常見的負載平衡算法是:
循環(huán)賽。 使用循環(huán),負載平衡器將請求定向到第一臺服務(wù)器。它將向下移動列表到最后一個,然后從頭開始。該方法易于實現(xiàn),應(yīng)用廣泛。但是,它沒有考慮服務(wù)器是否具有不同的硬件配置以及它們是否可以更快地過載。
最少的連接。 在這種情況下,負載均衡器將選擇活動連接數(shù)最少的服務(wù)器。當請求進來時,負載均衡器不會像輪詢那樣為列表中的下一個服務(wù)器分配連接。相反,它將尋找當前連接最少的一個。在會話持續(xù)很長時間的情況下,最少連接方法對于避免 Web 服務(wù)器過載特別有用。
源 IP 哈希。 這個算法會根據(jù)請求的源IP地址來決定選擇哪個服務(wù)器。負載均衡器使用源 IP 地址和目標 IP 地址創(chuàng)建唯一的哈希鍵。這樣的密鑰使其始終能夠?qū)⒂脩舻恼埱蠖ㄏ虻酵环?wù)器。
負載均衡器確實在實現(xiàn)高可用性基礎(chǔ)架構(gòu)方面發(fā)揮著重要作用。但是,僅僅擁有一個負載均衡器并不意味著您擁有很高的系統(tǒng)可用性。
如果具有負載均衡器的配置僅路由流量以減少單臺機器上的負載,則不會使系統(tǒng)具有高可用性。
通過為負載均衡器本身實現(xiàn)冗余,您可以將其作為單點故障消除。
如果您選擇這種類型的云計算服務(wù),那么保持高可用性是 DBaaS 提供商可以為您管理的任務(wù)之一。了解有關(guān) 數(shù)據(jù)庫即服務(wù)的更多信息。
最后:實施高可用性架構(gòu)
無論您經(jīng)營何種規(guī)模和類型的業(yè)務(wù),如果沒有 云災(zāi)難恢復(fù)解決方案,任何類型的服務(wù)停機都可能代價高昂。
更糟糕的是,它可能會對您的聲譽造成永久性損害。通過應(yīng)用上面列出的一系列最佳實踐,您可以降低丟失數(shù)據(jù)的風險。您還可以大限度地減少出現(xiàn)生產(chǎn)環(huán)境問題的可能性。
如果沒有高可用性系統(tǒng),您離線的機會會更高。
從這個角度來看,停機成本大大超過了精心設(shè)計的 IT 基礎(chǔ)架構(gòu)的成本。近年來,托管和云計算解決方案比內(nèi)部解決方案支持更受歡迎。這樣做的主要原因是它 降低了 IT 成本 并增加了更多的靈活性。
無論您選擇哪種解決方案,高可用性系統(tǒng)的好處是多方面的:
您可以節(jié)省金錢和時間,因為無需重建因存儲或其他系統(tǒng)故障而丟失的數(shù)據(jù)。在某些情況下,中斷后無法恢復(fù)您的數(shù)據(jù)。這可能會對您的業(yè)務(wù)造成災(zāi)難性的影響。
更少的停機時間意味著對用戶和客戶的影響更小。如果您的可用性以五個九來衡量,這意味著幾乎沒有服務(wù)中斷。這可以提高員工的生產(chǎn)力并保證客戶滿意度。
您的應(yīng)用程序和服務(wù)的性能將得到改善。
如果您因服務(wù)器問題不符合合同 SLA,您將避免罰款和處罰。
網(wǎng)頁標題:高可用性的定義以及它為什么如此重要?
網(wǎng)頁URL:http://m.rwnh.cn/news13/320013.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、品牌網(wǎng)站設(shè)計、網(wǎng)站建設(shè)、網(wǎng)站設(shè)計公司、品牌網(wǎng)站制作、自適應(yīng)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容