博客專欄

EEPW首頁 > 博客 > Keepalived基本原理

Keepalived基本原理

發(fā)布人:天翼云開發(fā)者 時間:2024-08-02 來源:工程師 發(fā)布文章

本文分享自天翼云開發(fā)者社區(qū)《Keepalived基本原理》,作者:Ujnrfc

Keepalived簡介

Keepalived是Linux下一個輕量級別的高可用解決方案。高可用:廣義來講,是指整個系統(tǒng)的高可用行;狹義的來講就是主機(jī)的冗余和接管。

它與HeartBeat實現(xiàn)類似的功能,都可以實現(xiàn)服務(wù)或者網(wǎng)絡(luò)的高可用,但是又有差別,HeartBeat是一個專業(yè)的、功能完善的高可用軟件,它提供HA軟件所需的基本功能,比如:心跳檢測、資源接管,檢測集群中的服務(wù),在集群節(jié)點轉(zhuǎn)移共享IP地址的所有者等等。HeartBeat功能強大,但是部署和使用相對比較麻煩,與HeartBeat相比,Keepalived主要是通過虛擬路由冗余來實現(xiàn)高可用功能,雖然它沒有HeartBeat功能強大,但是Keepalived部署和使用非常的簡單,所有配置只需要一個配置文件即可以完成。

Keepalived起初是為LVS設(shè)計的,專門用來監(jiān)控集群系統(tǒng)中各個服務(wù)節(jié)點的狀態(tài),它根據(jù)TCP/IP參考模型的第三、第四層、第五層交換機(jī)制檢測每個服務(wù)節(jié)點的狀態(tài),如果某個服務(wù)器節(jié)點出現(xiàn)異常,或者工作出現(xiàn)故障,Keepalived將檢測到,并將出現(xiàn)的故障的服務(wù)器節(jié)點從集群系統(tǒng)中剔除,這些工作全部是自動完成的,不需要人工干涉,需要人工完成的只是修復(fù)出現(xiàn)故障的服務(wù)節(jié)點。

Keepalived又加入了VRRP的功能,VRRP(VritrualRouterRedundancyProtocol,虛擬路由冗余協(xié)議)出現(xiàn)的目的是解決靜態(tài)路由出現(xiàn)的單點故障問題,通過VRRP可以實現(xiàn)網(wǎng)絡(luò)不間斷穩(wěn)定運行,因此Keepalvied一方面具有服務(wù)器狀態(tài)檢測和故障隔離功能,另外一方面也有HAcluster功能。

目前健康檢查和失敗切換是keepalived的兩大核心功能。所謂的健康檢查,就是采用tcp三次握手,icmp請求,http請求,udp echo請求等方式對負(fù)載均衡器后面的實際的服務(wù)器(通常是承載真實業(yè)務(wù)的服務(wù)器)進(jìn)行?;?;而失敗切換主要是應(yīng)用于配置了主備模式的負(fù)載均衡器,利用VRRP維持主備負(fù)載均衡器的心跳,當(dāng)主負(fù)載均衡器出現(xiàn)問題時,由備負(fù)載均衡器承載對應(yīng)的業(yè)務(wù),從而在最大限度上減少流量損失,并提供服務(wù)的穩(wěn)定性。

VRRP協(xié)議與工作原理

在現(xiàn)實的網(wǎng)絡(luò)環(huán)境中。主機(jī)之間的通信都是通過配置靜態(tài)路由或者(默認(rèn)網(wǎng)關(guān))來完成的,而主機(jī)之間的路由器一旦發(fā)生故障,通信就會失效,因此這種通信模式當(dāng)中,路由器就成了一個單點瓶頸,為了解決這個問題,就引入了VRRP協(xié)議。

VRRP協(xié)議是一種容錯的主備模式的協(xié)議,保證當(dāng)主機(jī)的下一跳路由出現(xiàn)故障時,由另一臺路由器來代替出現(xiàn)故障的路由器進(jìn)行工作,通過VRRP可以在網(wǎng)絡(luò)發(fā)生故障時透明的進(jìn)行設(shè)備切換而不影響主機(jī)之間的數(shù)據(jù)通信。

虛擬路由器:虛擬路由器是VRRP備份組中所有路由器的集合,它是一個邏輯概念,并不是正真存在的。從備份組外面看備份組中的路由器,感覺組中的所有路由器就像一個 一樣,可以理解為在一個組中:主路由器+所有備份路由器=虛擬路由器。虛擬路由器有一個虛擬的IP地址和MAC地址。主機(jī)將虛擬路由器當(dāng)作默認(rèn)網(wǎng)關(guān)。虛擬MAC地址的格式為00-00-5E-00-01-{VRID}。通常情況下,虛擬路由器回應(yīng)ARP請求使用的是虛擬MAC地址,只有虛擬路由器做特殊配置的時候,才回應(yīng)接口的真實MAC地址。

主路由器(MASTER):虛擬路由器通過虛擬IP對外提供服務(wù),而在虛擬路由器內(nèi)部同一時間只有一臺物理路由器對外提供服務(wù),這臺提供服務(wù)的物理路由器被稱為主路由器。一般情況下Master是由選舉算法產(chǎn)生,它擁有對外服務(wù)的虛擬IP,提供各種網(wǎng)絡(luò)功能,如:ARP請求,ICMP數(shù)據(jù)轉(zhuǎn)發(fā)等。

備份路由器(BACKUP):虛擬路由器中的其他物理路由器不擁有對外的虛擬IP,也不對外提供網(wǎng)絡(luò)功能,僅接受MASTER的VRRP狀態(tài)通告信息,這些路由器被稱為備份路由器。當(dāng)主路由器失敗時,處于BACKUP角色的備份路由器將重新進(jìn)行選舉,產(chǎn)生一個新的主路由器進(jìn)入MASTER角色,繼續(xù)提供對外服務(wù),整個切換對用戶來說是完全透明的。

VRRP選舉機(jī)制

VRRP路由器在運行過程中有三種狀態(tài):Initialize、Master、Backup。一般主路由器處于Master狀態(tài),備份路由器處于Backup狀態(tài)。

VRRP使用選舉機(jī)制來確定路由器的狀態(tài),優(yōu)先級如下:

1.VRRP組中IP擁有者。如果虛擬IP地址與VRRP組中的某臺VRRP路由器IP地址相同,則此路由器為IP地址擁有者,這臺路由器將被定位主路由器。

2.比較優(yōu)先級。如果沒有IP地址擁有者,則比較路由器的優(yōu)先級,優(yōu)先級的范圍是0~255,優(yōu)先級大的作為主路由器

3.比較IP地址。在沒有Ip地址擁有者和優(yōu)先級相同的情況下,IP地址大的作為主路由器。

如下圖所示,虛擬IP為10.1.1.254,在VRRP組中沒有IP地址擁有者,則比較優(yōu)先級,很明顯router_a和router_b的優(yōu)先級要大于router_c,則比較router_a和router_b的IP地址,router_a的IP地址大。所以router_a為組中的主路由器。

image.png

VRRP工作過程

路由器使用VRRP 功能后,會根據(jù)優(yōu)先級確定自己在備份組中的角色。優(yōu)先級高的路由器成為Master 路由器,優(yōu)先級低的成為Backup 路由器。Master 擁有對外服務(wù)的虛擬IP,提供各種網(wǎng)絡(luò)功能,并定期發(fā)送VRRP 報文,通知備份組內(nèi)的其他設(shè)備自己工作正常;Backup 路由器只接收Master 發(fā)來的報文信息,用來監(jiān)控Master 的運行狀態(tài)。當(dāng)Master 失效時,Backup 路由器進(jìn)行選舉,優(yōu)先級高的Backup 將成為新的Master 。

主備切換邏輯如下:在搶占方式下,當(dāng)Backup 路由器收到VRRP 報文后,會將自己的優(yōu)先級與報文中的優(yōu)先級進(jìn)行比較。如果大于通告報文中的優(yōu)先級,則成為Master 路由器;否則將保持Backup狀態(tài);在非搶占方式下,只要Master 路由器沒有出現(xiàn)故障,備份組中的路由器始終保持Master 或Backup 狀態(tài),Backup 路由器即使隨后被配置了更高的優(yōu)先級也不會成為Master 路由器;如果Backup 路由器的定時器超時后仍未收到Master 路由器發(fā)送來的VRRP報文,則認(rèn)為Master 路由器已經(jīng)無法正常工作,此時Backup 路由器會認(rèn)為自己是Master 路由器,并對外發(fā)送VRRP報文。備份組內(nèi)的路由器根據(jù)優(yōu)先級選舉出Master 路由器,承擔(dān)報文的轉(zhuǎn)發(fā)功能。

Keepalvied的工作原理

Keepalived 包含以下組件:

core:是keepalived的核心,復(fù)雜主進(jìn)程的啟動和維護(hù),全局配置文件的加載解析等

check:負(fù)責(zé)healthchecker(健康檢查),包括了各種健康檢查方式,以及對應(yīng)的配置的解析包括LVS的配置解析

vrrp:vrrpd子進(jìn)程,VRRPD子進(jìn)程就是來實現(xiàn)VRRP協(xié)議的

libipfwc:iptables(ipchains)庫,配置LVS

libipvs:配置LVS

Keepalived 啟動后會 通過healthchecker組件負(fù)責(zé)檢查各自服務(wù)器的健康狀態(tài),如果MASTER節(jié)點上服務(wù)不可用就會通過vrrpd組件切換到BACKUP狀態(tài)。


Keepalived工作在TCP/IP參考模型的三層、四層、五層(物理層,鏈路層):


網(wǎng)絡(luò)層(3):Keepalived通過ICMP協(xié)議向服務(wù)器集群中的每一個節(jié)點發(fā)送一個ICMP數(shù)據(jù)包(有點類似與Ping的功能),如果某個節(jié)點沒有返回響應(yīng)數(shù)據(jù)包,那么認(rèn)為該節(jié)點發(fā)生了故障,Keepalived將報告這個節(jié)點失效,并從服務(wù)器集群中剔除故障節(jié)點。


傳輸層(4):Keepalived在傳輸層里利用了TCP協(xié)議的端口連接和掃描技術(shù)來判斷集群節(jié)點的端口是否正常,比如對于常見的WEB服務(wù)器80端口。或者SSH服務(wù)22端口,Keepalived一旦在傳輸層探測到這些端口號沒有數(shù)據(jù)響應(yīng)和數(shù)據(jù)返回,就認(rèn)為這些端口發(fā)生異常,然后強制將這些端口所對應(yīng)的節(jié)點從服務(wù)器集群中剔除掉。


應(yīng)用層(5):Keepalived的運行方式也更加全面化和復(fù)雜化,用戶可以通過自定義Keepalived工作方式,例如:可以通過編寫程序或者腳本來運行Keepalived,而Keepalived將根據(jù)用戶的設(shè)定參數(shù)檢測各種程序或者服務(wù)是否允許正常,如果Keepalived的檢測結(jié)果和用戶設(shè)定的不一致時,Keepalived將把對應(yīng)的服務(wù)器從服務(wù)器集群中剔除。

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: keepalived linux

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉