負(fù)載均衡的原理說明

上傳人：t*** IP屬地：天津上傳時(shí)間：2023-09-29 格式：DOCX 頁數(shù)：19 大小：164.88KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩14頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

負(fù)載均衡的演進(jìn)大家都知道一臺服務(wù)器的處理能力，主要受限于服務(wù)器自身的可擴(kuò)展硬件能力。所以，在需要處理大量用戶請求的時(shí)候，通常都會引入負(fù)載均衡器，將多臺普通服務(wù)器組成一個(gè)系統(tǒng)，來完成高并發(fā)的請求處理任務(wù)。之前負(fù)載均衡只能通過DNS來實(shí)現(xiàn)，1996年之后，出現(xiàn)了新的網(wǎng)絡(luò)負(fù)載均衡技術(shù)。通過設(shè)置虛擬服務(wù)地址（IP），將位于同一地域（Region）的多臺服務(wù)器虛擬成一個(gè)高性能、高可用的應(yīng)用服務(wù)池；再根據(jù)應(yīng)用指定的方式，將來自客戶端的網(wǎng)絡(luò)請求分發(fā)到服務(wù)器池中。網(wǎng)絡(luò)負(fù)載均衡會檢查服務(wù)器池中后端服務(wù)器的健康狀態(tài)，自動隔離異常狀態(tài)的后端服務(wù)器，從而解決了單臺后端服務(wù)器的單點(diǎn)問題，同時(shí)提高了應(yīng)用的整體服務(wù)能力。網(wǎng)絡(luò)負(fù)載均衡主要有硬件與軟件兩種實(shí)現(xiàn)方式，主流負(fù)載均衡解決方案中，硬件廠商以F5為代表目前市場占有率超過50%，軟件主要為NGINX與LVS。但是，無論硬件或軟件實(shí)現(xiàn)，都逃不出基于四層交互技術(shù)的"轉(zhuǎn)發(fā)”或基于七層協(xié)議的"代理”這兩種方式。四層的轉(zhuǎn)發(fā)模式通常性能會更好，但七層的代理模式可以根據(jù)更多的信息做到更智能地分發(fā)流量。一般大規(guī)模應(yīng)用中，這兩種方式會同時(shí)存在。2007年F5提出了ADC(Applicationdeliverycontroller)的概念為傳統(tǒng)的負(fù)載均衡器增加了大量的功能，常用的有:SSL卸載、壓縮優(yōu)化和TCP連接優(yōu)化。NGINX也支持很多ADC的特性，但F5的中高端型號會通過硬件加速卡來實(shí)現(xiàn)SSL卸載、壓縮優(yōu)化這一類CPU密集型的操作，從而可以提供更好的性能。F5推出ADC以后，各種各樣的功能有很多，但其實(shí)我們最常用的也就幾種。這里我也簡單的總結(jié)了一下，并和LVS、Nginx對比了一下。HTTP丿弋理SS匸且載古縮優(yōu)化F57..LVSNGINXSSL卸載和壓縮優(yōu)化，主要是將CPU密集型的加解密和壓縮操作移到負(fù)載均衡器上進(jìn)行；TCP連接優(yōu)化主要指的是用戶和負(fù)載均衡器短連接的同時(shí)，負(fù)載均衡器和后端服務(wù)器建立長連接。不過我們本次主要介紹四層負(fù)載均衡，所以這些高級ADC功能不會涉及到。F5的硬件負(fù)載均衡產(chǎn)品又分單機(jī)BigIP系列和集群VISRION系列，都是X86架構(gòu)，配合自研的TMOS(TrafficManagementOperatingSystem)，再加上硬件加速卡(Cavium提供)處理SSL和壓縮等CPU密集型操作。L4CPS:四層每秒新建連接數(shù)。測試的時(shí)候一般采用TCP短連接，每次請求128字節(jié)。體現(xiàn)CPU性能，最重要的性能指標(biāo)，沒有之一。L4最大并發(fā)連接數(shù)：體現(xiàn)內(nèi)存大小L7RPS:七層每秒請求數(shù)。測試時(shí)每連接10個(gè)128字節(jié)HTTP請求。主要體現(xiàn)HTTP協(xié)議棧性能這些性能指標(biāo)實(shí)際上就是一個(gè)負(fù)載均衡器最關(guān)鍵的指標(biāo)了。大家如有采購硬件負(fù)載均衡器一定要看這個(gè)。有很多小牌子的硬件負(fù)載均衡器經(jīng)常不標(biāo)注L4CPS，只是籠統(tǒng)地說10G負(fù)載均衡，其實(shí)差別很大的。硬件負(fù)載均衡在功能、易用性和可擴(kuò)展性上都做得不錯，但是也有不少缺點(diǎn)。從商業(yè)角度來說，硬件負(fù)載均衡產(chǎn)品過于昂貴，高端產(chǎn)品動輒五十萬甚至數(shù)百萬的價(jià)格對于用戶是幾乎不可承受的負(fù)擔(dān)。從使用角度來說，硬件負(fù)載均衡是黑盒，有BUG需要聯(lián)系廠商等待解決，時(shí)間不可控、新特性迭代緩慢且需資深人員維護(hù)升級，也是變相增加昂貴的人力成本。相信除了很多不差錢的公司，大家還是用軟件負(fù)載均衡比較多。軟件四層負(fù)載均衡最常見的就是LVS了。

轉(zhuǎn)發(fā)欖武優(yōu)葩 1NAT■后端RS不需任何特殊配供6LV呂必須作為兩黃樸VIP和FNP必狽柚于下同網(wǎng)段.都是客戶端源IF信息DR回程報(bào)丈不經(jīng)過LVS九囹不対稱流量性能優(yōu)化明顯□同名保留源IP地址-LVS^RS必須在相同?護(hù)網(wǎng)，必?zé)笇涌蛇_(dá)，R益無法叛到零配儘，需要配f§VIP,同時(shí)耍對ARP做特殊址理FULLNAT:幣端RS不需任何特殊配爵“物理冏絡(luò)僅要求三層可達(dá)*丟失源舊倍息CTOAJj-式對只営改動過大）q雅護(hù)及具匍雜；FULLNAT無法進(jìn)入LM其內(nèi)LVS最常用的有NAT、DR以及新的FULLNAT模式。上圖比較了幾種常見轉(zhuǎn)發(fā)模式的優(yōu)缺點(diǎn)。我們認(rèn)為LVS的每種轉(zhuǎn)發(fā)模式都有其優(yōu)點(diǎn)和缺點(diǎn)，但最大的問題還是其復(fù)雜性。我第一次看到這三種轉(zhuǎn)發(fā)方式、還有F5的單臂模式、雙臂模式都會有云里霧里的感覺。雪上加霜的是咱們還需要考慮LVS的性能擴(kuò)展和容災(zāi)方法，這使得整個(gè)方案更加的復(fù)雜。常見的有基于Keepalived的主備方式和ECMP兩種。Keepalived主備模式設(shè)備利用率低；不能橫向擴(kuò)展；VRRP協(xié)議，有腦裂的風(fēng)險(xiǎn)。而ECMP的方式需要了解動態(tài)路由協(xié)議，LVS和交換機(jī)均需要較復(fù)雜配置；交換機(jī)的HASH算法一般比較簡單，增加刪除節(jié)點(diǎn)會造成HASH重分布，可能導(dǎo)致當(dāng)前TCP連接全部中斷；部分交換機(jī)的ECMP在處理分片包時(shí)會有Bug，說起來心中滿滿的都是血淚呀?？煽啃?ECMP+—致性哈希保證連接不中斷當(dāng)負(fù)載均衡器發(fā)主變化可伸縮性橫向擴(kuò)展半ECMP集群縱向擴(kuò)展：DPDF：提升單機(jī)勺虛擬化網(wǎng)絡(luò)中的DR轉(zhuǎn)發(fā)模式當(dāng)兩者同時(shí)發(fā)生變更如圖：UCIoudVortex負(fù)載均衡器的設(shè)計(jì)理念用戶使用負(fù)載均衡器最重要的需求是"HighAvailability”和"Scalability”，Vortex的架構(gòu)設(shè)計(jì)重心就是滿足用戶需求，提供極致的"可靠性”和"可收縮性”，而在這兩者之間我們又把“可靠性”放在更重要的位置。

值得一提的是今年3月舉辦的第十三屆網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)USENIX研討會(NSDI'16)上，來自谷歌、加州大學(xué)洛杉磯分校、SpaceX公司的工程師們分享了《Maglev:快速、可靠的軟件網(wǎng)絡(luò)負(fù)載均衡器》，介紹了從2008年開始在生產(chǎn)環(huán)境投入使用的軟件負(fù)載均衡器。其設(shè)計(jì)理念和我們非常相似，同樣是ECMP+一致性哈希；同樣是KernelBypass模式；單機(jī)性能也和我們的Vortex非常接近。關(guān)于Vortex的HighAvailability實(shí)現(xiàn)四層負(fù)載均衡器的主要功能是將收到的數(shù)據(jù)包轉(zhuǎn)發(fā)給不同的后端服務(wù)器，旦必須保證將五元組相同的數(shù)據(jù)包發(fā)送到同一臺后端服務(wù)器，否則后端服務(wù)器將無法正確處理該數(shù)據(jù)包。以常見的HTTP連接為例，如果報(bào)文沒有被發(fā)送到同一臺后端服務(wù)器，操作系統(tǒng)的TCP協(xié)議棧無法找到對應(yīng)的TCP連接或者是驗(yàn)證TCP序列號錯誤將會無聲無息的丟棄報(bào)文，發(fā)送端不會得到任何的通知。如果應(yīng)用層沒有超時(shí)機(jī)制的話，服務(wù)將會長期不可用。Vortex的可靠性設(shè)計(jì)面臨的最大問題就是如何在任何情況下避免該情況發(fā)生。Vortex通過ECMP集群和一致性哈希來實(shí)現(xiàn)極致程度的可靠性。首先，我們來考察一下負(fù)載均衡服務(wù)器變化場景。這種場景下，可能由于負(fù)載均衡服務(wù)器故障被動觸發(fā)，也可能由于運(yùn)維需要主動增加或者減少負(fù)載均衡服務(wù)器。此時(shí)交換機(jī)會通過動態(tài)路由協(xié)議檢測負(fù)載均衡服務(wù)器集群的變化，旦除思科的某些型號外大多數(shù)交換機(jī)都采用簡單的取模算法，導(dǎo)致大多數(shù)數(shù)據(jù)包被發(fā)送到不同的負(fù)載均衡服務(wù)器。

Vortex服務(wù)器的一致性哈希算法能夠保證即使是不同的Vortex服務(wù)器收到了數(shù)據(jù)包，仍然能夠?qū)⒃摂?shù)據(jù)包轉(zhuǎn)發(fā)到同一臺后端服務(wù)器，從而保證客戶應(yīng)用對此類變化無感知，業(yè)務(wù)不受任何影響。這種場景下，如果負(fù)載均衡器是LVS且采用RR(RoundRobin)算法的話，該數(shù)據(jù)包會被送到錯誤的后端服務(wù)器，且上層應(yīng)用無法得到任何通知。R^ialServiceInstances菇詢轉(zhuǎn)發(fā)算注LVS腕務(wù)器變i!1h05T;lR|n$M肝卅瞞6,3irl=-Ji鬲t_￡S甩羌霽S5i崖嶺生靈貯河一虧涯陛就S5酮爾3ha&h^Rf^ihashl-iR)%^聲臨=5陽誦溜L(fēng)翩g務(wù)甌鎖比iWWB四曲陽上空斷屆陶魁氏X”叭，.二阿為"式海諄目瑕運(yùn)咅:!問2妙M剎l^^KA,耳例甲拐閆呂剛§罷密’淫舶人覘各發(fā)生蠻狂如果LVS配置了SH(SourceHash)算法的話，該數(shù)據(jù)包會被送到正確的后端服務(wù)器，上層應(yīng)用對此類變化無感知，業(yè)務(wù)不受任何影響；

srsr頂Iflf■LYSSOufMn-abh\LV5——\\ 二DODDBBBBHgfilSriuiceIns^nai：:s能服務(wù)器孌噩宋塞e頓叭旌厠加、*割iait卿§駆伽?第I■引.陽創(chuàng)輸啤5;hr!i托21L1=I2;'r：35h2ILISiiE衿RS確樹限生蠻出時(shí)，般陽Kb芒舷媚珈1he倚1(R|=fl,hash1斛砸;刁hs&Ji?(LF=12;h0^2>LI^7在RS畫飆砂主謝8融一畠舷的協(xié)比廈不兌W^z臨i/「￡T認(rèn)，洛町胡坯U.7 產(chǎn)舌宙為-K比(抵H剃密更判距町□如果負(fù)載均衡器是NGINX的話，亥數(shù)據(jù)包會被TCP協(xié)議棧無聲無息地丟棄，上層應(yīng)用不會得到任何通知。其次，來考察后端服務(wù)器變化的場景。這種場景下，可能由于后端服務(wù)器故障由健康檢查機(jī)制檢查出來，也可能由于運(yùn)維需要主動增加或者減少后端服務(wù)器。此時(shí)，Vortex服務(wù)器會通過連接追蹤機(jī)制保證當(dāng)前活動連接的數(shù)據(jù)包被送往之前選擇的服務(wù)器，而所有新建連接則會在變化后的服務(wù)器集群中進(jìn)行負(fù)載分擔(dān)。同時(shí)，Vortex一致性哈希算法能保證大部分新建連接與后端服務(wù)器的映射關(guān)系保持不變，只有最少數(shù)量的映射關(guān)系發(fā)生變化，從而最大限度地減小了對客戶端到端的應(yīng)用層面的影響。這種場景下，如果負(fù)載均衡器是LVS且SH算法的話，大部分新建連接與后端服務(wù)器的映射關(guān)系會發(fā)生變化。某些應(yīng)用，列如緩存服務(wù)器，如果發(fā)生映射關(guān)系的突變，將造成大量的cachemiss，從而需要從數(shù)據(jù)源重新讀取內(nèi)容，由此導(dǎo)致性能的大幅下降。而NGINX在該場景下如果配置了一致性哈希的話可以達(dá)到和Vortex一樣的效果。最后，讓我們來看一下負(fù)載均衡服務(wù)器和后端服務(wù)器集群同時(shí)變化的場景。在這種場景下，Vortex能夠保證大多數(shù)活動連接不受影響，少數(shù)活動連接被送往錯誤的后端服務(wù)器且上層應(yīng)用不會得到任何通知。并且大多數(shù)新建連接與后端服務(wù)器的映射關(guān)系保持不變，只有最少數(shù)量的映射關(guān)系發(fā)生變化。源地址俯希尊法LVSE?源地址俯希尊法LVSE?器與恣同肚孌建Ji. ：71也j站旦注il曰ki肚inpmnn陽;阿叫COI1I旳C1K>[itJLkrilflM=|ER3-a.haah1-lRW&hd3h?il.^t2esjarinoconnMnionu￡sconnaeWfitraekiAQelse:hashzrimi如果負(fù)載均衡器是LVS且SH算法的話幾乎所有活動連接都會被送往錯誤的后端服務(wù)器且上層應(yīng)用不會得到任何通知。大多數(shù)新建連接與后端服務(wù)器的映射關(guān)系同樣也會發(fā)生變化。如果是NGINX的話因?yàn)榻粨Q機(jī)將數(shù)據(jù)包送往不同的NGINX服務(wù)器，幾乎所有數(shù)據(jù)包會被無聲無息的丟棄，上層應(yīng)用不會得到任何通知。可收縮性的設(shè)計(jì)是基于ECMP集群的ScalingOut設(shè)計(jì)Vortex采用動態(tài)路由的方式通過路由器ECMP(Equal-costmulti-pathrouting!來實(shí)現(xiàn)Vortex集群的負(fù)載均衡?！懵酚蓹C(jī)支持至少16或32路ECMP集群,特殊的SDN交換機(jī)支持多達(dá)256路ECMP集群。而一致性哈希的使用是的ECMP集群的變化對上層應(yīng)用基本無感知，用戶業(yè)務(wù)不受影響。雖然ECMP提供了良好的ScalingOut的能力，但是考慮到網(wǎng)絡(luò)設(shè)備的價(jià)格仍然希望單機(jī)性能夠盡可能的強(qiáng)。例如，轉(zhuǎn)發(fā)能力最好是能夠達(dá)到10G甚至40G的線速，同時(shí)能夠支持盡可能高的每秒新建連接數(shù)r：0.?.M]D丸衛(wèi)OGOWJUGXWC13drncx},rwn20,000,?IO.O(K1.DOT￡11281522*fi32030444B51257S640704768￡33B9E9601D241D8B,115212l￡t20Q13JJpucoIIll^」ald巾一dj左UEaPackBLSiz&10Z4byt1QGPjcke(s.'se￡opid-1aMillionearPscKeiajnvaira.i&2OBBns2GlizC4ocxcycles417cydtTy口lealServerPaGk^tSizesPacketSizeS4bytes■ICGPucketSj'Eecorid59.5MilllOEiuact!wayPacketarrivalrate16.0fK2GrtzCIdciccydes33cyclesNelwciKInFra^tructurePacketSizes內(nèi)核不是解決方案，而是問題所在！從上圖可以看到隨著高速網(wǎng)絡(luò)的發(fā)展64字節(jié)小包線速的要求越來越高，對10G網(wǎng)絡(luò)來說平均67ns，對40G網(wǎng)絡(luò)來說只有17ns。而于此同時(shí)CPU、內(nèi)存的速度提升卻沒有那么多。以2G主頻的CPU為例，每次命中L3緩存的讀取操作需要約40個(gè)CPU周期，而一旦沒有命中緩存從主存讀取則需要140個(gè)CPU周期。為了達(dá)到線速就必須采用多核并發(fā)處理、批量數(shù)據(jù)包處理的方式來攤銷單個(gè)數(shù)據(jù)包處理所需要的CPU周期數(shù)。此外，即使采用上述方式，如果沒有得到充分的優(yōu)化，發(fā)生多次cachemiss或者是memorycopy都無法達(dá)到10G線速的目標(biāo)。

iMTrnHWHYVORTEX?iMTrnH縣楝k也世遲1.*侍Llset用審rbfI&inlp賈l優(yōu)碘2梅玉了Sak金特?cái)鄥[桎円G3罟冷SKB釗fig珂軒療也的艮雋虧輛4^^Sa-fcHtCI .UMfSfiaiDB^!5S像NGINX這樣的代理模式，轉(zhuǎn)發(fā)程序因?yàn)樾枰猅CP協(xié)議棧的處理以及至少一次內(nèi)存復(fù)制性能要遠(yuǎn)低于LVS。而LVS又因?yàn)橥ㄓ肒ernel的限制，會考慮節(jié)省內(nèi)存等設(shè)計(jì)策略，而不會向Vortex—樣在一開始就特別注重轉(zhuǎn)發(fā)性能。例如LVS缺省的連接追蹤HASH表大小為4K,而Vortex直接使用了50%以上的內(nèi)存作為連接追蹤表。Vortex通過DPDK提供函數(shù)庫充分利用CPU和網(wǎng)卡的能力從而達(dá)到了單機(jī)10G線速的轉(zhuǎn)發(fā)性能。?用戶空間驅(qū)動，完全Zero-Copy采用批處理攤銷單個(gè)報(bào)文處理的成本?充分利用硬件特性?IntelDataDirectI/OTechnology(IntelDDIO)?NUMA?HugePages,CacheAlignment,MemorychanneluseVortex直接采用多隊(duì)列10G網(wǎng)卡，通過RSS直接將網(wǎng)卡隊(duì)列和CPUCore綁定，消除線程的上下文切換帶來的開銷。Vortex線程間采用高并發(fā)無鎖的消息隊(duì)列通信。除此之外，完全不共享狀態(tài)從而保證轉(zhuǎn)發(fā)線程之間不會互相影響。Vortex在設(shè)計(jì)時(shí)盡可能的減少指針的使用、采用連續(xù)內(nèi)存數(shù)據(jù)結(jié)構(gòu)來降低cachemiss。通過這樣一系列精心設(shè)計(jì)的優(yōu)化措施，最終Vortex的單機(jī)性能遠(yuǎn)超LVS，甚至超過了GoogleMaglev的水平。LVS支持四種轉(zhuǎn)發(fā)模式：NAT、DR、TUNNEL和FULLNAT，其實(shí)各有利弊。Vortex在設(shè)計(jì)之初就對四種模式做了評估，最后發(fā)現(xiàn)在虛擬化的環(huán)境下DR方式在各方面比較平衡，并且符合我們追求極致性能的理念。DR方式最大的優(yōu)點(diǎn)是絕佳的性能，只有request需要負(fù)載均衡器處理，response可以

人人文庫> 全部分類> 行業(yè)資料 > 各類標(biāo)準(zhǔn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

負(fù)載均衡的原理說明

文檔簡介

溫馨提示

最新文檔

評論

負(fù)載均衡的原理說明

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔