摘要:計數限流算法無論固定窗口還是滑動窗口核心均是對請求進行計數,區別僅僅在于對于計數時間區間的處理。令牌桶限流實現原理令牌桶限流的實現原理在有詳細說明。因此由此為入口進行分析。目前可返回的實現子類包括及兩種,具體不同下文詳細分析。
限流
限流一詞常用于計算機網絡之中,定義如下:
In computer networks, rate limiting is used to control the rate of traffic sent or received by a network interface controller and is used to prevent DoS attacks.
通過控制數據的網絡數據的發送或接收速率來防止可能出現的DOS攻擊。而實際的軟件服務過程中,限流也可用于API服務的保護。由于提供服務的計算機資源(包括CPU、內存、磁盤及網絡帶寬等)是有限的,則其提供的API服務的QPS也是有限的,限流工具就是通過限流算法對API訪問進行限制,保證服務不會超過其能承受的負載壓力。
本文主要涉及內容包括:
常用限流算法的簡單介紹及比較
Guava包中限流工具的實現分析
常用限流算法援引wiki中關于限流的Algorithms一小節的說明,常用的限流算法主要包括:
Token bucket-令牌桶
Leaky bucket-漏桶
Fixed window counter-固定窗口計數
Sliding window log-滑動窗口日志
Sliding window counter-滑動窗口計數
以上幾種方式其實可以簡單的分為計數算法、漏桶算法和令牌桶算法。
計數限流算法無論固定窗口還是滑動窗口核心均是對請求進行計數,區別僅僅在于對于計數時間區間的處理。
固定窗口計數 實現原理固定窗口計數法思想比較簡單,只需要確定兩個參數:計數周期T及周期內最大訪問(調用)數N。請求到達時使用以下流程進行操作:
固定窗口計數實現簡單,并且只需要記錄上一個周期起始時間與周期內訪問總數,幾乎不消耗額外的存儲空間。
算法缺陷固定窗口計數缺點也非常明顯,在進行周期切換時,上一個周期的訪問總數會立即置為0,這可能導致在進行周期切換時可能出現流量突發,如下圖所示
簡化模型,假設在兩個周期T0中a時刻有n1個訪問同時到達,周期T1中b時刻有n2個訪問同時到達,且n1和n2均小于設定的最高訪問次數N(否則會觸發限流)。
根據以上假設可以推斷,限流器不會限流,n1+n2次訪問均可以通過?,F假設a,b兩時刻之間時間差為t,則可以得出以下關系:
$$ left{ egin{aligned} n1 le N n2 le N (n1+n2) le 2N end{aligned} ight. $$
根據觀察可發現,在$t$的時間內,出現了$n1+n2$次請求,且$n1+n2$是可能大于$N$的,所以在實際使用過程中,固定窗口計數器存在突破限額N的可能。
舉例,限制QPS為10,某用戶在周期切換的前后的0.1秒內,分兩次發送10次請求,根據算法規則此20次請求可通過限流器,則0.1面秒請求數20,超過每秒最多10次請求的限制。
為解決固定窗口計數帶來的周期切換處流量突發問題,可以使用滑動窗口計數?;瑒哟翱谟嬎惚举|上也是固定窗口計數,區別在于將計數周期進行細化。
實現原理滑動窗口計數法與股固定窗口計數法相比較,除了計數周期T及周期內最大訪問(調用)數N兩個參數,增加一個參數M,用于設置周期T內的滑動窗口數。限流流程如下:
滑動窗口計數在固定窗口計數記錄數據基礎上,需要增加一個長度為M的計數數組,用于記錄在窗口滑動過程中各窗口訪問數據。其流程示例如下:
周期切換問題滑動窗口針對周期進行了細分,不存在周期到后計數直接重置為0的情況,故不會出現跨周期的流量限制問題。
非計數限流法 漏桶限流 實現原理漏桶限流算法的實現原理在wiki有詳細說明,引用其原理圖:
簡單說明為:人為設定漏桶流出速度及漏桶的總容量,在請求到達時判斷當前漏桶容量是否已滿,不滿則可將請求存入桶中,否則拋棄請求。程序以設定的速率取出請求進行處理。
根據描述,需要確定參數為漏桶流出速度r及漏桶容量N,流程如下:
漏桶算法主要特點在于可以保證無論收到請求的速率如何,真正抵達服務方接口的請求速率最大為r,能夠對輸入的請求進行平滑處理。
漏桶算法的缺點也非常明顯,由于其只能以特定速率處理請求,則如何確定該速率就是核心問題,如果速率設置太小則會浪費性能資源,設置太大則會造成資源不足。并且由于速率的設置,無論輸入速率如何波動,均不會體現在服務端,即使資源有空余,對于突發請求也無法及時處理,故對有突發請求處理需求時,不宜選擇該方法。
令牌桶限流的實現原理在wiki有詳細說明。簡單總結為:設定令牌桶中添加令牌的速率,并且設置桶中最大可存儲的令牌,當請求到達時,向桶中請求令牌(根據應用需求,可能為1個或多個),若令牌數量滿足要求,則刪除對應數量的令牌并通過當前請求,若桶中令牌數不足則觸發限流規則。
根據描述需要設置的參數為,令牌添加速率r,令牌桶中最大容量N,流程如下:
令牌桶算法通過設置令牌放入速率可以控制請求通過的平均速度,且由于設置的容量為N的桶對令牌進行緩存,可以容忍一定流量的突發。
算法比較以上提到四種算法,本小節主要對四種算法做簡單比較算法進行對比。
算法名稱 | 需要確定參數 | 實現簡介 | 空間復雜度 | 說明 |
---|---|---|---|---|
固定窗口計數 | 計數周期T 周期內最大訪問數N |
使用計數器在周期內累加訪問次數,達到最大次數后出發限流策略 | O(1),僅需要記錄周期內訪問次數及周期開始時間 | 周期切換時可能出現訪問次數超過限定值 |
滑動窗口計數 | 計數周期T 周期內最大訪問數N 滑動窗口數M |
將時間周期分為M個小周期,分別記錄每個小周期內訪問次數,并且根據時間滑動刪除過期的小周期 | O(M),需要記錄每個小周期中的訪問數量 | 解決固定窗口算法周期切換時的訪問突發問題 |
漏桶算法 | 漏桶流出速度r 漏桶容量N |
服務到達時直接放入漏桶,如當前容量達到N,則觸發限流側率,程序以r的速度在漏桶中獲取訪問請求,知道漏桶為空 | O(1),僅需要記錄當前漏桶中容量 | 平滑流量,保證服務請求到達服務方的速度恒定 |
令牌桶算法 | 令牌產生速度r 令牌桶容量N |
程序以r的速度向令牌桶中增加令牌,直到令牌桶滿,請求到達時向令牌桶請求令牌,如有滿足需求的令牌則通過請求,否則觸發限流策略 | O(1),僅需要記錄當前令牌桶中令牌數 | 能夠在限流的基礎上,處理一定量的突發請求 |
上文簡單介紹了常用的限流算法,在JAVA軟件開發過程中可使用Guava包中的限流工具進行服務限流。Guava包中限流工具類圖如下所示:
其中RateLimiter類為限流的核心類,其為public的抽象類,RateLimiter有一個實現類SmoothRateLimiter,根據不同消耗令牌的策略SmoothRateLimiter又有兩個具體實現類SmoothBursty和SmoothWarmingUp。
在實際使用過程中一般直接使用RateLimiter類,其他類對用戶是透明的。RateLimiter類的設計使用了類似BUILDER模式的小技巧,并做了一定的調整。
通過RateLimiter類圖可見,RateLimiter類不僅承擔了具體實現類的創建職責,同時也確定了被創建出的實際類可提供的方法。標準創建者模式UML圖如下所示(引用自百度百科)
RateLimiter類即承擔了builder的職責,也承擔了Product的職責。
在實際的代碼編寫過程中,對GUAVA包限流工具的使用參考以下代碼:
final RateLimiter rateLimiter = RateLimiter.create(2.0); // rate is "2 permits per second" void submitTasks(Listtasks, Executor executor) { for (Runnable task : tasks) { rateLimiter.acquire(); // may wait executor.execute(task); } }
以上代碼摘自GUAVA包RateLimiter類的說明文檔,首先使用create函數創建限流器,指定每秒生成2個令牌,在需要調用服務時使用acquire函數或取令牌。
RateLimiter實現分析根據代碼示例,抽象類RateLimiter由于承擔了Product的職責,其已經確定了暴露給編程人員使用的API函數,其中主要實現的核心函數為create及acquire。因此由此為入口進行分析。
create函數分析create函數具有兩個個重載,根據不同的重載可能創建不同的RateLimiter具體實現子類。目前可返回的實現子類包括SmoothBursty及SmoothWarmingUp兩種,具體不同下文詳細分析。
acquire函數分析acquire函數也具有兩個重載類,但分析過程僅僅需要關系具有整形參數的函數重載即可,無參數的函數僅僅是acquire(1)的簡便寫法。
在acquire(int permits)函數中主要完成三件事:
預分配授權數量,此函數返回需要等待的時間,可能為0;
根據等待時間進行休眠;
以秒為單位,返回獲取授權消耗的時間。
完成以上工作的過程中,RateLimiter類確定了獲取授權的過程骨架并且實現了一些通用的方法,這些通用方法中會調用為實現的抽象方法,開發人員根據不同的算法需求可實現特定子類對抽象方法進行覆蓋。其調用流程如下圖:
其中橙色塊中reserveEarliestAvailable方法即為需要子類進行實現的,下文以該函數為核心,分析RateLimiter類的子類是如何實現該方法的。
根據上文的類圖可見,RateLimiter類在GUAVA包中的直接子類僅有SmoothRateLimiter,故以reserveEarliestAvailable函數為入口研究其具體實現,而在代碼實現的過程中需要使用SmoothRateLimiter類中的屬性,現將類中各屬性羅列出來:
序號 | 屬性名稱 | 屬性說明 | 是否為靜態屬性 |
---|---|---|---|
1 | storedPermits | 當前令牌桶中令牌數 | 否 |
2 | maxPermits | 令牌桶中最大令牌數 | 否 |
3 | stableIntervalMicros | 兩個令牌產生的時間間隔 | 否 |
4 | nextFreeTicketMicros | 下一次有空閑令牌產生的時刻 | 否 |
reserveEarliestAvailable源碼如下:
@Override final long reserveEarliestAvailable(int requiredPermits, long nowMicros) { resync(nowMicros); long returnValue = nextFreeTicketMicros; double storedPermitsToSpend = min(requiredPermits, this.storedPermits); double freshPermits = requiredPermits - storedPermitsToSpend; long waitMicros = storedPermitsToWaitTime(this.storedPermits, storedPermitsToSpend) + (long) (freshPermits * stableIntervalMicros); this.nextFreeTicketMicros = LongMath.saturatedAdd(nextFreeTicketMicros, waitMicros); this.storedPermits -= storedPermitsToSpend; return returnValue; }
通過reserveEarliestAvailable的函數名稱可以知道,該函數能夠返回令牌可用的最早時間。函數需要的輸入參數有需求的令牌數requiredPermits,當前時刻nowMicros。進入函數后,首先調用名為resync的函數:
void resync(long nowMicros) { // if nextFreeTicket is in the past, resync to now if (nowMicros > nextFreeTicketMicros) { double newPermits = (nowMicros - nextFreeTicketMicros) / coolDownIntervalMicros(); storedPermits = min(maxPermits, storedPermits + newPermits); nextFreeTicketMicros = nowMicros; } }
函數邏輯比較簡單,首先獲取nextFreeTicketMicros,該值在上表中已經說明,表示下一次有空閑令牌產生的時刻,如果當前時刻小于等于nextFreeTicketMicros,說明在當前時刻不可能有新的令牌產生,則直接返回。若當前時刻大于nextFreeTicketMicros,則完成以下工作:
計算到當前時刻新產生的令牌數,其中涉及一個名為coolDownIntervalMicros 的函數,該函數返回創建一個新令牌需要的冷卻時間(注:該函數在當前類中并未實現,具體實現下文說明);
更新storedPermits屬性,取產生的令牌和最大可存儲令牌之間的最小值;
將nextFreeTicketMicros屬性置為當前時刻。
可見,resync函數主要功能在于計算新產生的令牌數,并更新nextFreeTicketMicros屬性,nextFreeTicketMicros屬性取值是當前時刻和nextFreeTicketMicros屬性的原始值中最大的一個。
完成resync函數的調用后,使用returnValue變量記錄更新令牌后的最近可用時間(即上文更新后的nextFreeTicketMicros屬性)。
使用storedPermitsToSpend變量記錄需要消耗以存儲的令牌數,其取值為請求令牌數和當前存儲令牌數之間的最小值。
使用freshPermits變量記錄需要刷新的令牌數,其實現是用需求的令牌數減去之前計算的storedPermitsToSpend變量,可見freshPermits變量取值為需求令牌數與已存儲令牌數之間的差值,當需求令牌數小于已存儲令牌數是則為0。
后續為該函數核心,計算需要等待的時間,計算等待時間主要分為兩個部分:消耗已經存儲的令牌需要的時間及生成新令牌的時間,其中storedPermitsToWaitTime函數用于計算消耗已經存儲的令牌需要的時間,該函數也是抽象函數,后文具體分析子類實現。
完成等待時間的計算后,程序更新nextFreeTicketMicros屬性,將最近可用時間與需要等待的時間相加。
最后在更新存儲的令牌數,將需要消耗額令牌數減去。
根據以上的代碼分析可以發現,GUAVA對于令牌桶的實現跟理論有一點點小的區別。其當前一次的請求消耗的令牌數并不會影響本次請求的等待時間,而是會影響下一次請求的等待時間。
根據以上分析,當一次請求到達,最近可用時間返回當前時間和上一次請求計算的最近可用時間的最大值,而本次請求需要的令牌數會更新下一次的最近可用時間。在這樣的設計下,如果每秒產生一個令牌,第一請求需求10個令牌,則當第一次請求調用acquire方法時能夠立即返回,而下一次請求(無論需要多少令牌)均需要等待到第一個請求之后的10秒以后,第三次請求等待時間則取決于第二次需求了多少令牌。這也是函數名稱中“reserve”的含義。
在以上文代碼分析中出現了兩個抽象函數coolDownIntervalMicros及storedPermitsToWaitTime,現分析這兩個抽象函數。
coolDownIntervalMicros函數coolDownIntervalMicros函數在代碼中已經有說明:
Returns the number of microseconds during cool down that we have to wait to get a new permit.
主要含義為生成一個令牌需要消耗的時間,該函數主要應用于計算當前時間可產生的令牌數。根據上文的UML圖SmoothRateLimiter類有兩個子類SmoothBursty及SmoothWarmingUp。
SmoothBursty類中對于coolDownIntervalMicros函數的實現如下:
@Override double coolDownIntervalMicros() { return stableIntervalMicros; }
可見實現非常簡單,僅僅只是返回stableIntervalMicros屬性,即產生兩個令牌需要的時間間隔。
SmoothWarmingUp類中對于coolDownIntervalMicros函數的實現如下:
@Override double coolDownIntervalMicros() { return warmupPeriodMicros / maxPermits; }
其中maxPermits屬性上文已經出現過,表示當前令牌桶的最大容量。warmupPeriodMicros屬性屬于SmoothWarmingUp類的特有屬性,表示令牌桶中令牌從0到maxPermits需要經過的時間,故warmupPeriodMicros / maxPermits表示在令牌數量達到maxPermits之前的令牌產生時間間隔。
storedPermitsToWaitTime函數storedPermitsToWaitTime函數在代碼中已經有說明:
Translates a specified portion of our currently stored permits which we want to spend/acquire, into a throttling time. Conceptually, this evaluates the integral of the underlying function we use, for the range of [(storedPermits - permitsToTake), storedPermits]
主要表示消耗存儲在令牌桶中的令牌需要的時間。
SmoothBursty類中對于storedPermitsToWaitTime函數的實現如下:
@Override long storedPermitsToWaitTime(double storedPermits, double permitsToTake) { return 0L; }
直接返回0,表示消耗令牌不需要時間。
SmoothBursty類中對于storedPermitsToWaitTime函數的實現如下:
@Override long storedPermitsToWaitTime(double storedPermits, double permitsToTake) { double availablePermitsAboveThreshold = storedPermits - thresholdPermits; long micros = 0; // measuring the integral on the right part of the function (the climbing line) if (availablePermitsAboveThreshold > 0.0) { double permitsAboveThresholdToTake = min(availablePermitsAboveThreshold, permitsToTake); // TODO(cpovirk): Figure out a good name for this variable. double length = permitsToTime(availablePermitsAboveThreshold) + permitsToTime(availablePermitsAboveThreshold - permitsAboveThresholdToTake); micros = (long) (permitsAboveThresholdToTake * length / 2.0); permitsToTake -= permitsAboveThresholdToTake; } // measuring the integral on the left part of the function (the horizontal line) micros += (long) (stableIntervalMicros * permitsToTake); return micros; }
實現較為復雜,其核心思想在于計算消耗當前存儲令牌時需要根據預熱設置區別對待。其中涉及到新變量thresholdPermits,該變量為令牌閾值,當當前存儲的令牌數大于該值時,消耗(storedPermits-thresholdPermits)范圍的令牌需要有預熱的過程(即消耗每個令牌的間隔時間慢慢減小),而消耗0~thresholdPermits個數的以存儲令牌,每個令牌消耗時間為固定值,即stableIntervalMicros。
而thresholdPermits取值需要考慮預熱時間及令牌產生速度兩個屬性,即thresholdPermits = 0.5 * warmupPeriodMicros / stableIntervalMicros;??梢婇撝禐轭A熱時間中能夠產生的令牌數的一半,并且根據注釋計算消耗閾值以上的令牌的時間可以轉換為計算預熱圖的梯形面積(實際為積分),本處不詳細展開。
使用此種設計可以保證在上次請求間隔時間較長時,令牌桶中存儲了較多的令牌,當消耗這些令牌時,最開始的令牌消耗時間較長,后續時間慢慢縮短直到達到stableIntervalMicros的狀態,產生預熱的效果。
以上分析GUAVA限流器實現,其使用了兩個抽象類及兩個具體子類完成了限流器實現,其中使用頂層抽象類承擔了創建者角色,將所有子類進行了透明化,減少了程序員在使用工具過程中需要了解的類的數量。
在實現限流器的過程中,基于令牌桶的思想,并且增加了帶有預熱器的令牌桶限流器實現。被限流的線程使用其自帶的SleepingStopwatch工具類,最終使用的是Thread.sleep(ms, ns);方法,而線程使用sleep休眠時其持有的鎖并不會釋放,在多線程編程時此處需要注意。
最后,GUAVA的限流器觸發算法采用的是預定令牌的方式,即當前請求需要的令牌數不會對當前請求的等待時間造成影響,而是會影響下一次請求的等待時間。
本文主要總結了當前常用的服務限流算法,對比個各算法特點,最后分析GUAVA包中對于限流器的實現的核心方法。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/76971.html
摘要:令牌桶算法對于很多應用場景來說,除了要求能夠限制數據的平均傳輸速率外,還要求允許某種程度的突發傳輸。使用以及源碼解析開源工具包提供了限流工具類,該類基于令牌桶算法實現流量限制,使用十分方便,而且十分高效。 前言 在開發高并發系統時有三把利器用來保護系統:緩存、降級和限流 緩存 緩存的目的是提升系統訪問速度和增大系統處理容量 降級 降級是當服務出現問題或者影響到核心流程時,需要暫時...
摘要:令牌桶算法漏桶算法漏桶漏桶的出水速度是恒定的,那么意味著如果瞬時大流量的話,將有大部分請求被丟棄掉也就是所謂的溢出。 工作中對外提供的API 接口設計都要考慮限流,如果不考慮限流,會成系統的連鎖反應,輕者響應緩慢,重者系統宕機,整個業務線崩潰,如何應對這種情況呢,我們可以對請求進行引流或者直接拒絕等操作,保持系統的可用性和穩定性,防止因流量暴增而導致的系統運行緩慢或宕機。 在開發高并發...
摘要:自定義注解實現基于接口限流仔細看會發現上面的簡單實現會造成我每個接口都要寫一次限流方法代碼很冗余所以采用來使用自定義注解來實現。 服務限流 -- 自定義注解基于RateLimiter實現接口限流 令牌桶限流算法showImg(https://segmentfault.com/img/bVbgTi6?w=2420&h=1547);圖片來自網上 令牌桶會以一個恒定的速率向固定容量大小桶...
閱讀 741·2021-11-11 16:54
閱讀 3062·2021-09-26 09:55
閱讀 2012·2021-09-07 10:20
閱讀 1204·2019-08-30 10:58
閱讀 1051·2019-08-28 18:04
閱讀 705·2019-08-26 13:57
閱讀 3591·2019-08-26 13:45
閱讀 1155·2019-08-26 11:42