1. 程式人生 > 其它 >常用限流策略——漏桶與令牌桶介紹

常用限流策略——漏桶與令牌桶介紹

常用限流策略——漏桶與令牌桶介紹

限流又稱為流量控制(流控),通常是指限制到達系統的併發請求數,本文列舉了常見的限流策略,並以gin框架為例演示瞭如何為專案新增限流元件。

限流

限流又稱為流量控制(流控),通常是指限制到達系統的併發請求數。

我們生活中也會經常遇到限流的場景,比如:某景區限制每日進入景區的遊客數量為8萬人;沙河地鐵站早高峰通過站外排隊逐一放行的方式限制同一時間進入車站的旅客數量等。

限流雖然會影響部分使用者的使用體驗,但是卻能在一定程度上報障系統的穩定性,不至於崩潰(大家都沒了使用者體驗)。

而網際網路上類似需要限流的業務場景也有很多,比如電商系統的秒殺、微博上突發熱點新聞、雙十一購物節、12306搶票等等。這些場景下的使用者請求量通常會激增,遠遠超過平時正常的請求量,此時如果不加任何限制很容易就會將後端服務打垮,影響服務的穩定性。

此外,一些廠商公開的API服務通常也會限制使用者的請求次數,比如百度地圖開放平臺等會根據使用者的付費情況來限制使用者的請求數等。

常用的限流策略

漏桶

漏桶法限流很好理解,假設我們有一個水桶按固定的速率向下方滴落一滴水,無論有多少請求,請求的速率有多大,都按照固定的速率流出,對應到系統中就是按照固定的速率處理請求。

漏桶法的關鍵點在於漏桶始終按照固定的速率執行,但是它並不能很好的處理有大量突發請求的場景,畢竟在某些場景下我們可能需要提高系統的處理效率,而不是一味的按照固定速率處理請求。

關於漏桶的實現,uber團隊有一個開源的github.com/uber-go/ratelimit

庫。 這個庫的使用方法比較簡單,Take() 方法會返回漏桶下一次滴水的時間。

import (
	"fmt"
	"time"

	"go.uber.org/ratelimit"
)

func main() {
    rl := ratelimit.New(100) // per second

    prev := time.Now()
    for i := 0; i < 10; i++ {
        now := rl.Take()
        fmt.Println(i, now.Sub(prev))
        prev = now
    }

    // Output:
// 0 0 // 1 10ms // 2 10ms // 3 10ms // 4 10ms // 5 10ms // 6 10ms // 7 10ms // 8 10ms // 9 10ms }

它的原始碼實現也比較簡單,這裡大致說一下關鍵的地方,有興趣的同學可以自己去看一下完整的原始碼。

限制器是一個介面型別,其要求實現一個Take()方法:

type Limiter interface {
	// Take方法應該阻塞已確保滿足 RPS
	Take() time.Time
}

實現限制器介面的結構體定義如下,這裡可以重點留意下maxSlack欄位,它在後面的Take()方法中的處理。

type limiter struct {
	sync.Mutex                // 鎖
	last       time.Time      // 上一次的時刻
	sleepFor   time.Duration  // 需要等待的時間
	perRequest time.Duration  // 每次的時間間隔
	maxSlack   time.Duration  // 最大的富餘量
	clock      Clock          // 時鐘
}

limiter結構體實現Limiter介面的Take()方法內容如下:

// Take 會阻塞確保兩次請求之間的時間走完
// Take 呼叫平均數為 time.Second/rate.
func (t *limiter) Take() time.Time {
	t.Lock()
	defer t.Unlock()

	now := t.clock.Now()

	// 如果是第一次請求就直接放行
	if t.last.IsZero() {
		t.last = now
		return t.last
	}

	// sleepFor 根據 perRequest 和上一次請求的時刻計算應該sleep的時間
	// 由於每次請求間隔的時間可能會超過perRequest, 所以這個數字可能為負數,並在多個請求之間累加
	t.sleepFor += t.perRequest - now.Sub(t.last)

	// 我們不應該讓sleepFor負的太多,因為這意味著一個服務在短時間內慢了很多隨後會得到更高的RPS。
	if t.sleepFor < t.maxSlack {
		t.sleepFor = t.maxSlack
	}

	// 如果 sleepFor 是正值那麼就 sleep
	if t.sleepFor > 0 {
		t.clock.Sleep(t.sleepFor)
		t.last = now.Add(t.sleepFor)
		t.sleepFor = 0
	} else {
		t.last = now
	}

	return t.last
}

上面的程式碼根據記錄每次請求的間隔時間和上一次請求的時刻來計算當次請求需要阻塞的時間——sleepFor,這裡需要留意的是sleepFor的值可能為負,在經過間隔時間長的兩次訪問之後會導致隨後大量的請求被放行,所以程式碼中針對這個場景有專門的優化處理。建立限制器的New()函式中會為maxSlack設定初始值,也可以通過WithoutSlack這個Option取消這個預設值。

func New(rate int, opts ...Option) Limiter {
	l := &limiter{
		perRequest: time.Second / time.Duration(rate),
		maxSlack:   -10 * time.Second / time.Duration(rate),
	}
	for _, opt := range opts {
		opt(l)
	}
	if l.clock == nil {
		l.clock = clock.New()
	}
	return l
}

令牌桶

令牌桶其實和漏桶的原理類似,令牌桶按固定的速率往桶裡放入令牌,並且只要能從桶裡取出令牌就能通過,令牌桶支援突發流量的快速處理。

對於從桶裡取不到令牌的場景,我們可以選擇等待也可以直接拒絕並返回。

對於令牌桶的Go語言實現,大家可以參照github.com/juju/ratelimit庫。這個庫支援多種令牌桶模式,並且使用起來也比較簡單。

建立令牌桶的方法:

// 建立指定填充速率和容量大小的令牌桶
func NewBucket(fillInterval time.Duration, capacity int64) *Bucket
// 建立指定填充速率、容量大小和每次填充的令牌數的令牌桶
func NewBucketWithQuantum(fillInterval time.Duration, capacity, quantum int64) *Bucket
// 建立填充速度為指定速率和容量大小的令牌桶
// NewBucketWithRate(0.1, 200) 表示每秒填充20個令牌
func NewBucketWithRate(rate float64, capacity int64) *Bucket

取出令牌的方法如下:

// 取token(非阻塞)
func (tb *Bucket) Take(count int64) time.Duration
func (tb *Bucket) TakeAvailable(count int64) int64

// 最多等maxWait時間取token
func (tb *Bucket) TakeMaxDuration(count int64, maxWait time.Duration) (time.Duration, bool)

// 取token(阻塞)
func (tb *Bucket) Wait(count int64)
func (tb *Bucket) WaitMaxDuration(count int64, maxWait time.Duration) bool

雖說是令牌桶,但是我們沒有必要真的去生成令牌放到桶裡,我們只需要每次來取令牌的時候計算一下,當前是否有足夠的令牌就可以了,具體的計算方式可以總結為下面的公式:

當前令牌數 = 上一次剩餘的令牌數 + (本次取令牌的時刻-上一次取令牌的時刻)/放置令牌的時間間隔 * 每次放置的令牌數

github.com/juju/ratelimit這個庫中關於令牌數計算的原始碼如下:

func (tb *Bucket) currentTick(now time.Time) int64 {
	return int64(now.Sub(tb.startTime) / tb.fillInterval)
}
func (tb *Bucket) adjustavailableTokens(tick int64) {
	if tb.availableTokens >= tb.capacity {
		return
	}
	tb.availableTokens += (tick - tb.latestTick) * tb.quantum
	if tb.availableTokens > tb.capacity {
		tb.availableTokens = tb.capacity
	}
	tb.latestTick = tick
	return
}

獲取令牌的TakeAvailable()函式關鍵部分的原始碼如下:

func (tb *Bucket) takeAvailable(now time.Time, count int64) int64 {
	if count <= 0 {
		return 0
	}
	tb.adjustavailableTokens(tb.currentTick(now))
	if tb.availableTokens <= 0 {
		return 0
	}
	if count > tb.availableTokens {
		count = tb.availableTokens
	}
	tb.availableTokens -= count
	return count
}

大家從程式碼中也可以看到其實令牌桶的實現並沒有很複雜。

gin框架中使用限流中介軟體

在gin框架構建的專案中,我們可以將限流元件定義成中介軟體。

這裡使用令牌桶作為限流策略,編寫一個限流中介軟體如下:

func RateLimitMiddleware(fillInterval time.Duration, cap int64) func(c *gin.Context) {
	bucket := ratelimit.NewBucket(fillInterval, cap)
	return func(c *gin.Context) {
		// 如果取不到令牌就中斷本次請求返回 rate limit...
		if bucket.TakeAvailable(1) < 1 {
			c.String(http.StatusOK, "rate limit...")
			c.Abort()
			return
		}
		c.Next()
	}
}

對於該限流中介軟體的註冊位置,我們可以按照不同的限流策略將其註冊到不同的位置,例如:

  1. 如果要對全站限流就可以註冊成全域性的中介軟體。
  2. 如果是某一組路由需要限流,那麼就只需將該限流中介軟體註冊到對應的路由組即可。