當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

Redis Streams 介绍

發(fā)布時(shí)間：2025/3/21 数据库 40 豆豆

生活随笔收集整理的這篇文章主要介紹了 Redis Streams 介绍小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Stream是Redis 5.0版本引入的一個(gè)新的數(shù)據(jù)類型，它以更抽象的方式模擬日志數(shù)據(jù)結(jié)構(gòu)，但日志仍然是完整的：就像一個(gè)日志文件，通常實(shí)現(xiàn)為以只附加模式打開的文件，Redis流主要是一個(gè)僅附加數(shù)據(jù)結(jié)構(gòu)。至少?gòu)母拍钌蟻碇v，因?yàn)镽edis流是一種在內(nèi)存表示的抽象數(shù)據(jù)類型，他們實(shí)現(xiàn)了更加強(qiáng)大的操作，以此來克服日志文件本身的限制。

Stream是Redis的數(shù)據(jù)類型中最復(fù)雜的，盡管數(shù)據(jù)類型本身非常簡(jiǎn)單，它實(shí)現(xiàn)了額外的非強(qiáng)制性的特性：提供了一組允許消費(fèi)者以阻塞的方式等待生產(chǎn)者向Stream中發(fā)送的新消息，此外還有一個(gè)名為消費(fèi)者組的概念。

消費(fèi)者組最早是由名為Kafka（TM）的流行消息系統(tǒng)引入的。Redis用完全不同的術(shù)語重新實(shí)現(xiàn)了一個(gè)相似的概念，但目標(biāo)是相同的：允許一組客戶端相互配合來消費(fèi)同一個(gè)Stream的不同部分的消息。

Streams 基礎(chǔ)知識(shí)

為了理解Redis Stream是什么以及如何使用他們，我們將忽略所有的高級(jí)特性，從用于操縱和訪問它的命令方面來專注于數(shù)據(jù)結(jié)構(gòu)本身。這基本上是大多數(shù)其他Redis數(shù)據(jù)類型共有的部分，比如Lists，Sets，Sorted Sets等等。然而，需要注意的是Lists還有一個(gè)可選的更加復(fù)雜的阻塞API，由BLPOP等相似的命令導(dǎo)出。所以從這方面來說，Streams跟Lists并沒有太大的不同，只是附加的API更復(fù)雜、更強(qiáng)大。

因?yàn)镾treams是只附加數(shù)據(jù)結(jié)構(gòu)，基本的寫命令，叫XADD，向指定的Stream追加一個(gè)新的條目。一個(gè)Stream條目不是簡(jiǎn)單的字符串，而是由一個(gè)或多個(gè)鍵值對(duì)組成的。這樣一來，Stream的每一個(gè)條目就已經(jīng)是結(jié)構(gòu)化的，就像以CSV格式寫的只附加文件一樣，每一行由多個(gè)逗號(hào)割開的字段組成。

> XADD mystream * sensor-id 1234 temperature 19.8 1518951480106-0

上面的例子中，調(diào)用了XADD命令往名為mystream的Stream中添加了一個(gè)條目sensor-id: 123, temperature: 19.8，使用了自動(dòng)生成的條目ID，也就是命令返回的值，具體在這里是1518951480106-0。命令的第一個(gè)參數(shù)是key的名稱mystream，第二個(gè)參數(shù)是用于唯一確認(rèn)Stream中每個(gè)條目的條目ID。然而，在這個(gè)例子中，我們傳入的參數(shù)值是*，因?yàn)槲覀兿Ｍ蒖edis服務(wù)器為我們自動(dòng)生成一個(gè)新的ID。每一個(gè)新的ID都會(huì)單調(diào)增長(zhǎng)，簡(jiǎn)單來講就是，每次新添加的條目都會(huì)擁有一個(gè)比其它所有條目更大的ID。由服務(wù)器自動(dòng)生成ID幾乎總是我們所想要的，需要顯式指定ID的情況非常少見。我們稍后會(huì)更深入地討論這個(gè)問題。實(shí)際上每個(gè)Stream條目擁有一個(gè)ID與日志文件具有另一種相似性，即使用行號(hào)或者文件中的字節(jié)偏移量來識(shí)別一個(gè)給定的條目?；氐轿覀兊?strong>XADD例子中，跟在key和ID后面的參數(shù)是組成我們的Stream條目的鍵值對(duì)。

使用XLEN命令來獲取一個(gè)Stream的條目數(shù)量：

> XLEN mystream (integer) 1

條目 ID

條目ID由XADD命令返回，并且可以唯一的標(biāo)識(shí)給定Stream中的每一個(gè)條目，由兩部分組成：

毫秒時(shí)間部分實(shí)際是生成Stream ID的Redis節(jié)點(diǎn)的服務(wù)器本地時(shí)間，但是如果當(dāng)前毫秒時(shí)間戳比以前的條目時(shí)間戳小的話，那么會(huì)使用以前的條目時(shí)間，所以即便是服務(wù)器時(shí)鐘向后跳，單調(diào)增長(zhǎng)ID的特性仍然會(huì)保持不變。序列號(hào)用于以相同毫秒創(chuàng)建的條目。由于序列號(hào)是64位的，所以實(shí)際上對(duì)于在同一毫秒內(nèi)生成的條目數(shù)量是沒有限制的。

這樣的ID格式也許最初看起來有點(diǎn)奇怪，也許溫柔的讀者會(huì)好奇為什么時(shí)間會(huì)是ID的一部分。其實(shí)是因?yàn)镽edis Streams支持按ID進(jìn)行范圍查詢。由于ID與生成條目的時(shí)間相關(guān)，因此可以很容易地按時(shí)間范圍進(jìn)行查詢。我們?cè)诤竺嬷v到XRANGE命令時(shí)，很快就能明白這一點(diǎn)。

如果由于某些原因，用戶需要與時(shí)間無關(guān)但實(shí)際上與另一個(gè)外部系統(tǒng)ID關(guān)聯(lián)的增量ID，就像前面所說的，XADD命令可以帶上一個(gè)顯式的ID，而不是使用通配符*來自動(dòng)生成，如下所示：

> XADD somestream 0-1 field value 0-1 > XADD somestream 0-2 foo bar 0-2

請(qǐng)注意，在這種情況下，最小ID為0-1，并且命令不接受等于或小于前一個(gè)ID的ID：

> XADD somestream 0-1 foo bar (error) ERR The ID specified in XADD is equal or smaller than the target stream top item

從Streams中獲取數(shù)據(jù)

現(xiàn)在我們終于能夠通過XADD命令向我們的Stream中追加條目了。然而，雖然往Stream中追加數(shù)據(jù)非常明顯，但是為了提取數(shù)據(jù)而查詢Stream的方式并不是那么明顯，如果我們繼續(xù)使用日志文件進(jìn)行類比，一種顯而易見的方式是模擬我們通常使用Unix命令tail -f來做的事情，也就是，我們可以開始監(jiān)聽以獲取追加到Stream的新消息。需要注意的是，不像Redis的阻塞列表，一個(gè)給定的元素只能到達(dá)某一個(gè)使用了冒泡風(fēng)格的阻塞客戶端，比如使用類似BLPOP的命令，在Streams中我們希望看到的是多個(gè)消費(fèi)者都能看到追加到Stream中的新消息，就像許多的tail -f進(jìn)程能同時(shí)看到追加到日志文件的內(nèi)容一樣。用傳統(tǒng)術(shù)語來講就是我們希望Streams可以扇形分發(fā)消息到多個(gè)客戶端。

然而，這只是其中一種可能的訪問模式。我們還可以使用一種完全不同的方式來看待一個(gè)Stream：不是作為一個(gè)消息傳遞系統(tǒng)，而是作為一個(gè)時(shí)間序列存儲(chǔ)。在這種情況下，也許使附加新消息也非常有用，但是另一種自然查詢模式是通過時(shí)間范圍來獲取消息，或者使用一個(gè)游標(biāo)來增量遍歷所有的歷史消息。這絕對(duì)是另一種有用的訪問模式。

最后，如果我們從消費(fèi)者的角度來觀察一個(gè)Stream，我們也許想要以另外一種方式來訪問它，那就是，作為一個(gè)可以分區(qū)到多個(gè)處理此類消息的多個(gè)消費(fèi)者的消息流，以便消費(fèi)者組只能看到到達(dá)單個(gè)流的消息的子集。

Redis Streams通過不同的命令支持所有上面提到的三種訪問模式。接下來的部分將展示所有這些模式，從最簡(jiǎn)單和更直接的使用：范圍查詢開始。

按范圍查詢: XRANGE 和 XREVRANGE

要根據(jù)范圍查詢Stream，我們只需要提供兩個(gè)ID，即start?和?end。返回的區(qū)間數(shù)據(jù)將會(huì)包括ID是start和end的元素，因此區(qū)間是完全包含的。兩個(gè)特殊的ID-?和?+分別表示可能的最小ID和最大ID。

> XRANGE mystream - + 1) 1) 1518951480106-02) 1) "sensor-id"2) "1234"3) "temperature"4) "19.8" 2) 1) 1518951482479-02) 1) "sensor-id"2) "9999"3) "temperature"4) "18.2"

返回的每個(gè)條目都是有兩個(gè)元素的數(shù)組：ID和鍵值對(duì)列表。我們已經(jīng)說過條目ID與時(shí)間有關(guān)系，因?yàn)樵谧址?左邊的部分是創(chuàng)建Stream條目的本地節(jié)點(diǎn)上的Unix毫秒時(shí)間，即條目創(chuàng)建的那一刻（請(qǐng)注意：Streams的復(fù)制使用的是完全詳盡的XADD命令，因此從節(jié)點(diǎn)將具有與主節(jié)點(diǎn)相同的ID）。這意味著我可以使用XRANGE查詢一個(gè)時(shí)間范圍。然而為了做到這一點(diǎn)，我可能想要省略ID的序列號(hào)部分：如果省略，區(qū)間范圍的開始序列號(hào)將默認(rèn)為0，結(jié)束部分的序列號(hào)默認(rèn)是有效的最大序列號(hào)。這樣一來，僅使用兩個(gè)Unix毫秒時(shí)間去查詢，我們就可以得到在那段時(shí)間內(nèi)產(chǎn)生的所有條目（包含開始和結(jié)束）。例如，我可能想要查詢兩毫秒時(shí)間，可以這樣使用：

> XRANGE mystream 1518951480106 1518951480107 1) 1) 1518951480106-02) 1) "sensor-id"2) "1234"3) "temperature"4) "19.8"

我在這個(gè)范圍內(nèi)只有一個(gè)條目，然而在實(shí)際數(shù)據(jù)集中，我可以查詢數(shù)小時(shí)的范圍，或者兩毫秒之間包含了許多的項(xiàng)目，返回的結(jié)果集很大。因此，XRANGE命令支持在最后放一個(gè)可選的COUNT選項(xiàng)。通過指定一個(gè)count，我可以只獲取前面N個(gè)項(xiàng)目。如果我想要更多，我可以拿返回的最后一個(gè)ID，在序列號(hào)部分加1，然后再次查詢。我們?cè)谙旅娴睦又锌吹竭@一點(diǎn)。我們開始使用XADD添加10個(gè)項(xiàng)目（我這里不具體展示，假設(shè)流mystream已經(jīng)填充了10個(gè)項(xiàng)目）。要開始我的迭代，每個(gè)命令只獲取2個(gè)項(xiàng)目，我從全范圍開始，但count是2。

> XRANGE mystream - + COUNT 2 1) 1) 1519073278252-02) 1) "foo"2) "value_1" 2) 1) 1519073279157-02) 1) "foo"2) "value_2"

為了繼續(xù)下兩個(gè)項(xiàng)目的迭代，我必須選擇返回的最后一個(gè)ID，即1519073279157-0，并且在ID序列號(hào)部分加1。請(qǐng)注意，序列號(hào)是64位的，因此無需檢查溢出。在這個(gè)例子中，我們得到的結(jié)果ID是1519073279157-1，現(xiàn)在可以用作下一次XRANGE調(diào)用的新的start參數(shù)：

> XRANGE mystream 1519073279157-1 + COUNT 2 1) 1) 1519073280281-02) 1) "foo"2) "value_3" 2) 1) 1519073281432-02) 1) "foo"2) "value_4"

依此類推。由于XRANGE的查找復(fù)雜度是O(log(N))，因此O(M)返回M個(gè)元素，這個(gè)命令在count較小時(shí)，具有對(duì)數(shù)時(shí)間復(fù)雜度，這意味著每一步迭代速度都很快。所以XRANGE也是事實(shí)上的流迭代器并且不需要XSCAN命令。

XREVRANGE命令與XRANGE相同，但是以相反的順序返回元素，因此XREVRANGE的實(shí)際用途是檢查一個(gè)Stream中的最后一項(xiàng)是什么：

> XREVRANGE mystream + - COUNT 1 1) 1) 1519073287312-02) 1) "foo"2) "value_10"

請(qǐng)注意：XREVRANGE命令以相反的順序獲取start?和?stop參數(shù)。

使用XREAD監(jiān)聽新項(xiàng)目

當(dāng)我們不想按照Stream中的某個(gè)范圍訪問項(xiàng)目時(shí)，我們通常想要的是訂閱到達(dá)Stream的新項(xiàng)目。這個(gè)概念可能與Redis中你訂閱頻道的Pub/Sub或者Redis的阻塞列表有關(guān)，在這里等待某一個(gè)key去獲取新的元素，但是這跟你消費(fèi)Stream有著根本的不同：

一個(gè)Stream可以擁有多個(gè)客戶端（消費(fèi)者）在等待數(shù)據(jù)。默認(rèn)情況下，對(duì)于每一個(gè)新項(xiàng)目，都會(huì)被分發(fā)到等待給定Stream的數(shù)據(jù)的每一個(gè)消費(fèi)者。這個(gè)行為與阻塞列表不同，每個(gè)消費(fèi)者都會(huì)獲取到不同的元素。但是，扇形分發(fā)到多個(gè)消費(fèi)者的能力與Pub/Sub相似。

雖然在Pub/Sub中的消息是fire and forget并且從不存儲(chǔ)，以及使用阻塞列表時(shí)，當(dāng)一個(gè)客戶端收到消息時(shí)，它會(huì)從列表中彈出（有效刪除），Stream從跟本上以一種不同的方式工作。所有的消息都被無限期地附加到Stream中（除非用戶明確地要求刪除這些條目）：不同的消費(fèi)者通過記住收到的最后一條消息的ID，從其角度知道什么是新消息。

Streams 消費(fèi)者組提供了一種Pub/Sub或者阻塞列表都不能實(shí)現(xiàn)的控制級(jí)別，同一個(gè)Stream不同的群組，顯式地確認(rèn)已經(jīng)處理的項(xiàng)目，檢查待處理的項(xiàng)目的能力，申明未處理的消息，以及每個(gè)消費(fèi)者擁有連貫歷史可見性，單個(gè)客戶端只能查看自己過去的消息歷史記錄。

提供監(jiān)聽到達(dá)Stream的新消息的能力的命令稱為XREAD。比XRANGE要更復(fù)雜一點(diǎn)，所以我們將從簡(jiǎn)單的形式開始，稍后將提供整個(gè)命令布局。

> XREAD COUNT 2 STREAMS mystream 0 1) 1) "mystream"2) 1) 1) 1519073278252-02) 1) "foo"2) "value_1"2) 1) 1519073279157-02) 1) "foo"2) "value_2"

以上是XREAD的非阻塞形式。注意COUNT選項(xiàng)并不是必需的，實(shí)際上這個(gè)命令唯一強(qiáng)制的選項(xiàng)是STREAMS，指定了一組key以及調(diào)用者已經(jīng)看到的每個(gè)Stream相應(yīng)的最大ID，以便該命令僅向客戶端提供ID大于我們指定ID的消息。

在上面的命令中，我們寫了STREAMS mystream 0，所以我們想要流?mystream中所有ID大于0-0的消息。正如你在上面的例子中所看到的，命令返回了鍵名，因?yàn)閷?shí)際上可以通過傳入多個(gè)key來同時(shí)從不同的Stream中讀取數(shù)據(jù)。我可以寫一下，例如：STREAMS mystream otherstream 0 0。注意在STREAMS選項(xiàng)后面，我們需要提供鍵名稱，以及之后的ID。因此，STREAMS選項(xiàng)必須始終是最后一個(gè)。

除了XREAD可以同時(shí)訪問多個(gè)Stream這一事實(shí)，以及我們能夠指定我們擁有的最后一個(gè)ID來獲取之后的新消息，在個(gè)簡(jiǎn)單的形式中，這個(gè)命令并沒有做什么跟XRANGE有太大區(qū)別的事情。然而，有趣的部分是我們可以通過指定BLOCK參數(shù)，輕松地將XREAD?變成一個(gè)?阻塞命令：

> XREAD BLOCK 0 STREAMS mystream $

請(qǐng)注意，在上面的例子中，除了移除COUNT以外，我指定了新的BLOCK選項(xiàng)，超時(shí)時(shí)間為0毫秒（意味著永不超時(shí)）。此外，我并沒有給流?mystream傳入一個(gè)常規(guī)的ID，而是傳入了一個(gè)特殊的ID$。這個(gè)特殊的ID意思是XREAD應(yīng)該使用流?mystream已經(jīng)存儲(chǔ)的最大ID作為最后一個(gè)ID。以便我們僅接收從我們開始監(jiān)聽時(shí)間以后的新消息。這在某種程度上相似于Unix命令tail -f。

請(qǐng)注意當(dāng)使用BLOCK選項(xiàng)時(shí)，我們不必使用特殊ID$。我們可以使用任意有效的ID。如果命令能夠立即處理我們的請(qǐng)求而不會(huì)阻塞，它將執(zhí)行此操作，否則它將阻止。通常如果我們想要從新的條目開始消費(fèi)Stream，我們以$開始，接著繼續(xù)使用接收到的最后一條消息的ID來發(fā)起下一次請(qǐng)求，依此類推。

XREAD的阻塞形式同樣可以監(jiān)聽多個(gè)Stream，只需要指定多個(gè)鍵名即可。如果請(qǐng)求可以同步提供，因?yàn)橹辽儆幸粋€(gè)流的元素大于我們指定的相應(yīng)ID，則返回結(jié)果。否則，該命令將阻塞并將返回獲取新數(shù)據(jù)的第一個(gè)流的項(xiàng)目（根據(jù)提供的ID）。

跟阻塞列表的操作類似，從等待數(shù)據(jù)的客戶端角度來看，阻塞流讀取是公正的，由于語義是FIFO樣式。阻塞給定Stream的第一個(gè)客戶端是第一個(gè)在新項(xiàng)目可用時(shí)將被解除阻塞的客戶端。

XREAD命令沒有除了COUNT?和?BLOCK以外的其他選項(xiàng)，因此它是一個(gè)非常基本的命令，具有特定目的來攻擊消費(fèi)者一個(gè)或多個(gè)流。使用消費(fèi)者組API可以用更強(qiáng)大的功能來消費(fèi)Stream，但是通過消費(fèi)者組讀取是通過另外一個(gè)不同的命令來實(shí)現(xiàn)的，稱為XREADGROUP。本指南的下一節(jié)將介紹。

消費(fèi)者組

當(dāng)手頭的任務(wù)是從不同的客戶端消費(fèi)同一個(gè)Stream，那么XREAD已經(jīng)提供了一種方式可以扇形分發(fā)到N個(gè)客戶端，還可以使用從節(jié)點(diǎn)來提供更多的讀取可伸縮性。然而，在某些問題中，我們想要做的不是向許多客戶端提供相同的消息流，而是從同一流向許多客戶端提供不同的消息子集。這很有用的一個(gè)明顯的例子是處理消息的速度很慢：能夠讓N個(gè)不同的客戶端接收流的不同部分，通過將不同的消息路由到準(zhǔn)備做更多工作的不同客戶端來擴(kuò)展消息處理工作。

實(shí)際上，假如我們想象有三個(gè)消費(fèi)者C1，C2，C3，以及一個(gè)包含了消息1, 2, 3, 4, 5, 6, 7的Stream，我們想要按如下圖表的方式處理消息：

1 -> C1 2 -> C2 3 -> C3 4 -> C1 5 -> C2 6 -> C3 7 -> C1

為了獲得這個(gè)效果，Redis使用了一個(gè)名為消費(fèi)者組的概念。非常重要的一點(diǎn)是，從實(shí)現(xiàn)的角度來看，Redis的消費(fèi)者組與Kafka (TM) 消費(fèi)者組沒有任何關(guān)系，它們只是從實(shí)施的概念上來看比較相似，所以我決定不改變最初普及這種想法的軟件產(chǎn)品已有的術(shù)語。

消費(fèi)者組就像一個(gè)偽消費(fèi)者，從流中獲取數(shù)據(jù)，實(shí)際上為多個(gè)消費(fèi)者提供服務(wù)，提供某些保證：

每條消息都提供給不同的消費(fèi)者，因此不可能將相同的消息傳遞給多個(gè)消費(fèi)者。

消費(fèi)者在消費(fèi)者組中通過名稱來識(shí)別，該名稱是實(shí)施消費(fèi)者的客戶必須選擇的區(qū)分大小寫的字符串。這意味著即便斷開連接過后，消費(fèi)者組仍然保留了所有的狀態(tài)，因?yàn)榭蛻舳藭?huì)重新申請(qǐng)成為相同的消費(fèi)者。然而，這也意味著由客戶端提供唯一的標(biāo)識(shí)符。

每一個(gè)消費(fèi)者組都有一個(gè)第一個(gè)ID永遠(yuǎn)不會(huì)被消費(fèi)的概念，這樣一來，當(dāng)消費(fèi)者請(qǐng)求新消息時(shí)，它能提供以前從未傳遞過的消息。

消費(fèi)消息需要使用特定的命令進(jìn)行顯式確認(rèn)，表示：這條消息已經(jīng)被正確處理了，所以可以從消費(fèi)者組中逐出。

消費(fèi)者組跟蹤所有當(dāng)前所有待處理的消息，也就是，消息被傳遞到消費(fèi)者組的一些消費(fèi)者，但是還沒有被確認(rèn)為已處理。由于這個(gè)特性，當(dāng)訪問一個(gè)Stream的歷史消息的時(shí)候，每個(gè)消費(fèi)者將只能看到傳遞給它的消息。

在某種程度上，消費(fèi)者組可以被想象為關(guān)于Stream的一些狀態(tài)：

如果你從這個(gè)視角來看，很容易理解一個(gè)消費(fèi)者組能做什么，如何做到向給消費(fèi)者提供他們的歷史待處理消息，以及當(dāng)消費(fèi)者請(qǐng)求新消息的時(shí)候，是如何做到只發(fā)送ID大于last_delivered_id的消息的。同時(shí)，如果你把消費(fèi)者組看成Redis Stream的輔助數(shù)據(jù)結(jié)構(gòu)，很明顯單個(gè)Stream可以擁有多個(gè)消費(fèi)者組，每個(gè)消費(fèi)者組都有一組消費(fèi)者。實(shí)際上，同一個(gè)Stream甚至可以通過XREAD讓客戶端在沒有消費(fèi)者組的情況下讀取，同時(shí)有客戶端通過XREADGROUP在不同的消費(fèi)者組中讀取。

現(xiàn)在是時(shí)候放大來查看基本的消費(fèi)者組命令了，具體如下：

XGROUP?用于創(chuàng)建，摧毀或者管理消費(fèi)者組。
XREADGROUP?用于通過消費(fèi)者組從一個(gè)Stream中讀取。
XACK?是允許消費(fèi)者將待處理消息標(biāo)記為已正確處理的命令。

創(chuàng)建一個(gè)消費(fèi)者組

假設(shè)我已經(jīng)存在類型流的?mystream，為了創(chuàng)建消費(fèi)者組，我只需要做：

> XGROUP CREATE mystream mygroup $ OK

請(qǐng)注意：目前還不能為不存在的Stream創(chuàng)建消費(fèi)者組，但有可能在不久的將來我們會(huì)給XGROUP命令增加一個(gè)選項(xiàng)，以便在這種場(chǎng)景下可以創(chuàng)建一個(gè)空的Stream。

如你所看到的上面這個(gè)命令，當(dāng)創(chuàng)建一個(gè)消費(fèi)者組的時(shí)候，我們必須指定一個(gè)ID，在這個(gè)例子中ID是$。這是必要的，因?yàn)橄M(fèi)者組在其他狀態(tài)中必須知道在第一個(gè)消費(fèi)者連接時(shí)接下來要服務(wù)的消息，即消費(fèi)者組創(chuàng)建完成時(shí)的最后消息ID是什么？如果我們就像上面例子一樣，提供一個(gè)$，那么只有從現(xiàn)在開始到達(dá)Stream的新消息才會(huì)被傳遞到消費(fèi)者組中的消費(fèi)者。如果我們指定的消息ID是0，那么消費(fèi)者組將會(huì)開始消費(fèi)這個(gè)Stream中的所有歷史消息。當(dāng)然，你也可以指定任意其他有效的ID。你所知道的是，消費(fèi)者組將開始傳遞ID大于你所指定的ID的消息。因?yàn)?表示Stream中當(dāng)前最大ID的意思，指定$會(huì)有只消費(fèi)新消息的效果。

現(xiàn)在消費(fèi)者組創(chuàng)建好了，我們可以使用XREADGROUP命令立即開始嘗試通過消費(fèi)者組讀取消息。我們會(huì)從消費(fèi)者那里讀到，假設(shè)指定消費(fèi)者分別是Alice和Bob，來看看系統(tǒng)會(huì)怎樣返回不同消息給Alice和Bob。

XREADGROUP和XREAD非常相似，并且提供了相同的BLOCK選項(xiàng)，除此以外還是一個(gè)同步命令。但是有一個(gè)強(qiáng)制的選項(xiàng)必須始終指定，那就是GROUP，并且有兩個(gè)參數(shù)：消費(fèi)者組的名字，以及嘗試讀取的消費(fèi)者的名字。選項(xiàng)COUNT仍然是支持的，并且與XREAD命令中的用法相同。

在開始從Stream中讀取之前，讓我們往里面放一些消息：

> XADD mystream * message apple 1526569495631-0 > XADD mystream * message orange 1526569498055-0 > XADD mystream * message strawberry 1526569506935-0 > XADD mystream * message apricot 1526569535168-0 > XADD mystream * message banana 1526569544280-0

請(qǐng)注意：在這里消息是字段名稱，水果是關(guān)聯(lián)的值，記住Stream中的每一項(xiàng)都是小字典。

現(xiàn)在是時(shí)候嘗試使用消費(fèi)者組讀取了：

> XREADGROUP GROUP mygroup Alice COUNT 1 STREAMS mystream > 1) 1) "mystream"2) 1) 1) 1526569495631-02) 1) "message"2) "apple"

XREADGROUP的響應(yīng)內(nèi)容就像XREAD一樣。但是請(qǐng)注意上面提供的GROUP <group-name> <consumer-name>，這表示我想要使用消費(fèi)者組mygroup從Stream中讀取，我是消費(fèi)者Alice。每次消費(fèi)者使用消費(fèi)者組中執(zhí)行操作時(shí)，都必須要指定可以這個(gè)消費(fèi)者組中唯一標(biāo)識(shí)它的名字。

在以上命令行中還有另外一個(gè)非常重要的細(xì)節(jié)，在強(qiáng)制選項(xiàng)STREAMS之后，鍵mystream請(qǐng)求的ID是特殊的ID?>。這個(gè)特殊的ID只在消費(fèi)者組的上下文中有效，其意思是：消息到目前為止從未傳遞給其他消費(fèi)者。

這幾乎總是你想要的，但是也可以指定一個(gè)真實(shí)的ID，比如0或者任何其他有效的ID，在這個(gè)例子中，我們請(qǐng)求XREADGROUP只提供給我們歷史待處理的消息，在這種情況下，將永遠(yuǎn)不會(huì)在組中看到新消息。所以基本上XREADGROUP可以根據(jù)我們提供的ID有以下行為：

如果ID是特殊ID>，那么命令將會(huì)返回到目前為止從未傳遞給其他消費(fèi)者的新消息，這有一個(gè)副作用，就是會(huì)更新消費(fèi)者組的最后ID。如果ID是任意其他有效的數(shù)字ID，那么命令將會(huì)讓我們?cè)L問我們的歷史待處理消息。即傳遞給這個(gè)指定消費(fèi)者（由提供的名稱標(biāo)識(shí)）的消息集，并且到目前為止從未使用XACK進(jìn)行確認(rèn)。

我們可以立即測(cè)試此行為，指定ID為0，不帶任何COUNT選項(xiàng)：我們只會(huì)看到唯一的待處理消息，即關(guān)于apples的消息：

> XREADGROUP GROUP mygroup Alice STREAMS mystream 0 1) 1) "mystream"2) 1) 1) 1526569495631-02) 1) "message"2) "apple"

但是，如果我們確認(rèn)這個(gè)消息已經(jīng)處理，它將不再是歷史待處理消息的一部分，因此系統(tǒng)將不再報(bào)告任何消息：

> XACK mystream mygroup 1526569495631-0 (integer) 1 > XREADGROUP GROUP mygroup Alice STREAMS mystream 0 1) 1) "mystream"2) (empty list or set)

如果你還不清楚XACK是如何工作的，請(qǐng)不用擔(dān)心，這個(gè)概念只是已處理的消息不再是我們可以訪問的歷史記錄的一部分。

現(xiàn)在輪到Bob來讀取一些東西了：

> XREADGROUP GROUP mygroup Bob COUNT 2 STREAMS mystream > 1) 1) "mystream"2) 1) 1) 1526569498055-02) 1) "message"2) "orange"2) 1) 1526569506935-02) 1) "message"2) "strawberry"

Bob要求最多兩條消息，并通過同一消費(fèi)者組mygroup讀取。所以發(fā)生的是Redis僅報(bào)告新消息。正如你所看到的，消息”apple”未被傳遞，因?yàn)樗呀?jīng)被傳遞給Alice，所以Bob獲取到了orange和strawberry，以此類推。

這樣，Alice，Bob以及這個(gè)消費(fèi)者組中的任何其他消費(fèi)者，都可以從相同的Stream中讀取到不同的消息，讀取他們尚未處理的歷史消息，或者標(biāo)記消息為已處理。這允許創(chuàng)建不同的拓?fù)浜驼Z義來從Stream中消費(fèi)消息。

有幾件事需要記住：

消費(fèi)者是在他們第一次被提及的時(shí)候自動(dòng)創(chuàng)建的，不需要顯式創(chuàng)建。
即使使用XREADGROUP，你也可以同時(shí)從多個(gè)key中讀取，但是要讓其工作，你需要給每一個(gè)Stream創(chuàng)建一個(gè)名稱相同的消費(fèi)者組。這并不是一個(gè)常見的需求，但是需要說明的是，這個(gè)功能在技術(shù)上是可以實(shí)現(xiàn)的。
XREADGROUP命令是一個(gè)寫命令，因?yàn)楫?dāng)它從Stream中讀取消息時(shí)，消費(fèi)者組被修改了，所以這個(gè)命令只能在master節(jié)點(diǎn)調(diào)用。

使用Ruby語言編寫的使用用戶組的消費(fèi)者實(shí)現(xiàn)示例如下。 Ruby代碼的編寫方式，幾乎對(duì)使用任何其他語言編程的程序員或者不懂Ruby的人來說，都是清晰可讀的：

require 'redis'if ARGV.length == 0puts "Please specify a consumer name"exit 1 endConsumerName = ARGV[0] GroupName = "mygroup" r = Redis.newdef process_message(id,msg)puts "[#{ConsumerName}] #{id} = #{msg.inspect}" end$lastid = '0-0'puts "Consumer #{ConsumerName} starting..." check_backlog = true while true# Pick the ID based on the iteration: the first time we want to# read our pending messages, in case we crashed and are recovering.# Once we consumer our history, we can start getting new messages.if check_backlogmyid = $lastidelsemyid = '>'enditems = r.xreadgroup('GROUP',GroupName,ConsumerName,'BLOCK','2000','COUNT','10','STREAMS',:my_stream_key,myid)if items == nilputs "Timeout!"nextend# If we receive an empty reply, it means we were consuming our history# and that the history is now empty. Let's start to consume new messages.check_backlog = false if items[0][1].length == 0items[0][1].each{|i|id,fields = i# Process the messageprocess_message(id,fields)# Acknowledge the message as processedr.xack(:my_stream_key,GroupName,id)$lastid = id} end

正如你所看到的，這里的想法是開始消費(fèi)歷史消息，即我們的待處理消息列表。這很有用，因?yàn)橄M(fèi)者可能已經(jīng)崩潰，因此在重新啟動(dòng)時(shí)，我們想要重新讀取那些已經(jīng)傳遞給我們但還沒有確認(rèn)的消息。通過這種方式，我們可以多次或者一次處理消息（至少在消費(fèi)者失敗的場(chǎng)景中是這樣，但是這也受到Redis持久化和復(fù)制的限制，請(qǐng)參閱有關(guān)此主題的特定部分）。

消耗歷史消息后，我們將得到一個(gè)空的消息列表，我們可以切換到?>?，使用特殊ID來消費(fèi)新消息。

從永久性失敗中恢復(fù)

上面的例子允許我們編寫多個(gè)消費(fèi)者參與同一個(gè)消費(fèi)者組，每個(gè)消費(fèi)者獲取消息的一個(gè)子集進(jìn)行處理，并且在故障恢復(fù)時(shí)重新讀取各自的待處理消息。然而在現(xiàn)實(shí)世界中，消費(fèi)者有可能永久地失敗并且永遠(yuǎn)無法恢復(fù)。由于任何原因停止后，消費(fèi)者的待處理消息會(huì)發(fā)生什么呢？

Redis的消費(fèi)者組提供了一個(gè)專門針對(duì)這種場(chǎng)景的特性，用以認(rèn)領(lǐng)給定消費(fèi)者的待處理消息，這樣一來，這些消息就會(huì)改變他們的所有者，并且被重新分配給其他消費(fèi)者。這個(gè)特性是非常明確的，消費(fèi)者必須檢查待處理消息列表，并且必須使用特殊命令來認(rèn)領(lǐng)特定的消息，否則服務(wù)器將把待處理的消息永久分配給舊消費(fèi)者，這樣不同的應(yīng)用程序就可以選擇是否使用這樣的特性，以及使用它的方式。

這個(gè)過程的第一步是使用一個(gè)叫做XPENDING的命令，這個(gè)命令提供消費(fèi)者組中待處理?xiàng)l目的可觀察性。這是一個(gè)只讀命令，它總是可以安全地調(diào)用，不會(huì)改變?nèi)魏蜗⒌乃姓?。在最?jiǎn)單的形式中，調(diào)用這個(gè)命令只需要兩個(gè)參數(shù)，即Stream的名稱和消費(fèi)者組的名稱。

> XPENDING mystream mygroup 1) (integer) 2 2) 1526569498055-0 3) 1526569506935-0 4) 1) 1) "Bob"2) "2"

當(dāng)以這種方式調(diào)用的時(shí)候，命令只會(huì)輸出給定消費(fèi)者組的待處理消息總數(shù)（在本例中是兩條消息），所有待處理消息中的最小和最大的ID，最后是消費(fèi)者列表和每個(gè)消費(fèi)者的待處理消息數(shù)量。我們只有Bob有兩條待處理消息，因?yàn)锳lice請(qǐng)求的唯一一條消息已使用XACK確認(rèn)了。

我們可以通過給XPENDING命令傳遞更多的參數(shù)來獲取更多信息，完整的命令簽名如下：

XPENDING <key> <groupname> [<start-id> <end-id> <count> [<conusmer-name>]]

通過提供一個(gè)開始和結(jié)束ID（可以只是-和+，就像XRANGE一樣），以及一個(gè)控制命令返回的信息量的數(shù)字，我們可以了解有關(guān)待處理消息的更多信息。如果我們想要將輸出限制為僅針對(duì)給定使用者組的待處理消息，可以使用最后一個(gè)可選參數(shù)，即消費(fèi)者組的名稱，但我們不會(huì)在以下示例中使用此功能。

> XPENDING mystream mygroup - + 10 1) 1) 1526569498055-02) "Bob"3) (integer) 741704584) (integer) 1 2) 1) 1526569506935-02) "Bob"3) (integer) 741704584) (integer) 1

現(xiàn)在我們有了每一條消息的詳細(xì)信息：消息ID，消費(fèi)者名稱，空閑時(shí)間（單位是毫秒，意思是：自上次將消息傳遞給某個(gè)消費(fèi)者以來經(jīng)過了多少毫秒），以及每一條給定的消息被傳遞了多少次。我們有來自Bob的兩條消息，它們空閑了74170458毫秒，大概20個(gè)小時(shí)。

請(qǐng)注意，沒有人阻止我們檢查第一條消息內(nèi)容是什么，使用XRANGE即可。

> XRANGE mystream 1526569498055-0 1526569498055-0 1) 1) 1526569498055-02) 1) "message"2) "orange"

我們只需要在參數(shù)中重復(fù)兩次相同的ID。現(xiàn)在我們有了一些想法，Alice可能會(huì)根據(jù)過了20個(gè)小時(shí)仍然沒有處理這些消息，來判斷Bob可能無法及時(shí)恢復(fù)，所以現(xiàn)在是時(shí)候認(rèn)領(lǐng)這些消息，并繼續(xù)代替Bob處理了。為了做到這一點(diǎn)，我們使用XCLAIM命令。

這個(gè)命令非常的復(fù)雜，并且在其完整形式中有很多選項(xiàng)，因?yàn)樗糜趶?fù)制消費(fèi)者組的更改，但我們只使用我們通常需要的參數(shù)。在這種情況下，它就像調(diào)用它一樣簡(jiǎn)單：

XCLAIM <key> <group> <consumer> <min-idle-time> <ID-1> <ID-2> ... <ID-N>

基本上我們說，對(duì)于這個(gè)特定的Stream和消費(fèi)者組，我希望指定的ID的這些消息可以改變他們的所有者，并將被分配到指定的消費(fèi)者<consumer>。但是，我們還提供了最小空閑時(shí)間，因此只有在上述消息的空閑時(shí)間大于指定的空閑時(shí)間時(shí)，操作才會(huì)起作用。這很有用，因?yàn)橛锌赡軆蓚€(gè)客戶端會(huì)同時(shí)嘗試認(rèn)領(lǐng)一條消息：

Client 1: XCLAIM mystream mygroup Alice 3600000 1526569498055-0 Clinet 2: XCLAIM mystream mygroup Lora 3600000 1526569498055-0

然而認(rèn)領(lǐng)一條消息的副作用是會(huì)重置它的閑置時(shí)間！并將增加其傳遞次數(shù)的計(jì)數(shù)器，所以上面第二個(gè)客戶端的認(rèn)領(lǐng)會(huì)失敗。通過這種方式，我們可以避免對(duì)消息進(jìn)行簡(jiǎn)單的重新處理（即使是在一般情況下，你仍然不能獲得準(zhǔn)確的一次處理）。

下面是命令執(zhí)行的結(jié)果：

> XCLAIM mystream mygroup Alice 3600000 1526569498055-0 1) 1) 1526569498055-02) 1) "message"2) "orange"

Alice成功認(rèn)領(lǐng)了該消息，現(xiàn)在可以處理并確認(rèn)消息，盡管原來的消費(fèi)者還沒有恢復(fù)，也能往前推動(dòng)。

從上面的例子很明顯能看到，作為成功認(rèn)領(lǐng)了指定消息的副作用，XCLAIM命令也返回了消息數(shù)據(jù)本身。但這不是強(qiáng)制性的?？梢允褂?strong>JUSTID選項(xiàng)，以便僅返回成功認(rèn)領(lǐng)的消息的ID。如果你想減少客戶端和服務(wù)器之間的帶寬使用量的話，以及考慮命令的性能，這會(huì)很有用，并且你不會(huì)對(duì)消息感興趣，因?yàn)樯院竽愕南M(fèi)者的實(shí)現(xiàn)方式將不時(shí)地重新掃描歷史待處理消息。

認(rèn)領(lǐng)也可以通過一個(gè)獨(dú)立的進(jìn)程來實(shí)現(xiàn)：這個(gè)進(jìn)程只負(fù)責(zé)檢查待處理消息列表，并將空閑的消息分配給看似活躍的消費(fèi)者?？梢酝ㄟ^Redis Stream的可觀察特性獲得活躍的消費(fèi)者。這是下一個(gè)章節(jié)的主題。

消息認(rèn)領(lǐng)及交付計(jì)數(shù)器

在XPENDING的輸出中，你所看到的計(jì)數(shù)器是每一條消息的交付次數(shù)。這樣的計(jì)數(shù)器以兩種方式遞增：消息通過XCLAIM成功認(rèn)領(lǐng)時(shí)，或者調(diào)用XREADGROUP訪問歷史待處理消息時(shí)。

當(dāng)出現(xiàn)故障時(shí)，消息被多次傳遞是很正常的，但最終它們通常會(huì)得到處理。但有時(shí)候處理特定的消息會(huì)出現(xiàn)問題，因?yàn)橄?huì)以觸發(fā)處理代碼中的bug的方式被損壞或修改。在這種情況下，消費(fèi)者處理這條特殊的消息會(huì)一直失敗。因?yàn)槲覀冇袀鬟f嘗試的計(jì)數(shù)器，所以我們可以使用這個(gè)計(jì)數(shù)器來檢測(cè)由于某些原因根本無法處理的消息。所以一旦消息的傳遞計(jì)數(shù)器達(dá)到你給定的值，比較明智的做法是將這些消息放入另外一個(gè)Stream，并給系統(tǒng)管理員發(fā)送一條通知。這基本上是Redis Stream實(shí)現(xiàn)的dead letter概念的方式。

Streams 的可觀察性

缺乏可觀察性的消息系統(tǒng)很難處理。不知道誰在消費(fèi)消息，哪些消息待處理，不知道給定Stream的活躍消費(fèi)者組的集合，使得一切都不透明。因此，Redis Stream和消費(fèi)者組都有不同的方式來觀察正在發(fā)生的事情。我們已經(jīng)介紹了XPENDING，它允許我們檢查在給定時(shí)刻正在處理的消息列表，以及它們的空閑時(shí)間和傳遞次數(shù)。

但是，我們可能希望做更多的事情，XINFO命令是一個(gè)可觀察性接口，可以與子命令一起使用，以獲取有關(guān)Stream或消費(fèi)者組的信息。

這個(gè)命令使用子命令來顯示有關(guān)Stream和消費(fèi)者組的狀態(tài)的不同信息，比如使用**XINFO STREAM?**可以報(bào)告關(guān)于Stream本身的信息。

> XINFO STREAM mystream1) length2) (integer) 133) radix-tree-keys4) (integer) 15) radix-tree-nodes6) (integer) 27) groups8) (integer) 29) first-entry 10) 1) 1524494395530-02) 1) "a"2) "1"3) "b"4) "2" 11) last-entry 12) 1) 1526569544280-02) 1) "message"2) "banana"

輸出顯示了有關(guān)如何在內(nèi)部編碼Stream的信息，以及顯示了Stream的第一條和最后一條消息。另一個(gè)可用的信息是與這個(gè)Stream相關(guān)聯(lián)的消費(fèi)者組的數(shù)量。我們可以進(jìn)一步挖掘有關(guān)消費(fèi)者組的更多信息。

> XINFO GROUPS mystream 1) 1) name2) "mygroup"3) consumers4) (integer) 25) pending6) (integer) 2 2) 1) name2) "some-other-group"3) consumers4) (integer) 15) pending6) (integer) 0

正如你在這里和前面的輸出中看到的，XINFO命令輸出一系列鍵值對(duì)。因?yàn)檫@是一個(gè)可觀察性命令，允許人類用戶立即了解報(bào)告的信息，并允許命令通過添加更多字段來報(bào)告更多信息，而不會(huì)破壞與舊客戶端的兼容性。其他更高帶寬效率的命令，比如XPENDING，只報(bào)告沒有字段名稱的信息。

上面例子中的輸出（使用了子命令GROUPS）應(yīng)該能清楚地觀察字段名稱。我們可以通過檢查在此類消費(fèi)者組中注冊(cè)的消費(fèi)者，來更詳細(xì)地檢查特定消費(fèi)者組的狀態(tài)。

> XINFO CONSUMERS mystream mygroup 1) 1) name2) "Alice"3) pending4) (integer) 15) idle6) (integer) 9104628 2) 1) name2) "Bob"3) pending4) (integer) 15) idle6) (integer) 83841983

如果你不記得命令的語法，只需要查看命令本身的幫助：

> XINFO HELP 1) XINFO <subcommand> arg arg ... arg. Subcommands are: 2) CONSUMERS <key> <groupname> -- Show consumer groups of group <groupname>. 3) GROUPS <key> -- Show the stream consumer groups. 4) STREAM <key> -- Show information about the stream. 5) HELP -- Print this help.

與Kafka（TM）分區(qū)的差異

Redis Stream的消費(fèi)者組可能類似于基于Kafka（TM）分區(qū)的消費(fèi)者組，但是要注意Redis Stream實(shí)際上非常不同。分區(qū)僅僅是邏輯的，并且消息只是放在一個(gè)Redis鍵中，因此不同客戶端的服務(wù)方式取決于誰準(zhǔn)備處理新消息，而不是從哪個(gè)分區(qū)客戶端讀取。例如，如果消費(fèi)者C3在某一點(diǎn)永久故障，Redis會(huì)繼續(xù)服務(wù)C1和C2，將新消息送達(dá)，就像現(xiàn)在只有兩個(gè)邏輯分區(qū)一樣。

類似地，如果一個(gè)給定的消費(fèi)者在處理消息方面比其他消費(fèi)者快很多，那么這個(gè)消費(fèi)者在相同單位時(shí)間內(nèi)按比例會(huì)接收更多的消息。這是有可能的，因?yàn)镽edis顯式地追蹤所有未確認(rèn)的消息，并且記住了誰接收了哪些消息，以及第一條消息的ID從未傳遞給任何消費(fèi)者。

但是，這也意味著在Redis中，如果你真的想把同一個(gè)Stream的消息分區(qū)到不同的Redis實(shí)例中，你必須使用多個(gè)key和一些分區(qū)系統(tǒng)，比如Redis集群或者特定應(yīng)用程序的分區(qū)系統(tǒng)。單個(gè)Redis Stream不會(huì)自動(dòng)分區(qū)到多個(gè)實(shí)例上。

我們可以說，以下是正確的：

如果你使用一個(gè)Stream對(duì)應(yīng)一個(gè)消費(fèi)者，則消息是按順序處理的。
如果你使用N個(gè)Stream對(duì)應(yīng)N個(gè)消費(fèi)者，那么只有給定的消費(fèi)者h(yuǎn)its N個(gè)Stream的子集，你可以擴(kuò)展上面的模型來實(shí)現(xiàn)。
如果你使用一個(gè)Stream對(duì)應(yīng)多個(gè)消費(fèi)者，則對(duì)N個(gè)消費(fèi)者進(jìn)行負(fù)載平衡，但是在那種情況下，有關(guān)同一邏輯項(xiàng)的消息可能會(huì)無序消耗，因?yàn)榻o定的消費(fèi)者處理消息3可能比另一個(gè)消費(fèi)者處理消息4要快。

所以基本上Kafka分區(qū)更像是使用了N個(gè)不同的Redis鍵。而Redis消費(fèi)者組是一個(gè)將給定Stream的消息負(fù)載均衡到N個(gè)不同消費(fèi)者的服務(wù)端負(fù)載均衡系統(tǒng)。

設(shè)置Streams的上限

許多應(yīng)用并不希望將數(shù)據(jù)永久收集到一個(gè)Stream。有時(shí)在Stream中指定一個(gè)最大項(xiàng)目數(shù)很有用，之后一旦達(dá)到給定的大小，將數(shù)據(jù)從Redis中移到不那么快的非內(nèi)存存儲(chǔ)是有用的，適合用來記錄未來幾十年的歷史數(shù)據(jù)。Redis Stream對(duì)此有一定的支持。這就是XADD命令的MAXLEN選項(xiàng)，這個(gè)選項(xiàng)用起來很簡(jiǎn)單：

> XADD mystream MAXLEN 2 * value 1 1526654998691-0 > XADD mystream MAXLEN 2 * value 2 1526654999635-0 > XADD mystream MAXLEN 2 * value 3 1526655000369-0 > XLEN mystream (integer) 2 > XRANGE mystream - + 1) 1) 1526654999635-02) 1) "value"2) "2" 2) 1) 1526655000369-02) 1) "value"2) "3"

如果使用MAXLEN選項(xiàng)，當(dāng)Stream的達(dá)到指定長(zhǎng)度后，老的條目會(huì)自動(dòng)被驅(qū)逐，因此Stream的大小是恒定的。目前還沒有選項(xiàng)讓Stream只保留給定數(shù)量的條目，因?yàn)闉榱艘恢碌剡\(yùn)行，這樣的命令必須為了驅(qū)逐條目而潛在地阻塞很長(zhǎng)時(shí)間。比如可以想象一下如果存在插入尖峰，然后是長(zhǎng)暫停，以及另一次插入，全都具有相同的最大時(shí)間。Stream會(huì)阻塞來驅(qū)逐在暫停期間變得太舊的數(shù)據(jù)。因此，用戶需要進(jìn)行一些規(guī)劃并了解Stream所需的最大長(zhǎng)度。此外，雖然Stream的長(zhǎng)度與內(nèi)存使用是成正比的，但是按時(shí)間來縮減不太容易控制和預(yù)測(cè)：這取決于插入速率，該變量通常隨時(shí)間變化（當(dāng)它不變化時(shí)，那么按尺寸縮減是微不足道的）。

然而使用MAXLEN進(jìn)行修整可能很昂貴：Stream由宏節(jié)點(diǎn)表示為基數(shù)樹，以便非常節(jié)省內(nèi)存。改變由幾十個(gè)元素組成的單個(gè)宏節(jié)點(diǎn)不是最佳的。因此可以使用以下特殊形式提供命令：

XADD mystream MAXLEN ~ 1000 * ... entry fields here ...

在選項(xiàng)MAXLEN和實(shí)際計(jì)數(shù)中間的參數(shù)~的意思是，我不是真的需要精確的1000個(gè)項(xiàng)目。它可以是1000或者1010或者1030，只要保證至少保存1000個(gè)項(xiàng)目就行。通過使用這個(gè)參數(shù)，僅當(dāng)我們移除整個(gè)節(jié)點(diǎn)的時(shí)候才執(zhí)行修整。這使得命令更高效，而且這也是我們通常想要的。

還有XTRIM命令可用，它做的事情與上面講到的MAXLEN選項(xiàng)非常相似，但是這個(gè)命令不需要添加任何其他參數(shù)，可以以獨(dú)立的方式與Stream一起使用。

> XTRIM mystream MAXLEN 10

或者，對(duì)于XADD選項(xiàng)：

> XTRIM mystream MAXLEN ~ 10

但是，XTRIM旨在接受不同的修整策略，雖然現(xiàn)在只實(shí)現(xiàn)了MAXLEN。鑒于這是一個(gè)明確的命令，將來有可能允許按時(shí)間來進(jìn)行修整，因?yàn)橐元?dú)立的方式調(diào)用這個(gè)命令的用戶應(yīng)該知道她或者他正在做什么。

一個(gè)有用的驅(qū)逐策略是，XTRIM應(yīng)該具有通過一系列ID刪除的能力。目前這是不可能的，但在將來可能會(huì)實(shí)現(xiàn)，以便更方便地使用XRANGE?和?XTRIM來將Redis中的數(shù)據(jù)移到其他存儲(chǔ)系統(tǒng)中（如果需要）。

持久化，復(fù)制和消息安全性

與任何其他Redis數(shù)據(jù)結(jié)構(gòu)一樣，Stream會(huì)異步復(fù)制到從節(jié)點(diǎn)，并持久化到AOF和RDB文件中。但可能不那么明顯的是，消費(fèi)者組的完整狀態(tài)也會(huì)傳輸?shù)紸OF，RDB和從節(jié)點(diǎn)，因此如果消息在主節(jié)點(diǎn)是待處理的狀態(tài)，在從節(jié)點(diǎn)也會(huì)是相同的信息。同樣，節(jié)點(diǎn)重啟后，AOF文件會(huì)恢復(fù)消費(fèi)者組的狀態(tài)。

但是請(qǐng)注意，Redis Stream和消費(fèi)者組使用Redis默認(rèn)復(fù)制來進(jìn)行持久化和復(fù)制，所以：

如果消息的持久性在您的應(yīng)用程序中很重要，則AOF必須與強(qiáng)大的fsync策略一起使用。
默認(rèn)情況下，異步復(fù)制不能保證復(fù)制XADD命令或者消費(fèi)者組的狀態(tài)更改：在故障轉(zhuǎn)移后，可能會(huì)丟失某些內(nèi)容，具體取決于從節(jié)點(diǎn)從主節(jié)點(diǎn)接收數(shù)據(jù)的能力。
WAIT命令可以用于強(qiáng)制將更改傳輸?shù)揭唤M從節(jié)點(diǎn)上。但請(qǐng)注意，雖然這使得數(shù)據(jù)不太可能丟失，但由Sentinel或Redis群集運(yùn)行的Redis故障轉(zhuǎn)移過程僅執(zhí)行盡力檢查以故障轉(zhuǎn)移到最新的從節(jié)點(diǎn)，并且在某些特定故障下可能會(huì)選舉出缺少一些數(shù)據(jù)的從節(jié)點(diǎn)。因此，在使用Redis Stream和消費(fèi)者組設(shè)計(jì)應(yīng)用程序時(shí)，確保了解你的應(yīng)用程序在故障期間應(yīng)具有的語義屬性，并進(jìn)行相應(yīng)地配置，評(píng)估它是否足夠安全地用于您的用例。

從Stream中刪除單個(gè)項(xiàng)目

Stream還有一個(gè)特殊的命令可以通過ID從中間移除項(xiàng)目。一般來講，對(duì)于一個(gè)只附加的數(shù)據(jù)結(jié)構(gòu)來說，這也許看起來是一個(gè)奇怪的特征，但實(shí)際上它對(duì)于涉及例如隱私法規(guī)的應(yīng)用程序是有用的。這個(gè)命令稱為XDEL，調(diào)用的時(shí)候只需要傳遞Stream的名稱，在后面跟著需要?jiǎng)h除的ID即可：

> XRANGE mystream - + COUNT 2 1) 1) 1526654999635-02) 1) "value"2) "2" 2) 1) 1526655000369-02) 1) "value"2) "3" > XDEL mystream 1526654999635-0 (integer) 1 > XRANGE mystream - + COUNT 2 1) 1) 1526655000369-02) 1) "value"2) "3"

但是在當(dāng)前的實(shí)現(xiàn)中，在宏節(jié)點(diǎn)完全為空之前，內(nèi)存并沒有真正回收，所以你不應(yīng)該濫用這個(gè)特性。

零長(zhǎng)度Stream

Stream與其他Redis數(shù)據(jù)結(jié)構(gòu)有一個(gè)不同的地方在于，當(dāng)其他數(shù)據(jù)結(jié)構(gòu)沒有元素的時(shí)候，調(diào)用刪除元素的命令會(huì)把key本身刪掉。舉例來說就是，當(dāng)調(diào)用ZREM命令將有序集合中的最后一個(gè)元素刪除時(shí)，這個(gè)有序集合會(huì)被徹底刪除。但Stream允許在沒有元素的時(shí)候仍然存在，不管是因?yàn)槭褂?strong>MAXLEN選項(xiàng)的時(shí)候指定了count為零（在XADD和XTRIM命令中），或者因?yàn)檎{(diào)用了XDEL命令。

存在這種不對(duì)稱性的原因是因?yàn)?#xff0c;Stream可能具有相關(guān)聯(lián)的消費(fèi)者組，以及我們不希望因?yàn)镾tream中沒有項(xiàng)目而丟失消費(fèi)者組定義的狀態(tài)。當(dāng)前，即使沒有相關(guān)聯(lián)的消費(fèi)者組，Stream也不會(huì)被刪除，但這在將來有可能會(huì)發(fā)生變化。

關(guān)于本文翻譯者

網(wǎng)名：eson
github：helloeson

總結(jié)

以上是生活随笔為你收集整理的Redis Streams 介绍的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Redis FAQ
下一篇： MySQL的limit用法和分页查询的性