Redis管道Pipelining原理详解

原创

公众号JavaEdge 2021-06-24 14:56:31 ©著作权

文章标签 Redis 文章分类 Redis 数据库

©著作权归作者所有：来自51CTO博客作者公众号JavaEdge的原创作品，请联系作者获取转载授权，否则将追究法律责任

请求/响应协议和RTT

Redis是一种基于客户端-服务端模型及请求/响应协议的TCP服务。
这意味着一个请求会遵循以下步骤：

客户端向服务端发送一个查询请求，并监听Socket返回，通常以阻塞模式，等待服务端响应
服务端处理命令，并将结果返回给客户端。

因此，例如下面是4个命令序列执行情况：

Client: INCR X
Server: 1
Client: INCR X
Server: 2
Client: INCR X
Server: 3
Client: INCR X
Server: 4

客户端和服务器通过网络进行连接。该连接可以很快（loopback接口）或很慢（建立一个多次跳转的网络连接）。无论网络如何延迟，数据包总是能从客户端到达服务器，并从服务器返回数据回复客户端。

这个时间被称之为 RTT (Round Trip Time - 往返时间)。当客户端需要在一个批处理中执行多次请求时，这很影响性能（例如添加许多元素到同一个list，或者用很多Keys填充数据库）。如果RTT时间是250ms（在一个很慢的连接下），即使服务器每秒能处理100k的请求数，我们每秒最多也只能处理4个请求。

如果采用loopback接口，RTT就短得多（比如我的主机ping 127.0.0.1只需要44毫秒），但它在一次批量写入操作中仍是一笔巨大开销。还好一种方法可以改善这种情况。

Redis 管道（Pipelining）

一次请求/响应服务器能实现处理新的请求，即使旧的请求还未被响应。这样即可将多个命令发送到服务器，而不用等待响应，最后在一个步骤中读取该响应。

这就是管道（pipelining），一种几十年来广泛使用的技术。许多POP3协议支持这个功能，大大加快从服务器下载新邮件的过程。

Redis很早就支持管道（pipelining），因此无论你运行的是什么版本，你都可以使用管道（pipelining）操作Redis。

Pipelining不仅是一种减少往返时间的延迟成本的方法，还大大提高了你在给定的Redis服务器中每秒可执行的总操作量。这是由于以下事实的结果：从访问数据结构和产生响应的角度来看，不使用pipelining，服务每个命令非常廉价，但从执行socket I/O角度来看这非常昂贵。
这涉及到调用read和write的系统调用，这意味着从用户态到内核态。上下文切换是巨大的速度损失。

但当使用Pipelining时，通常使用单个read系统调用读取许多命令，并且通过单个write系统调用传递多个答复。因此，每秒执行的总查询数最初随着较长的管道而几乎呈线性增加，最终达到不使用流水线获得的基准的10倍：
Redis管道Pipelining原理详解_Redis

代码案例

在以下基准测试中，我们将使用支持管道的Redis Ruby客户端来测试由于管道带来的速度提高：

$ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379
+PONG
+PONG
+PONG

这一次我们没有为每个命令都花费了RTT开销，而是只用了一个命令的开销时间。

非常明确的，用管道顺序操作的第一个例子如下：

Client: INCR X
Client: INCR X
Client: INCR X
Client: INCR X
Server: 1
Server: 2
Server: 3
Server: 4

使用管道发送命令时，服务器将被迫回复一个队列答复，占用很多内存。所以，如果你需要发送大量的命令，最好是把他们按照合理数量分批次的处理，例如10K的命令，读回复，然后再发送另一个10k的命令，等等。这样速度几乎是相同的，但是在回复这10k命令队列需要非常大量的内存用来组织返回数据内容。

测试

下面我们会使用Redis Ruby客户端进行一些使用管道和不使用管道的情况，测试管道技术对速度的提升效果：

require 'rubygems'
require 'redis'

def bench(descr)
    start = Time.now
    yield
    puts "#{descr} #{Time.now-start} seconds"
end

def without_pipelining
    r = Redis.new
    10000.times {
        r.ping
    }
end

def with_pipelining
    r = Redis.new
    r.pipelined {
        10000.times {
            r.ping
        }
    }
end

bench("without pipelining") {
    without_pipelining
}
bench("with pipelining") {
    with_pipelining
}

从处于局域网中的Mac OS X系统上执行上面这个简单脚本的数据表明，开启了管道操作后，往返时延已经被改善得相当低了：

without pipelining 1.185238 seconds
with pipelining 0.250783 seconds

如你所见，开启管道后，我们的速度效率提升了5倍。

对比 redis 批处理命令，这里的命令互相无任何关系。

管道（Pipelining） VS 脚本（Scripting）

大量 pipeline 应用场景可通过 Redis 脚本（Redis 版本 >= 2.6）得到更高效的处理，后者在服务器端执行大量工作。
脚本的一大优势是可通过最小的延迟读写数据，让读、计算、写等操作变得非常快（pipeline 在这种情况下不能使用，因为客户端在写命令前需要读命令返回的结果）。

应用程序有时可能在 pipeline 中发送 EVAL 或 EVALSHA 命令。Redis 通过 SCRIPT LOAD 命令（保证 EVALSHA 成功被调用）明确支持这种情况。

上一篇：大厂Redis性能优化指南

下一篇：都2021了还不懂Redis的网络通信协议？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯