命令请求的执行过程

一个命令请求从发送到获得回复的过程中, 客户端和服务器需要完成一系列操作。

举个例子, 如果我们使用客户端执行以下命令:

redis> SET KEY VALUE
OK

那么从客户端发送 SET KEY VALUE 命令到获得回复 OK 期间, 客户端和服务器共需要执行以下操作:

  1. 客户端向服务器发送命令请求 SET KEY VALUE
  2. 服务器接收并处理客户端发来的命令请求 SET KEY VALUE , 在数据库中进行设置操作, 并产生命令回复 OK
  3. 服务器将命令回复 OK 发送给客户端。
  4. 客户端接收服务器返回的命令回复 OK , 并将这个回复打印给用户观看。

本节接下来的内容将对这些操作的执行细节进行补充, 详细地说明客户端和服务器在执行命令请求时所做的各种工作。

发送命令请求

Redis 服务器的命令请求来自 Redis 客户端, 当用户在客户端中键入一个命令请求时, 客户端会将这个命令请求转换成协议格式, 然后通过连接到服务器的套接字, 将协议格式的命令请求发送给服务器, 如图 14-1 所示。

digraph {

    label = "\n\n 图 14-1    客户端接收并发送命令请求的过程";

    rankdir = LR;

    node [shape = plaintext];

    user [label = "用户"];

    client [label = "客户端"];

    server [label = "服务器"];

    //

    user -> client [label = "键入命令请求"];

    client -> server [label = "将命令请求转换成协议格式\n然后发送"];

}

举个例子, 假设客户端执行命令:

SET KEY VALUE

那么客户端会将这个命令转换成协议:

*3\r\n$3\r\nSET\r\n$3\r\nKEY\r\n$5\r\nVALUE\r\n

然后将这段协议内容发送给服务器。

读取命令请求

当客户端与服务器之间的连接套接字因为客户端的写入而变得可读时, 服务器将调用命令请求处理器来执行以下操作:

  1. 读取套接字中协议格式的命令请求, 并将其保存到客户端状态的输入缓冲区里面。
  2. 对输入缓冲区中的命令请求进行分析, 提取出命令请求中包含的命令参数, 以及命令参数的个数, 然后分别将参数和参数个数保存到客户端状态的 argv 属性和 argc 属性里面。
  3. 调用命令执行器, 执行客户端指定的命令。

继续用上一个小节的 SET 命令为例子, 图 14-2 展示了程序将命令请求保存到客户端状态的输入缓冲区之后, 客户端状态的样子。

digraph {

    label = "\n 图 14-2    客户端状态中的命令请求";

    rankdir = LR;

    //

    node [shape = record];

    client [label = " redisClient | ... | <querybuf> querybuf | ... ", width = 2];

    sdshdr [label = " <head> sdshdr | free \n 0 | len \n 33 | <buf> buf "];

    buf [label = " { '*' | '3' | '\\r' | '\\n' | ... | 'V' | 'A' | 'L' | 'U' | 'E' | '\\r' | '\\n' | '\\0' } "];

    //

    client:querybuf -> sdshdr:head;

    sdshdr:buf -> buf;

}

之后, 分析程序将对输入缓冲区中的协议:

*3\r\n$3\r\nSET\r\n$3\r\nKEY\r\n$5\r\nVALUE\r\n

进行分析, 并将得出的分析结果保存到客户端状态的 argv 属性和 argc 属性里面, 如图 14-3 所示。

digraph {

    label = "\n 图 14-3    客户端状态的 argv 属性和 argc 属性";

    rankdir = LR;

    node [shape = record];

    redisClient [label = " redisClient | ... | <argv> argv | argc \n 3 | ... ", width = 2];

    argv [label = " { { <head> argv[0] | StringObject \n \"SET\" } | { argv[1] | StringObject \n \"KEY\" } | { argv[2] | StringObject \n \"VALUE\" } } "];

    redisClient:argv -> argv:head;

}

之后, 服务器将通过调用命令执行器来完成执行命令所需的余下步骤, 以下几个小节将分别介绍命令执行器所执行的工作。

命令执行器(1):查找命令实现

命令执行器要做的第一件事就是根据客户端状态的 argv[0] 参数, 在命令表(command table)中查找参数所指定的命令, 并将找到的命令保存到客户端状态的 cmd 属性里面。

命令表是一个字典, 字典的键是一个个命令名字,比如 "set""get""del" ,等等; 而字典的值则是一个个 redisCommand 结构, 每个 redisCommand 结构记录了一个 Redis 命令的实现信息, 表 14-1 记录了这个结构的各个主要属性的类型和作用。


表 14-1 redisCommand 结构的主要属性

属性名 类型 作用
name char * 命令的名字,比如 "set"
proc redisCommandProc * 函数指针,指向命令的实现函数,比如 setCommandredisCommandProc 类型的定义为 typedef void redisCommandProc(redisClient *c);
arity int 命令参数的个数,用于检查命令请求的格式是否正确。 如果这个值为负数 -N ,那么表示参数的数量大于等于 N 。 注意命令的名字本身也是一个参数, 比如说 SET msg "hello world" 命令的参数是 "SET""msg""hello world" , 而不仅仅是 "msg""hello world"
sflags char * 字符串形式的标识值, 这个值记录了命令的属性, 比如这个命令是写命令还是读命令, 这个命令是否允许在载入数据时使用, 这个命令是否允许在 Lua 脚本中使用, 等等。
flags int sflags 标识进行分析得出的二进制标识, 由程序自动生成。 服务器对命令标识进行检查时使用的都是 flags 属性而不是 sflags 属性, 因为对二进制标识的检查可以方便地通过 &^~ 等操作来完成。
calls long long 服务器总共执行了多少次这个命令。
milliseconds long long 服务器执行这个命令所耗费的总时长。

表 14-2 列出了 sflags 属性可以使用的标识值, 以及这些标识的意义。


表 14-2 sflags 属性的标识

标识 意义 带有这个标识的命令
w 这是一个写入命令,可能会修改数据库。 SETRPUSHDEL ,等等。
r 这是一个只读命令,不会修改数据库。 GETSTRLENEXISTS ,等等。
m 这个命令可能会占用大量内存, 执行之前需要先检查服务器的内存使用情况, 如果内存紧缺的话就禁止执行这个命令。 SETAPPENDRPUSHLPUSHSADDSINTERSTORE ,等等。
a 这是一个管理命令。 SAVEBGSAVESHUTDOWN ,等等。
p 这是一个发布与订阅功能方面的命令。 PUBLISHSUBSCRIBEPUBSUB ,等等。
s 这个命令不可以在 Lua 脚本中使用。 BRPOPBLPOPBRPOPLPUSHSPOP ,等等。
R 这是一个随机命令, 对于相同的数据集和相同的参数, 命令返回的结果可能不同。 SPOPSRANDMEMBERSSCANRANDOMKEY ,等等。
S 当在 Lua 脚本中使用这个命令时, 对这个命令的输出结果进行一次排序, 使得命令的结果有序。 SINTERSUNIONSDIFFSMEMBERSKEYS ,等等。
l 这个命令可以在服务器载入数据的过程中使用。 INFOSHUTDOWNPUBLISH ,等等。
t 这是一个允许从服务器在带有过期数据时使用的命令。 SLAVEOFPINGINFO ,等等。
M 这个命令在监视器(monitor)模式下不会自动被传播(propagate)。 EXEC

图 14-4 展示了命令表的样子, 并且以 SET 命令和 GET 命令作为例子, 展示了 redisCommand 结构:

  • SET 命令的名字为 "set" , 实现函数为 setCommand ; 命令的参数个数为 -3 , 表示命令接受三个或以上数量的参数; 命令的标识为 "wm" , 表示 SET 命令是一个写入命令, 并且在执行这个命令之前, 服务器应该对占用内存状况进行检查, 因为这个命令可能会占用大量内存。
  • GET 命令的名字为 "get" , 实现函数为 getCommand 函数; 命令的参数个数为 2 , 表示命令只接受两个参数; 命令的标识为 "r" , 表示这是一个只读命令。

digraph {

    label = "\n 图 14-4    命令表";

    rankdir = LR;

    node [shape = record];

    commands [label = " 命令表 | ... | <set> \"set\" | <get> \"get\" | ... | <sadd> \"sadd\" | ... | <rpush> \"rpush\" | ... | <publish> \"publish\" | ... ", width = 2.0];

    set [label = " <head> redisCommand | name \n \"set\" | <proc> proc | arity \n -3 | sflags \n \"wm\" | ... "];
    get [label = " <head> redisCommand | name \n \"get\" | <proc> proc | arity \n 2 | sflags \n \"r\" | ... "];
    //sadd [label = " <head> redisCommand | name \n \"sadd\" | <proc> proc | arity \n -3 | sflags \n \"wm\" | ... "];
    //rpush [label = " <head> redisCommand | name \n \"rpush\" | <proc> proc | arity \n -3 | sflags \n \"wm\" | ... "];
    //publish [label = " <head> redisCommand | name \n \"publish\" | <proc> proc | arity \n 3 | sflags \n \"pltr\" | ... "];

    node [shape = plaintext];

    setCommand [label = "void setCommand(redisClient *c);"];
    getCommand [label = "void getCommand(redisClient *c);"];
    //saddCommand;
    //rpushCommand;
    //publishCommand;

    //

    commands:set -> set:head; set:proc -> setCommand;
    commands:get -> get:head; get:proc -> getCommand;
    //commands:sadd -> sadd:head; sadd:proc -> saddCommand;
    //commands:rpush -> rpush:head; rpush:proc -> rpushCommand;
    //commands:publish -> publish:head; publish:proc -> publishCommand;

    //* fix editor highlight

}

继续之前 SET 命令的例子, 当程序以图 14-3 中的 argv[0] 作为输入, 在命令表中进行查找时, 命令表将返回 "set" 键所对应的 redisCommand 结构, 客户端状态的 cmd 指针会指向这个 redisCommand 结构, 如图 14-5 所示。

digraph {

    label = "\n 图 14-5    设置客户端状态的 cmd 指针";

    rankdir = LR;

    node [shape = record];

    redisClient [label = " redisClient | ... | <cmd> cmd | ... ", width = 2];

    commands [label = " 命令表 | ... | <set> \"set\" | <get> \"get\" | ... | <sadd> \"sadd\" | ... | <rpush> \"rpush\" | ... | <publish> \"publish\" | ... ", width = 2.0];

    set [label = " <head> redisCommand | name \n \"set\" | <proc> proc | arity \n -3 | sflags \n \"wm\" | ... "];

    node [shape = plaintext];

    setCommand [label = "void setCommand(redisClient *c);"];
    //* fix editor highlight

    //

    redisClient:cmd -> set:head [label = "指向 \n \"set\" 键对应的 \n redisCommand \n 结构"];

    commands:set -> set:head; set:proc -> setCommand;

}

命令名字的大小写不影响命令表的查找结果

因为命令表使用的是大小写无关的查找算法, 无论输入的命令名字是大写、小写或者混合大小写, 只要命令的名字是正确的, 就能找到相应的 redisCommand 结构。

比如说, 无论用户输入的命令名字是 "SET""set""SeT" 又或者 "sEt" , 命令表返回的都是同一个 redisCommand 结构。

这也是 Redis 客户端可以发送不同大小写的命令, 并且获得相同执行结果的原因:

# 以下四个命令的执行效果完全一样

redis> SET msg "hello world"
OK

redis> set msg "hello world"
OK

redis> SeT msg "hello world"
OK

redis> sEt msg "hello world"
OK

命令执行器(2):执行预备操作

到目前为止, 服务器已经将执行命令所需的命令实现函数(保存在客户端状态的 cmd 属性)、参数(保存在客户端状态的 argv 属性)、参数个数(保存在客户端状态的 argc 属性)都收集齐了, 但是在真正执行命令之前, 程序还需要进行一些预备操作, 从而确保命令可以正确、顺利地被执行, 这些操作包括:

  • 检查客户端状态的 cmd 指针是否指向 NULL , 如果是的话, 那么说明用户输入的命令名字找不到相应的命令实现, 服务器不再执行后续步骤, 并向客户端返回一个错误。
  • 根据客户端 cmd 属性指向的 redisCommand 结构的 arity 属性, 检查命令请求所给定的参数个数是否正确, 当参数个数不正确时, 不再执行后续步骤, 直接向客户端返回一个错误。 比如说, 如果 redisCommand 结构的 arity 属性的值为 -3 , 那么用户输入的命令参数个数必须大于等于 3 个才行。
  • 检查客户端是否已经通过了身份验证, 未通过身份验证的客户端只能执行 AUTH 命令, 如果未通过身份验证的客户端试图执行除 AUTH 命令之外的其他命令, 那么服务器将向客户端返回一个错误。
  • 如果服务器打开了 maxmemory 功能, 那么在执行命令之前, 先检查服务器的内存占用情况, 并在有需要时进行内存回收, 从而使得接下来的命令可以顺利执行。 如果内存回收失败, 那么不再执行后续步骤, 向客户端返回一个错误。
  • 如果服务器上一次执行 BGSAVE 命令时出错, 并且服务器打开了 stop-writes-on-bgsave-error 功能, 而且服务器即将要执行的命令是一个写命令, 那么服务器将拒绝执行这个命令, 并向客户端返回一个错误。
  • 如果客户端当前正在用 SUBSCRIBE 命令订阅频道, 或者正在用 PSUBSCRIBE 命令订阅模式, 那么服务器只会执行客户端发来的 SUBSCRIBEPSUBSCRIBEUNSUBSCRIBEPUNSUBSCRIBE 四个命令, 其他别的命令都会被服务器拒绝。
  • 如果服务器正在进行数据载入, 那么客户端发送的命令必须带有 l 标识(比如 INFOSHUTDOWNPUBLISH ,等等)才会被服务器执行, 其他别的命令都会被服务器拒绝。
  • 如果服务器因为执行 Lua 脚本而超时并进入阻塞状态, 那么服务器只会执行客户端发来的 SHUTDOWN nosave 命令和 SCRIPT KILL 命令, 其他别的命令都会被服务器拒绝。
  • 如果客户端正在执行事务, 那么服务器只会执行客户端发来的 EXECDISCARDMULTIWATCH 四个命令, 其他命令都会被放进事务队列中。
  • 如果服务器打开了监视器功能, 那么服务器会将要执行的命令和参数等信息发送给监视器。

当完成了以上预备操作之后, 服务器就可以开始真正执行命令了。

注意

以上只列出了服务器在单机模式下执行命令时的检查操作, 当服务器在复制或者集群模式下执行命令时, 预备操作还会更多一些。

命令执行器(3):调用命令的实现函数

在前面的操作中, 服务器已经将要执行命令的实现保存到了客户端状态的 cmd 属性里面, 并将命令的参数和参数个数分别保存到了客户端状态的 argv 属性和 argc 属性里面, 当服务器决定要执行命令时, 它只要执行以下语句就可以了:

// client 是指向客户端状态的指针

client->cmd->proc(client);

因为执行命令所需的实际参数都已经保存到客户端状态的 argv 属性里面了, 所以命令的实现函数只需要一个指向客户端状态的指针作为参数即可。

继续以之前的 SET 命令为例子, 图 14-6 展示了客户端包含了命令实现、参数和参数个数的样子。

digraph {

    label = "\n 图 14-6    客户端状态";

    //

    rankdir = LR;

    node [shape = record];

    redisClient [label = " redisClient | ... | <cmd> cmd | <argv> argv | argc \n 3 | ... ", width = 2];

    set [label = " <head> redisCommand | name \n \"set\" | <proc> proc | arity \n -3 | sflags \n \"wm\" | ... "];

    setCommand [label = "void setCommand(redisClient *c);", shape = plaintext];
    //* fix editor highlight

    redisClient:cmd -> set:head; set:proc -> setCommand;

    argv [label = " { { <head> argv[0] | StringObject \n \"SET\" } | { argv[1] | StringObject \n \"KEY\" } | { argv[2] | StringObject \n \"VALUE\" } } "];

    redisClient:argv -> argv:head;

}

对于这个例子来说, 执行语句:

client->cmd->proc(client);

等于执行语句:

setCommand(client);

被调用的命令实现函数会执行指定的操作, 并产生相应的命令回复, 这些回复会被保存在客户端状态的输出缓冲区里面(buf 属性和 reply 属性), 之后实现函数还会为客户端的套接字关联命令回复处理器, 这个处理器负责将命令回复返回给客户端。

对于前面 SET 命令的例子来说, 函数调用 setCommand(client); 将产生一个 "+OK\r\n" 回复, 这个回复会被保存到客户端状态的 buf 属性里面, 如图 14-7 所示。

digraph {

    label = "\n 图 14-7    保存了命令回复的客户端状态";

    rankdir = LR;

    node [shape = record];

    redisClient [label = " redisClient | ... | <buf> buf | bufpos \n 5 | ... ", width = 2];

    buf [label = " { '+' | 'O' | 'K' | '\\r' | '\\n' | '\\0' | ... } "];

    redisClient:buf -> buf;

}

命令执行器(4):执行后续工作

在执行完实现函数之后, 服务器还需要执行一些后续工作:

  • 如果服务器开启了慢查询日志功能, 那么慢查询日志模块会检查是否需要为刚刚执行完的命令请求添加一条新的慢查询日志。
  • 根据刚刚执行命令所耗费的时长, 更新被执行命令的 redisCommand 结构的 milliseconds 属性, 并将命令的 redisCommand 结构的 calls 计数器的值增一。
  • 如果服务器开启了 AOF 持久化功能, 那么 AOF 持久化模块会将刚刚执行的命令请求写入到 AOF 缓冲区里面。
  • 如果有其他从服务器正在复制当前这个服务器, 那么服务器会将刚刚执行的命令传播给所有从服务器。

当以上操作都执行完了之后, 服务器对于当前命令的执行到此就告一段落了, 之后服务器就可以继续从文件事件处理器中取出并处理下一个命令请求了。

将命令回复发送给客户端

前面说过, 命令实现函数会将命令回复保存到客户端的输出缓冲区里面, 并为客户端的套接字关联命令回复处理器, 当客户端套接字变为可写状态时, 服务器就会执行命令回复处理器, 将保存在客户端输出缓冲区中的命令回复发送给客户端。

当命令回复发送完毕之后, 回复处理器会清空客户端状态的输出缓冲区, 为处理下一个命令请求做好准备。

以图 14-7 所示的客户端状态为例子, 当客户端的套接字变为可写状态时, 命令回复处理器会将协议格式的命令回复 "+OK\r\n" 发送给客户端。

客户端接收并打印命令回复

当客户端接收到协议格式的命令回复之后, 它会将这些回复转换成人类可读的格式, 并打印给用户观看(假设我们使用的是 Redis 自带的 redis-cli 客户端), 如图 14-8 所示。

digraph {

    label = "\n\n 图 14-8    客户端接收并打印命令回复的过程";

    rankdir = LR;

    node [shape = plaintext];

    user [label = "用户"];

    client [label = "客户端"];

    server [label = "服务器"];

    //

    server -> client [label = "回复处理器将协议格式的\n命令回复返回给客户端"];

    client -> user [label = "将回复格式化成人类可读格式 \n 然后打印显示"];

}

继续以之前的 SET 命令为例子, 当客户端接到服务器发来的 "+OK\r\n" 协议回复时, 它会将这个回复转换成 "OK\n" , 然后打印给用户看:

redis> SET KEY VALUE
OK

以上就是 Redis 客户端和服务器执行命令请求的整个过程了。

讨论

comments powered by Disqus