面试官:Redis的事务满足原子性吗?

Hydra大约 10 分钟RedisLua事务

谈起数据库的事务来,估计很多同学的第一反应都是ACID,而排在ACID中首位的A原子性,要求一个事务中的所有操作,要么全部完成,要么全部不完成。熟悉redis的同学肯定知道,在redis中也存在事务,那么它的事务也满足原子性吗?下面我们就来一探究竟。

什么是Redis事务?

和数据库事务类似,redis事务也是用来一次性地执行多条命令。使用起来也很简单,可以用MULTI开启一个事务,然后将多个命令入队到事务的队列中,最后由EXEC命令触发事务,执行事务中的所有命令。看一个简单的事务执行例子:

127.0.0.1:6379> multi
OK
127.0.0.1:6379> set name Hydra
QUEUED
127.0.0.1:6379> set age 18
QUEUED
127.0.0.1:6379> incr age
QUEUED
127.0.0.1:6379> exec
1) OK
2) OK
3) (integer) 19

可以看到,在指令和操作数的数据类型等都正常的情况下,输入EXEC后所有命令被执行成功。

Redis事务满足原子性吗?

如果要验证redis事务是否满足原子性,那么需要在redis事务执行发生异常的情况下进行,下面我们分两种不同类型的错误分别测试。

语法错误

首先测试命令中有语法错误的情况,这种情况多为命令的参数个数不正确或输入的命令本身存在错误。下面我们在事务中输入一个存在格式错误的命令,开启事务并依次输入下面的命令:

127.0.0.1:6379> multi
OK
127.0.0.1:6379> set name Hydra
QUEUED
127.0.0.1:6379> incr
(error) ERR wrong number of arguments for 'incr' command
127.0.0.1:6379> set age 18
QUEUED

输入的命令incr后面没有添加参数,属于命令格式不对的语法错误,这时在命令入队时就会立刻检测出错误并提示error。使用exec执行事务,查看结果输出:

127.0.0.1:6379> exec
(error) EXECABORT Transaction discarded because of previous errors.

在这种情况下,只要事务中的一条命令有语法错误,在执行exec后就会直接返回错误,包括语法正确的命令在内的所有命令都不会被执行。对此进行验证,看一下在事务中其他指令执行情况,查看set命令的执行结果,全部为空,说明指令没有被执行。

127.0.0.1:6379> get name
(nil)
127.0.0.1:6379> get age
(nil)

此外,如果存在命令本身拼写错误、或输入了一个不存在的命令等情况,也属于语法错误的情况,执行事务时会直接报错。

运行错误

运行错误是指输入的指令格式正确,但是在命令执行期间出现的错误,典型场景是当输入参数的数据类型不符合命令的参数要求时,就会发生运行错误。例如下面的例子中,对一个string类型的值执行列表的操作,报错如下:

127.0.0.1:6379> set key1 value1
OK
127.0.0.1:6379> lpush key1 value2
(error) WRONGTYPE Operation against a key holding the wrong kind of value

这种错误在redis实际执行指令前是无法被发现的,只能当真正执行才能够被发现,因此这样的命令是可以被事务队列接收的,不会和上面的语法错误一样立即报错。

具体看一下当事务中存在运行错误的情况,在下面的事务中,尝试对string类型数据进行incr自增操作:

127.0.0.1:6379> multi
OK
127.0.0.1:6379> set name Hydra
QUEUED
127.0.0.1:6379> set age eighteen
QUEUED
127.0.0.1:6379> incr age
QUEUED
127.0.0.1:6379> del name
QUEUED

redis一直到这里都没有提示存在错误,执行exec看一下结果输出:

127.0.0.1:6379> exec
1) OK
2) OK
3) (error) ERR value is not an integer or out of range
4) (integer) 1

运行结果可以看到,虽然incr age这条命令出现了错误,但是它前后的命令都正常执行了,再看一下这些key对应的值,确实证明了其余指令都执行成功:

127.0.0.1:6379> get name
(nil)
127.0.0.1:6379> get age
"eighteen"

阶段性结论

对上面的事务的运行结果进行一下分析:

  • 存在语法错误的情况下,所有命令都不会执行
  • 存在运行错误的情况下,除执行中出现错误的命令外,其他命令都能正常执行

通过分析我们知道了redis中的事务是不满足原子性的,在运行错误的情况下,并没有提供类似数据库中的回滚功能。那么为什么redis不支持回滚呢,官方文档给出了说明,大意如下:

  • redis命令失败只会发生在语法错误或数据类型错误的情况,这一结果都是由编程过程中的错误导致,这种情况应该在开发环境中检测出来,而不是生产环境
  • 不使用回滚,能使redis内部设计更简单,速度更快
  • 回滚不能避免编程逻辑中的错误,如果想要将一个键的值增加2却只增加了1,这种情况即使提供回滚也无法提供帮助

基于以上原因,redis官方选择了更简单、更快的方法,不支持错误回滚。这样的话,如果在我们的业务场景中需要保证原子性,那么就要求了开发者通过其他手段保证命令全部执行成功或失败,例如在执行命令前进行参数类型的校验,或在事务执行出现错误时及时做事务补偿。

提到其他方式,相信很多小伙伴都听说使用Lua脚本来保证操作的原子性,例如在分布式锁中通常使用的就是Lua脚本,那么,神奇的Lua脚本真的能保证原子性吗?

简单的Lua脚本入门

在验证lua脚本的原子性之前,我们需要对它做一个简单的了解。redis从2.6版本开始支持执行lua脚本,它的功能和事务非常类似,一段lua脚本被视作一条命令执行,这样将多条redis命令写入lua,即可实现类似事务的执行结果。我们先看一下下面几个常用的命令。

EVAL 命令

最常用的EVAL用于执行一段脚本,它的命令的格式如下:

EVAL script numkeys key [key ...] arg [arg ...] 

简单解释一下其中的参数:

  • script是一段lua脚本程序
  • numkeys指定后续参数有几个key,如没有key则为0
  • key [key …]表示脚本中用到的redis中的键,在lua脚本中通过KEYS[i]的形式获取
  • arg [arg …]表示附加参数,在lua脚本中通过ARGV[i]获取

看一个简单的例子:

127.0.0.1:6379> eval "return {KEYS[1],KEYS[2],ARGV[1],ARGV[2]}" 2 key1 key2 value1 vauel2
1) "key1"
2) "key2"
3) "value1"
4) "vauel2"

在上面的命令中,双引号中是lua脚本程序,后面的2表示存在两个key,分别是key1key2,之后的参数是附加参数value1value2

如果想要使用lua脚本执行set命令,可以写成这样:

127.0.0.1:6379> EVAL "redis.call('SET', KEYS[1], ARGV[1]);" 1 name Hydra
(nil)

这里使用了redis内置的lua函数redis.call来完成set命令,这里打印的执行结果nil是因为没有返回值,如果不习惯的话,其实我们可以在脚本中添加return 0;的返回语句。

SCRIPT LOAD 和 EVALSHA命令

这两个命令放在一起是因为它们一般成对使用。先看SCRIPT LOAD,它用于把脚本加载到缓存中,返回SHA1校验和,这时候只是缓存了命令,但是命令没有被马上执行,看一个例子:

127.0.0.1:6379> SCRIPT LOAD "return redis.call('GET', KEYS[1]);"
"228d85f44a89b14a5cdb768a29c4c4d907133f56"

这里返回了一个SHA1的校验和,接下来就可以使用EVALSHA来执行脚本了:

127.0.0.1:6379> EVALSHA "228d85f44a89b14a5cdb768a29c4c4d907133f56" 1 name
"Hydra"

这里使用这个SHA1值就相当于导入了上面缓存的命令,在之后再拼接numkeyskeyarg等参数,命令就能够正常执行了。

其他命令

使用SCRIPT EXISTS命令判断脚本是否被缓存:

127.0.0.1:6379> SCRIPT EXISTS 228d85f44a89b14a5cdb768a29c4c4d907133f56
1) (integer) 1

使用SCRIPT FLUSH命令清除redis中的lua脚本缓存:

127.0.0.1:6379> SCRIPT FLUSH
OK
127.0.0.1:6379> SCRIPT EXISTS 228d85f44a89b14a5cdb768a29c4c4d907133f56
1) (integer) 0

可以看到,执行了SCRIPT FLUSH后,再次通过SHA1值查看脚本时已经不存在。最后,还可以使用SCRIPT KILL命令杀死当前正在运行的 lua 脚本,但是只有当脚本没有执行写操作时才会生效。

从这些操作看来,lua脚本具有下面的优点:

  • 多次网络请求可以在一次请求中完成,减少网络开销,减少了网络延迟
  • 客户端发送的脚本会存在redis中,其他客户端可以复用这一脚本,而不需要再重复编码完成相同的逻辑

Java代码中使用lua脚本

在Java代码中可以使用Jedis中封装好的API来执行lua脚本,下面是一个使用Jedis执行lua脚本的例子:

public static void main(String[] args) {
    Jedis jedis = new Jedis("127.0.0.1", 6379);
    String script="redis.call('SET', KEYS[1], ARGV[1]);"
            +"return redis.call('GET', KEYS[1]);";
    List<String> keys= Arrays.asList("age");
    List<String> values= Arrays.asList("eighteen");
    Object result = jedis.eval(script, keys, values);
    System.out.println(result);
}

执行上面的代码,控制台打印了get命令返回的结果:

eighteen

简单的铺垫完成后,我们来看一下lua脚本究竟能否实现回滚级别的原子性。对上面的代码进行改造,插入一条运行错误的命令:

public static void main(String[] args) {
    Jedis jedis = new Jedis("127.0.0.1", 6379);
    String script="redis.call('SET', KEYS[1], ARGV[1]);"
            +"redis.call('INCR', KEYS[1]);"
            +"return redis.call('GET', KEYS[1]);";
    List<String> keys= Arrays.asList("age");
    List<String> values= Arrays.asList("eighteen");
    Object result = jedis.eval(script, keys, values);
    System.out.println(result);
}

查看执行结果:

再到客户端执行一下get命令:

127.0.0.1:6379> get age
"eighteen"

也就是说,虽然程序抛出了异常,但异常前的命令还是被正常的执行了且没有被回滚。再试试直接在redis客户端中运行这条指令:

127.0.0.1:6379> flushall
OK
127.0.0.1:6379> eval "redis.call('SET', KEYS[1], ARGV[1]);redis.call('INCR', KEYS[1]);return redis.call('GET', KEYS[1])" 1 age eight
(error) ERR Error running script (call to f_c2ea9d5c8f60735ecbedb47efd42c834554b9b3b): @user_script:1: ERR value is not an integer or out of range
127.0.0.1:6379> get age
"eight"

同样,错误之前的指令仍然没有被回滚,那么我们之前经常听说的Lua脚本保证原子性操作究竟是怎么回事呢?

其实,在redis中是使用的同一个lua解释器来执行所有命令,也就保证了当一段lua脚本在执行时,不会有其他脚本或redis命令同时执行,保证了操作不会被其他指令插入或打扰,实现的仅仅是这种程度上的原子性。

但是遗憾的是,如果脚本运行时出错并中途结束,之后的操作不会进行,但是之前已经发生的写操作不会撤销,所以即使使用了lua脚本,也不能实现类似数据库回滚的原子性。

本文基于redis 5.0.3 进行测试

官方文档相关说明:https://redis.io/topics/transactionsopen in new window