Ruby 使用 Rails 8 提供的默认任务队列 Solid Queue

1 Solid Queue 简介

Solid Queue 是 Active Job 的一个基于数据库的队列后端,设计时考虑到了简单性和性能。


可与 SQL 数据库(如 MySQL、PostgreSQL 或 SQLite)一起使用,它利用 FOR UPDATE SKIP LOCKED子句(如果有的话)来避免轮询作业时的阻塞和锁等待。它依赖 Active Job 进行重试、丢弃、错误处理、序列化或延迟执行,并与 Ruby on Rails 的多线程兼容。

除了常规的作业排队和处理外,Solid Queue 还支持延迟作业、并发控制、重复作业、暂停队列、每个作业的数字优先级、队列顺序优先级和批量排队(enqueue_all for Active Job's perform_all_later)。

这概念是否似曾相识,与Unix的进程控制很像?!通过在命令后加上`&`将任务传送至后台,在通过`jobs -l`查看后台任务队列,并且可以通过
`bg`和`fg`实现前后台操作。只不过在这里的Rails的Active Job 将其封装为一个线程,与操作系统的进程接口交互。


2 环境安装和启动任务队列

Solid Queue 将 :solid_queue 适配器设置为生产环境中 Active Job 的默认适配器,并连接到 queue 数据库进行写入。在开发环境中使用生产环境变量:

export RAILS_ENV=production
rails db:prepare
bin/jobs start

为啥要用生产环境?因为 Rails 官方没有准备测试和开发环境,似乎也没有必要。执行rails db:prepare后会创建 solid_queue 需要的queue_schema和创建对应的数据库表。最后启动 jobs 后台任务。

此时在 db 文件夹会看到分别的schema文件:

$ \ls db/
cable_schema.rb  cache_schema.rb  queue_schema.rb  seeds.rb

Solid Queue对应的表在数据库中也建立起来:

3 创建和发布任务

3.1 创建作业

创建一个在特定队列 (bar_queue) 上运行的作业 (foo_job)。

rails generate job foo_job --queue bar_queue


class FooJob < ApplicationJob
  queue_as :bar_queue

  def perform(*args)
    # Do something later
    sleep(args[0])"slept #{args[0]} seconds job!")
    return true

3.2 让任务进入队列

rails c
# 创建1个等待1周执行的任务
FooJob.set(wait: 1.week).perform_later(1)

此时观察solid_queue_jobs表会生成 1 条记录:


其他更多用法 (例如:设置优先级、回调方法、批量任务入队、邮件任务等) 参考官方文档:

4 任务(jobs) 监控

关于任务队列的监控,目前一种解决方案是通过查询 queue 数据库的finished_atscheduled_at 字段,这将包括在队列中等待的时间。参考:

同时对任务队列的监控也提供一个 GUI:

gem "propshaft"
$ bundle install
RAILS_ENV=production rails assets:precompile
RAILS_ENV=production bin/rails mission_control:jobs:authentication:configure
RAILS_ENV=production rails s

5 关于性能扩展数据库分片

任务队列的本质是不断的轮询数据库和少量写入,随着队列任务增多,数据库读的压力会骤增,简单对机器进行垂直扩展(CPU RAM) 起不到本质改变,需要水平扩展数据库分片(shard),从而提升“读”(轮询)效率。 目前 Solid Queue 还没完备支持。不过已经有 Issue 在追踪此问题,作者也将其列为高优先级。

我一直没搞懂,为啥要用 Redis 作为异步队列的存储。

我一直认为,除了缓存,使用 redis 都不是一个严肃的事情。

因爲以前的硬盤太慢,傳統 SQL 數據庫做輪詢效率不如基於 RAM 的數據庫 Redis,Redis 也提供持久化。現在的硬盤性能起來了,用 SQL 數據庫速度和用 Redis 差不多,而且可以簡化架構。

由於硬盤性能起來了,緩存和 cable 的數據都可以用 SQL 數據庫了。

我想说的是,Redis 虽然用在缓存挺合适的,用在异步队列,除非大家不在意丢偶尔会丢。

Before I go into the details of Redlock, let me say that I quite like Redis, and I have successfully used it in production in the past. I think it’s a good fit in situations where you want to share some transient, approximate, fast-changing data between servers, and where it’s not a big deal if you occasionally lose that data for whatever reason.

不用 ENV=production. 可以配置 development 运行的,把 production 的东西 copy 过来就行了。具体:

我们几年前就用 Redis 做异步队列了,胜在简单,也没啥大问题。

Reply to cooper

其实 solid queue 更简单(包括部署),而且还可控、可查询。

redis 作者对这篇文章有回复的,也写的有些道理,有兴趣可以自己找着看

Martin Kleppmann 的回复。

Update 9 Feb 2016: Salvatore, the original author of Redlock, has posted a rebuttal to this article (see also HN discussion). He makes some good points, but I stand by my conclusions. I may elaborate in a follow-up post if I have time, but please form your own opinions – and please consult the references below, many of which have received rigorous academic peer review (unlike either of our blog posts).

He makes some good points, but I stand by my conclusions. 说明没办法说服 Martin Kleppmann。Martin 说有时间会回复,但并没有,有可能说明这些 good points 并不值得在写一篇东西。

我也完全同意 Martin 这句 please form your own opinions – and please consult the references below。

对的,要根据场景自己确定怎么应用,比如 redis 的 redlock 选择不占着卡死进程而是超时释放,代码逻辑就要兜底处理这个 lock 被释放时的处理。

