最近几个月一直在搞 Agent,试了一圈下来,感觉 Ruby 在这个场景可能比大家想的要合适。
之前以为做 Agent 会很复杂,实际做下来发现,基本就是在调 API 和写业务逻辑。模型不用自己训练,算法也不用优化。真正要写的代码就是:调 LLM、处理数据、让 Agent 操作各种工具。说白了,这活儿考验的是语言表达力和开发效率,不是性能。
调 API 很舒服 - ruby-openai
接 GPT,anthropic
接 Claude,代码写起来很直接。配合 httparty
或 faraday
调其他 API 也不用折腾。
工具集成特别方便 - Agent 得能干活,处理文件用 fileutils
、csv
、nokogiri
,操作数据用 json
、sequel
,跑定时任务用 sidekiq
、whenever
,网络操作用 net/http
、open-uri
。这些要么是标准库,要么是成熟的 gem,直接用就行。
代码写起来顺 - Agent 的逻辑就是"听懂用户 → 找工具 → 整合结果"。Ruby 写这种流程特别自然,调整也快。
让不太懂技术的同事试着写简单 Agent(自动整理文件、定时发邮件),用 Ruby 的明显上手快。装个 ruby-openai
,用用 fileutils
和 net/smtp
,看着文档改改例子就能跑起来。这些库的文档写得都挺人话的,不是程序员也能看明白个大概。
要搞复杂 RAG、大规模向量检索,Python 生态肯定更全。但大部分 Agent 就是"调 LLM + 操作文件/数据/网络"。Ruby 的工具链对这些支持得挺好,写起来也顺手。现在 AI 都在卷框架、卷复杂度,但做 Agent 这事儿,简单快速才是最重要的。Ruby 的工具链其实已经挺完善了。