分享探讨如何统计 Ruby 应用服务器使用内存方法

rubyist518 · 2015年10月14日 · 最后由 rubyist518 回复于 2015年10月14日 · 2852 次阅读

最近在解决探针获取 Ruby 应用服务器的内存使用的情况，将解决的思路总结一下，希望对此感兴趣的伙伴一起探讨。

先对比应用服务器：Puma和Passenger，下面对比这 2 个服务器内存统计，

Puma (2.13.4)

单进程模式：直接获取进程 id: Process.pid

memory = `ps -o rss= #{Process.pid}`.to_f / 1024 #单位:MB

cluster 模式：以启动 2 个 worker 进程为例: Puma cluster 从上面截图可以看到，Puma 启动后会出现 3 个进程：1 个 master 进程和 2 个 worker 进程。内存的使用情况 (见RSS列):

(109908 + 109868 + 7256 ).to_f / 1024 = 221.7109375 #单位:MB

而对于探针来说，一个探针实例是伴随进程一起启动的，也就说一个探针只能识别自己所在的进程 id，那如何获取应用服务器使用的内存？我们用其中 1 个 woker 进程所在的进程组 [PGID] 看一下:(为啥不是父进程？, 见下文 Passenger) puma 2 这 3 个进程都在相同的进程组里，而且进程组号为 master 的进程 id，那我们就可以用这个信息获取应用服务器的所使用的内存：

得到 1 个 worker 进程 id: Process.pid
获取所在进程组：Process.getpgrp
获取到进程组内所有的进程： ruby `ps -o pid,pgid -e | grep -w "#{pgrp_id}"`.split(/\s+/).uniq 4.累加进程组内进程内存和即为应用服务器使用内存： ruby pids.inject(0.0){|m, pid| m + memory(pid)} ## Passenger (5.0.20) 启动 Passenger 后的 Process 信息：对 Passenger 架构感兴趣的请移步到这儿. 查看一下 worker 所在进程组和父进程: 通过 PPID 可以看出 Passenger core —> Passenger AppPreloader —> Passenger RubyApp 三者为爷 - 父-子关系，当服务器请求量增大时AppPreloader会产生新的进程来响应请求，从而新的RubyApp进程的PPID即为AppPreloader的PID，这样看来就可以将同一个PPID的进程加起来得到应用服务器的内存？

由于 Passenger 会根据服务器的负载量动态调整进程数，当服务器请求量较小时，Passenger 会 kill 多余的进程，会出现下面的情况： pssenger 3

AppPreloader也被 Passenger 杀掉了。原RubyApp进程的PPID变成了 1。这时如果服务器的请求量增大，应用服务器进程会成为这样： passener 4

Passenger core 产生新的AppPreloader进程，并且AppPreloader产生新的RubyApp进程，这时如果只用PPID统计应用服务器内存就会不准确，所以要统计 Passenger 的使用的内存还得通过累加在同一个进程组 (PGID) 的所有进程使用的内存和得到。

由于Unicorn和Rainbows都与 Puma 的 cluster 模式 [master+worker 模式] 类似，内存统计的方式可以参考上文的 Puma。