运维 Ruby 会间歇式大姨妈么?

cassiuschen · 2013年12月29日 · 最后由 ruohanc 回复于 2013年12月30日 · 3149 次阅读

最近用户总是反应说网站登不上去,说打不开…我每次测试都是好好的,就没管…今天自己用的时候突然就服务器没响应了,以为是服务器挂了,结果上面的所有静态站都没问题,rails 的全挂了…不知道为啥…查 Log 也没发现什么问题…服务器上 rails 的有用 puma 跑的有用 unicorn 跑的,同时挂…约两分多种后自己恢复正常了……不知道别人遇到过这个问题没有……莫非与新的 RUBY_GC 有关?

ubuntu 12.04.3LTS + nginx + ruby2.1.0p0 5G 内存…挂的时候使用量大概 4.4G…我觉得应该和内存没关系…

楼主有设置过什么定时重启 Rails 服务器的 Cron 吗?

2 楼 已删除

是不是服务器上设有啥监控,进程内存使用超过一定大小就被杀什么的

可以监控内存看看有没有内存颠簸,反应太大基本上都会大姨妈 (可能是代码的问题), 可以尝试 hot restart.

你可能需要 newrelic 的监控,收集一下系统的数据,不知道你那里是不是云主机。

你降级到 2.0 试试看,用来排除一下是否是最新 Ruby 解释器的问题

2.1 不能用。。。。我这里也产生崩溃过好几次 就是 GC 的问题,正确来说不是 GC 本身功能的问题 可能 GC 优化引入的新 BUG,因为我有一次是单进程任务 2w 次循环左右,内存使用能在 top 下直接用肉眼看到往上彪 而且远远大于每次循环应该带来的数据大小

2.1-p0 内存泄漏的。

#7 楼 @azhao
#8 楼 @sevk

发现 BUG,有没报到官方去啊?

#3 楼 @aptx4869 这道没有……但可能是内存的 bug…想不通 unicorn 怎么这么耗内存?

#5 楼 @jimrokliu 不是云…物理主机 hyper-V 里的

#6 楼 @kgen 目前还没发现类似问题…

#7 楼 @azhao 看来现象和你这个类似…

想运维好一个 app,监控不能落下啊

需要 登录 后方可回复, 如果你还没有账号请 注册新账号