Linux 服务器自动监控并报警.

lb563 · 2013年05月17日 · 最后由 terrywang 回复于 2013年07月03日 · 4999 次阅读

想监控服务器的服务异常. 当服务器上的服务异常退出时,发送短信到开发人员人手上. 然后处理异常. 有没有什么比较好又比较廉价的方案来做这件事呢? 各位大牛推荐推荐吧.

好像有好多监控软件啊 ruby 的有 god

不清楚有啥可以直接发短信,我在用 monit,可以发送邮件报警,也可以预设条件各种 io 啊 cpu 啊内存占用啊啥的,触发后可以设定执行动作 配置文件已经非常像 DSL 了

#3 楼 @ShiningRay 话说 new relic 得收费才能有异常处理之类的功能吧,免费只能监测 报警

#5 楼 @jasl 就是错误么?现在已经有报错信息收集的了,就是收费可以看到比较长时间的,以及可以看到比较详细的 sql 之类的东西

#6 楼 @ShiningRay 我现在用 new relic 就是观测服务器和 rails app 的运行状态,airbrake 来做运行时异常的报警 monit 或者 god 这样的工具可以设置一些阀值,触发之后触发对应的动作,比如 cpu 超过多少就重启进程之类的,提高可用性,貌似免费版的 new relic 没提供这种功能

#8 楼 @jasl 对的,我也差不多,不过 airbrake 我已经不用了,用 newrelic 自带的错误报警,而且装了 newrelic 的应用,有报警推送的,可以设置阈值 难道是因为我用的时间比较久已经变成 vip 了?

#9 楼 @ShiningRay 没花钱么...回头我去看看...

#10 楼 @jasl 手机 app 有推送

#11 楼 @ShiningRay 唔。。。那我大 WinPhone 党无缘了...

報警可以使用 nagios, 提醒可以使用 郵件,短信 (飛信,139 郵箱), IM, 微信等很多方式...

有时候感觉短信不是必须的啦,开着邮箱和 3g,来邮件一样会叫

#1 楼 @hooopo #7 楼 @kgen
采用了 god,很不错的东西.

简单的解决方案是 monit 非常轻量级。最好用 APS - New Relic 监控宝之类的,比较靠谱。

需要 登录 后方可回复, 如果你还没有账号请 注册新账号