现在的 Web 服务由于一些 bug,会导致服务宕掉

自动的 recover 中间件等只能处理当前 goroutine 中的 panic,如果每个 goroutine 都要 recover 处理下就太麻烦了,而且也不能有效排除后续维护人员的偷懒或失误

看了一些相关模块,没有太满意的,期望的是像 supervisor 的那样的功能,但是不想用 python 包,也想用更轻量级的方案。

求问大家是怎么解决的。
第 1 条附言  ·  255 天前
感谢各位的建议,目前生产环境不是 docker,这个方案不能用了。

go 版本的 supervisor 是我最初希望的答案,不过现在看来,systemd 才是正途。