线上故障如何快速排查?

前几天凌晨2点,我又被监控报警给吵醒了。

服务器CPU飙到90%,但是top看了半天也找不到罪魁祸首。

这种时候,就得请出我们运维人员的两大法宝了——strace和ftrace。

说实话,刚开始接触这两个工具的时候,我也是一脸懵逼。

什么系统调用、内核跟踪,听起来就很高大上的样子。

但是用多了你就会发现,这玩意儿简直就是排查问题的神器!今天就跟大家分享一下我这些年用下来的一些心得。

先说说系统调用这个东西你可能会问,系统调用到…。

线上故障如何快速排查?


设计顾问在线 微信扫一扫关注我们 在线咨询