CPU 跑满,服务响应变慢甚至宕机 服务器 CPU 使用率突然飙升到 100% 是运维中非常常见的紧急情况。症状通常是:网站响应极慢甚至无法访问,SSH 登录也变得迟钝,服务器负载居高不下。 导致 CPU 跑满的原因多种多样:流量突增、死循环 Bug、CC 攻击、定时任务同时触发、MySQL 慢查询、内存不足触发频繁 swap 交换等。 本文提供一套系统化的排查流程,帮你在最短时间内定位 CPU 占用根因,并给出对应的优化方案。 一、第一步:快速确认 CPU 使用情况 使用 top 命令实时查看 top top 界面关键信息解读: load average:系统平均负载,三个数字分别代表过去 1 分钟、5 分钟、15 分钟的平均负载。负载值超过 CPU 核心数说明系统过载(如 4 核服务器负载超过 4.0 就需要关注) %Cpu(s):CPU 各类使用率分布,重点关注 us(用户态)和 sy(内核态) 进程列表:按 CPU 使用率降序排列,第一行就是当前 CPU 占用最高的进程 在 top 界面中,按 1 可以查看每个 CPU […]