核心结论:HPA(Horizontal Pod Autoscaler)生产环境假死,本质是“指标采集异常、HPA配置冲突或控制器调度阻塞”,处理需按“快速恢复业务→定位根因→彻底修复”推进,以下结合真实案例拆解。 一、案例背景 环境:K8s 1.24,HPA基于CPU利用率(80%阈值)弹性伸缩,控
首先需明确 “谁在消耗 CPU”,常用工具如下: top命令(实时监控,最常用) 执行top后,按P键按 CPU 使用率排序,重点关注: PID:进程 ID %CPU:进程占用 CPU 的百分比(超过 100% 可能是多线程进程,如 Java 服务) COMMAND:进程名称(如java、mysql