Skip to content

Performance checkpoints in Linux

硬件

  • BIOS设置:性能偏好,能源管理
  • CPU主频是否异常(和 BIOS 设置相关)
  • 网卡工作模式是否异常
  • 磁盘或 RAID/SAS 卡工作是否异常
  • 内存布局(带宽)

系统状态

  • CPU 占用率是否异常(User/Sys/Wait 等绝对值,比例等)
  • CPU 是否均衡
  • 内存使用比例
  • 是否有 swap,高 context switch,高 irq

系统设置

  • 网卡 IRQ 分配
  • 资源限制设置
  • NUMA
  • TCP 等网络参数设置,比如缓冲、拥塞控制算法、超时设置、listen queue len
  • 是否使用了对网络性能影响较大的特性:iptables(conntrack)、bridge、(userspace) tun

应用

  • 应用网络 IO 模型
  • 小流量 or 大流量业务。大流量业务要关注报文大小即 PPS 因素
  • 锁的使用模式
  • 对内存的使用方式决定了对内存的要求:data crunching (bandwidth), data transfer (latency)
  • 是否 syscall intensive
  • 是否大量的 userspace-kernel space copy
  • 是否大量的网络 round trip (也见网络部分)
  • 注:其实以上都是乘积效应的某种具体作用形式
  • 如果突发高,所需资源需要有更大的 headroom,70% or 50% 拇指定律
  • 是否有雪崩点,是否运行在雪崩点附近

网络

  • 网络路径是否存在链路质量问题,比如错包、拥塞引起丢包
  • 是否存在 incast (N-to-1) 通信模式
  • 是否存在速率不匹配 (10G-to-1G)
  • 延时是否对 N-trip 访问模式友好