CPU与外围

linux负载(平均数),掂量零碎忙碌水平指标。数值靠近于系统核心总数70%

均匀负载

均匀负载是指单位工夫内,零碎处于可运行状态和不可中断状态的均匀过程数,也就是均匀沉闷过程数

  • 如果cpu有两个外围,均匀负载为2.73,6.90.12.98
  • 过来1分钟内,有2.73/2 = 136%的超载
  • 当均匀负载高于cpu负载总数量70%的时候,应该剖析排查

    CPU密集型过程

    应用大量CPU会导致均匀负载升高,此时两者是统一的

    IO密集型过程

    期待I/O也会导致均匀负载身高,但cpu使用率不肯定很高

大量期待CPU的过程调度也会导致均匀负载升高,此时的CPU使用率也会比拟高

可运行状态:S R 占用cpu
不可中断状态:D 占用IO

stress

压力测试工具
模仿I/O压力,即不停地的执行sync()
stress --cpu 5 --timeout 100s #
stress --hdd &--hdd-bytes 1g #hd harkdisk发明过程读写
stress -io 1 --timeout 600s #--io 利用sync()测试600s
watch uptime #每两秒运行一次uptime命令

mpstat

CPU测试工具
查看cpu统计信息
-P ALL 1 #查看所有cpu使用率,一秒刷新一次
mpstat 1 10 #一秒更新一次,更新10次

pidstat

查看pid统计信息
-u 5 1 每5秒更新一组数据

iostat

查看io设施统计信息

日志故障排查流程(含日志)

  • w/uptime 查看负载、
  • ps aux/top查看cpu百分比
  • top查看具体是哪个过程,找出能够过程
  • 追踪这个过程应用状况
  • 查看对应日志
  • 系统日志:/var/log/messages(零碎通用日志)
  • /var/log/secure(用户登录状况)
  • 服务软件的日志