如何快速分析出现性能问题的Linux服务器(4)

日期：2020-06-08 栏目：程序人生浏览：次

# top
Tasks: 79 total, 2 running, 77 sleeping, 0 stopped, 0 zombie %Cpu(s): 6.0 us, 44.1 sy, 0.0 ni, 49.6 id, 0.0 wa, 0.0 hi, 0.3 si, 0.0 st KiB Mem : 8010456 total, 7326348 free, 132296 used, 551812 buff/cache KiB Swap: 0 total, 0 free, 0 used. 7625940 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 4617 root 20 0 44064 2076 1544 R 100.0 0.0 16:27.23 nc 13634 nginx 20 0 121192 3864 1208 S 0.3 0.0 17:59.85 nginx 1 root 20 0 125372 3740 2428 S 0.0 0.0 6:11.53 systemd 2 root 20 0 0 0 0 S 0.0 0.0 0:00.60 kthreadd 3 root 20 0 0 0 0 S 0.0 0.0 0:17.92 ksoftirqd/0 5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H 7 root rt 0 0 0 0 S 0.0 0.0 0:03.21 migration/0 8 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcu_bh 9 root 20 0 0 0 0 S 0.0 0.0 31:47.62 rcu_sched 10 root rt 0 0 0 0 S 0.0 0.0 0:10.00 watchdog/0

top是一个常用的命令，包括了多方面的指标。缺点是没有滚动输出(rolling output)，不可复现问题发生时不容易保留信息。对于信息保留，用vmstat或者pidstat等能够提供滚动输出的工具会更好。

示例的问题？

在上面利用工具排查的过程中，我们可以在非常短的时间内快速得到如下结论：

2个CPU，nc这个进程消耗了CPU 1 100%的时间，并且时间消耗在system内核态。其他进程基本没有在消耗CPU。

内存free比较少，大部分在cache中 (并不是问题)。

Disk I/O非常低，平均读写请求小于1个。

收到报文在个位数KB/s级别，每秒有15个被动建立的TCP连接，没有明显异常。

整个排查过程把系统的问题定位到了进程级别，并且排除一些可能性 (Disk I/O和内存)。接下来就是进一步到进程级别的排查，不属于本文的覆盖范围。

Linux公社的RSS地址：https://www.linuxidc.com/rssFeed.aspx

转载注明出处：https://www.heiqu.com/23ae1d0ee6f72b70750146e40daf0154.html

如何快速分析出现性能问题的Linux服务器(4)

相关推荐