top后发现load average很高,网站几乎打不开了
如下图:
这是怎么回事呢 我该怎么办,本人对服务器不太懂,主要是做php开发
ringa_lee2017-04-10 16:06:07
man uptime可见:
load average指的是处于task_running或task_uninterruptible状态的进程(或线程)数的平均值.
处于task_running状态的进程(或线程),可能正在使用CPU或排队等待使用CPU.
处于task_uninterruptible状态的进程(或线程),可能正在等待I/O,比如等待磁盘I/O.
183 116 82 这三个值分别指的是在过去1分钟,5分钟,15分钟的load average.
拿183来说,就是在过去1分钟,平均有183个任务(进程或线程)处于running或uninterruptible状态.
我的Xubuntu14.04桌面,总共的任务数(进程或线程)才189个,而你的服务器居然有4355个.而且在过去1分钟平均有183个处于运行或不可中断状态,而我的电脑这个平均值小于1.
另外你的13.6 wa这个值也比较高,这个值的含义是I/O等待占用的CPU时间百分比,也就是I/O等待占用了13.6%的CPU资源.
32.5 sy为内核空间占用CPU时间百分比为32.5%,而4.8 us用户空间程序占用CPU时间百分比却只有4.8%,这点也不正常.
建议用atop -d(按t刷新)或iotop找出哪些进程正在读写磁盘,如果是PHP,那就把PHP的进程数调低,可以尝试调为2倍CPU核心数(nproc).因为当CPU和磁盘都忙不过来的时候,开再多的进程也没有任何意义,只会徒增CPU上下文切换和磁盘I/O等待,得不偿失.
高洛峰2017-04-10 16:06:07
你把信息写的具体一点,这样没法回答的
可以使用以下利器
ps -aux | sar -P ALL 1 100 | top | strace -p pid | iowait | gdb
这样方便找出原因的