CPU使用率度量指标的分析！-LINUX-PHP中文网

首页

系统教程

LINUX

CPU使用率度量指标的分析！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2024 pm 09:18 PM

linuxlinux教程红帽linux系统linux命令linux认证红帽linuxlinux视频

没错，我在这里所说的是每个人在到处使用的“%CPU”这个度量指标，用于每一款性能监控产品中。用top(1)命令来查看。
你可能认为90%的CPU使用率意味着：
CPU使用率度量指标的分析！
而实际上它可能意味着：

停滞（stalled）意味着处理器在处理指令方面没有进展，通常是由于处理器在等待内存输入/输出。我在上面划分的比例（忙碌和停滞之间）是我在实际的生产环境中经常看到的情形。你很可能基本上处于停滞状态，但浑然不知罢了。

这对你来说意味着什么呢？了解你的多少CPU处于停滞状态可以指导减少代码或减少内存输入/输出之间的性能调优工作。谁要是在关注CPU性能，尤其是在根据CPU自动扩展资源的云，如果知道%CPU中停滞的部分，那将大有益处。

CPU使用率其实是什么东东？

我们称为CPU使用率的衡量指标其实是“非闲置时间”（non-idle time）：也就是CPU未运行闲置线程的时间。你的操作系统内核（无论它是什么内核）通常在上下文切换过程中跟踪这个指标。如果非闲置进程开始运行，然后停止100毫秒，内核还是认为该CPU在那整段时间都被使用。

这个度量指标的历史与分时系统一样久远。Apollo Lunar Module制导计算机（一种开创性的分时系统）称其闲置线程为“DUMMY JOB”，工程师们跟踪了运行该闲置线程的周期和运行实际任务的周期，将这视作是一个衡量计算机使用率的重要指标。

那么这个指标哪里不对劲呢？

现如今，CPU的速度已变得比主内存快得多，等待内存在仍然所谓的“CPU使用率”中占了大头。如果你看到数值很高的%CPU，可能认为处理器是瓶颈（即散热片和风扇下面的CPU封装件），而实际上那些DRAM模组才是瓶颈。

这方面的情形一直变得越来越严峻。长期以来，处理器厂商提高时钟速度的幅度超过DRAM提高访问延迟的幅度，这就是所谓的“CPU DRAM缺口”（ CPU DRAM gap）。这种情形在3 GHz处理器面世的2005年前后趋稳；自那以后，处理器使用更多的核心和超线程来提升性能，另外使用多插座配置，这一切给内存子系统提出了更高的要求。处理器厂商试图采用更庞大、更智能的CPU缓存以及更快速的内存总线和互连技术来缓解这个内存瓶颈。但是我们仍然通常处于停滞状态。

如何表明CPU到底在处理什么？

不妨使用性能监控计数器（PMC）：这是使用Linux perf及其他工具可以读取的硬件计数器。比如说，将整个系统测量10秒钟：

# perf stat -a — sleep 10
Performance counter stats for ‘system wide’:
641398.723351      task-clock (msec)         #  64.116 CPUs utilized         (100.00%)
379,651      context-switches          #    0.592 K/sec                 (100.00%)
51,546      cpu-migrations           #    0.080 K/sec                 (100.00%)
13,423,039       page-faults              #    0.021 M/sec
1,433,972,173,374      cycles                  #    2.236 GHz                  (75.02%)
<not>      stalled-cycles-frontend
<not>      stalled-cycles-backend
1,118,336,816,068      instructions              #    0.78  insns per cycle          (75.01%)
249,644,142,804       branches               #   389.218 M/sec                (75.01%)
7,791,449,769       branch-misses            #  3.12% of all branches          (75.01%)
10.003794539 seconds time elapsed</not></not>

这里一个关键的度量指标是每个周期指令（即IPC），该度量指标显示了我们在每个CPU时钟周期平均完成了多少个指令。简单来说，这个值越高越好。上面例子中的0.78听起来不赖（78%的时间段处于忙碌状态）；但如果你意识到该处理器的最高速度下IPC是4.0，就不这么认为了。这又叫4-wide，是指指令取出/解码路径。这意味着，CPU每个时钟周期可以retire（完成）四个指令。所以，在4-wide系统上IPC为0.78，意味着CPU的运行速度是其最高速度的19.5%。新的英特尔Skylake处理器是5-wide。

你可以用来进一步钻研的PMC要多数百个：可以按不同的类型，直接测量停滞的周期。

在云端

如果你在虚拟环境中，可能无法访问PMC，这要看虚拟机管理程序是否为访客（guest）支持PMC。我最近写过一篇文章：《EC2的PMC：测量IPC》，表明了如今PMC如何可用于基于Xen的AWS EC2云上面的专用主机类型。

实际对策

如果你的IPC

如果你的IPC > 1.0，你可能是指令密集型。想方设法减少代码执行：消除不必要的工作和缓存操作等。CPU火焰图是一款很适合开展这项调查的工具。至于硬件调优，不妨试一试更快的时钟频率和数量更多的核心/超线程。

性能监测产品应该能告诉你什么？

每一款性能工具应该显示IPC以及%CPU。或者将%CPU分解成指令完成周期与停滞周期，比如%INS和%STL。

面向Linux的tiptop(1)可按进程显示IPC：

tiptop –                 [root]
Tasks: 96 total,    3 displayed                                 screen   0: default
 
PID [ %CPU] %SYS  P   Mcycle   Minstr  IPC %MISS %BMIS  %BUS COMMAND
3897   35.3   28.5    4   274.06   178.23 0.65   0.06  0.00   0.0     java
1319+   5.5    2.6   6    87.32   125.55 1.44   0.34  0.26  0.0    nm-applet
900    0.9  0.0    6    25.91    55.55 2.14   0.12  0.21     0.0     dbus-daemo

CPU使用率具有误导性的其他理由

让CPU使用率具有误导性的不仅仅是内存停滞周期。其他因素包括如下：

温度过高导致处理器停滞。
睿频加速（Turboboost）导致时钟频率不一。
内核因speedstep导致时钟频率不一。
平均值方面的问题：1分钟内的使用率为80%，隐藏了100%的突发使用率。
自旋锁：CPU被使用，有很高的IPC，但是应用程序在处理指令方面没有合理的进展。

结束语

CPU使用率已成为一个极具误导性的度量指标：它包括了等待主内存的周期，而这类周期在现代工作负载中占了大头。如果使用额外的度量指标，你就能搞清楚%CPU到底意味着什么，包括每个周期指令（IPC）。IPC 1.0可能意味着指令密集型。我在之前的一篇文章中介绍了IPC，包括介绍了衡量IPC所需要的性能监控计数器（PMC）。显示%CPU的性能监控产品还应该显示PMC度量指标，解释那个值意味着什么，那样才不会误导最终用户。比如说，它们可以一并显示%CPU及IPC，以及/或指令完成周期与停滞周期。有了这些度量指标，开发人员和操作人员才能决定如何才能更好地调优应用程序和系统。

以上是CPU使用率度量指标的分析！的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

XOJO 2025R1：具有Linux ARM支持，Web Drag和Direct App Store Publishing的开发人员的大更新Apr 25, 2025 am 09:50 AM

Linux软件的未来：Flatpak和Snap会替换本机桌面应用程序吗？Apr 25, 2025 am 09:10 AM

多年来，Linux软件分布依赖于DEB和RPM等本地格式，并深深地根深蒂固。但是，Flatpak和Snap已经出现，有望成为应用程序包装的通用方法。本文考试

Linux和Windows处理设备驱动程序的区别有什么区别？Apr 25, 2025 am 12:13 AM

Linux和Windows在处理设备驱动程序上的差异主要体现在驱动管理的灵活性和开发环境上。1.Linux采用模块化设计，驱动可以动态加载和卸载，开发者需深入理解内核机制。2.Windows依赖微软生态，驱动需通过WDK开发并签名认证，开发相对复杂但保证了系统的稳定性和安全性。

比较和对比Linux和Windows的安全模型。Apr 24, 2025 am 12:03 AM

Linux和Windows的安全模型各有优势。Linux提供灵活性和可定制性，通过用户权限、文件系统权限和SELinux/AppArmor实现安全。Windows则注重用户友好性，依赖WindowsDefender、UAC、防火墙和BitLocker保障安全。

Linux和Windows之间的硬件兼容性有何不同？Apr 23, 2025 am 12:15 AM

Linux和Windows在硬件兼容性上不同：Windows有广泛的驱动程序支持，Linux依赖社区和厂商。解决Linux兼容性问题可通过手动编译驱动，如克隆RTL8188EU驱动仓库、编译和安装；Windows用户需管理驱动程序以优化性能。

Linux和Windows之间虚拟化支持有哪些差异？Apr 22, 2025 pm 06:09 PM

Linux和Windows在虚拟化支持上的主要区别在于：1)Linux提供KVM和Xen，性能和灵活性突出，适合高定制环境；2)Windows通过Hyper-V支持虚拟化，界面友好，与Microsoft生态系统紧密集成，适合依赖Microsoft软件的企业。

Linux系统管理员的主要任务是什么？Apr 19, 2025 am 12:23 AM

Linux系统管理员的主要任务包括系统监控与性能调优、用户管理、软件包管理、安全管理与备份、故障排查与解决、性能优化与最佳实践。1.使用top、htop等工具监控系统性能，并进行调优。2.通过useradd等命令管理用户账户和权限。3.利用apt、yum管理软件包，确保系统更新和安全。4.配置防火墙、监控日志、进行数据备份以确保系统安全。5.通过日志分析和工具使用进行故障排查和解决。6.优化内核参数和应用配置，遵循最佳实践提升系统性能和稳定性。

很难学习Linux吗？Apr 18, 2025 am 12:23 AM

学习Linux并不难。1.Linux是一个开源操作系统，基于Unix，广泛应用于服务器、嵌入式系统和个人电脑。2.理解文件系统和权限管理是关键，文件系统是层次化的，权限包括读、写和执行。3.包管理系统如apt和dnf使得软件管理方便。4.进程管理通过ps和top命令实现。5.从基本命令如mkdir、cd、touch和nano开始学习，再尝试高级用法如shell脚本和文本处理。6.常见错误如权限问题可以通过sudo和chmod解决。7.性能优化建议包括使用htop监控资源、清理不必要文件和使用sy

See all articles