Rumah  >  Artikel  >  Tutorial sistem  >  Analisis metrik penggunaan CPU!

Analisis metrik penggunaan CPU!

WBOY
WBOYasal
2024-06-01 21:18:08485semak imbas

Betul, apa yang saya bincangkan di sini ialah metrik "%CPU" yang semua orang gunakan di mana-mana, dalam setiap produk pemantauan prestasi. Gunakan arahan atas(1) untuk melihatnya.
Anda mungkin fikir 90% penggunaan CPU bermakna:
Analisis metrik penggunaan CPU!
Dan sebenarnya ia mungkin bermaksud:
Analisis metrik penggunaan CPU!
Terhenti bermakna pemproses tidak membuat kemajuan dalam arahan pemprosesan, biasanya kerana pemproses sedang menunggu input/output memori. Nisbah yang saya lukis di atas (antara sibuk dan tersekat) ialah perkara yang sering saya lihat dalam persekitaran pengeluaran sebenar. Ada kemungkinan bahawa anda pada dasarnya buntu dan tidak mengetahuinya.

Apakah maksud ini kepada anda? Mengetahui berapa banyak CPU anda terhenti boleh membimbing usaha penalaan prestasi antara mengurangkan kod atau mengurangkan I/O memori. Sesiapa sahaja yang mengambil berat tentang prestasi CPU, terutamanya dalam awan yang menskalakan sumber secara automatik berdasarkan CPU, akan mendapat manfaat daripada mengetahui di mana %CPU terhenti.

Apakah penggunaan CPU sebenarnya?

Ukuran yang kami panggil penggunaan CPU sebenarnya ialah "masa tidak terbiar": iaitu masa CPU tidak menjalankan benang terbiar. Kernel sistem pengendalian anda (walau apa pun) biasanya menjejaki metrik ini semasa penukaran konteks. Jika proses tidak melahu mula berjalan dan kemudian berhenti selama 100 milisaat, kernel masih menganggap CPU sedang digunakan untuk keseluruhan tempoh tersebut.

Metrik ini setua sistem perkongsian masa. Komputer panduan Apollo Lunar Module, sistem perkongsian masa perintis, memanggil benang terbiarnya "DUMMY JOB" Jurutera menjejaki kitaran yang diperlukan untuk menjalankan benang melahu berbanding kitaran yang diperlukan untuk menjalankan tugas sebenar sebagai ukuran komputer. Penunjuk penting penggunaan.

Jadi apa yang salah dengan penunjuk ini?

Kini, CPU telah menjadi lebih pantas daripada memori utama, dan memori menunggu menyumbang sebahagian besar daripada apa yang masih dipanggil "penggunaan CPU". Jika anda melihat nombor %CPU yang tinggi, anda mungkin berfikir bahawa pemproses adalah kesesakan (iaitu pakej CPU di bawah heatsink dan kipas), sedangkan modul DRAM itu sebenarnya adalah kesesakan.

Keadaan dalam hal ini semakin serius. Untuk masa yang lama, pengeluar pemproses telah meningkatkan kelajuan jam lebih daripada DRAM telah meningkatkan kependaman akses Ini adalah apa yang dipanggil "CPU DRAM gap" (CPU DRAM gap). Keadaan ini stabil sekitar tahun 2005, apabila pemproses 3 GHz diperkenalkan sejak itu, pemproses telah menggunakan lebih banyak teras dan hyper-threading untuk meningkatkan prestasi, dan menggunakan konfigurasi berbilang soket, yang kesemuanya telah meletakkan permintaan yang lebih tinggi pada subsistem memori. Pengeluar pemproses cuba mengurangkan kesesakan memori ini dengan menggunakan cache CPU yang lebih besar dan lebih pintar serta bas memori yang lebih pantas dan teknologi antara sambungan. Tetapi kita secara amnya masih buntu.

Bagaimana untuk menunjukkan apa yang sebenarnya sedang diproses oleh CPU?

Boleh juga menggunakan Kaunter Pemantauan Prestasi (PMC): Ini ialah kaunter perkakasan yang boleh dibaca menggunakan Linux perf dan alatan lain. Contohnya, mengukur keseluruhan sistem selama 10 saat:

# perf stat -a — sleep 10
Performance counter stats for ‘system wide’:
641398.723351      task-clock (msec)         #  64.116 CPUs utilized         (100.00%)
379,651      context-switches          #    0.592 K/sec                 (100.00%)
51,546      cpu-migrations           #    0.080 K/sec                 (100.00%)
13,423,039       page-faults              #    0.021 M/sec
1,433,972,173,374      cycles                  #    2.236 GHz                  (75.02%)
<not>      stalled-cycles-frontend
<not>      stalled-cycles-backend
1,118,336,816,068      instructions              #    0.78  insns per cycle          (75.01%)
249,644,142,804       branches               #   389.218 M/sec                (75.01%)
7,791,449,769       branch-misses            #  3.12% of all branches          (75.01%)
10.003794539 seconds time elapsed</not></not>

Metrik utama di sini ialah arahan setiap kitaran (iaitu IPC), yang menunjukkan bilangan arahan yang kami lengkapkan secara purata bagi setiap kitaran jam CPU. Ringkasnya, lebih tinggi nilai, lebih baik. 0.78 dalam contoh di atas kedengaran bagus (sibuk 78% masa); tetapi tidak apabila anda menyedari bahawa IPC pada kelajuan tertinggi pemproses ialah 4.0. Ini juga dipanggil 4-lebar, yang merujuk kepada laluan pengambilan/nyahkod arahan. Ini bermakna CPU boleh berhenti (melengkapkan) empat arahan setiap kitaran jam. Jadi, IPC 0.78 pada sistem 4 lebar bermakna CPU berjalan pada 19.5% daripada kelajuan maksimumnya. Pemproses Intel Skylake baharu adalah 5-lebar.

Terdapat ratusan lagi PMC yang boleh anda gunakan untuk menyelidiki lebih lanjut: anda boleh terus mengukur tempoh bertakung mengikut jenis yang berbeza.

Di awan

如果你在虚拟环境中,可能无法访问PMC,这要看虚拟机管理程序是否为访客(guest)支持PMC。我最近写过一篇文章:《EC2的PMC:测量IPC》,表明了如今PMC如何可用于基于Xen的AWS EC2云上面的专用主机类型。

实际对策

如果你的IPC

如果你的IPC > 1.0,你可能是指令密集型。想方设法减少代码执行:消除不必要的工作和缓存操作等。CPU火焰图是一款很适合开展这项调查的工具。至于硬件调优,不妨试一试更快的时钟频率和数量更多的核心/超线程。

性能监测产品应该能告诉你什么?

每一款性能工具应该显示IPC以及%CPU。或者将%CPU分解成指令完成周期与停滞周期,比如%INS和%STL。

面向Linux的tiptop(1)可按进程显示IPC:

tiptop –                 [root]
Tasks: 96 total,    3 displayed                                 screen   0: default
 
PID [ %CPU] %SYS  P   Mcycle   Minstr  IPC %MISS %BMIS  %BUS COMMAND
3897   35.3   28.5    4   274.06   178.23 0.65   0.06  0.00   0.0     java
1319+   5.5    2.6   6    87.32   125.55 1.44   0.34  0.26  0.0    nm-applet
900    0.9  0.0    6    25.91    55.55 2.14   0.12  0.21     0.0     dbus-daemo
CPU使用率具有误导性的其他理由

让CPU使用率具有误导性的不仅仅是内存停滞周期。其他因素包括如下:

  • 温度过高导致处理器停滞。
  • 睿频加速(Turboboost)导致时钟频率不一。
  • 内核因speedstep导致时钟频率不一。
  • 平均值方面的问题:1分钟内的使用率为80%,隐藏了100%的突发使用率。
  • 自旋锁:CPU被使用,有很高的IPC,但是应用程序在处理指令方面没有合理的进展。
结束语

CPU使用率已成为一个极具误导性的度量指标:它包括了等待主内存的周期,而这类周期在现代工作负载中占了大头。如果使用额外的度量指标,你就能搞清楚%CPU到底意味着什么,包括每个周期指令(IPC)。IPC 1.0可能意味着指令密集型。我在之前的一篇文章中介绍了IPC,包括介绍了衡量IPC所需要的性能监控计数器(PMC)。 显示%CPU的性能监控产品还应该显示PMC度量指标,解释那个值意味着什么,那样才不会误导最终用户。比如说,它们可以一并显示%CPU及IPC,以及/或指令完成周期与停滞周期。有了这些度量指标,开发人员和操作人员才能决定如何才能更好地调优应用程序和系统。

Atas ialah kandungan terperinci Analisis metrik penggunaan CPU!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel sebelumnya:Pengenalan arahan masa aktifArtikel seterusnya:Pengenalan arahan masa aktif