首頁  >  文章  >  運維  >  linux perf是什麼?怎麼用? (使用總結)

linux perf是什麼?怎麼用? (使用總結)

藏色散人
藏色散人轉載
2021-11-05 17:50:457241瀏覽

以下由linux系統教學專欄為大家介紹總結關於linux perf的使用方法,希望對需要的朋友有幫助!

簡介

perf是linux系統中提供的效能分析工具,它基於一個叫做「Performance counters」的核心子系統實現,同時支援硬體(CPU、 PMU(Performance Monitoring Unit))與軟體(軟體計數器、tracepoint)層面的效能分析。

perf中的事件

perf與其他效能調優工具一樣,都是透過對監測物件進行取樣,根據取樣點的分佈來推斷整個程式的行為。透過perf list指令我們可以看到perf支援很多的取樣事件,像是branch-misses、cpu-clock等等。 perf中預先定義的事件屬於不同的類型,例如硬體產生的事件(cache 命中/分支miss)和軟體產生的事件(context switch/page fault)等等。

tracepoint

tracepoint是linux核心中定義的一些hook,如果被開啟,它們就會在執行到特定邏輯時被觸發,方便其他工具取得系統內部的運作狀態等訊息,perf就是利用了tracepoint,它會記錄和統計tracepoint的各個事件,產生分析報告。

使用方式

perf 工具的具體使用方式如下:

perf [--version] [--help] COMMAND [ARGS]

其中的COMMAND清單可以透過執行perf --help查看,以下列舉幾個常用的command。

perf stat

perf stat的作用是執行一個命令並收集其運行過程中的各個數據,它可以提供一個程式運行情況的總體概覽。例如:

user@localhost:~$ perf stat hostname
localhost
 Performance counter stats for 'hostname':
          0.313464      task-clock (msec)         #    0.481 CPUs utilized          
                 2      context-switches          #    0.006 M/sec                  
                 0      cpu-migrations            #    0.000 K/sec                  
               153      page-faults               #    0.488 M/sec                  
           896,723      cycles                    #    2.861 GHz                    
           620,709      instructions              #    0.69  insn per cycle         
           121,143      branches                  #  386.465 M/sec                  
             6,247      branch-misses             #    5.16% of all branches        
       0.000651441 seconds time elapsed

上面這個例子,透過perf stat運行了hostname命令,並將其運行過程中的一些指標匯總顯示了出來,例如task-clock、context-switches等待。預設情況下,perf stat 會輸出幾個常用的事件的統計,例如:

task-clock-msecs:cpu 使用率
context-switches:进程切换次数
page-faults:发生缺页的次数
cpu-migrations:表示进程运行过程中发生了多少次CPU迁移,即被调度器从一个CPU转移到另外一个CPU上运行
cycles:处理器时钟,一条机器指令可能需要多个cycles
instructions: 机器指令数目
branches:遇到的分支指令数
branch-misses是预测错误的分支指令数

除此之外,我們可以使用-e參數來指定我們感興趣的事件,例如:

user@localhost:~$ perf stat -e cache-misses hostname
localhost
 Performance counter stats for 'hostname':
          682      cache-misses                                                
       0.000646676 seconds time elapsed

perf top

perf top的作用是即時顯示系統目前的效能統計資訊。前面的perf stat用來對一個特定的程式進行分析,而某些時候我們可能不知道是哪個程式影響了系統效能,這時候就可以用perf top來找出可疑的程式。例如:

Samples: 775  of event 'cpu-clock', Event count (approx.): 92931021
Overhead  Shared Object       Symbol
   8.93%  [kernel]            [k] vsnprintf
   7.73%  perf                [.] rb_next
   5.92%  [kernel]            [k] kallsyms_expand_symbol.clone.0
   5.07%  [kernel]            [k] format_decode
   4.59%  [kernel]            [k] number
   3.40%  perf                [.] symbols__insert
   3.03%  libslang.so.2.2.1   [.] SLtt_smart_puts

上面的範例顯示perf統計了cpu-clock事件的數據,根據比例進行了排序。和perf stat一樣,我們可以透過-e參數指定統計其他的事件,例如perf top -e context-switches可以查看進程切換最多的top N個進程。

perf record & perf report

perf record的作用和perf stat類似,它可以運行一個命令並產生統計信息,不過perf record不會將結果顯示出來,而是將結果輸出到文件中。 perf record產生的檔案可以用perf report來進行解析。

perf record也可以透過-g參數,在分析時產生calling graph,幫助定位更上層的邏輯分佈。

其他

透過例子我們可以發現,perf的分析結果中的Symbol一列顯示的都是c語言函數的名字。對於java來說,jit編譯產生的函數就會直接顯示在symbol裡,而不是java的函數名,這時要定位問題就不是那麼容易了,我們需要透過額外的手段將symbol和java程式的符號表對應起來,具體後續再討論了。

推薦學習:《linux影片教學

以上是linux perf是什麼?怎麼用? (使用總結)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:juejin.im。如有侵權,請聯絡admin@php.cn刪除