以下由linux系統教學專欄為大家介紹總結關於linux perf的使用方法,希望對需要的朋友有幫助!
簡介
perf是linux系統中提供的效能分析工具,它基於一個叫做「Performance counters」的核心子系統實現,同時支援硬體(CPU、 PMU(Performance Monitoring Unit))與軟體(軟體計數器、tracepoint)層面的效能分析。
perf中的事件
perf與其他效能調優工具一樣,都是透過對監測物件進行取樣,根據取樣點的分佈來推斷整個程式的行為。透過perf list指令我們可以看到perf支援很多的取樣事件,像是branch-misses、cpu-clock等等。 perf中預先定義的事件屬於不同的類型,例如硬體產生的事件(cache 命中/分支miss)和軟體產生的事件(context switch/page fault)等等。
tracepoint
tracepoint是linux核心中定義的一些hook,如果被開啟,它們就會在執行到特定邏輯時被觸發,方便其他工具取得系統內部的運作狀態等訊息,perf就是利用了tracepoint,它會記錄和統計tracepoint的各個事件,產生分析報告。
使用方式
perf 工具的具體使用方式如下:
perf [--version] [--help] COMMAND [ARGS]
其中的COMMAND清單可以透過執行perf --help查看,以下列舉幾個常用的command。
perf stat
perf stat的作用是執行一個命令並收集其運行過程中的各個數據,它可以提供一個程式運行情況的總體概覽。例如:
user@localhost:~$ perf stat hostname localhost Performance counter stats for 'hostname': 0.313464 task-clock (msec) # 0.481 CPUs utilized 2 context-switches # 0.006 M/sec 0 cpu-migrations # 0.000 K/sec 153 page-faults # 0.488 M/sec 896,723 cycles # 2.861 GHz 620,709 instructions # 0.69 insn per cycle 121,143 branches # 386.465 M/sec 6,247 branch-misses # 5.16% of all branches 0.000651441 seconds time elapsed
上面這個例子,透過perf stat運行了hostname命令,並將其運行過程中的一些指標匯總顯示了出來,例如task-clock、context-switches等待。預設情況下,perf stat 會輸出幾個常用的事件的統計,例如:
task-clock-msecs:cpu 使用率 context-switches:进程切换次数 page-faults:发生缺页的次数 cpu-migrations:表示进程运行过程中发生了多少次CPU迁移,即被调度器从一个CPU转移到另外一个CPU上运行 cycles:处理器时钟,一条机器指令可能需要多个cycles instructions: 机器指令数目 branches:遇到的分支指令数 branch-misses是预测错误的分支指令数
除此之外,我們可以使用-e參數來指定我們感興趣的事件,例如:
user@localhost:~$ perf stat -e cache-misses hostname localhost Performance counter stats for 'hostname': 682 cache-misses 0.000646676 seconds time elapsed
perf top
perf top的作用是即時顯示系統目前的效能統計資訊。前面的perf stat用來對一個特定的程式進行分析,而某些時候我們可能不知道是哪個程式影響了系統效能,這時候就可以用perf top來找出可疑的程式。例如:
Samples: 775 of event 'cpu-clock', Event count (approx.): 92931021 Overhead Shared Object Symbol 8.93% [kernel] [k] vsnprintf 7.73% perf [.] rb_next 5.92% [kernel] [k] kallsyms_expand_symbol.clone.0 5.07% [kernel] [k] format_decode 4.59% [kernel] [k] number 3.40% perf [.] symbols__insert 3.03% libslang.so.2.2.1 [.] SLtt_smart_puts
上面的範例顯示perf統計了cpu-clock事件的數據,根據比例進行了排序。和perf stat一樣,我們可以透過-e參數指定統計其他的事件,例如perf top -e context-switches可以查看進程切換最多的top N個進程。
perf record & perf report
perf record的作用和perf stat類似,它可以運行一個命令並產生統計信息,不過perf record不會將結果顯示出來,而是將結果輸出到文件中。 perf record產生的檔案可以用perf report來進行解析。
perf record也可以透過-g參數,在分析時產生calling graph,幫助定位更上層的邏輯分佈。
其他
透過例子我們可以發現,perf的分析結果中的Symbol一列顯示的都是c語言函數的名字。對於java來說,jit編譯產生的函數就會直接顯示在symbol裡,而不是java的函數名,這時要定位問題就不是那麼容易了,我們需要透過額外的手段將symbol和java程式的符號表對應起來,具體後續再討論了。
推薦學習:《linux影片教學》
以上是linux perf是什麼?怎麼用? (使用總結)的詳細內容。更多資訊請關注PHP中文網其他相關文章!