다음 칼럼에서는 linux system tutorial 칼럼에서 linux perf의 사용법을 소개하고 정리하겠습니다. 필요한 친구들에게 도움이 되었으면 좋겠습니다!
소개
perf는 Linux 시스템에서 제공되는 성능 분석 도구로 "성능 카운터"라는 커널 하위 시스템을 기반으로 구현되며 하드웨어(CPU, PMU(Performance Monitoring Unit))와 소프트웨어(소프트웨어 카운터)를 모두 지원합니다. ) , 추적점) 수준 성능 분석.
perf
perf의 이벤트는 다른 성능 조정 도구와 마찬가지로 모니터링 개체를 샘플링하고 샘플링 지점 분포를 기반으로 전체 프로그램의 동작을 추론합니다. perf list 명령을 통해 perf가 Branch-misses, CPU-clock 등과 같은 많은 샘플링 이벤트를 지원한다는 것을 알 수 있습니다. 성능에 사전 정의된 이벤트는 하드웨어 생성 이벤트(캐시 적중/분기 누락) 및 소프트웨어 생성 이벤트(컨텍스트 전환/페이지 오류) 등과 같은 다양한 유형에 속합니다.
tracepoint
tracepoint는 Linux 커널에 정의된 일부 후크입니다. 활성화되면 특정 논리가 실행될 때 트리거되어 Perf가 추적점을 사용하는 내부 실행 상태와 같은 정보를 쉽게 얻을 수 있습니다. , 다양한 추적점 이벤트를 기록 및 계산하고 분석 보고서를 생성합니다.
Usage
perf 도구의 구체적인 사용법은 다음과 같습니다.
perf [--version] [--help] COMMAND [ARGS]
COMMAND 목록은 perf --help를 실행하여 볼 수 있습니다.
perf stat
perf stat는 명령을 실행하고 작업 중에 다양한 데이터를 수집하는 데 사용되며 프로그램 실행 상태에 대한 전반적인 개요를 제공할 수 있습니다. 예:
user@localhost:~$ perf stat hostname localhost Performance counter stats for 'hostname': 0.313464 task-clock (msec) # 0.481 CPUs utilized 2 context-switches # 0.006 M/sec 0 cpu-migrations # 0.000 K/sec 153 page-faults # 0.488 M/sec 896,723 cycles # 2.861 GHz 620,709 instructions # 0.69 insn per cycle 121,143 branches # 386.465 M/sec 6,247 branch-misses # 5.16% of all branches 0.000651441 seconds time elapsed
위의 예에서 호스트 이름 명령은 perf stat를 통해 실행되었으며 작업 중 작업 시계, 컨텍스트 스위치 등과 같은 일부 표시기가 요약되어 표시되었습니다. 기본적으로 perf stat는 다음과 같이 일반적으로 사용되는 여러 이벤트의 통계를 출력합니다.
task-clock-msecs:cpu 使用率 context-switches:进程切换次数 page-faults:发生缺页的次数 cpu-migrations:表示进程运行过程中发生了多少次CPU迁移,即被调度器从一个CPU转移到另外一个CPU上运行 cycles:处理器时钟,一条机器指令可能需要多个cycles instructions: 机器指令数目 branches:遇到的分支指令数 branch-misses是预测错误的分支指令数
또한 -e 매개변수를 사용하여 다음과 같이 관심 있는 이벤트를 지정할 수 있습니다.
user@localhost:~$ perf stat -e cache-misses hostname localhost Performance counter stats for 'hostname': 682 cache-misses 0.000646676 seconds time elapsed
perf top
perf top은 시스템의 현재 성능 통계를 실시간으로 표시하는 데 사용됩니다. 이전 성능 통계는 특정 프로그램을 분석하는 데 사용되며, 때로는 어떤 프로그램이 시스템 성능에 영향을 미치는지 알 수 없을 수도 있습니다. 이때 성능 상단을 사용하여 의심스러운 프로그램을 찾을 수 있습니다. 예:
Samples: 775 of event 'cpu-clock', Event count (approx.): 92931021 Overhead Shared Object Symbol 8.93% [kernel] [k] vsnprintf 7.73% perf [.] rb_next 5.92% [kernel] [k] kallsyms_expand_symbol.clone.0 5.07% [kernel] [k] format_decode 4.59% [kernel] [k] number 3.40% perf [.] symbols__insert 3.03% libslang.so.2.2.1 [.] SLtt_smart_puts
위의 예에서는 perf가 CPU 시계 이벤트의 데이터를 계산하고 비율에 따라 정렬하는 것을 보여줍니다. perf stat와 마찬가지로 -e 매개변수를 통해 다른 이벤트의 통계를 지정할 수 있습니다. 예를 들어 perf top -e context-switches는 프로세스 스위치가 가장 많은 상위 N개 프로세스를 볼 수 있습니다.
perf 레코드 및 성능 보고서
perf 레코드는 명령을 실행하고 통계 정보를 생성할 수 있지만 perf 레코드는 결과를 표시하지 않고 결과를 파일로 출력합니다. 성능 기록에 의해 생성된 파일은 성능 보고서를 통해 구문 분석될 수 있습니다.
perf 레코드는 -g 매개변수를 사용하여 분석 중에 호출 그래프를 생성하여 더 높은 수준의 논리적 분포를 찾는 데 도움을 줄 수도 있습니다.
Others
예를 통해 성능 분석 결과의 Symbol 열에 C 언어 함수의 이름이 표시되는 것을 확인할 수 있습니다. Java의 경우 JIT 컴파일로 생성된 함수가 Java의 함수 이름 대신 기호에 직접 표시됩니다. 이때 기호를 기호와 결합하는 방법을 추가로 사용해야 합니다. Java 프로그램의 기호 테이블에 대해서는 나중에 자세히 설명합니다.
추천 학습: "linux 비디오 튜토리얼"
위 내용은 리눅스 성능이란 무엇입니까? 그것을 사용하는 방법? (사용 요약)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!