パフォーマンスの最適化のために x86 アセンブリ出力を読みやすくする
パフォーマンスの最適化のために Go コンパイラーの x86 アセンブリ出力を検査する場合、デフォルト出力を理解するのは難しい場合があります。この記事では、外部アセンブリ ファイルの生成とアセンブリ コード内での関数の分離という 2 つの問題について説明します。
アセンブリ ファイルの生成
Go アセンブリの出力を、次のコマンドを使用してファイルを作成します:
go tool compile -S file.go > file.s
これにより、後で使用できるようにアセンブリ コードが「file.s」という名前のファイルに保存されます。
関数の分離
関数を分離してラベルを追加するには、-N フラグを使用してコンパイラの最適化を無効にします。
go tool compile -S -N file.go
または、次のようにします。 gccgoを使用できますコンパイラ:
gccgo -S -O0 -masm=intel test.go
gccgo は、関数の境界とラベルを含むアセンブリ コードを含む "test.s" という名前のファイルを生成します。
-O{0-3 でさまざまな最適化レベルを指定することにより、 } を使用すると、アセンブリ コードに対する最適化の影響を観察し、パフォーマンス向上の可能性がある領域を特定できます。
以上がパフォーマンス チューニングのために Go からの x86 アセンブリ出力を読みやすくするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。