ホームページ  >  記事  >  ウェブフロントエンド  >  タスク スケジューリングの信頼性の向上: DolphinScheduler での API モニタリング用の Arthas の統合

タスク スケジューリングの信頼性の向上: DolphinScheduler での API モニタリング用の Arthas の統合

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-11-05 12:56:021016ブラウズ

この記事では、API 呼び出しのリアルタイム監視を可能にする Arthas の Apache DolphinScheduler への統合について詳しく説明します。 Arthas は強力な Java 診断ツールであり、開発者によるランタイム ステータスの検査、パフォーマンスのボトルネックの特定、およびメソッド呼び出しの追跡を支援します。 DolphinScheduler に Arthas を組み込むことで、タスクのスケジューリング中に主要な通話情報をキャプチャできるようになり、タイムリーな問題の検出と解決が可能になり、システムの安定性が向上します。ここでは、DolphinScheduler 環境内で Arthas を起動し、特定の API 呼び出しを監視し、収集されたパフォーマンス データを分析してスケジュールの信頼性と保守性を向上させる手順の概要を説明します。

手動インストール

https://arthas.aliyun.com/download/latest_version?mirror=aliyun
arthas-packaging-3.7.2-bin.zip

cp arthas-packaging-3.7.2-bin.zip /opt/arthas
cd /opt/arthas
unzip arthas-packaging-3.7.2-bin.zip

java -jar arthas-boot.jar

Select the corresponding process ID.

エラーのトラブルシューティング

エラー1

[ERROR] Start arthas failed, exception stack trace: 
com.sun.tools.attach.AttachNotSupportedException: Unable to open socket file: target process not responding or HotSpot VM not loaded
        at sun.tools.attach.LinuxVirtualMachine.<init>(LinuxVirtualMachine.java:106)
        at sun.tools.attach.LinuxAttachProvider.attachVirtualMachine(LinuxAttachProvider.java:78)
        at com.sun.tools.attach.VirtualMachine.attach(VirtualMachine.java:250)
        at com.taobao.arthas.core.Arthas.attachAgent(Arthas.java:102)
        at com.taobao.arthas.core.Arthas.<init>(Arthas.java:27)
        at com.taobao.arthas.core.Arthas.main(Arthas.java:161)

解決策:
${DOLPHINSCHEUDLER_HOME}/api-server/bin で、次の行を jvm_args_env.sh に追加します:

-XX:+StartAttachListener

エラー2

Picked up JAVA_TOOL_OPTIONS: 
java.io.IOException: well-known file /tmp/.java_pid731688 is not secure: file should be owned by the current user (which is 0) but is owned by 989
        at sun.tools.attach.LinuxVirtualMachine.checkPermissions(Native Method)
        at sun.tools.attach.LinuxVirtualMachine.<init>(LinuxVirtualMachine.java:117)
        at sun.tools.attach.LinuxAttachProvider.attachVirtualMachine(LinuxAttachProvider.java:78)
        at com.sun.tools.attach.VirtualMachine.attach(VirtualMachine.java:250)
        at com.taobao.arthas.core.Arthas.attachAgent(Arthas.java:102)
        at com.taobao.arthas.core.Arthas.<init>(Arthas.java:27)
        at com.taobao.arthas.core.Arthas.main(Arthas.java:161)
[ERROR] Start arthas failed, exception stack trace: 
[ERROR] attach fail, targetPid: 731688

解決策:
このエラーを回避するには、Arthas サービスを実行しているユーザーが DolphinScheduler を実行しているユーザーと一致することを確認してください。

時計

Watch は、パラメーターや戻り値など、メソッドの特定の実行の詳細を監視するために使用されます。

watch org.apache.dolphinscheduler.api.controller.UsersController queryUserList returnObj
[arthas@731688]$ watch org.apache.dolphinscheduler.api.controller.UsersController queryUserList returnObj
Press Q or Ctrl+C to abort.
Affect(class count: 1 , method count: 1) cost in 126 ms, listenerId: 2
method=org.apache.dolphinscheduler.api.controller.UsersController.queryUserList location=AtExit
ts=2024-08-27 02:04:01; [cost=4.918943ms] result=@Result[
...

トレース

トレースは、呼び出されたメソッドとそれぞれの実行時間を含む、メソッド呼び出しの深さを監視します。

[arthas@973263]$ trace org.apache.dolphinscheduler.api.controller.UsersController queryUserList 
Press Q or Ctrl+C to abort.
Affect(class count: 1 , method count: 1) cost in 319 ms, listenerId: 1
`---ts=2024-08-27 10:33:08;thread_name=qtp1836984213-26;id=26;is_daemon=false;priority=5;TCCL=sun.misc.Launcher$AppClassLoader@439f5b3d
    `---[13.962731ms] org.apache.dolphinscheduler.api.controller.UsersController:queryUserList()
        +---[0.18% 0.025123ms ] org.apache.dolphinscheduler.api.controller.UsersController:checkPageParams() #130
        +---[0.09% 0.012549ms ] org.apache.dolphinscheduler.plugin.task.api.utils.ParameterUtils:handleEscapes() #131
        `---[96.47% 13.469876ms ] org.apache.dolphinscheduler.api.service.UsersService:queryUserList() #132

ごみ

ヒープ ダンプ ファイルを生成するには、次を使用します:

[arthas@973263]$ heapdump arthas-output/dump.hprof
Dumping heap to arthas-output/dump.hprof ...
Heap dump file created

メモリ リーク診断用の MAT などのツールを使用してダンプ ファイルを分析します。

JVMメモリ変更の表示

メモリを使用して JVM メモリ使用量を検査します:

[arthas@973263]$ memory 
Memory                                                         used                 total                max                  usage                
heap                                                           485M                 900M                 900M                 53.91%               
ps_eden_space                                                  277M                 327M                 358M                 77.61%               
...

CPU使用率の表示

ダッシュボードを使用して CPU 使用率を表示し、thread -n thread_id で詳細な検査のために特定のスレッドを特定します。

Enhancing Task Scheduling Reliability: Integrating Arthas for API Monitoring in DolphinScheduler

以上がタスク スケジューリングの信頼性の向上: DolphinScheduler での API モニタリング用の Arthas の統合の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。