ホームページ  >  記事  >  テクノロジー周辺機器  >  Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

WBOY
WBOY転載
2023-10-23 11:17:081090ブラウズ

2020 年の AutoGL のリリース以来、清華大学の Zhu Wenwu 教授のチームは、特にグラフ トランスフォーマー、グラフ アウトの観点から、自動グラフ機械学習の解釈可能性と一般化可能性において新たな進歩を遂げてきました。分布一般化 (OOD)、グラフ自己教師あり学習などの研究において、グラフ ニューラル アーキテクチャの検索および評価ベンチマークが公開され、中国の新世代オープン ソースである初の軽量インテリジェンス ライブラリ (AutoGL-light) が GitLink でリリースされました。イノベーションサービスプラットフォーム。

インテリジェンス データベースのレビュー

グラフは、データ間の関係を説明する一般的な抽象概念であり、さまざまな研究分野に広く存在しており、多くの重要な要素があります。ソーシャル ネットワーク分析、レコメンデーション システム、交通量予測などのインターネット アプリケーション、新薬発見、新材料調製などの科学アプリケーション (AI for Science) などのアプリケーションは、さまざまな分野をカバーしています。グラフ機械学習は近年広く注目を集めています。異なるグラフ データは構造、性質、タスクが大きく異なるため、手動で設計された既存のグラフ機械学習モデルには、さまざまなシナリオや環境の変化に一般化する機能がありません。 AutoML on Graphs は、グラフ機械学習開発の最前線です。与えられたデータとタスクに対して最適なグラフ機械学習モデルを自動的に設計することを目的としています。研究と応用の両方で非常に価値があります。

グラフの自動機械学習の問題に対応して、清華大学の朱文武教授のチームは 2017 年に計画を開始し、2020 年に世界初のグラフの自動機械学習である AutoGL をリリースしました。機械学習のプラットフォームとツールキット。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

プロジェクト アドレス: https://github.com/THUMNLab/AutoGL

スマート ライブラリGitHub で 1000 を超えるスターを獲得し、20 以上の国と地域から数万の訪問を集め、GitLink で公開されました。スマート ライブラリには、主流のグラフ自動機械学習方法をカバーする、グラフ自動機械学習プロセスの完全なセットが含まれています。 Zhitu は、グラフ自動機械学習ソリューション AutoGL Solver を通じて、グラフ上の自動機械学習を 5 つのコア部分に分割します。グラフ自動特徴量エンジニアリング、グラフ ニューラル アーキテクチャ検索 (NAS)、グラフ ハイパーパラメータ最適化 (HPO)、グラフ モデル トレーニング、および自動グラフモデルの統合。スマート ライブラリは、ノード分類、異種グラフ ノード分類、リンク予測、グラフ分類など、さまざまな種類のグラフ タスクをすでにサポートしています。

グラフ自動機械学習研究の新たな進歩

グラフ自動機械学習の解釈可能性と一般化可能性が現在のところ欠如していることを考慮して、インテリジェント インテリジェンスグラフ チームは、グラフ自動機械学習の研究において一連の新たな進歩を遂げました。

1. グラフの分布外汎化 (OOD) アーキテクチャの検索

グラフのニューラル アーキテクチャの検索はできません。プロセスグラフ データ分布変化の問題を解決するために, 分離自己教師あり学習に基づくグラフニューラルアーキテクチャ探索手法を提案する. グラフサンプルごとに適切なグラフニューラルネットワークアーキテクチャをカスタマイズすることで, グラフニューラルアーキテクチャ探索手法の適応性を高めるデータ分散シフトの処理が効果的に強化されます。この成果は、機械学習に関するトップ国際会議である ICML 2022 で発表されました。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

論文アドレス: https://proceedings.mlr.press/v162/qin22b/qin22b.pdf

2. 大規模なグラフ アーキテクチャの検索

既存のグラフ ニューラル アーキテクチャの検索では大規模なグラフを処理できないという問題を解決するには、アーキテクチャ サブグラフを使用します。サンプリングメカニズムのスーパーネットワークトレーニング方法は、重要度サンプリングとピア学習アルゴリズムを通じてサンプリングプロセスの一貫性ボトルネックを突破し、グラフニューラルアーキテクチャ検索の効率を大幅に向上させ、初めて単一マシンを達成します。 1億スケールの実グラフデータを処理できます。この成果は、機械学習に関するトップ国際会議である ICML 2022 で発表されました。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

#論文アドレス: https://proceedings.mlr.press/v162/guan22d.html

3. グラフニューラルアーキテクチャ検索評価ベンチマーク

グラフ ニューラル アーキテクチャ検索の統一された評価基準の欠如と、評価プロセスで消費される膨大なコンピューティング リソースを考慮して、Zhitu チームはグラフ ニューラル アーキテクチャ検索ベンチマーク NAS-Bench-Graph を調査し、提案しました。これは、最初のグラフ ニューラル アーキテクチャ検索ベンチマークです。ニューラル アーキテクチャ検索用の表形式のベンチマークです。このベンチマークは、さまざまなグラフ ニューラル アーキテクチャ検索方法を効率的、公平かつ再現性よく比較でき、グラフ データ アーキテクチャ検索のベンチマークが存在しないギャップを埋めることができます。 NAS-Bench-Graph は、さまざまなサイズとタイプの 9 つの一般的に使用されるノード分類グラフ データを使用して、26,206 の異なるグラフ ニューラル ネットワーク アーキテクチャを含む検索空間を設計し、再現性と公正な比較を確保しながら、完全にトレーニングされたモデル効果を提供します。コンピューティングリソースが大幅に削減されます。この成果は、機械学習に関するトップ国際会議である NeurIPS 2022 で発表されました。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

# プロジェクトアドレス: https://github.com/THUMNLab/NAS-Bench-Graph

#4. 自動グラフ トランスフォーマー

現在の手動で設計されたグラフ トランスフォーマー アーキテクチャでは最高の予測パフォーマンスを達成することが難しいという問題を考慮して、自動グラフ トランスフォーマーアーキテクチャ検索フレームワークを提案します. 統合されたグラフ Transformer 検索スペースと構造を意識したパフォーマンス評価戦略により、最適なグラフ Transformer の設計には時間がかかり、最適なアーキテクチャを取得するのが難しいという問題が解決されます. この研究は、トップの ICLR 2023 で公開されました機械学習に関する国際会議。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

#論文アドレス: https://openreview.net/pdf?id=GcM7qfl5zY

##5. 堅牢なグラフ ニューラル アーキテクチャ検索

現在のグラフ ニューラル アーキテクチャ検索では敵対的攻撃に対処できないという問題に向けて、堅牢なグラフ ニューラル アーキテクチャ検索手法を提案します。検索 堅牢なグラフ演算子が空間に追加され、検索プロセス中に堅牢性評価指標が提案され、敵対的な攻撃に耐えるグラフ ニューラル アーキテクチャ検索の能力が強化されます。この成果は、パターン認識に関するトップ国際会議である CVPR 2023 で発表されました。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ#論文アドレス: https://openaccess.thecvf.com/content/CVPR2023/papers/Xie_Adversarily_Robust_Neural_Architecture_Search_for_Graph_Neural_Networks_CVPR_2023_paper.pdf

6. 自己教師ありグラフ ニューラル アーキテクチャ検索

既存のグラフ ニューラル アーキテクチャ検索は、アーキテクチャのトレーニングと検索の指標としてラベルに大きく依存しています。ラベルが不足しているシナリオでのグラフに対する自動機械学習の適用。この問題に対応して、Zhitu チームは自己教師ありグラフ ニューラル アーキテクチャの検索方法を提案し、グラフ データ形成を駆動するグラフ要素と最適なニューラル アーキテクチャの間の潜在的な関係を発見し、新しい分離された自己教師ありグラフ ニューラル アーキテクチャを採用しました。探索モデルは、ラベルなしのグラフデータに対して最適なアーキテクチャを効率的に探索することを実現します。この成果は、機械学習に関するトップカンファレンスである NeurIPS 2023 に採択されました。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ

7. マルチタスク グラフ ニューラル アーキテクチャの検索

既存のターゲットをターゲットにするグラフ ニューラル ネットワーク アーキテクチャの検索では、タスクごとのアーキテクチャ要件の違いを考慮することができません。Zhitu チームは、最初のマルチタスク グラフ ニューラル ネットワーク アーキテクチャの検索方法を提案しました。これは、異なるグラフ タスクに対して同時に最適なアーキテクチャを設計し、コース学習を使用します。それらの間の協力関係により、異なるグラフ タスクをカスタマイズするための最適なアーキテクチャが効果的に実現されます。この成果は、機械学習に関するトップカンファレンスである NeurIPS 2023 に採択されました。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ軽量インテリジェント マップ

上記の研究の進捗状況に基づいて、インテリジェント マップ チームはオープンなマップを指定しました。 CCF のソース プラットフォーム GitLink は、世界初の軽量グラフ自動機械学習オープン ソース ライブラリである AutoGL-light をリリースしました。その全体的なアーキテクチャ図を図 1 に示します。軽量スマート グラフには、主に次の特徴があります。

Tsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリ図 1. 軽量スマート グラフのフレームワーク図

#

プロジェクトアドレス: https://gitlink.org.cn/THUMNLab/AutoGL-light

1. モジュールの分離

Lightweight Intelligent Graph は、より包括的なモジュール分離方法を通じて、さまざまなグラフの自動機械学習パイプラインのより便利なサポートを実現し、機械学習プロセスのどのステップでもモジュールを自由に追加してニーズを満たすことができます。ユーザーのカスタマイズされたニーズ。

2. 自己カスタマイズ機能

軽量インテリジェンス ライブラリは、ユーザーがカスタマイズしたグラフ ハイパーパラメータ最適化 (HPO) とグラフ ニューラル アーキテクチャ検索 (NAS)。グラフ ハイパーパラメータ最適化モジュールでは、Lightweight Intelligent Graph がさまざまなハイパーパラメータ最適化アルゴリズムと検索スペースを提供し、基本クラスを継承することでユーザーが独自の検索スペースを作成できるようにします。グラフ ニューラル アーキテクチャ検索モジュールでは、軽量スマート グラフが典型的かつ最先端の検索アルゴリズムを実装しており、ユーザーは自分のニーズに応じて検索スペース、検索戦略、評価戦略のモジュール設計を簡単に組み合わせてカスタマイズできます。

3. 幅広い応用分野

軽量インテリジェント グラフの応用は、従来のグラフ マシンに限定されません。学習タスクに加えて、さらに幅広い応用分野に拡張されました。現在、軽量スマート マップは、分子マップや単一細胞オミクス データなどの科学向け AI アプリケーションをすでにサポートしています。将来的には、Lightweight Intelligent Graph は、さまざまな分野のグラフ データに対する最先端のグラフ自動機械学習ソリューションを提供したいと考えています。

4. GitLink プログラミング サマー キャンプ

Lightweight Smart Map の機会を利用して、Smart Map チームは、 GitLink プログラミング サマー キャンプ (GLCC) への参加は、CCF 中国コンピュータ連盟の指導の下、CCF オープンソース開発委員会 (CCF ODC) が主催する、全国の大学生を対象とした夏季プログラミング活動です。 Zhitu チームの 2 つのプロジェクト、「GraphNAS アルゴリズムの再現」と「グラフ自動学習科学分野での応用事例」には、国内 10 以上の大学の学部生と大学院生が参加申し込みをしました。

サマーキャンプ中、Zhitu チームは参加学生と積極的にコミュニケーションを図り、作業の進捗は予想を上回りました。その中で、GraphNAS アルゴリズム複製プロジェクトは、前述のグラフ分布外の一般化アーキテクチャ検索 (ICML'22)、大規模グラフ アーキテクチャ検索 (ICML'22)、および自動グラフ Transformer (ICLR'23) を軽量で実装することに成功しました。インテリジェント グラフ。) を使用して、軽量のシンク ライブラリの柔軟性と独立したカスタマイズ機能を効果的に検証します。

グラフ自動機械学習科学応用プロジェクトは、単一細胞 RNA 配列解析の代表的なアルゴリズム scGNN、代表的な MolCLR を含む、軽量のインテリジェント グラフ上にグラフベースの生物学的情報処理アルゴリズムを実装します。分子表現学習のアルゴリズムである AutoGNNUQ と分子構造予測の代表的なアルゴリズムである AutoGNNUQ は、AI for Science におけるグラフ自動機械学習技術の適用を促進します。 GitLink プログラミング サマー キャンプでは、Lightweight Intelligent Graph によってアルゴリズムとアプリケーション ケースが充実するだけでなく、参加する学生がオープンソース ソフトウェア開発やその他のスキルを実践し、グラフ自動機械学習の才能を育成し、我が国のオープン プログラミングの発展に貢献することもできます。根源的なエコロジー構造、自らの強み。

Zhitu チームは、清華大学コンピューター サイエンス学部の Zhu Wenwu 教授が率いるネットワークおよびメディア研究所の出身で、中心メンバーには、Wang Xin 助教授、Zhang Ziwei 博士研究員が含まれています。 、博士課程のLi Haoyang、Qin Yijian、Zhang Zeyang、修士課程のGuan Chaoyuと10人以上がいます。このプロジェクトは、中国国家自然科学財団と科学技術省から強力な支援を受けています。

以上がTsinghua Zhu Wenwu のチーム: AutoGL-light、オープンソースのグラフ用の世界初の軽量自動機械学習ライブラリの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。