Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。-AI-php.cn

ホームページ

テクノロジー周辺機器

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 06, 2024 pm 07:34 PM

理論

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

編集者 | KX

逆合成は創薬と有機合成において重要なタスクであり、そのプロセスを高速化するために AI の使用が増えています。

既存の AI 手法はパフォーマンスが不十分で、多様性が限られています。実際には、化学反応は多くの場合、反応物と生成物の間にかなりの重複を伴う局所的な分子変化を引き起こします。

これに触発されて、浙江大学のHou Tingjun氏のチームは、シングルステップ逆合成予測を分子列編集タスクとして再定義し、標的分子列を反復的に改良して前駆体化合物を生成することを提案しました。そして、高品質で多様な予測を実現できる編集ベースの逆合成モデルEditRetroを提案する。

広範な実験により、このモデルが標準ベンチマークデータセット USPTO-50 K で優れたパフォーマンスを達成し、トップ 1 の精度 60.8% を達成することが示されました。

結果は、EditRetro が優れた一般化機能と堅牢性を示し、AI 主導の化学合成計画の分野における可能性を強調していることを示しています。

関連研究「反復文字列編集モデルによる逆合成予測」が、7月30日付けの『Nature Communications』に掲載されました。

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

論文リンク: https://www.nature.com/articles/s41467-024-50617-1

分子合成経路設計は、生物医学、医薬品にとって重要な有機合成における重要なタスクです素材産業など様々な分野で大きな意義を持っています。

逆合成分析は、合成ルートを開発するために最も広く使用されている方法です。これには、確立された反応を使用して、分子をより単純で合成しやすい前駆体に繰り返し分解することが含まれます。

近年、AI 駆動の逆合成により、より複雑な分子の探索が容易になり、合成実験の設計に必要な時間と労力が大幅に削減されました。シングルステップ逆合成予測は逆合成計画の重要な部分であり、現在、優れた結果をもたらしている深層学習ベースの手法がいくつかあります。これらの手法は、テンプレートベースの手法、テンプレートフリーの手法、および半テンプレートベースの手法の 3 つのカテゴリに大別できます。

ここでは、研究者たちはテンプレートフリーの逆合成予測に焦点を当てています。この問題を分子列編集タスクとして再定義し、高品質で多様な予測を実現できる編集ベースの逆合成モデル EditRetro を提案します。

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

図: 分子列逆合成に基づいて提案された EditRetro メソッドの概略図。 (出典: 論文)

この研究の核となるコンセプトは、レーベンシュタイン操作を使用した反復編集プロセスを通じて反応物文字列を生成することです。このアプローチは、編集ベースのシーケンス生成モデルの最近の進歩からインスピレーションを得ています。具体的には、ニューラル機械翻訳用に設計された編集ベースの Transformer である EDITOR からの操作が使用されます。

EditRetro の概要

EditRetro モデルには、反応物文字列を生成するための 3 つの編集操作、つまりシーケンスの再配置、プレースホルダーの挿入、およびマーカーの挿入が含まれています。これは、スタックされた Transformer ブロックで構成される 1 つのエンコーダーと 3 つのデコーダーで構成される Transformer モデルによって実装されます。

再配置デコーダ: 再配置操作には、保持、削除、並べ替えなどの基本的なトークン編集操作が含まれます。これは、シントンを得るために原子またはグループを並べ替えたり削除したりすることを含む、反応中心を特定するプロセスと比較できます。
プレースホルダーデコーダー: プレースホルダー挿入戦略 (分類子) は、隣接するトークンの間に挿入されるプレースホルダーの数を予測します。これは、配列再配置段階で得られる中間シントンの追加原子または基の位置を特定するのと同様に、反応物の構造を決定する上で重要な役割を果たします。
トークンデコーダー: トークン挿入戦略 (分類子)。各プレースホルダーの候補トークンを生成します。これは、ターゲット生成物の合成に使用できる実際の反応物質を決定する際に重要です。このプロセスは、プレースホルダー挿入操作と組み合わせた、シントンによって実行される同様のプロセスとみなすことができます。

EditRetro モデルは、非自己回帰デコーダーを通じて生成効率を向上させます。編集操作を反復的に予測するために追加のデコーダーを組み込んでいますが、EditRetro は各デコーダー内で編集操作を並行して実行します (つまり、非自己回帰生成)。

ターゲット分子が与えられると、エンコーダーはその文字列を入力として受け取り、対応する隠れた表現を生成し、それがデコーダーのクロスアテンションモジュールへの入力として使用されます。同様に、デコーダも最初の反復で積文字列を入力として受け取ります。各デコード反復中に、3 つのデコーダーが順番に実行されます。

ベースラインよりも優れた、正確な反応物を生成します

The researchers evaluated the proposed method on the public benchmark datasets USPTO-50K and USPTO-FULL. Extensive experimental results show that this method outperforms other baselines in terms of prediction accuracy, including the state-of-the-art sequence-based method R-SMILES and the graph editing-based method Graph2Edits.

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

EditRetro Extensive experiments on the benchmark retrosynthesis dataset USPTO-50K show that EditRetro achieves superior performance, with a top-1 exact matching accuracy of 60.8%.

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

In addition, on the larger USPTO-FULL data set, the top-1 exact matching accuracy reached 52.2%, proving its effectiveness in more diverse and challenging chemical reactions .

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

EditRetro also shows better performance than baseline methods in terms of RoundTrip and MaxFrag accuracy. This demonstrates that EditRetro can effectively learn chemical rules.

In addition, EditRetro provides diverse predictions through well-designed inference modules. This module combines relocation sampling and sequence augmentation to help generate diverse and changing predictions. Repositioning sampling samples predictions of repositioning actions, enabling the identification of distinct response sites. Sequence enhancement generates different editing pathways from different product variants to reactants, thereby increasing prediction accuracy and diversity. These two strategies work together to increase the accuracy and diversity of predictions.

Further experiments verified the superiority of EditRetro in some more complex reactions, including chiral, ring-opening and ring-forming reactions. The results confirm the superiority of EditRetro in these challenging scenarios, demonstrating its ability to handle different types of chemical transformations.

Practicality in multi-step synthesis planning

In particular, the successful application of EditRetro in four multi-step retrosynthesis planning scenarios demonstrates its practicality.

To evaluate the utility of EditRetro in synthesis planning, complete chemical pathways were designed through sequential retrosynthetic predictions. The researchers selected four target compounds with important pharmaceutical value for evaluation: febuxostat, osimertinib, an allosteric activator of GPX4, and the DDR1 kinase inhibitor INS015_037.

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。

Illustration: EditRetro’s multi-step retrosynthetic prediction. (Source: paper)

All four examples produced retrosynthetic pathways that were very consistent with those reported in the literature, with most predictions ranking in the top two. Of the 16 individual steps considered, 10 had a prediction accuracy of 1. These results demonstrate the practical potential of EditRetro in practical retrosynthetic predictions.

This method is expected to find practical applications in the field of retrosynthetic planning by providing valuable insights and facilitating the design of efficient synthetic routes.

以上がTransformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Huggingface smollmであなたの個人的なAIアシスタントを構築する方法Apr 18, 2025 am 11:52 AM

オンデバイスAIの力を活用：個人的なチャットボットCLIの構築最近では、個人的なAIアシスタントの概念はサイエンスフィクションのように見えました。ハイテク愛好家のアレックスを想像して、賢くて地元のAI仲間を夢見ています。

メンタルヘルスのためのAIは、スタンフォード大学でのエキサイティングな新しいイニシアチブによって注意深く分析されますApr 18, 2025 am 11:49 AM

AI4MHの最初の発売は2025年4月15日に開催され、有名な精神科医および神経科学者であるLuminary Dr. Tom Insel博士がキックオフスピーカーを務めました。 Insel博士は、メンタルヘルス研究とテクノでの彼の傑出した仕事で有名です

2025年のWNBAドラフトクラスは、成長し、オンラインハラスメントの成長と戦いに参加しますApr 18, 2025 am 11:44 AM

「私たちは、WNBAが、すべての人、プレイヤー、ファン、企業パートナーが安全であり、大切になり、力を与えられたスペースであることを保証したいと考えています」とエンゲルバートは述べ、女性のスポーツの最も有害な課題の1つになったものに取り組んでいます。アノ

Pythonビルトインデータ構造の包括的なガイド-AnalyticsVidhyaApr 18, 2025 am 11:43 AM

導入 Pythonは、特にデータサイエンスと生成AIにおいて、プログラミング言語として優れています。大規模なデータセットを処理する場合、効率的なデータ操作（ストレージ、管理、アクセス）が重要です。以前に数字とstをカバーしてきました

Openaiの新しいモデルからの代替案からの第一印象Apr 18, 2025 am 11:41 AM

潜る前に、重要な注意事項：AIパフォーマンスは非決定論的であり、非常にユースケース固有です。簡単に言えば、走行距離は異なる場合があります。この（または他の）記事を最終的な単語として撮影しないでください。これらのモデルを独自のシナリオでテストしないでください

AIポートフォリオ| AIキャリアのためにポートフォリオを構築する方法は？Apr 18, 2025 am 11:40 AM

傑出したAI/MLポートフォリオの構築：初心者と専門家向けガイド説得力のあるポートフォリオを作成することは、人工知能（AI）と機械学習（ML）で役割を確保するために重要です。このガイドは、ポートフォリオを構築するためのアドバイスを提供します

エージェントAIがセキュリティ運用にとって何を意味するのかApr 18, 2025 am 11:36 AM

結果？燃え尽き症候群、非効率性、および検出とアクションの間の隙間が拡大します。これは、サイバーセキュリティで働く人にとってはショックとしてはありません。しかし、エージェントAIの約束は潜在的なターニングポイントとして浮上しています。この新しいクラス

Google対Openai：学生のためのAIの戦いApr 18, 2025 am 11:31 AM

即時の影響と長期パートナーシップ？ 2週間前、Openaiは強力な短期オファーで前進し、2025年5月末までに米国およびカナダの大学生にChatGpt Plusに無料でアクセスできます。このツールにはGPT ‑ 4o、Aが含まれます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。