ホームページ > 記事 > テクノロジー周辺機器 > 方程式は二分木フォレストですか?未知の支配方程式や物理メカニズムをデータから直接発見
研究者は、機械学習手法を使用して、最も価値があり重要な固有法則を高次元の非線形データから直接自動的にマイニングし (つまり、問題の背後にある PDE ベースの支配方程式をマイニング)、自動知識発見を実現したいと考えています。
最近、東部工科大学、ワシントン大学、瑞来知能、北京大学の研究チームは、記号数学に基づく遺伝的アルゴリズム SGA-PDE を提案し、データからデータを抽出できるオープン候補セットを構築しました。 . 支配方程式の任意の形式を直接マイニングします。
実験によれば、SGA-PDE は Burgers 方程式 (相互作用項を含む)、Korteweg-de Vries 方程式 (KdV、高次微分項を含む)、および Chafee-Infante 方程式 (相互作用項を含む) をマイニングできるだけではありません。また、粘性重力流問題における複合関数を含む支配方程式と分数構造を含む方程式のマイニングにも成功しました。このうち後 2 つの方程式は、以前の方法では発見することが困難でした。 SGA-PDE は方程式形式に関する事前知識に依存せず、複雑な構造制御方程式マイニング問題のギャップを埋めます。このモデルは、方程式の候補セットを事前に与える必要がないため、未知の科学的問題における自動知識発見アルゴリズムの実際の適用に有益です。
この研究は「開形式偏微分方程式を発見するためのシンボリック遺伝的アルゴリズム (SGA-PDE)」と題され、6 月 1 日付けの Physical Review Research に掲載されました。
現在の共通知識発見のアイデアは、スパース回帰を使用することです。つまり、閉じた候補セットを事前に与え、そこから方程式項を選択し、支配方程式を結合します。 、SINDy や PDE-FIND など。ただし、このタイプの方法では、ユーザーが事前に方程式の大まかな形式を決定し、対応するすべての微分演算子を事前に候補セット内の関数項として提供する必要があります。 data の候補セットに存在します。最新の研究の一部では、遺伝的アルゴリズムを使用して候補セットを拡張しようとしていますが、遺伝子の組み換えや突然変異には大きな制限があり、依然として複雑な構造関数項 (分数構造や合成関数など) を生成することはできません。 オープン形式の支配方程式をデータから直接マイニングするための鍵は、計算しやすい方法で任意の形式の支配方程式を生成して表現し、どの程度適切であるかを測定することで方程式形式の精度を評価することです。生成された方程式は観察されたデータのプロパティに適合し、マイニングされた方程式を繰り返し最適化します。したがって、自動ナレッジ発見の中核となる問題は、表現と最適化です。
#表 1. 自動制御方程式マイニング手法の比較表
問題を表現する際の課題は次のとおりです:1 . 限られた基本単位を使用して無限の複雑な構造制御方程式 (つまり、オープン候補セット) を表現する方法 ##;2. 計算が容易な制御方程式表現方法を構築する方法。
研究者らは、あらゆる構造の方程式を自由に表現できるよう、SGA-PDEの基本表現単位をオペランドと演算子に弱体化し、記号数学を通じて二分木を用いてオープン候補集合を構築した。最適化問題の課題は次のとおりです: 1. 方程式形式と方程式評価指標の間の勾配を計算するのは困難です ; 2. 未解決候補の実行可能領域set は無限であり、最適化プロセスでは探索と活用のバランスを効果的に取ることが困難です。オープン候補集合問題を効率的に最適化するために、研究者らはツリー構造用に特別に設計された遺伝的アルゴリズムを使用して、方程式の形で最適化を実現しました。
#図 1: 自動知識発見問題と SGA-PDE の概略図
研究者らはまず方程式の基本を洗練させました。アルゴリズムでは、表現単位は開形式偏微分方程式を表現するために使用され、 方程式の表現スケールを独立関数項のレベルから演算子とオペランドのより基本的なレベルに変換します。
SGA-PDE は、制御方程式内の演算子を二重演算子 (- など) と単一演算子 (sin、cos など) に分割し、すべての潜在的な変数をオペランド (x、t、u など) として定義します。 。研究者は、バイナリ ツリーの構造を使用して演算子とオペランドを組み合わせ、さまざまな方程式をエンコードします。バイナリ ツリー内のすべての終端ノード (次数 0 の葉ノード) はオペランドに対応し、すべての非終端ノードは演算子に対応します。二重演算子は次数 2 のノードに対応し、単一演算子は次数 1 のノードに対応します。
図 2 に示すように、接続として計算可能な文字列を介して、任意の関数項を二分木に変換できますと同時に、 は特定の数学的規則を満たします。二分木は関数項に変換することもできます。さらに、複数の関数項を含む 支配方程式は、複数の二分木から構成されるフォレスト と等価です。 SGA-PDE は、記号数学を通じて任意の開形式偏微分支配方程式を表します。さらに、この論文では、数学的意味を持つ二分木をランダムに生成する方法も提案しています。これにより、生成された二分木が数学的原理に違反しないことが保証されます。
図 2: 二分木と関数項の間の表現と変換方法
図 2 に示す表現方法は次のとおりです。関数空間内のサンプルと二分木空間内のサンプル間の 1 対 1 の対応関係です。これは、記号数学に基づく表現方法が効率的かつ非冗長であり、遺伝的アルゴリズムの符号化プロセスとして使用できることを意味します。研究者らは、実験データから観測データと一致する制御方程式を自動的にマイニングするためのツリー構造の遺伝的アルゴリズム (図 3) を提案しました。ツリー構造用のこの遺伝的アルゴリズムは、さまざまなレベルでの最適化を実現できます。
再編成リンクは、フォレスト (方程式) レベルでを最適化し、バイナリ ツリー (関数項) の最適な組み合わせを見つけることです。このリンクは、閉じた候補セット内での最適化である、現在の一般的なスパース回帰手法に似ています。
突然変異リンクはバイナリ ツリー (関数項) レベルで最適化されます. 異なるノード属性をランダムに生成することにより、特定のバイナリ ツリー構造の下でノード属性の最適な組み合わせが見つかります。それは現在の構造を悪用したものです。
置換プロセスはバイナリ ツリー (機能項目) レベルでも最適化されますただし、新しいバイナリ ツリー構造が生成されます。これはツリー構造の探索であり、完全なオープン候補セットの最適化。 SGA-PDE は、マルチレベルの最適化を通じてバイナリ ツリー トポロジの利用と探索を考慮に入れることができ、最適な方程式形式を効率的に見つけるのに役立ちます。
#図 3: ツリー構造の遺伝的アルゴリズム
実験データを図 4 に示します。その 2 列目は次のとおりです。物理場の観測値 は、SGA-PDE の唯一の入力情報
です。列 3 と列 4 の基礎となる一次導関数は、物理場の観測値を差分することによって取得できます。列 1 は方程式の正しい形式です。実験では、SGA-PDE は同じプリセット オペランドと演算子を使用するため、アルゴリズムの多用途性を検証するために特定の問題に合わせて調整する必要はありません。最後に、SGA-PDE は、Burgers 方程式、KdV 方程式、Chafee-Infante 方程式、複合関数導出を伴う粘性重力流支配方程式、および分数構造を伴う方程式をデータからマイニングすることに成功しました。上の方程式には、指数項、高次微分項、交互作用項、複合関数、入れ子構造など、多くの複雑な形式が含まれています。 #表 2 は、上記 5 つの計算例における既存のさまざまなアルゴリズムの計算結果を比較したもので、複雑な構造の制御方程式のマイニングにおいて SGA-PDE がギャップを埋めることがわかります。
#図 4: 実験データのグラフ
#表 2 さまざまな制御方程式マイニング問題における自動知識発見アルゴリズムの実験結果
SGA の検索をより完全に理解するために、 PDE 最適化プロセス、図 5 は、KdV 方程式をマイニングする際の進化の経路を示しています。第一世代によって生成された最適な方程式は、実際の方程式からかけ離れていることがわかります。その後の進化の過程では、二分木の位相構造やノードの意味の変化、関数項間の交差組み換えなどを経て、第31世代でようやく正解が見出され、この時点でAIC 指数は、成形品基準で指定された収束に達しています。興味深いことに、最適化を継続すると、複合関数の導出に基づいた KdV 方程式のより節約的な式が世代 69 で見つかります。図 6 は、分数構造の支配方程式を見つけるための SGA-PDE の最適化プロセスを示しています。 #図 5: KdV 方程式の SGA-PDE 最適化プロセス
# #図 6: 分数構造の方程式の SGA-PDE 最適化プロセス
制御方程式はドメイン知識を効率的に表現しますが、現実世界の多くの問題では方程式パラメーターや方程式形式すら不確実です。正確な制御方程式を記述するのは難しく、機械学習におけるドメイン知識の適用が大幅に制限されます。
SGA-PDE は、記号数学を通じて方程式を変換し、任意形式の偏微分方程式の表現問題
を解決します。さらに、SGA-PDE はバイナリ ツリー用に設計された遺伝的アルゴリズムを使用し、ツリーのトポロジとノード属性の反復最適化を通じて、オープン ドメインからの観測データと一致する制御方程式を自動的にマイニングします。 SGA-PDE は、最適化において方程式の事前情報に依存せず、候補セットを与える必要もなく、複雑な構造方程式の 自動最適化を実現します。同時に、SGA-PDE は勾配のないアルゴリズムでもあり、方程式構造と損失値の間の勾配の難しい計算の問題を回避します。 今後の研究は次のことに焦点を当てます: 1. 強化学習または組み合わせ最適化アルゴリズムの組み合わせを試みる; 2. 物理メカニズムを埋め込むことで解空間を削減する; 3. 疎なデータと SGA-PDE の適用性を評価および改善するノイズの多いデータ、自然、4. 知識埋め込み手法と知識発見手法を統合します。 紙のリンク (無料で利用可能):
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.4.023174
コードとサンプル データのリンク:
https://github.com/YuntianChen/SGA-PDE
以上が方程式は二分木フォレストですか?未知の支配方程式や物理メカニズムをデータから直接発見の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。