연구원들은 자동 지식 발견을 달성하기 위해 기계 학습 방법을 사용하여 고차원 비선형 데이터에서 직접 가장 가치 있고 중요한 고유 법칙을 자동으로 마이닝(즉, 문제 뒤에 있는 PDE 기반 지배 방정식을 마이닝)하기를 희망합니다.
최근 Eastern Institute of Technology, University of Washington, Ruilai Intelligence 및 Peking University의 연구팀은 기호 수학을 기반으로 한 유전 알고리즘 SGA-PDE를 제안하여 데이터 제어에서 모든 형태를 직접 마이닝할 수 있는 공개 후보 세트를 구성했습니다. 방정식.
실험에 따르면 SGA-PDE는 Burgers 방정식(상호작용 항 포함), Korteweg–de Vries 방정식(KdV, 고차 도함수 항 포함) 및 Chafee-Infante 방정식(지수 항 및 도함수 포함)을 마이닝할 수 있는 것으로 나타났습니다. 용어))를 사용하여 점성 중력 흐름 문제에서 복합 함수를 사용하는 지배 방정식과 분수 구조를 갖는 방정식을 성공적으로 마이닝했는데, 후자의 두 방정식은 이전 방법으로는 발견하기 어려웠습니다. SGA-PDE는 방정식 형식에 대한 사전 지식에 의존하지 않으며 복잡한 구조 제어 방정식 마이닝 문제의 공백을 채웁니다. 이 모델은 후보 방정식 세트를 미리 제공할 필요가 없으며 이는 알려지지 않은 과학적 문제에 대한 자동 지식 발견 알고리즘의 실제 적용에 유리합니다.
"개방형 편미분 방정식(SGA-PDE) 발견을 위한 기호 유전 알고리즘"이라는 제목의 이 연구는 6월 1일 Physical Review Research에 게재되었습니다.
현재 상식 발견 아이디어는 희소 회귀를 사용하는 것입니다. 즉, 닫힌 후보 집합을 미리 제공한 다음 여기에서 방정식 항을 선택하고 SINDy 및 PDE-와 같은 지배 방정식을 결합하는 것입니다. 찾다. 그러나 이러한 방식은 사용자가 방정식의 대략적인 형태를 미리 결정한 다음, 해당 미분 연산자를 모두 후보 집합의 함수항으로 지정해야 하며, 후보 집합에 존재하지 않는 함수항을 미리 찾을 수 없습니다. 데이터에서. 최신 연구 중 일부는 유전자 알고리즘을 사용하여 후보 세트를 확장하려고 시도하지만 유전자 재조합 및 돌연변이에 큰 제한이 있으며 데이터에서 직접 복잡한 구조 함수 용어(예: 분수 구조 및 복합 함수)를 생성하는 것은 여전히 불가능합니다. 개방형 지배방정식의 핵심은 계산하기 쉬운 방식으로 임의의 형태의 지배방정식을 생성하고 표현하며, 생성된 방정식이 관찰된 데이터와 얼마나 잘 맞는지 측정하여 방정식 형식의 정확성을 평가하는 것입니다. 그런 다음 마이닝된 방정식에 대한 실험을 수행합니다. 따라서 자동 지식발견의 핵심 이슈는 표현과 최적화이다.
표 1. 자동 제어 방정식 마이닝 방법의 비교표
문제 표현의 과제는 다음과 같습니다.
1. 무한 복잡한 구조 제어 방정식을 표현하기 위해 제한된 기본 단위를 사용하는 방법(예: 공개 후보 집합); 계산하기 쉬운 제어 방정식 표현을 구성하는 방법. 어떤 구조의 방정식도 자유롭게 표현할 수 있도록 연구자들은 SGA-PDE의 기본 표현 단위를 피연산자와 연산자로 약화시키고, 기호 수학을 통해 이진 트리를 활용한 개방형 후보 집합을 구성했습니다.
최적화 문제의 과제는 다음과 같습니다.1. 방정식 형식과 방정식 평가 지수 간의 기울기를 계산하기 어렵습니다. 2. 공개 후보 집합의 실현 가능 영역은 무한합니다. 탐색과 활용(Exploitation)의 효과적인 균형을 위한 최적화 프로세스입니다. 연구진은 개방형 후보 집합 문제를 효율적으로 최적화하기 위해 트리 구조용으로 특별히 설계된 유전 알고리즘을 사용해 방정식 형태로 최적화를 달성했다.
그림 1: 자동 지식 발견 문제와 SGA-PDE의 개략도
연구원들은 먼저 알고리즘에서 방정식의 기본 표현 단위를 세분화하여 개방형 편미분 방정식을 표현했고,독립함수항 수준의 방정식 표현 스케일은 보다 기본적인 연산자 및 피연산자 수준으로 변환됩니다.
SGA-PDE는 제어 방정식의 연산자를 이중 연산자(예: +, -)와 단일 연산자(예: sin, cos)로 나눈 후 모든 잠재적 변수를 피연산자(x, t, u 등)로 정의합니다. 연구자들은 이진 트리 구조를 사용하여 연산자와 피연산자를 결합하여 다양한 방정식을 인코딩합니다. 이진 트리의 모든 터미널 노드(차수 0의 리프 노드)는 피연산자에 해당하고, 모든 비종단 노드는 연산자에 해당합니다. 이중 연산자는 차수 2의 노드에 해당하고, 단일 연산자는 차수 1의 노드에 해당합니다.
그림 2에서 볼 수 있듯이, 계산 가능한 문자열을 연결로 통해 모든 함수 용어는 이진 트리로 변환될 수 있습니다 동시에 특정 수학적 규칙을 만족하는 이진 트리도 함수로 변환될 수 있습니다. 용어. 또한, 여러 함수 항을 갖는 지배 방정식은 여러 이진 트리로 구성된 숲 과 동일합니다. SGA-PDE는 기호 수학을 통해 개방형 편미분 지배 방정식을 나타냅니다. 또한, 본 논문에서는 생성된 이진 트리가 수학적 원리를 위반하지 않도록 보장할 수 있는 수학적 의미를 지닌 이진 트리를 무작위로 생성하는 방법도 제안합니다.
그림 2: 이진 트리와 함수 용어 간의 표현 및 변환 방법
그림 2에 표시된 표현 방법은 함수 공간의 샘플과 이진 트리 공간의 샘플 간에 일대일 대응이 가능하기 때문입니다. . 이는 기호 수학을 기반으로 한 표현이 효율적이고 중복되지 않으며 유전 알고리즘의 인코딩 프로세스로 사용될 수 있음을 의미합니다. 연구자들은 실험 데이터에서 관찰된 데이터와 일치하는 제어 방정식을 자동으로 마이닝하기 위해 트리 구조(그림 3)에 대한 유전 알고리즘을 제안했습니다. 나무 구조에 대한 이 유전 알고리즘은 다양한 수준에서 최적화를 달성할 수 있습니다.
재구성 링크는 포리스트(방정식) 수준에서 최적화되어이진 트리(함수 용어)의 최적 조합을 찾습니다. 이 링크는 닫힌 후보 집합 내에서 최적화하는 현재의 공통 희소 회귀 방법과 유사합니다.
변이 링크는 이진 트리(함수 용어) 수준에서 최적화됩니다. 서로 다른 노드 속성을 무작위로 생성하여 주어진 이진 트리 구조에서 노드 속성의 최적 조합을 찾습니다. 이는 본질적으로 현재 구조를 활용하는 것입니다. .).
대체 링크도 이진 트리(함수 용어) 수준에서 최적화되지만, 트리 구조를 탐색하고 완전히 개방된 후보 집합의 최적화를 실현하는 새로운 이진 트리 구조를 생성합니다. SGA-PDE는 다단계 최적화를 통해 이진 트리 토폴로지의 활용 및 탐색을 고려할 수 있으며, 이는 최적의 방정식 형식을 효율적으로 찾는 데 도움이 됩니다.
그림 3: 트리 구조에 대한 유전 알고리즘실험 데이터는 그림 4에 표시되어 있으며, 열 2는 물리적 필드 관찰을 보여주며,
는 SGA-PDE에 대한 유일한 입력 정보입니다. 3열과 4열의 기본 1차 도함수는 물리적 장 관측값의 차이를 통해 얻을 수 있습니다. 열 1은 방정식의 올바른 형식입니다. 실험에서 SGA-PDE는 미리 설정된 동일한 피연산자와 연산자를 사용하며 알고리즘의 다양성을 검증하기 위해 특정 문제에 대해 조정할 필요가 없습니다. 마지막으로 SGA-PDE는 데이터에서 Burgers 방정식, KdV 방정식, Chafee-Infante 방정식, 복합 함수 유도를 통한 점성 중력 흐름 지배 방정식 및 분수 구조를 갖는 방정식을 성공적으로 마이닝했습니다. 위 방정식은 지수 항, 고차 미분 항, 상호 작용 항, 복합 함수 및 중첩 구조와 같은 복잡한 형태
를 많이 가지고 있습니다.표 2는 위의 5가지 계산 예에서 다양한 기존 알고리즘의 계산 결과를 비교합니다. SGA-PDE가 복잡한 구조의 제어 방정식 마이닝의 공백을 메우는 것을 볼 수 있습니다.
그림 4: 실험 데이터 그래프
표 2 다양한 제어 방정식 마이닝 문제에서 자동 지식 발견 알고리즘의 실험 결과
SGA-PDE의 최적화 프로세스를 보다 완전히 이해하기 위해 그림 5는 KdV 방정식 마이닝 시 진화 경로를 보여줍니다. 1세대에서 생성된 최적 방정식은 실제 방정식과 거리가 멀다는 것을 알 수 있다. 이후의 진화 과정에서 이진 트리의 위상적 구조와 노드의 의미가 변화하고, 함수항 간의 교차 재조합을 거치면서 마침내 31세대에서 올바른 해법을 찾았고, 이때 AIC 지수는 기사 표준에 명시된 수렴에 도달했습니다. 흥미롭게도 최적화를 계속하면 69세대에서 복합 함수의 유도를 기반으로 한 KdV 방정식의 보다 간결한 표현이 발견됩니다. 그림 6은 분수 구조를 갖는 지배방정식을 찾기 위한 SGA-PDE의 최적화 과정을 보여줍니다.
그림 5: KdV 방정식에 대한 SGA-PDE의 최적화 프로세스
그림 6: 분수 구조의 방정식에 대한 SGA-PDE의 최적화 프로세스
제어 방정식은 도메인 지식입니다 효율적인 표현 그러나 많은 실제 문제의 방정식 매개변수와 심지어 방정식 형식도 불확실하므로 정확한 제어 방정식을 작성하기 어렵고, 이는 기계 학습에서 도메인 지식의 적용을 크게 제한합니다.
SGA-PDE는 기호 수학을 사용하여 방정식을 변환하고 모든 형태의 편미분 방정식을 표현하는 문제를 해결합니다. 또한 SGA-PDE는 이진 트리용으로 설계된 유전 알고리즘을 사용하고 트리의 토폴로지 및 노드 속성의 반복적 최적화를 통해 오픈 도메인의 관측 데이터에 맞는 제어 방정식을 자동으로 마이닝 합니다. 최적화에서 SGA-PDE는 방정식 형태의 사전 정보에 의존하지 않으며 후보 세트를 제공할 필요도 없어 복잡한 구조 방정식의 자동 최적화를 실현합니다. 동시에 SGA-PDE는 방정식 구조와 손실 값 사이의 어려운 기울기 계산 문제를 방지하는 기울기 없는 알고리즘이기도 합니다. 향후 연구는 다음 사항에 중점을 둘 것입니다. 1. 강화 학습 또는 조합 최적화 알고리즘을 결합합니다. 2. 물리적 메커니즘을 내장하여 솔루션 공간을 줄입니다. 3. 희소 데이터 및 시끄러운 데이터에 대한 SGA-PDE의 적용 가능성을 평가하고 개선합니다. . 지식 임베딩 방법을 지식 발견 방법과 통합합니다.
논문 링크(무료로 이용 가능):
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.4.023174
코드 및 예제 데이터 링크:
https://github.com/ YuntianChen /SGA-PDE
위 내용은 방정식은 이진 트리 숲입니까? 데이터에서 직접 알려지지 않은 지배 방정식과 물리적 메커니즘을 발견하세요.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!