>기술 주변기기 >일체 포함 >'좋은' 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토

'좋은' 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토

王林
王林앞으로
2023-04-12 21:04:071058검색

좋은 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토

https://www.zhuanzhi.ai/paper/a904f0aa0762e65e1dd0b8b464df7168

그래프는 객체와 객체의 관계를 설명하는 중요한 데이터 표현이며 다양한 실제 시나리오에 나타납니다. 그래프 생성은 이 분야의 주요 문제 중 하나이며, 주어진 그래프의 분포를 학습하고 더 많은 새로운 그래프를 생성하는 것을 고려합니다. 그러나 광범위한 적용으로 인해 풍부한 역사를 지닌 그래프의 생성 모델은 전통적으로 수작업으로 제작되었으며 그래프의 일부 통계적 속성만 모델링할 수 있습니다.

그래프 생성을 위한 심층 생성 모델의 최근 발전은 생성된 그래프의 충실도를 향상시키는 중요한 단계이며 새로운 유형의 애플리케이션을 위한 길을 열어줍니다. 이 논문은 그래프 생성을 위한 심층 생성 모델 분야의 문헌에 대한 광범위한 개요를 제공합니다. 첫째, 그래프 생성을 위한 심층 생성 모델의 형식적 정의와 사전 지식을 제공합니다. 둘째, 무조건 그래프 생성을 위한 심층 생성 모델의 분류를 각각 제안하고, 각각의 기존 연구를 비교 분석합니다. 이어서, 이 특정 영역의 평가 지표에 대한 개요가 설명됩니다. 마지막으로 깊이 맵 생성의 응용을 요약하고 5가지 유망 연구 방향을 제시합니다.

소개

그래프는 현실 세계 어디에나 존재하며 소셜 네트워크, 인용 네트워크, 생물학적 네트워크, 교통 네트워크 등과 같은 개체와 개체의 관계를 나타냅니다. 그래프는 풍부한 기본 값을 포함하는 복잡한 구조를 갖는 것으로도 알려져 있습니다[1]. 이 분야에서 상당한 노력이 이루어져 다양한 그래프 문제를 처리하기 위한 풍부한 문헌과 방법이 탄생했습니다.

이 작업은 두 가지 범주로 나눌 수 있습니다. 1) 주어진 그래프의 패턴을 예측하고 분석합니다. 2) 주어진 그래프의 분포를 학습하고 더 새로운 그래프를 생성합니다. 첫 번째 유형은 노드 분류, 그래프 분류 및 링크 예측을 포함한 많은 연구 영역을 다룹니다. 지난 수십 년 동안 이 분야에서 많은 작업이 이루어졌습니다. 첫 번째 유형의 문제에 비해 두 번째 유형의 문제는 그래프 생성 문제와 관련이 있으며 이 기사에서도 중점을 두고 있습니다.

그래프 생성에는 소셜 네트워크의 상호 작용 역학 이해[2], [3], [4], 이상 탐지[5]와 같은 여러 영역에 적용할 수 있는 실제 그래프를 모델링하고 생성하는 프로세스가 포함됩니다. , 단백질 구조 모델링 [6], [7], 소스 코드 생성 및 번역 [8], [9], 의미 분석 [10]. 광범위한 적용으로 인해 그래프의 생성 모델 개발은 풍부한 역사를 가지고 있으며, 그 결과 선험적 구조를 기반으로 하는 무작위 그래프, 작은 세계 모델, 확률적 블록 모델 및 베이지안 네트워크 모델과 같은 잘 알려진 모델이 탄생했습니다. 가정 [11] 그래프를 생성합니다. 이러한 그래프 생성 모델[12], [13], [14]은 무작위 그래프[15], 소규모 네트워크[16] 및 척도 없는 그래프[12]와 같이 미리 선택된 그래프 계열을 모델링하는 것을 목표로 합니다. 그러나 단순성과 수작업 특성으로 인해 이러한 무작위 그래프 모델은 복잡한 종속성을 모델링하는 기능이 제한되는 경우가 많으며 그래프의 일부 통계적 속성만 모델링할 수 있습니다.

이러한 방법은 일반적으로 미리 정의된 원칙이 맞춤화된 속성에는 잘 작동하지만 다른 속성에는 잘 작동하지 않는 경우가 많습니다. 예를 들어 접촉 네트워크 모델은 인플루엔자 전염병에 적합하지만 동적 기능 연결에는 적합하지 않습니다. 그러나 정신 질환, 사이버 공격, 뇌 네트워크의 악성 코드 확산 메커니즘을 설명하는 등 많은 영역에서 네트워크의 특성과 생성 원리는 거의 알려지지 않았습니다. 또 다른 예를 들어, Erdos-Renyi의 그래프에는 많은 실제 네트워크에서 일반적으로 나타나는 두꺼운 꼬리 분포가 없습니다. 더욱이, 선험적 가정을 사용하면 그래프에 대한 선험적 지식을 항상 사용할 수 없는 대규모 영역에서 더 많은 응용 프로그램을 탐색하는 데 이러한 전통적인 기술이 제한됩니다.

기존 그래프 생성 기술의 한계를 고려할 때, 핵심 공개 과제는 관찰된 그래프 모음에서 생성 모델을 직접 학습할 수 있는 방법을 개발하는 것입니다. 이는 생성된 그래프의 충실도를 향상시키는 중요한 단계입니다. 이는 신약 발견[17], [18] 및 단백질 구조 모델링[19], [20], [21]과 같은 새로운 유형의 응용 분야를 위한 길을 열어줍니다. VAE(Variational Autoencoder)[22] 및 GAN(Generative Adversarial Network)[23]과 같은 심층 생성 모델의 최근 발전이 그래프 생성을 위해 제안되었습니다. 그래프 생성은 유망한 영역입니다. 이 리뷰의 초점은 심층 생성 모델입니다.

일회성 그래프 생성부터 순차적 그래프 생성 프로세스까지 다양한 심층 생성 학습 전략에 적응하면서 깊이 지도 생성에 대한 다양한 고급 작업이 수행되었습니다. 이러한 방법은 기계 학습, 생물정보학, 인공 지능, 인간 건강, 소셜 네트워크 마이닝 등 다양한 분야의 작업을 통해 위의 과제 중 하나 이상을 해결하는 것을 목표로 합니다. 그러나 다양한 연구 분야에서 개발된 방법은 종종 서로 다른 어휘를 사용하고 서로 다른 관점에서 문제에 접근합니다.

게다가 개발된 그래프용 심층 생성 모델을 검증하기 위한 표준적이고 포괄적인 평가 절차가 부족합니다. 이를 위해 본 논문에서는 그래프 생성을 위한 심층 생성 모델에 대한 체계적인 검토를 제공합니다. 목적은 학제간 연구자들이 자신의 응용 분야의 문제를 해결하기 위해 적절한 기술을 선택할 수 있도록 돕고, 더 중요하게는 그래프 생성 연구자들이 그래프 생성의 기본 원리를 이해하고 심층 그래프 생성 분야의 공개 연구 기회를 식별할 수 있도록 돕는 것입니다. 우리가 아는 한, 이는 그래프 생성을 위한 심층 생성 모델에 대한 최초의 포괄적인 검토입니다. 아래에서는 이 리뷰의 주요 기여를 요약합니다.

이 논문은 문제 설정 및 접근 방식에 따라 분류된 그래프 생성을 위한 심층 생성 모델의 분류를 제안합니다. 다양한 하위 범주 간의 장점, 단점 및 관계가 제시됩니다. 그래프 생성을 위한 심층 생성 모델과 기본 심층 생성 모델을 자세히 설명하고 분석하고 비교합니다.

  • 기존 평가 절차와 지표, 벤치마크 데이터 세트에 대한 결과와 그래프 생성 작업에 대한 해당 심층 생성 모델을 요약하고 분류합니다.
  • 그래프 깊이 생성 모델의 기존 응용 분야와 이러한 응용 프로그램에 가져올 잠재적인 이점과 기회를 소개합니다.
  • 우리는 그래프 생성을 위한 심층 생성 모델 분야의 여러 가지 공개 문제와 유망한 미래 연구 방향을 제시합니다.

좋은 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토

그래프 생성을 위한 무조건 깊이 생성 모델

무조건 깊이 맵 생성의 목적은 깊이 생성 모델을 통해 실제 분포 p(G)에서 관측된 실제 그래프 집합을 샘플링하는 것입니다. 분포 pmodel(G). 생성 프로세스의 스타일에 따라 이러한 방법을 두 가지 주요 분기로 나눌 수 있습니다. (1) 순차 생성: 노드와 에지를 순차적으로 생성합니다. (2) 일회성 생성: 행렬 표현에 따라 확률 그래프 모델을 구축합니다. 노드와 에지를 한꺼번에 생성합니다. 그래프를 생성하는 두 가지 방법 모두 장점과 단점이 있습니다. 순차 생성은 이전 세대의 로컬 결정을 효율적으로 실행하는 반면 장기적인 종속성을 유지하는 데 어려움이 있습니다. 따라서 그래프의 일부 전역 속성(척도 없는 속성 등)은 포함하기 어렵습니다. 더욱이, 시퀀스 생성에 대한 기존 작업은 순열의 역할을 떠나 미리 정의된 시퀀스의 순서 지정으로 제한됩니다. 원샷 생성 방법은 여러 번의 반복을 통해 전체 그래프(즉, 노드와 에지)를 동시에 생성하고 개선하여 그래프의 전역 속성을 모델링할 수 있지만 노드 간의 전역 관계를 집합적으로 모델링해야 하기 때문에 시간이 많이 걸립니다. 복잡성은 일반적으로 O(N2)를 초과하므로 대부분의 방법을 큰 그래프로 확장하기가 어렵습니다.

좋은 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토

그래프 생성을 위한 조건부 깊이 생성 모델

조건부 깊이 그래프 생성의 목표는 조건부 분포 pmodel(G|y)을 학습하는 것입니다. 보조 정보는 카테고리 라벨, 의미적 맥락, 다른 배포 공간의 그래프 등이 될 수 있습니다. 조건부 생성은 무조건 깊이 맵 생성과 비교하여 맵 생성의 어려움 외에도 주어진 조건에서 특징을 추출하고 이를 맵 생성에 통합하는 방법도 고려해야 합니다.

따라서 기존의 조건부 깊이 맵 생성 모델을 체계적으로 도입하기 위해 이러한 방법이 조건을 처리하는 방법을 주로 설명합니다. 조건은 어떤 형태의 보조 정보일 수 있으므로 그림 1의 분류 트리의 노란색 부분에 표시된 것처럼 그래프, 순서 및 의미 컨텍스트를 포함하여 세 가지 유형으로 나뉩니다.

좋은 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토

위 내용은 '좋은' 그래프를 생성하는 방법은 무엇입니까? 그래프 생성을 위한 심층 생성 모델의 체계적 검토의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제