>  기사  >  기술 주변기기  >  생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식

생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식

PHPz
PHPz앞으로
2023-04-12 09:04:02792검색

인공 지능에 대한 수요가 증가하면서 물리적 장치를 기반으로 하는 비전통적인 컴퓨팅에 대한 연구가 주도되었습니다. 이러한 컴퓨팅 장치는 두뇌에서 영감을 받은 아날로그 정보 처리를 모방하지만 학습 프로세스는 여전히 물리적 구현에 적합하지 않은 역전파와 같은 수치 처리에 최적화된 방법에 의존합니다.

여기서 일본의 NTT 장치 기술 연구소와 도쿄 대학의 연구원 팀은 직접 피드백 정렬(DFA) 딥 러닝이라는 생물학적으로 영감을 받은 훈련 알고리즘을 확장하여 물리학을 시연합니다. 원래 알고리즘과 달리 제안된 방법은 대체 비선형 활성화를 사용한 무작위 투영을 기반으로 합니다. 따라서 물리적 신경망은 물리적 시스템과 그 기울기에 대한 지식 없이도 훈련될 수 있습니다. 또한 이 훈련의 계산은 확장 가능한 물리적 하드웨어에서 시뮬레이션될 수 있습니다.

연구원들은 심층 저장소 컴퓨터라고 불리는 광전자 순환 신경망을 사용하여 개념 증명을 시연했습니다. 벤치마크에서 경쟁력 있는 성능을 갖춘 가속화된 컴퓨팅의 잠재력이 입증되었습니다. 결과는 뉴로모픽 컴퓨팅의 훈련 및 가속화를 위한 실용적인 솔루션을 제공합니다.

이 연구의 제목은 "생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식"이며 2022년 12월 26일 "Nature Communications"에 게재되었습니다.

물리적 딥러닝

이미지 처리, 음성 인식, 게임 등 분야에서 인공신경망(ANN) 기반 머신러닝의 기록적인 성능이 그 뛰어난 역량을 성공적으로 입증했습니다. 이러한 알고리즘은 인간의 두뇌가 작동하는 방식과 유사하지만 본질적으로 전통적인 폰 노이만 컴퓨팅 하드웨어를 사용하여 소프트웨어 수준에서 구현됩니다. 그러나 이러한 디지털 컴퓨팅 기반의 인공신경망은 에너지 소모와 처리속도 측면에서 문제를 안고 있다. 이러한 문제는 인공 신경망 구현을 위해 대체 물리적 플랫폼을 사용하도록 동기를 부여합니다.

흥미롭게도 수동적 물리적 역학도 무작위로 연결된 ANN의 계산 리소스로 사용될 수 있습니다. 물리적 저장소 컴퓨터(RC) 또는 익스트림 학습 머신(ELM)으로 알려진 이 프레임워크의 구현 용이성은 달성 가능한 재료의 선택과 응용 범위를 크게 확장합니다. 이러한 물리적으로 구현된 신경망(PNN)은 작업별 계산 부하를 물리적 시스템에 아웃소싱할 수 있습니다.

더 깊은 물리적 네트워크를 구축하는 것은 네트워크 표현 기능을 기하급수적으로 확장할 수 있으므로 성능을 더욱 향상시킬 수 있는 유망한 방향입니다. 이는 다양한 물리적 플랫폼을 사용하는 심층 PNN에 대한 제안에 동기를 부여합니다. 그들의 훈련은 기본적으로 소프트웨어 기반 ANN에서 큰 성공을 거둔 역전파(BP)라는 방법에 의존합니다. 그러나 BP는 다음과 같은 측면에서 PNN에 적합하지 않습니다. 첫째, BP 운영의 물리적 구현은 여전히 ​​복잡하고 확장성이 없습니다. 둘째, BP는 물리적 시스템 전체에 대한 정확한 이해를 요구합니다. 또한 BP를 RC에 적용할 때 이러한 요구 사항은 물리적 RC의 고유한 속성, 즉 블랙박스 물리적 확률론적 네트워크를 정확하게 이해하고 시뮬레이션해야 하는 특성을 약화시킵니다.

PNN의 BP와 마찬가지로 생물학적 신경망에서 BP를 운영하는 것이 어렵다는 점은 뇌 과학 커뮤니티에서도 지적되어 왔습니다. 뇌에서 BP의 합리성은 항상 의문시되어 왔습니다. 이러한 고려 사항으로 인해 생물학적으로 건전한 훈련 알고리즘이 개발되었습니다.

가까운 미래에 유망한 방향은 DFA(Direct Feedback Alignment)입니다. 이 알고리즘에서는 최종 출력 레이어 오류 신호의 고정된 무작위 선형 변환이 역 오류 신호를 대체하는 데 사용됩니다. 따라서 이 방법에는 오류 신호의 계층별 전파나 가중치에 대한 지식이 필요하지 않습니다. 또한 DFA는 최신 대규모 네트워크 모델로 확장 가능한 것으로 보고되었습니다. 이러한 생물학적 동기 부여 훈련의 성공은 BP보다 PNN을 훈련하는 데 더 적합한 방법이 있음을 시사합니다. 그러나 DFA는 여전히 훈련을 위해 비선형 함수 f(x)의 도함수 f'(a)를 요구하므로 물리적 시스템에서 DFA 방법을 적용하는 데 방해가 됩니다. 따라서 PNN 애플리케이션에는 DFA의 대규모 확장이 중요합니다.

물리학 딥러닝을 위한 DFA 및 그 향상

여기서 연구자들은 DFA 알고리즘을 향상시켜 물리학 딥러닝을 시연합니다. 향상된 DFA에서는 표준 DFA의 물리적 비선형 활성화 f'(a)의 미분을 임의의 비선형 g(a)로 대체하고 g(a) 선택에 따라 성능이 견고하다는 것을 보여줍니다. 이러한 개선으로 인해 더 이상 f'(a)를 정확하게 모델링할 필요가 없습니다. 제안된 방법은 임의의 비선형 활성화를 사용한 병렬 확률론적 투영을 기반으로 하기 때문에 물리적 ELM 또는 RC 개념과 동일한 방식으로 물리적 시스템에서 훈련 계산을 수행할 수 있습니다. 이를 통해 추론과 훈련의 물리적 가속이 가능해집니다.

생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식

그림: PNN의 개념과 BP 및 강화된 DFA를 통한 교육. (출처: 논문)

개념 증명을 시연하기 위해 연구원들은 FPGA 지원 광전자 심층 물리학 RC를 작업대로 구축했습니다. 벤치탑은 사용이 간편하고 소프트웨어 수준의 업데이트만으로 다양한 물리적 플랫폼에 적용할 수 있지만, 크고 복잡한 첨단 시스템에 버금가는 성능을 발휘한다.

생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식

그림: 향상된 DFA 교육을 갖춘 광전자 깊이 RC 시스템. (출처: 논문)

또한, 디지털 처리 시간을 포함한 전체 처리 시간을 비교한 결과, 훈련 과정의 물리적 가속 가능성이 발견되었습니다.

생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식

그림: 광전자 딥 RC 시스템의 성능. (출처: 논문)

RC 벤치의 처리 시간 예산은 다음과 같이 분류됩니다. FPGA 처리(데이터 전송, 메모리 할당 및 DAC/ADC) ~92% 전처리/후처리를 위한 디지털 처리 처리. 따라서 현 단계에서는 처리 시간이 FPGA 및 CPU의 수치 계산에 의해 좌우됩니다. 이는 광전자 벤치가 단 하나의 비선형 지연 라인을 사용하여 하나의 저장소를 구현하기 때문입니다. 향후 완전 병렬 및 전광 컴퓨팅 하드웨어를 사용하면 이러한 제한이 완화될 수 있습니다. 보시다시피, CPU와 GPU에서의 계산은 노드 수에 대해 O(N^2) 경향을 보이는 반면, 벤치탑은 데이터 전송 병목 현상으로 인해 O(N)을 나타냅니다.

CPU 외부의 물리적 가속은 BP 및 향상된 DFA 알고리즘에 대해 각각 N ~5,000 및 ~12,000에서 관찰됩니다. 그러나 계산 속도 측면에서는 메모리 제한으로 인해 GPU에 대한 효율성이 직접적으로 관찰되지 않았습니다. GPU 추세를 추정하면 N ~80,000에서 GPU에 대한 물리적 속도 향상을 관찰할 수 있습니다. 우리가 아는 한, 이는 전체 훈련 과정에 대한 첫 번째 비교이자 PNN을 사용한 신체 훈련 가속화의 첫 번째 시연입니다.

제안된 방법이 다른 시스템에 적용 가능한지 조사하기 위해 널리 연구된 광자 신경망을 사용하여 수치 시뮬레이션을 수행했습니다. 또한, 실험적으로 입증된 지연 기반 RC는 다양한 물리적 시스템에 매우 적합한 것으로 나타났습니다. 물리적 시스템의 확장성과 관련하여 심층 네트워크 구축의 주요 문제는 고유한 노이즈입니다. 소음의 영향은 수치 시뮬레이션을 통해 연구됩니다. 시스템은 소음에 강한 것으로 확인되었습니다.

제안된 접근 방식의 확장성과 한계

여기에서는 보다 현대적인 모델에 대한 DFA 기반 접근 방식의 확장성이 고려됩니다. 실용적인 딥러닝에 가장 일반적으로 사용되는 모델 중 하나는 심층 연결 컨볼루셔널 신경망(CNN)입니다. 그러나 DFA 알고리즘은 표준 CNN에 적용하기 어려운 것으로 보고됐다. 따라서 제안하는 방법은 컨벌루션 PNN에 간단하게 적용하기 어려울 수 있다.

SNN에의 적용 여부도 시뮬레이션 하드웨어 구현을 고려할 때 중요한 주제입니다. SNN에 DFA 기반 훈련의 적용 가능성이 보고되었는데, 이는 본 연구에서 제안하는 강화된 DFA가 훈련을 더 쉽게 할 수 있음을 의미한다.

DFA 기반 알고리즘은 단순한 MLP 또는 RC보다 더 실용적인 모델로 확장될 수 있는 잠재력이 있지만 이러한 네트워크에 DFA 기반 교육을 적용하는 효과는 아직 알려지지 않았습니다. 여기서는 본 연구에 대한 추가 작업으로 위에서 언급한 모델(MLP-Mixer, Vision Transformer(ViT), ResNet 및 SNN)에 대한 DFA 기반 학습(DFA 자체 및 향상된 DFA)의 확장성을 조사합니다. DFA 기반 교육은 탐색적 실무 모델에도 효과적인 것으로 나타났습니다. DFA 기반 훈련의 달성 가능한 정확도는 기본적으로 BP 훈련의 정확도보다 낮지만 모델 및/또는 알고리즘을 일부 조정하면 성능이 향상될 수 있습니다. 특히, DFA와 증강 DFA의 정확도는 탐색된 모든 실험 설정에서 유사했으며, 이는 DFA 자체의 추가 개선이 증강 DFA 개선에 직접적으로 기여할 것임을 시사합니다. 결과는 이 방법이 단순한 MLP 또는 RC 모델을 넘어 PNN의 실제 모델 구현으로 확장될 수 있음을 보여줍니다.

표 1: 실제 네트워크 모델에 대한 향상된 DFA 적용 가능성. (출처: Paper)

생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식

BP와 물리적 하드웨어의 DFA

일반적으로 BP는 그래프의 모든 정보를 계산해야 하기 때문에 물리적 하드웨어에 구현하기가 매우 어렵습니다. 따라서 물리적인 하드웨어에 대한 훈련은 항상 전산 시뮬레이션을 통해 이루어져 왔으며, 이로 인해 많은 전산 비용이 발생합니다. 또한 모델과 실제 시스템의 차이로 인해 정확도가 저하됩니다. 이와 대조적으로 향상된 DFA에는 물리적 시스템에 대한 정확한 사전 지식이 필요하지 않습니다. 따라서 Deep PNN에서는 DFA 기반 방법이 BP 기반 방법보다 정확도 측면에서 더 효과적입니다. 또한 물리적 하드웨어를 사용하여 계산을 가속화할 수 있습니다.

또한 DFA 학습에는 계층별로 계산된 순차적 오류 전파가 필요하지 않습니다. 즉, 각 계층의 학습을 병렬로 수행할 수 있습니다. 따라서 보다 최적화되고 병렬적인 DFA 구현을 통해 속도가 더욱 크게 향상될 수 있습니다. 이러한 고유한 특성은 특히 물리적 하드웨어 기반 신경망에 대한 DFA 기반 방법의 효율성을 보여줍니다. 반면에 향상된 DFA 훈련 모델의 정확도는 BP 훈련 모델의 정확도보다 여전히 낮습니다. DFA 기반 교육의 정확성을 더욱 향상시키는 것은 향후 과제로 남아 있습니다.

추가 물리 가속

물리 구현을 통해 대규모 노드 수로 RC 루프 처리의 가속을 확인합니다. 그러나 그 장점은 여전히 ​​제한적이며 추가적인 개선이 필요합니다. 현재 프로토타입의 처리 시간은 FPGA로의 데이터 전송 및 메모리 할당으로 표현됩니다. 따라서 모든 프로세스를 FPGA에 통합하면 실험적 유연성을 희생하면서 성능이 크게 향상됩니다. 또한, 미래에는 공중 광학 방식이 전송 비용을 크게 절감할 것입니다. 대규모 광 통합과 온칩 통합은 광 컴퓨팅 자체의 성능을 더욱 향상시킬 것입니다.

위 내용은 생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제