인공 지능에 대한 수요가 증가하면서 물리적 장치를 기반으로 하는 비전통적인 컴퓨팅에 대한 연구가 주도되었습니다. 이러한 컴퓨팅 장치는 두뇌에서 영감을 받은 아날로그 정보 처리를 모방하지만 학습 프로세스는 여전히 물리적 구현에 적합하지 않은 역전파와 같은 수치 처리에 최적화된 방법에 의존합니다.
여기서 일본의 NTT 장치 기술 연구소와 도쿄 대학의 연구원 팀은 직접 피드백 정렬(DFA) 딥 러닝이라는 생물학적으로 영감을 받은 훈련 알고리즘을 확장하여 물리학을 시연합니다. 원래 알고리즘과 달리 제안된 방법은 대체 비선형 활성화를 사용한 무작위 투영을 기반으로 합니다. 따라서 물리적 신경망은 물리적 시스템과 그 기울기에 대한 지식 없이도 훈련될 수 있습니다. 또한 이 훈련의 계산은 확장 가능한 물리적 하드웨어에서 시뮬레이션될 수 있습니다.
연구원들은 심층 저장소 컴퓨터라고 불리는 광전자 순환 신경망을 사용하여 개념 증명을 시연했습니다. 벤치마크에서 경쟁력 있는 성능을 갖춘 가속화된 컴퓨팅의 잠재력이 입증되었습니다. 결과는 뉴로모픽 컴퓨팅의 훈련 및 가속화를 위한 실용적인 솔루션을 제공합니다.
이 연구의 제목은 "생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식"이며 2022년 12월 26일 "Nature Communications"에 게재되었습니다.
물리적 딥러닝
이미지 처리, 음성 인식, 게임 등 분야에서 인공신경망(ANN) 기반 머신러닝의 기록적인 성능이 그 뛰어난 역량을 성공적으로 입증했습니다. 이러한 알고리즘은 인간의 두뇌가 작동하는 방식과 유사하지만 본질적으로 전통적인 폰 노이만 컴퓨팅 하드웨어를 사용하여 소프트웨어 수준에서 구현됩니다. 그러나 이러한 디지털 컴퓨팅 기반의 인공신경망은 에너지 소모와 처리속도 측면에서 문제를 안고 있다. 이러한 문제는 인공 신경망 구현을 위해 대체 물리적 플랫폼을 사용하도록 동기를 부여합니다.
흥미롭게도 수동적 물리적 역학도 무작위로 연결된 ANN의 계산 리소스로 사용될 수 있습니다. 물리적 저장소 컴퓨터(RC) 또는 익스트림 학습 머신(ELM)으로 알려진 이 프레임워크의 구현 용이성은 달성 가능한 재료의 선택과 응용 범위를 크게 확장합니다. 이러한 물리적으로 구현된 신경망(PNN)은 작업별 계산 부하를 물리적 시스템에 아웃소싱할 수 있습니다.
더 깊은 물리적 네트워크를 구축하는 것은 네트워크 표현 기능을 기하급수적으로 확장할 수 있으므로 성능을 더욱 향상시킬 수 있는 유망한 방향입니다. 이는 다양한 물리적 플랫폼을 사용하는 심층 PNN에 대한 제안에 동기를 부여합니다. 그들의 훈련은 기본적으로 소프트웨어 기반 ANN에서 큰 성공을 거둔 역전파(BP)라는 방법에 의존합니다. 그러나 BP는 다음과 같은 측면에서 PNN에 적합하지 않습니다. 첫째, BP 운영의 물리적 구현은 여전히 복잡하고 확장성이 없습니다. 둘째, BP는 물리적 시스템 전체에 대한 정확한 이해를 요구합니다. 또한 BP를 RC에 적용할 때 이러한 요구 사항은 물리적 RC의 고유한 속성, 즉 블랙박스 물리적 확률론적 네트워크를 정확하게 이해하고 시뮬레이션해야 하는 특성을 약화시킵니다.
PNN의 BP와 마찬가지로 생물학적 신경망에서 BP를 운영하는 것이 어렵다는 점은 뇌 과학 커뮤니티에서도 지적되어 왔습니다. 뇌에서 BP의 합리성은 항상 의문시되어 왔습니다. 이러한 고려 사항으로 인해 생물학적으로 건전한 훈련 알고리즘이 개발되었습니다.
가까운 미래에 유망한 방향은 DFA(Direct Feedback Alignment)입니다. 이 알고리즘에서는 최종 출력 레이어 오류 신호의 고정된 무작위 선형 변환이 역 오류 신호를 대체하는 데 사용됩니다. 따라서 이 방법에는 오류 신호의 계층별 전파나 가중치에 대한 지식이 필요하지 않습니다. 또한 DFA는 최신 대규모 네트워크 모델로 확장 가능한 것으로 보고되었습니다. 이러한 생물학적 동기 부여 훈련의 성공은 BP보다 PNN을 훈련하는 데 더 적합한 방법이 있음을 시사합니다. 그러나 DFA는 여전히 훈련을 위해 비선형 함수 f(x)의 도함수 f'(a)를 요구하므로 물리적 시스템에서 DFA 방법을 적용하는 데 방해가 됩니다. 따라서 PNN 애플리케이션에는 DFA의 대규모 확장이 중요합니다.
물리학 딥러닝을 위한 DFA 및 그 향상
여기서 연구자들은 DFA 알고리즘을 향상시켜 물리학 딥러닝을 시연합니다. 향상된 DFA에서는 표준 DFA의 물리적 비선형 활성화 f'(a)의 미분을 임의의 비선형 g(a)로 대체하고 g(a) 선택에 따라 성능이 견고하다는 것을 보여줍니다. 이러한 개선으로 인해 더 이상 f'(a)를 정확하게 모델링할 필요가 없습니다. 제안된 방법은 임의의 비선형 활성화를 사용한 병렬 확률론적 투영을 기반으로 하기 때문에 물리적 ELM 또는 RC 개념과 동일한 방식으로 물리적 시스템에서 훈련 계산을 수행할 수 있습니다. 이를 통해 추론과 훈련의 물리적 가속이 가능해집니다.
그림: PNN의 개념과 BP 및 강화된 DFA를 통한 교육. (출처: 논문)
개념 증명을 시연하기 위해 연구원들은 FPGA 지원 광전자 심층 물리학 RC를 작업대로 구축했습니다. 벤치탑은 사용이 간편하고 소프트웨어 수준의 업데이트만으로 다양한 물리적 플랫폼에 적용할 수 있지만, 크고 복잡한 첨단 시스템에 버금가는 성능을 발휘한다.
그림: 향상된 DFA 교육을 갖춘 광전자 깊이 RC 시스템. (출처: 논문)
또한, 디지털 처리 시간을 포함한 전체 처리 시간을 비교한 결과, 훈련 과정의 물리적 가속 가능성이 발견되었습니다.
그림: 광전자 딥 RC 시스템의 성능. (출처: 논문)
RC 벤치의 처리 시간 예산은 다음과 같이 분류됩니다. FPGA 처리(데이터 전송, 메모리 할당 및 DAC/ADC) ~92% 전처리/후처리를 위한 디지털 처리 처리. 따라서 현 단계에서는 처리 시간이 FPGA 및 CPU의 수치 계산에 의해 좌우됩니다. 이는 광전자 벤치가 단 하나의 비선형 지연 라인을 사용하여 하나의 저장소를 구현하기 때문입니다. 향후 완전 병렬 및 전광 컴퓨팅 하드웨어를 사용하면 이러한 제한이 완화될 수 있습니다. 보시다시피, CPU와 GPU에서의 계산은 노드 수에 대해 O(N^2) 경향을 보이는 반면, 벤치탑은 데이터 전송 병목 현상으로 인해 O(N)을 나타냅니다.
CPU 외부의 물리적 가속은 BP 및 향상된 DFA 알고리즘에 대해 각각 N ~5,000 및 ~12,000에서 관찰됩니다. 그러나 계산 속도 측면에서는 메모리 제한으로 인해 GPU에 대한 효율성이 직접적으로 관찰되지 않았습니다. GPU 추세를 추정하면 N ~80,000에서 GPU에 대한 물리적 속도 향상을 관찰할 수 있습니다. 우리가 아는 한, 이는 전체 훈련 과정에 대한 첫 번째 비교이자 PNN을 사용한 신체 훈련 가속화의 첫 번째 시연입니다.
제안된 방법이 다른 시스템에 적용 가능한지 조사하기 위해 널리 연구된 광자 신경망을 사용하여 수치 시뮬레이션을 수행했습니다. 또한, 실험적으로 입증된 지연 기반 RC는 다양한 물리적 시스템에 매우 적합한 것으로 나타났습니다. 물리적 시스템의 확장성과 관련하여 심층 네트워크 구축의 주요 문제는 고유한 노이즈입니다. 소음의 영향은 수치 시뮬레이션을 통해 연구됩니다. 시스템은 소음에 강한 것으로 확인되었습니다.
제안된 접근 방식의 확장성과 한계
여기에서는 보다 현대적인 모델에 대한 DFA 기반 접근 방식의 확장성이 고려됩니다. 실용적인 딥러닝에 가장 일반적으로 사용되는 모델 중 하나는 심층 연결 컨볼루셔널 신경망(CNN)입니다. 그러나 DFA 알고리즘은 표준 CNN에 적용하기 어려운 것으로 보고됐다. 따라서 제안하는 방법은 컨벌루션 PNN에 간단하게 적용하기 어려울 수 있다.
SNN에의 적용 여부도 시뮬레이션 하드웨어 구현을 고려할 때 중요한 주제입니다. SNN에 DFA 기반 훈련의 적용 가능성이 보고되었는데, 이는 본 연구에서 제안하는 강화된 DFA가 훈련을 더 쉽게 할 수 있음을 의미한다.
DFA 기반 알고리즘은 단순한 MLP 또는 RC보다 더 실용적인 모델로 확장될 수 있는 잠재력이 있지만 이러한 네트워크에 DFA 기반 교육을 적용하는 효과는 아직 알려지지 않았습니다. 여기서는 본 연구에 대한 추가 작업으로 위에서 언급한 모델(MLP-Mixer, Vision Transformer(ViT), ResNet 및 SNN)에 대한 DFA 기반 학습(DFA 자체 및 향상된 DFA)의 확장성을 조사합니다. DFA 기반 교육은 탐색적 실무 모델에도 효과적인 것으로 나타났습니다. DFA 기반 훈련의 달성 가능한 정확도는 기본적으로 BP 훈련의 정확도보다 낮지만 모델 및/또는 알고리즘을 일부 조정하면 성능이 향상될 수 있습니다. 특히, DFA와 증강 DFA의 정확도는 탐색된 모든 실험 설정에서 유사했으며, 이는 DFA 자체의 추가 개선이 증강 DFA 개선에 직접적으로 기여할 것임을 시사합니다. 결과는 이 방법이 단순한 MLP 또는 RC 모델을 넘어 PNN의 실제 모델 구현으로 확장될 수 있음을 보여줍니다.
표 1: 실제 네트워크 모델에 대한 향상된 DFA 적용 가능성. (출처: Paper)
BP와 물리적 하드웨어의 DFA
일반적으로 BP는 그래프의 모든 정보를 계산해야 하기 때문에 물리적 하드웨어에 구현하기가 매우 어렵습니다. 따라서 물리적인 하드웨어에 대한 훈련은 항상 전산 시뮬레이션을 통해 이루어져 왔으며, 이로 인해 많은 전산 비용이 발생합니다. 또한 모델과 실제 시스템의 차이로 인해 정확도가 저하됩니다. 이와 대조적으로 향상된 DFA에는 물리적 시스템에 대한 정확한 사전 지식이 필요하지 않습니다. 따라서 Deep PNN에서는 DFA 기반 방법이 BP 기반 방법보다 정확도 측면에서 더 효과적입니다. 또한 물리적 하드웨어를 사용하여 계산을 가속화할 수 있습니다.
또한 DFA 학습에는 계층별로 계산된 순차적 오류 전파가 필요하지 않습니다. 즉, 각 계층의 학습을 병렬로 수행할 수 있습니다. 따라서 보다 최적화되고 병렬적인 DFA 구현을 통해 속도가 더욱 크게 향상될 수 있습니다. 이러한 고유한 특성은 특히 물리적 하드웨어 기반 신경망에 대한 DFA 기반 방법의 효율성을 보여줍니다. 반면에 향상된 DFA 훈련 모델의 정확도는 BP 훈련 모델의 정확도보다 여전히 낮습니다. DFA 기반 교육의 정확성을 더욱 향상시키는 것은 향후 과제로 남아 있습니다.
추가 물리 가속
물리 구현을 통해 대규모 노드 수로 RC 루프 처리의 가속을 확인합니다. 그러나 그 장점은 여전히 제한적이며 추가적인 개선이 필요합니다. 현재 프로토타입의 처리 시간은 FPGA로의 데이터 전송 및 메모리 할당으로 표현됩니다. 따라서 모든 프로세스를 FPGA에 통합하면 실험적 유연성을 희생하면서 성능이 크게 향상됩니다. 또한, 미래에는 공중 광학 방식이 전송 비용을 크게 절감할 것입니다. 대규모 광 통합과 온칩 통합은 광 컴퓨팅 자체의 성능을 더욱 향상시킬 것입니다.
위 내용은 생물학적으로 영감을 받은 훈련 방법을 사용한 물리적 딥 러닝: 물리적 하드웨어에 대한 그라데이션 없는 접근 방식의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

대형 언어 모델 (LLM)은 인기가 높아졌으며, 도구 전달 기능은 단순한 텍스트 생성을 넘어 기능을 극적으로 확장했습니다. 이제 LLM은 동적 UI 생성 및 자율적 인 A와 같은 복잡한 자동화 작업을 처리 할 수 있습니다.

비디오 게임이 불안을 완화하거나 집중하거나 ADHD를 가진 어린이를 지원할 수 있습니까? 건강 관리 도전이 전 세계적으로 급증함에 따라, 특히 청소년들 사이에서 혁신가들은 비디오 게임 인 가능성이없는 도구로 전환하고 있습니다. 이제 세계 최대의 엔터테인먼트 인더스 중 하나입니다

UNCTAD의 사무 총장 인 Rebeca Grynspan은“역사는 기술 진보가 경제 성장을 유발하거나 공평한 소득 분배를 보장하거나 포용적인 인간 발전을 촉진하지는 않습니다.

쉽게 생성 AI를 협상 교사 및 스파링 파트너로 사용하십시오. 그것에 대해 이야기합시다. 혁신적인 AI 혁신에 대한이 분석은 AI의 최신 Forbes 열 범위의 일부입니다.

밴쿠버에서 개최 된 TED2025 컨퍼런스는 어제 4 월 11 일 36 번째 판을 마무리했습니다. Sam Altman, Eric Schmidt 및 Palmer Luckey를 포함한 60 개 이상의 국가에서 80 명의 스피커를 선보였습니다. 테드의 주제 인“인류를 다시 상상했다”는 재단사가 만들어졌다

Joseph Stiglitz는 2001 년에 유명한 경제학자이자 노벨 경제학상을 수상했습니다. Stiglitz는 AI가 기존의 불평등과 통합 된 권력을 몇몇 지배적 인 기업의 손에 악화시킬 수 있으며 궁극적으로 경제를 훼손 할 수 있다고 주장합니다.

그래프 데이터베이스 : 관계를 통한 데이터 관리 혁명 데이터가 확장되고 그 특성이 다양한 필드에서 발전함에 따라 그래프 데이터베이스는 상호 연결된 데이터를 관리하기위한 변환 솔루션으로 떠오르고 있습니다. 전통적인 것과는 달리

대형 언어 모델 (LLM) 라우팅 : 지능형 작업 분포를 통한 성능 최적화 LLM의 빠르게 진화하는 환경은 각각 독특한 강점과 약점을 가진 다양한 모델을 제시합니다. 일부는 Creative Content Gen에서 탁월합니다


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

드림위버 CS6
시각적 웹 개발 도구

WebStorm Mac 버전
유용한 JavaScript 개발 도구

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경
