>  기사  >  기술 주변기기  >  Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

王林
王林앞으로
2023-04-14 14:10:07960검색

지난 10월 4일 발표된 2022년 노벨상에서는 알랭 아스펙트(Alain Aspect), 존 F. 클라우즈(John F. Clause), 안톤 차일링거(Anton Zeilinger) 세 명의 과학자가 양자얽힘으로 물리학상을 수상해 양자 연구 분야에서 외부의 관심과 논의를 불러일으켰습니다.

그 중 양자 컴퓨팅으로 대표되는 연구 투자는 최근 몇 년 동안 크게 증가했습니다. 사람들은 보안, 네트워크 통신 등의 분야에서 기존의 고전 컴퓨팅 기술을 전복하기 위해 양자 방법을 사용하는 방법을 모색하기 시작했습니다.

일부 연구자들은 양자컴퓨팅의 핵심이 "낮은 계산 비용 기술을 통해 고전적인 문제를 해결하는 것"에 있다고 믿습니다. 최근 딥러닝과 양자컴퓨팅 연구가 병행 발전하면서 많은 연구자들도 주목하기 시작했습니다. 이 두 분야의 교차점은 양자 딥러닝입니다.

최근 Xbox Game Studio Rare의 통찰력 책임자인 Holly Emblem은 새로운 기사 "Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks"에서 양자 딥러닝의 기존 연구 및 응용 프로그램을 소개했습니다. 기존 컴퓨팅 방법과 비교하여 양자 컨벌루션 신경망(QCNN)의 장점과 한계에 대해 논의합니다.

1 클래식 컴퓨팅과 양자 컴퓨팅의 차이점

먼저 클래식 컴퓨팅과 양자 컴퓨팅의 차이점에 대한 중요한 개념을 소개합니다. 프로그램이 클래식 컴퓨터에서 실행될 때 컴파일러는 프로그램 명령문을 이진 비트로 변환합니다. 양자 컴퓨팅에서는 비트가 언제든지 1 또는 0을 나타내는 클래식 컴퓨터와 달리 큐비트는 "호버링" 상태일 수 있습니다. "상태 사이에서 측정될 때만 큐비트는 두 가지 바닥 상태인 1 또는 0 중 하나로 붕괴됩니다.

이 속성을 중첩이라고 하며 양자 컴퓨팅 작업에 중요한 역할을 합니다. 중첩을 통해 양자 컴퓨터는 완전 병렬 아키텍처나 GPU 없이 작업을 병렬로 수행할 수 있습니다. 그 이유는 각 오버레이 상태가 서로 다른 값에 해당하는 경우, 해당 오버레이 상태에 대해 연산을 수행하면 모든 상태에 대해 연산이 동시에 수행되기 때문이다.

다음은 양자 상태 중첩의 예입니다.

양자 상태의 중첩은 지수적입니다. a와 b는 확률 크기를 나타내며 측정이 수행되면 상태로 투영될 확률을 제공합니다. 그 중 중첩 양자 상태는 양자 논리 게이트를 사용하여 생성됩니다.

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

캡션: 핀란드 에스포의 Ragsxl IQM 양자 컴퓨터

2 얽힘 및 벨 상태

중첩은 양자 물리학에서 매우 중요하며 또 다른 핵심 원리는 얽힘입니다.

얽힘은 두 개 이상의 입자 사이에 어떤 방식으로든 상호 작용을 생성하거나 유발하는 동작을 의미합니다. 즉, 이러한 입자의 양자 상태는 멀리 떨어져 있더라도 더 이상 서로 독립적으로 설명할 수 없습니다. 입자가 얽힐 때 한 입자를 측정하면 얽힌 다른 입자는 즉시 반대 상태로 측정됩니다(이러한 입자에는 국지적 상태가 없음).

큐비트와 얽힘에 대한 이해가 발전함에 따라 벨 상태에 대해 논의합니다. 다음은 큐비트의 최대 얽힘 상태를 보여줍니다.

|00  → β → 1 √ 2 (|00  + |11 ) = | β00 ,

|01  → β → 1 √ 2 (|01  + |10 ) = |β01 

|10  → β → 1 √ 2 (| 00  - |11 ) = |β10 

|11  → β → 1 √ 2 (|01  - |10 ) = |β11 

양자 회로를 사용하여 벨 상태 생성:

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

캡션: 페리의 양자 컴퓨팅 사원에 있는 벨 상태 회로

표시된 벨 상태 회로에서는 큐비트 입력을 취하고 Hadamard 게이트와 CNOT 게이트를 적용하여 얽힌 벨 상태를 생성합니다.

현재 Bell 상태는 일련의 양자 컴퓨팅 응용 프로그램을 개발하는 데 사용되어 왔으며 그중 Hegazy, Bahaa-Eldin 및 Dakoury는 Bell 상태와 초고밀도 코딩을 사용하여 "무조건적인 보안"을 달성할 수 있다는 이론을 제안했습니다. .

3 Convolutional Neural Networks and Quantum Convolutional Neural Networks

François Chollet은 Python Deep Learning에서 CNN(Convolutional Neural Networks)이 선을 나타내는 것과 같은 패턴 계층을 구축하기 때문에 이미지 분류와 같은 작업에서 인기가 있다고 지적했습니다. 먼저 해당 선의 가장자리를 처리하면 CNN이 레이어 간의 정보를 기반으로 복잡한 시각적 데이터를 표현할 수 있습니다.

CNN에는 입력을 통해 "슬라이드"하고 입력의 패턴을 감지할 수 있는 "특징 맵"을 생성하는 필터로 구성된 컨볼루션 레이어가 있습니다. 동시에 CNN은 풀링 레이어를 사용하여 특징 맵의 크기를 줄여 학습에 필요한 리소스를 줄일 수 있습니다. ㅋㅋㅋ

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.Garg와 Ramakrishnan은 양자 신경망을 개발하는 일반적인 접근 방식은 무작위 양자 회로를 기반으로 한 변환인 소위 "양자 컨볼루셔널 레이어"를 도입하는 "하이브리드" 접근 방식을 개발하는 것이라고 믿습니다. -클래식 CNN에서.

다음은 Yanxuan Lü와 다른 연구원들이 개발하고 MNIST 손글씨 숫자 데이터세트에서 테스트한 하이브리드 QCNN을 보여줍니다.

"A Quantum Convolutional Neural Network for Image Classification" 논문에서 연구원들은 양자 회로를 채택하고 얽힘은 입력 이미지를 가져와 예측을 출력으로 생성하기 위해 고전 모델의 일부로 사용됩니다.

이 방법에서 QCNN은 이미지 데이터를 입력으로 가져와 양자 상태 |x>로 인코딩한 다음 양자 컨볼루션 및 풀링 레이어를 사용하여 변환하여 마지막으로 특징을 추출합니다. 강하게 얽힌 완전히 연결된 레이어를 사용하여 분류합니다. 측정을 통한 회로 및 예측.

최적화는 SGD(확률적 경사하강법)를 통해 처리되며, 이는 훈련 데이터 레이블과 QCNN 예측 레이블 간의 차이를 줄이는 데 사용할 수 있습니다. 양자회로를 중심으로 회전연산자와 CNOT 게이트를 포함하여 양자 컨벌루션 계층에서 사용되는 게이트는 다음과 같다.

풀링 계층에서 큐비트의 하위 집합을 측정하면 그 결과에 따라 인접 비트에 단일 큐비트 게이트를 적용할지 여부가 결정됩니다.

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

완전히 연결된 계층은 "범용 단일 큐비트 게이트"와 구성으로 구성됩니다. 얽힌 상태를 생성하는 CNOT 게이트의 QCNN을 다른 방법과 비교하기 위해 연구원들은 시뮬레이션된 QCNN과 함께 MNIST 데이터 세트를 사용했습니다. 일반적인 접근 방식에 따라 훈련/테스트 데이터 세트를 생성하고 다음 레이어로 구성된 QCNN을 개발했습니다.

2개의 양자 컨볼루션 레이어

2개의 양자 풀링 레이어

1개의 양자 완전 연결 레이어

  • 데이터 세트에서 이 QCNN의 테스트 세트 정확도는 96.65%에 도달했으며, Papers with Code의 데이터에 따라 테스트한 후 클래식 CNN에서 이 데이터 세트의 최고 정확도 점수는 99.91%에 도달할 수 있습니다.
  • 이 실험에서는 두 가지 유형의 MNIST 데이터 세트만 분류되었으므로 다른 MNIST 모델 성능과 성능을 완전히 비교하는 데 한계가 있다는 점에 유의해야 합니다.
  • 4 타당성 평가 및 요약

    연구원들이 QCNN에서 방법을 개발했지만 현재 이 분야의 주요 문제는 이론적 모델을 구현하는 데 필요한 하드웨어가 아직 존재하지 않는다는 것입니다. 또한 하이브리드 방법은 기존 CNN 계산에 양자 진화 계층을 동시에 도입하는 테스트 방법에서도 어려움을 겪고 있습니다.

    양자 컴퓨팅의 장점 중 하나가 "계산적으로 더 저렴한 기술로 고전적으로 다루기 힘든 문제"를 해결할 수 있는 능력이라고 생각한다면, 이러한 솔루션의 중요한 측면은 "양자 가속"에 있습니다. 일부 연구자들은 기존 구현에 비해 양자 기계 학습의 장점은 양자 알고리즘이 다항식 또는 심지어 지수 가속 시간을 가질 것으로 예상된다는 점이라고 믿습니다.

    그러나 위에 표시된 QCNN 방법의 한 가지 제한 사항은 고전적인 데이터 및 측정값을 일관되게 디코딩/인코딩하는 알고리즘(예: QCNN)이 필요한 경우 "양자 가속" 이득이 제한되어 있으며 현재는 없다는 것입니다. "양자 가속"의 이점을 누릴 수 있도록 최소한의 측정이 필요한 최상의 인코딩/디코딩 및 프로토콜을 설계하는 방법에 대한 많은 정보.

    얽힘은 양자 기계 학습의 중요한 속성임이 입증되었습니다. 강력한 얽힘 회로를 사용하는 QCNN에 대한 연구는 완전히 연결된 계층으로 얽힌 상태를 생성하여 모델이 예측할 수 있도록 합니다. 뿐만 아니라 얽힘을 사용하여 이미지에서 중요한 특징을 추출하는 등 다른 영역의 딥 러닝 모델을 지원하는 데에도 사용되며, 데이터 세트에서 얽힘을 사용하면 모델이 이전에 예상했던 것보다 더 작은 훈련 데이터 세트에서 학습할 수 있음을 의미할 수 있습니다. .

    이 글에서는 고전적인 딥러닝 방법과 양자 딥러닝 방법을 비교하고, 양자 계층(강하게 얽힌 회로 포함)을 활용하여 예측을 생성하는 QCNN에 대해 논의하고, 양자 딥러닝의 장점과 한계를 분석하고, 얽힘을 소개합니다. 기계 학습의 보다 일반적인 적용은 또한 양자 딥 러닝의 다음 단계, 특히 더 많은 분야에서의 QCNN 적용에 대해 생각할 수 있음을 의미합니다. 또한, 양자 하드웨어 역시 지속적으로 발전하고 있으며, 사이퀀텀(PsiQuantum) 등의 기업에서는 100만 큐비트를 탑재한 양자 프로세서를 개발하겠다는 목표까지 제시한 바 있다.

    딥러닝과 양자컴퓨팅 분야의 연구가 계속되면서 양자딥러닝의 발전도 더욱 기대됩니다.

위 내용은 Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제