Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

王林

Apr 14, 2023 pm 02:10 PM

딥러닝양자

지난 10월 4일 발표된 2022년 노벨상에서는 알랭 아스펙트(Alain Aspect), 존 F. 클라우즈(John F. Clause), 안톤 차일링거(Anton Zeilinger) 세 명의 과학자가 양자얽힘으로 물리학상을 수상해 양자 연구 분야에서 외부의 관심과 논의를 불러일으켰습니다.

그 중 양자 컴퓨팅으로 대표되는 연구 투자는 최근 몇 년 동안 크게 증가했습니다. 사람들은 보안, 네트워크 통신 등의 분야에서 기존의 고전 컴퓨팅 기술을 전복하기 위해 양자 방법을 사용하는 방법을 모색하기 시작했습니다.

일부 연구자들은 양자컴퓨팅의 핵심이 "낮은 계산 비용 기술을 통해 고전적인 문제를 해결하는 것"에 있다고 믿습니다. 최근 딥러닝과 양자컴퓨팅 연구가 병행 발전하면서 많은 연구자들도 주목하기 시작했습니다. 이 두 분야의 교차점은 양자 딥러닝입니다.

최근 Xbox Game Studio Rare의 통찰력 책임자인 Holly Emblem은 새로운 기사 "Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks"에서 양자 딥러닝의 기존 연구 및 응용 프로그램을 소개했습니다. 기존 컴퓨팅 방법과 비교하여 양자 컨벌루션 신경망(QCNN)의 장점과 한계에 대해 논의합니다.

1 클래식 컴퓨팅과 양자 컴퓨팅의 차이점

먼저 클래식 컴퓨팅과 양자 컴퓨팅의 차이점에 대한 중요한 개념을 소개합니다. 프로그램이 클래식 컴퓨터에서 실행될 때 컴파일러는 프로그램 명령문을 이진 비트로 변환합니다. 양자 컴퓨팅에서는 비트가 언제든지 1 또는 0을 나타내는 클래식 컴퓨터와 달리 큐비트는 "호버링" 상태일 수 있습니다. "상태 사이에서 측정될 때만 큐비트는 두 가지 바닥 상태인 1 또는 0 중 하나로 붕괴됩니다.

이 속성을 중첩이라고 하며 양자 컴퓨팅 작업에 중요한 역할을 합니다. 중첩을 통해 양자 컴퓨터는 완전 병렬 아키텍처나 GPU 없이 작업을 병렬로 수행할 수 있습니다. 그 이유는 각 오버레이 상태가 서로 다른 값에 해당하는 경우, 해당 오버레이 상태에 대해 연산을 수행하면 모든 상태에 대해 연산이 동시에 수행되기 때문이다.

다음은 양자 상태 중첩의 예입니다.

양자 상태의 중첩은 지수적입니다. a와 b는 확률 크기를 나타내며 측정이 수행되면 상태로 투영될 확률을 제공합니다. 그 중 중첩 양자 상태는 양자 논리 게이트를 사용하여 생성됩니다.

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

캡션: 핀란드 에스포의 Ragsxl IQM 양자 컴퓨터

2 얽힘 및 벨 상태

중첩은 양자 물리학에서 매우 중요하며 또 다른 핵심 원리는 얽힘입니다.

얽힘은 두 개 이상의 입자 사이에 어떤 방식으로든 상호 작용을 생성하거나 유발하는 동작을 의미합니다. 즉, 이러한 입자의 양자 상태는 멀리 떨어져 있더라도 더 이상 서로 독립적으로 설명할 수 없습니다. 입자가 얽힐 때 한 입자를 측정하면 얽힌 다른 입자는 즉시 반대 상태로 측정됩니다(이러한 입자에는 국지적 상태가 없음).

큐비트와 얽힘에 대한 이해가 발전함에 따라 벨 상태에 대해 논의합니다. 다음은 큐비트의 최대 얽힘 상태를 보여줍니다.

|00　 → β → 1 √ 2 (|00　 + |11　) = | β00　,

|01　 → β → 1 √ 2 (|01　 + |10　) = |β01　

|10　 → β → 1 √ 2 (| 00　 - |11　) = |β10　

|11　 → β → 1 √ 2 (|01　 - |10　) = |β11　

양자 회로를 사용하여 벨 상태 생성:

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

캡션: 페리의 양자 컴퓨팅 사원에 있는 벨 상태 회로

표시된 벨 상태 회로에서는 큐비트 입력을 취하고 Hadamard 게이트와 CNOT 게이트를 적용하여 얽힌 벨 상태를 생성합니다.

현재 Bell 상태는 일련의 양자 컴퓨팅 응용 프로그램을 개발하는 데 사용되어 왔으며 그중 Hegazy, Bahaa-Eldin 및 Dakoury는 Bell 상태와 초고밀도 코딩을 사용하여 "무조건적인 보안"을 달성할 수 있다는 이론을 제안했습니다. .

3 Convolutional Neural Networks and Quantum Convolutional Neural Networks

François Chollet은 Python Deep Learning에서 CNN(Convolutional Neural Networks)이 선을 나타내는 것과 같은 패턴 계층을 구축하기 때문에 이미지 분류와 같은 작업에서 인기가 있다고 지적했습니다. 먼저 해당 선의 가장자리를 처리하면 CNN이 레이어 간의 정보를 기반으로 복잡한 시각적 데이터를 표현할 수 있습니다.

CNN에는 입력을 통해 "슬라이드"하고 입력의 패턴을 감지할 수 있는 "특징 맵"을 생성하는 필터로 구성된 컨볼루션 레이어가 있습니다. 동시에 CNN은 풀링 레이어를 사용하여 특징 맵의 크기를 줄여 학습에 필요한 리소스를 줄일 수 있습니다. ㅋㅋㅋ

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다. Garg와 Ramakrishnan은 양자 신경망을 개발하는 일반적인 접근 방식은 무작위 양자 회로를 기반으로 한 변환인 소위 "양자 컨볼루셔널 레이어"를 도입하는 "하이브리드" 접근 방식을 개발하는 것이라고 믿습니다. -클래식 CNN에서.

다음은 Yanxuan Lü와 다른 연구원들이 개발하고 MNIST 손글씨 숫자 데이터세트에서 테스트한 하이브리드 QCNN을 보여줍니다.

"A Quantum Convolutional Neural Network for Image Classification" 논문에서 연구원들은 양자 회로를 채택하고 얽힘은 입력 이미지를 가져와 예측을 출력으로 생성하기 위해 고전 모델의 일부로 사용됩니다.

이 방법에서 QCNN은 이미지 데이터를 입력으로 가져와 양자 상태 |x>로 인코딩한 다음 양자 컨볼루션 및 풀링 레이어를 사용하여 변환하여 마지막으로 특징을 추출합니다. 강하게 얽힌 완전히 연결된 레이어를 사용하여 분류합니다. 측정을 통한 회로 및 예측.

최적화는 SGD(확률적 경사하강법)를 통해 처리되며, 이는 훈련 데이터 레이블과 QCNN 예측 레이블 간의 차이를 줄이는 데 사용할 수 있습니다. 양자회로를 중심으로 회전연산자와 CNOT 게이트를 포함하여 양자 컨벌루션 계층에서 사용되는 게이트는 다음과 같다.

풀링 계층에서 큐비트의 하위 집합을 측정하면 그 결과에 따라 인접 비트에 단일 큐비트 게이트를 적용할지 여부가 결정됩니다.

Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.

완전히 연결된 계층은 "범용 단일 큐비트 게이트"와 구성으로 구성됩니다. 얽힌 상태를 생성하는 CNOT 게이트의 QCNN을 다른 방법과 비교하기 위해 연구원들은 시뮬레이션된 QCNN과 함께 MNIST 데이터 세트를 사용했습니다. 일반적인 접근 방식에 따라 훈련/테스트 데이터 세트를 생성하고 다음 레이어로 구성된 QCNN을 개발했습니다.

2개의 양자 컨볼루션 레이어

2개의 양자 풀링 레이어

1개의 양자 완전 연결 레이어

데이터 세트에서 이 QCNN의 테스트 세트 정확도는 96.65%에 도달했으며, Papers with Code의 데이터에 따라 테스트한 후 클래식 CNN에서 이 데이터 세트의 최고 정확도 점수는 99.91%에 도달할 수 있습니다.
이 실험에서는 두 가지 유형의 MNIST 데이터 세트만 분류되었으므로 다른 MNIST 모델 성능과 성능을 완전히 비교하는 데 한계가 있다는 점에 유의해야 합니다.

4 타당성 평가 및 요약

연구원들이 QCNN에서 방법을 개발했지만 현재 이 분야의 주요 문제는 이론적 모델을 구현하는 데 필요한 하드웨어가 아직 존재하지 않는다는 것입니다. 또한 하이브리드 방법은 기존 CNN 계산에 양자 진화 계층을 동시에 도입하는 테스트 방법에서도 어려움을 겪고 있습니다.

양자 컴퓨팅의 장점 중 하나가 "계산적으로 더 저렴한 기술로 고전적으로 다루기 힘든 문제"를 해결할 수 있는 능력이라고 생각한다면, 이러한 솔루션의 중요한 측면은 "양자 가속"에 있습니다. 일부 연구자들은 기존 구현에 비해 양자 기계 학습의 장점은 양자 알고리즘이 다항식 또는 심지어 지수 가속 시간을 가질 것으로 예상된다는 점이라고 믿습니다.

그러나 위에 표시된 QCNN 방법의 한 가지 제한 사항은 고전적인 데이터 및 측정값을 일관되게 디코딩/인코딩하는 알고리즘(예: QCNN)이 필요한 경우 "양자 가속" 이득이 제한되어 있으며 현재는 없다는 것입니다. "양자 가속"의 이점을 누릴 수 있도록 최소한의 측정이 필요한 최상의 인코딩/디코딩 및 프로토콜을 설계하는 방법에 대한 많은 정보.

얽힘은 양자 기계 학습의 중요한 속성임이 입증되었습니다. 강력한 얽힘 회로를 사용하는 QCNN에 대한 연구는 완전히 연결된 계층으로 얽힌 상태를 생성하여 모델이 예측할 수 있도록 합니다. 뿐만 아니라 얽힘을 사용하여 이미지에서 중요한 특징을 추출하는 등 다른 영역의 딥 러닝 모델을 지원하는 데에도 사용되며, 데이터 세트에서 얽힘을 사용하면 모델이 이전에 예상했던 것보다 더 작은 훈련 데이터 세트에서 학습할 수 있음을 의미할 수 있습니다. .

이 글에서는 고전적인 딥러닝 방법과 양자 딥러닝 방법을 비교하고, 양자 계층(강하게 얽힌 회로 포함)을 활용하여 예측을 생성하는 QCNN에 대해 논의하고, 양자 딥러닝의 장점과 한계를 분석하고, 얽힘을 소개합니다. 기계 학습의 보다 일반적인 적용은 또한 양자 딥 러닝의 다음 단계, 특히 더 많은 분야에서의 QCNN 적용에 대해 생각할 수 있음을 의미합니다. 또한, 양자 하드웨어 역시 지속적으로 발전하고 있으며, 사이퀀텀(PsiQuantum) 등의 기업에서는 100만 큐비트를 탑재한 양자 프로세서를 개발하겠다는 목표까지 제시한 바 있다.

딥러닝과 양자컴퓨팅 분야의 연구가 계속되면서 양자딥러닝의 발전도 더욱 기대됩니다.

위 내용은 Quantum CNN은 데이터 세트에 대한 테스트 정확도가 높지만 한계가 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

AI 게임 개발May 02, 2025 am 11:17 AM

격변 게임 : AI 에이전트와의 게임 개발 혁명 Blizzard 및 Obsidian과 같은 업계 대기업의 재향 군인으로 구성된 게임 개발 스튜디오 인 Upheaval은 혁신적인 AI 구동 Platfor로 게임 제작에 혁명을 일으킬 준비가되어 있습니다.

Uber는 Robotaxi 상점이되기를 원합니다. 제공자가 그들을 허락할까요?May 02, 2025 am 11:16 AM

Uber의 Robotaxi 전략 : 자율 주행 차량을위한 승차원 생태계 최근 Curbivore 컨퍼런스에서 Uber의 Richard Willder는 Robotaxi 제공 업체를위한 승마 플랫폼이되기위한 전략을 공개했습니다. 그들의 지배적 인 위치를 활용합니다

비디오 게임을하는 AI 요원은 미래의 로봇을 변화시킬 것입니다May 02, 2025 am 11:15 AM

비디오 게임은 특히 자율적 인 에이전트 및 실제 로봇의 개발에서 최첨단 AI 연구를위한 귀중한 테스트 근거로 입증되며, 인공 일반 정보 (AGI)에 대한 탐구에 잠재적으로 기여할 수 있습니다. 에이

스타트 업 산업 단지, VC 3.0 및 James Currier 's ManifestoMay 02, 2025 am 11:14 AM

진화하는 벤처 캐피탈 환경의 영향은 미디어, 재무 보고서 및 일상적인 대화에서 분명합니다. 그러나 투자자, 신생 기업 및 자금에 대한 구체적인 결과는 종종 간과됩니다. 벤처 캐피탈 3.0 : 패러다임

Adobe 업데이트 Adobe Max London 2025에서 Creative Cloud and FireflyMay 02, 2025 am 11:13 AM

Adobe Max London 2025는 Creative Cloud and Firefly에 상당한 업데이트를 제공하여 접근성 및 생성 AI로의 전략적 전환을 반영했습니다. 이 분석에는 Adobe Leadership과의 사전 이벤트 브리핑의 통찰력이 포함되어 있습니다. (참고 : Adob

모든 메타는 Llamacon에서 발표했습니다May 02, 2025 am 11:12 AM

Meta의 Llamacon 발표는 OpenAi와 같은 폐쇄 된 AI 시스템과 직접 경쟁하도록 설계된 포괄적 인 AI 전략을 보여 주며 동시에 오픈 소스 모델을위한 새로운 수익원을 만듭니다. 이 다각적 인 접근법은 Bo를 대상으로합니다

AI가 정상적인 기술에 지나지 않는다는 제안에 대한 양조 논쟁May 02, 2025 am 11:10 AM

이 결론에 대한 인공 지능 분야에는 심각한 차이가 있습니다. 어떤 사람들은 "황제의 새로운 옷"을 폭로 할 때라고 주장하는 반면, 인공 지능은 단지 일반적인 기술이라는 생각에 강력하게 반대합니다. 논의합시다. 이 혁신적인 AI 혁신에 대한 분석은 다양한 영향력있는 AI 복잡성을 식별하고 설명하는 것을 포함하여 AI 분야의 최신 발전을 다루는 진행중인 Forbes 열의 일부입니다 (링크를 보려면 여기를 클릭하십시오). 공통 기술로서의 인공 지능 첫째,이 중요한 토론을위한 토대를 마련하기 위해서는 몇 가지 기본 지식이 필요합니다. 현재 인공 지능을 발전시키는 데 전념하는 많은 연구가 있습니다. 전반적인 목표는 인공 일반 지능 (AGI) 및 가능한 인공 슈퍼 인텔리전스 (AS)를 달성하는 것입니다.

모델 시민, AI 가치가 다음 비즈니스 척도 인 이유May 02, 2025 am 11:09 AM

회사의 AI 모델의 효과는 이제 핵심 성과 지표입니다. AI 붐 이후 생일 초대장 작성부터 소프트웨어 코드 작성에 이르기까지 생성 AI는 모든 데 사용되었습니다. 이로 인해 언어 모드가 확산되었습니다

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

드림위버 CS6

시각적 웹 개발 도구

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.