Maison > Article > Périphériques technologiques > Quantum CNN a une grande précision de test sur les ensembles de données, mais a des limites
Lors du prix Nobel 2022 annoncé le 4 octobre, trois scientifiques, Alain Aspect, John F. Clause et Anton Zeilinger, ont remporté le prix de physique pour l'intrication quantique, qui a attiré l'attention et les discussions extérieures dans le domaine de la recherche quantique.
Parmi eux, les investissements dans la recherche représentés par l'informatique quantique ont considérablement augmenté ces dernières années. Les gens ont commencé à explorer l'utilisation de méthodes quantiques pour renverser la technologie informatique classique existante dans des domaines tels que la sécurité et les communications réseau.
Certains chercheurs pensent que le cœur de l'informatique quantique réside dans la « résolution de problèmes classiques grâce à une technologie à moindre coût de calcul ». Avec le développement parallèle de la recherche sur l'apprentissage profond et l'informatique quantique ces dernières années, de nombreux chercheurs ont également commencé à s'y intéresser. L’intersection de ces deux domaines : l’apprentissage profond quantique.
Récemment, Holly Emblem, responsable des connaissances chez Xbox Game Studio Rare, a présenté les recherches et les applications existantes de l'apprentissage profond quantique dans un nouvel article "Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks", axé sur le les avantages et les limites des réseaux neuronaux convolutifs quantiques (QCNN) par rapport aux méthodes informatiques classiques sont discutés.
Introduisez d'abord un concept important sur la différence entre l'informatique classique et l'informatique quantique. Lorsqu'un programme est exécuté sur un ordinateur classique, un compilateur convertit les instructions du programme en bits binaires ; en informatique quantique, contrairement à un ordinateur classique où les bits représentent soit un 1, soit un 0 à tout moment, les qubits peuvent être dans l'un ou l'autre état. " entre les états, ce n'est que lorsqu'il est mesuré que le qubit s'effondre vers l'un de ses deux états fondamentaux, 1 ou 0.
Cette propriété est appelée superposition et joue un rôle essentiel dans les tâches d'informatique quantique. Grâce à la superposition, les ordinateurs quantiques peuvent effectuer des tâches en parallèle sans nécessiter une architecture ou un GPU entièrement parallèle. La raison en est que lorsque chaque état de superposition correspond à une valeur différente, si une opération est effectuée sur l'état de superposition, l'opération est effectuée sur tous les états en même temps.
Voici un exemple de superposition d'états quantiques :
La superposition d'états quantiques est exponentielle, a et b font référence à des grandeurs de probabilité, qui donnent la probabilité de se projeter dans un état une fois qu'une mesure est effectuée. Parmi eux, les états quantiques de superposition sont créés à l’aide de portes logiques quantiques.
Légende : Ordinateur quantique Ragsxl IQM à Espoo, Finlande
La superposition est très importante en physique quantique, et un autre principe clé est son intrication.
L'intrication fait référence au comportement qui crée ou provoque une interaction entre deux ou plusieurs particules d'une manière ou d'une autre, ce qui signifie que les états quantiques de ces particules ne peuvent plus être décrits indépendamment les uns des autres, même s'ils sont éloignés les uns des autres. Lorsque des particules sont intriquées, si une particule est mesurée, l'autre particule avec laquelle elle est intriquée sera immédiatement mesurée dans l'état opposé (ces particules n'ont pas d'état local).
Au fur et à mesure que la compréhension des qubits et de l'intrication se développe, nous discutons ensuite des états de Bell. Ce qui suit montre l'état intriqué maximum des qubits :
|00 → β → 1 √ 2 (|00 + |11 ) = | β00 ,
|01 → β → 1 √ 2 (|01 + |10 ) = |β01
|10 → β → 1 √ 2 (| 00 - |11 ) = 10
| 11 → β → 1 √ 2 (| 01 - | 10) = | β11
Utilisez des circuits quantiques pour créer des états de cloche:
caption: circuit d'état de cloche au temple de Perry de calcul quantique
Dans le circuit d'état de Bell illustré, il prend une entrée qubit et applique les portes Hadamard et les portes CNOT pour créer un état de Bell intriqué.
Actuellement, les états de Bell ont été utilisés pour développer une série d'applications informatiques quantiques ; parmi eux, Hegazy, Bahaa-Eldin et Dakroury ont proposé la théorie selon laquelle les états de Bell et le codage ultra-dense peuvent être utilisés pour atteindre une « sécurité inconditionnelle ». .
CNN a des couches convolutives, qui sont composées de filtres qui « glissent » à travers l'entrée et produisent des « cartes de fonctionnalités » qui permettent la détection de modèles dans l'entrée. Dans le même temps, CNN peut utiliser des couches de regroupement pour réduire la taille des cartes de fonctionnalités, réduisant ainsi les ressources nécessaires à l'apprentissage.
Légende : Réseau neuronal convolutionnel démontré par Cecbur
Après avoir défini le CNN classique, nous pouvons explorer comment le CNN quantique (Quantum Convolutional Neural Network, QCNN) utilise cette méthode de traditions et l'étend.
Garg et Ramakrishnan pensent qu'une approche courante pour développer des réseaux de neurones quantiques consiste à développer une approche « hybride » qui introduit ce que l'on appelle des « couches de convolution quantique », qui sont des transformations basées sur des circuits quantiques aléatoires, dans Apparaît comme un ajout -on dans CNN classique.
Ce qui suit montre le QCNN hybride développé par Yanxuan Lü et d'autres chercheurs et testé sur l'ensemble de données de chiffres manuscrits du MNIST :
Dans l'article "A Quantum Convolutional Neural Network for Image Classification", les chercheurs ont adopté des circuits quantiques et L'intrication est utilisée dans le cadre d'un modèle classique pour prendre des images d'entrée et générer des prédictions en sortie.
Dans cette méthode, QCNN prend les données d'image en entrée et les code dans un état quantique |x>, puis les transforme à l'aide de couches de convolution quantique et de regroupement pour enfin extraire les caractéristiques en utilisant des couches entièrement connectées de fortement intriquées ; circuits et prédictions à partir de mesures.
Où, l'optimisation est gérée par descente de gradient stochastique (SGD), qui peut être utilisée pour réduire la différence entre les étiquettes de données d'entraînement et les étiquettes prédites QCNN. En se concentrant sur les circuits quantiques, les portes utilisées dans la couche convolutive quantique sont les suivantes, y compris les opérateurs de rotation et les portes CNOT.
Mesurez un sous-ensemble de qubits dans la couche de pooling, et le résultat déterminera s'il faut appliquer une seule porte de qubit à ses bits voisins :
La couche entièrement connectée se compose d'une "porte universelle à qubit unique" et composée de portes CNOT qui produisent des états intriqués Pour comparer QCNN avec d’autres méthodes, les chercheurs ont utilisé l’ensemble de données MNIST avec QCNN simulé. En suivant l'approche typique, nous avons créé un ensemble de données de formation/test et développé un QCNN composé des couches suivantes :
2 couches de convolution quantique
Il convient de noter que seuls deux types d'ensembles de données MNIST ont été classés dans cette expérience, ce qui signifie qu'il y aura des limites pour comparer pleinement ses performances avec celles d'autres modèles MNIST.
Bien que les chercheurs aient développé des méthodes dans QCNN, un problème clé dans le domaine actuellement est que le matériel requis pour mettre en œuvre le modèle théorique n'existe pas encore. En outre, les méthodes hybrides sont également confrontées à des défis pour tester des méthodes qui introduisent simultanément des couches d’évolution quantique dans les calculs CNN classiques.
Si l'on considère que l'un des avantages de l'informatique quantique est la capacité de résoudre « des problèmes classiquement insolubles avec des techniques de calcul moins coûteuses », alors un aspect important de ces solutions réside dans « l'accélération quantique ». Certains chercheurs estiment que l’avantage de l’apprentissage automatique quantique par rapport à la mise en œuvre classique réside dans le fait que les algorithmes quantiques sont censés avoir des temps d’accélération polynomiaux, voire exponentiels.
Cependant, une limitation de la méthode QCNN présentée ci-dessus est que lorsque nous avons besoin d'algorithmes (tels que QCNN) qui décodent/encodent de manière cohérente les données et mesures classiques, le gain « d'accélération quantique » est limité et actuellement, il n'y en a pas ; beaucoup d'informations sur la façon de concevoir les meilleurs codages/décodages et protocoles nécessitant des mesures minimales afin de pouvoir bénéficier de « l'accélération quantique ».
Il a été prouvé que l'intrication est une propriété importante de l'apprentissage automatique quantique. Les recherches mentionnées dans cet article sur QCNN utilisant des circuits à forte intrication peuvent générer des états intriqués en tant que couche entièrement connectée, permettant au modèle de faire des prédictions. De plus, l'intrication est également utilisée pour aider les modèles d'apprentissage profond dans d'autres domaines, comme l'utilisation de l'intrication pour extraire des caractéristiques importantes des images, et l'utilisation de l'intrication dans des ensembles de données peut signifier que les modèles peuvent apprendre à partir d'ensembles de données d'entraînement plus petits que prévu, etc. .
Cet article fournit une comparaison des méthodes d'apprentissage profond classiques et quantiques, discute du QCNN qui utilise des couches quantiques (y compris des circuits fortement intriqués) pour générer des prédictions, analyse les avantages et les limites de l'apprentissage profond quantique et introduit l'intrication avec des applications plus générales. dans le domaine de l’apprentissage automatique, cela signifie également que nous pouvons commencer à réfléchir aux prochaines étapes de l’apprentissage profond quantique, en particulier à l’application du QCNN dans davantage de domaines. En outre, le matériel quantique progresse également de manière continue, et des sociétés telles que PsiQuantum ont même proposé l'objectif de développer un processeur quantique doté d'un million de qubits.
À mesure que la recherche dans le domaine de l'apprentissage profond et de l'informatique quantique se poursuit, nous pouvons nous attendre à voir de nouveaux développements dans le domaine de l'apprentissage profond quantique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!