量子CNN對資料集的測試準確率高，但有局限性-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

量子CNN對資料集的測試準確率高，但有局限性

王林

Apr 14, 2023 pm 02:10 PM

深度學習量子

在10月4日公布的2022年诺贝尔奖中，Alain Aspect 、John F. Clause 和 Anton Zeilinger 三位科学家凭借量子纠缠获得物理学奖项，引起了外界对量子研究领域的关注和讨论。

其中，以量子计算为代表的研究投资近几年迎来显著增加，人们开始探索从安全、网络通信等领域出发，用量子方法来颠覆现有的经典计算技术。

有研究人员认为，量子计算的核心在于“通过计算成本更低的技术解决经典难题”，而随着近年来深度学习和量子计算的研究并行发展，不少研究者也开始关注到这两个领域的交叉点：量子深度学习。

近日，Xbox 游戏工作室 Rare 洞察主管 Holly Emblem 在新的文章“Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks”中，就量子深度学习的现有研究和应用进行介绍，并重点讨论了量子卷积神经网络 (QCNN)与经典计算方法相比存在的优势和局限性。

1 经典计算和量子计算的区别

首先介绍一个关于经典计算和量子计算区别的重要概念。在经典计算机上执行程序时，编译器会将程序语句转换为二进制位；而在量子计算中，与经典计算机上的位在任何时候都代表 1 或 0 的状态不同，量子位能够在这两种状态间“悬停”，只有当它被测量时，量子比特才会崩溃到它的两个基态之一，即 1 或 0。

这种属性称为叠加，在量子计算任务中有至关重要的作用。通过叠加，量子计算机可以并行执行任务，而不需要完全并行的架构或 GPU 来执行。其原因在于，当每个叠加状态对应一个不同的值，如果对叠加状态进行操作，则该操作同时在所有状态上执行。

这里举一个叠加量子态的例子：

量子态的叠加是指数的，a 和 b 指概率幅度，其给出了一旦执行测量就投射到一个状态的概率。其中，叠加量子态是通过使用量子逻辑门来创建的。

量子CNN對資料集的測試準確率高，但有局限性

图注：Ragsxl 在芬兰埃斯波的 IQM 量子计算机

2 纠缠和贝尔态

叠加在量子物理学中十分重要，而另一个关键的原理则是纠缠。

纠缠指在两个或多个粒子之间、以某种方式产生或引起相互作用的行为，这意味着这些粒子的量子态不再能彼此独立地描述，即使相隔很远也是如此。当粒子被纠缠时，如果一个粒子被测量，与之纠缠的另一个粒子将立即测量为相反的状态（这些粒子没有局部状态）。

随着对量子比特和纠缠的理解的发展，继而来讨论贝尔态，下面展示了量子比特的最大纠缠态：

|00⟩ → β → 1 √ 2 (|00⟩ |11⟩) = |β00⟩,

|01⟩ → β → 1 √ 2 (|01⟩ |10⟩) = |β01⟩

|10⟩ → β → 1 √ 2 (|00⟩ - |11⟩) = |β10⟩

|11⟩ → β → 1 √ 2 (|01⟩ - |10⟩) = |β11⟩

使用量子电路创建贝尔态：

量子CNN對資料集的測試準確率高，但有局限性

图注：Perry 量子计算神殿的贝尔态电路

在所顯示的貝爾態電路中，其接受量子位元輸入並應用 Hadamard 閘和 CNOT 閘創來建立一個糾纏的貝爾態。

目前，貝爾態已被用於開發一系列量子計算應用程式；其中，Hegazy、Bahaa-Eldin 和Dakroury 就提出了貝爾態和超密集編碼可用於實現“無條件安全」的理論。

3 卷積神經網路和量子卷積神經網路

François Chollet 在Python 深度學習中指出，卷積神經網路(CNN ) 在影像分類等任務中很受歡迎，原因在於它們能建構模式層次結構，例如先表示線條、再表示這些線條的邊緣，這使得CNN 能夠建立在層之間的資訊上，並表示複雜的視覺數據。

CNN 具有捲積層，由過濾器組成，這些過濾器會在輸入中“滑動”並產生“特徵圖”，允許檢測輸入中的模式。同時，CNN 可使用池化層來減少特徵圖的大小，進而減少學習所需的資源。

量子CNN對資料集的測試準確率高，但有局限性

圖註：Cecbur 展示的捲積神經網路

##定義了經典的CNN 後，我們就可以探索量子CNN （量子卷積神經網絡，QCNN）是如何利用這些傳統方法、並加以擴展。

Garg 和Ramakrishnan 認為，開發量子神經網路的一種常見方法，是開發一種“混合”方法，引入所謂的“量子卷積層”，這是一種基於隨機量子電路的變換，在經典CNN 中以附加元件出現。

下面展示了由Yanxuan Lü 等研究人員開發、並在MNIST 手寫數字資料集上進行測試的混合QCNN：

研究人員在論文「A Quantum Convolutional Neural Network for Image Classification」中，採用了量子電路和糾纏作為經典模型的一部分來獲取輸入影像，並產生預測作為輸出。

量子CNN對資料集的測試準確率高，但有局限性

在這個方法中，QCNN 將影像資料作為輸入，並將其編碼為量子態|x>，然後使用量子卷積和池化層對其進行轉換來提取特徵；最後，使用強糾纏電路的全連接層進行分類，並透過測量得到預測。

其中，最佳化是透過隨機梯度下降(SGD)處理的，可用於減少訓練資料標籤與 QCNN 預測標籤之間的差異。聚焦於量子電路，量子卷積層中使用的閘門如下所示，其中包括了旋轉算子和 CNOT 閘。

在池化層測量量子位元的子集，所得出的結果會決定是否對其臨近的位元應用單一量子位元閘：

#全連通層由「通用單量子位元閘」和產生糾纏態的CNOT閘組成，為了將QCNN 與其他方法進行比較，研究人員使用了模擬QCNN 的MNIST 資料集。按照典型的方法，我們創建了一個訓練/測試資料集，並開發了一個由以下層組成的QCNN：

2個量子卷積層
2 個量子池層
1個量子全連接層

該QCNN 對數據集的測試集準確率達到了96.65%，而根據Papers with Code 的數據進行測試後，該數據集在經典CNN 中的最高準確度得分可達到99.91%。

要注意的是，該實驗只有兩類 MNIST 資料集被分類，這也意味著將其與其他 MNIST 模型效能完全比較會有其限制。

4 可行性評估和總結

雖然研究人員在QCNN 開發了方法，但目前該領域的一個關鍵問題是，實現理論模型所需的硬件還不存在。此外，混合方法在經典 CNN 計算中同時引入量子演化層的測試方法，也面臨挑戰。

如果我們考慮量子計算的優勢之一，是可以解決“通過計算成本更低的技術解決經典棘手的問題”，那麼這些解決方案中的一個重要方面就在於「量子加速」。有研究人員認為，量子機器學習與經典實作相比，其優勢在於預期量子演算法可具有多項式、甚至指數級的加速時間。

然而，上文中展示的QCNN 方法有一個限制是，當我們需要對經典資料和測量進行一致解碼/編碼的演算法(如QCNN )時，「量子加速「增益是有限的；而目前，關於如何設計出最好的編碼/解碼和需要最小測量的協議、使其能夠受益於「量子加速」的資訊並不多。

糾纏已被證明是量子機器學習的一個重要性質，本文所提到的關於QCNN 利用強糾纏電路，可以產生糾纏態作為其全連通層的研究，使模型能夠進行預測。不僅如此，糾纏也在其他領域中被用於輔助深度學習模型，例如使用糾纏從圖像中提取重要特徵，以及在資料集中使用糾纏、可能意味著模型能夠從比之前預期更小的訓練資料集中學習等等。

本文提供了經典深度學習方法和量子深度學習方法的比較，並討論了利用量子層（包括強糾纏電路）產生預測的QCNN ，分析量子深度學習的好處和局限性，並介紹了糾纏在機器學習中更普遍的應用，這也意味著我們可以開始考慮量子深度學習的下一步，特別是QCNN 在更多領域中的應用。除此之外，量子硬體也在不斷進步，PsiQuantum 等公司更是提出了開發百萬量子位元的量子處理器目標。

隨著深度學習和量子運算領域研究的持續進行，我們可以期待看到量子深度學習的進一步發展。

以上是量子CNN對資料集的測試準確率高，但有局限性的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除