在10月4日公布的2022年诺贝尔奖中,Alain Aspect 、John F. Clause 和 Anton Zeilinger 三位科学家凭借量子纠缠获得物理学奖项,引起了外界对量子研究领域的关注和讨论。
其中,以量子计算为代表的研究投资近几年迎来显著增加,人们开始探索从安全、网络通信等领域出发,用量子方法来颠覆现有的经典计算技术。
有研究人员认为,量子计算的核心在于“通过计算成本更低的技术解决经典难题”,而随着近年来深度学习和量子计算的研究并行发展,不少研究者也开始关注到这两个领域的交叉点:量子深度学习。
近日,Xbox 游戏工作室 Rare 洞察主管 Holly Emblem 在新的文章“Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks”中,就量子深度学习的现有研究和应用进行介绍,并重点讨论了量子卷积神经网络 (QCNN)与经典计算方法相比存在的优势和局限性。
首先介绍一个关于经典计算和量子计算区别的重要概念。在经典计算机上执行程序时,编译器会将程序语句转换为二进制位;而在量子计算中,与经典计算机上的位在任何时候都代表 1 或 0 的状态不同,量子位能够在这两种状态间“悬停”,只有当它被测量时,量子比特才会崩溃到它的两个基态之一,即 1 或 0。
这种属性称为叠加,在量子计算任务中有至关重要的作用。通过叠加,量子计算机可以并行执行任务,而不需要完全并行的架构或 GPU 来执行。其原因在于,当每个叠加状态对应一个不同的值,如果对叠加状态进行操作,则该操作同时在所有状态上执行。
这里举一个叠加量子态的例子:
量子态的叠加是指数的,a 和 b 指概率幅度,其给出了一旦执行测量就投射到一个状态的概率。其中,叠加量子态是通过使用量子逻辑门来创建的。
图注:Ragsxl 在芬兰埃斯波的 IQM 量子计算机
叠加在量子物理学中十分重要,而另一个关键的原理则是纠缠。
纠缠指在两个或多个粒子之间、以某种方式产生或引起相互作用的行为,这意味着这些粒子的量子态不再能彼此独立地描述,即使相隔很远也是如此。当粒子被纠缠时,如果一个粒子被测量,与之纠缠的另一个粒子将立即测量为相反的状态(这些粒子没有局部状态)。
随着对量子比特和纠缠的理解的发展,继而来讨论贝尔态,下面展示了量子比特的最大纠缠态:
|00⟩ → β → 1 √ 2 (|00⟩ |11⟩) = |β00⟩,
|01⟩ → β → 1 √ 2 (|01⟩ |10⟩) = |β01⟩
|10⟩ → β → 1 √ 2 (|00⟩ - |11⟩) = |β10⟩
|11⟩ → β → 1 √ 2 (|01⟩ - |10⟩) = |β11⟩
使用量子电路创建贝尔态:
图注:Perry 量子计算神殿的贝尔态电路
在所顯示的貝爾態電路中,其接受量子位元輸入並應用 Hadamard 閘和 CNOT 閘創來建立一個糾纏的貝爾態。
目前,貝爾態已被用於開發一系列量子計算應用程式;其中,Hegazy、Bahaa-Eldin 和Dakroury 就提出了貝爾態和超密集編碼可用於實現“無條件安全」的理論。
François Chollet 在Python 深度學習中指出,卷積神經網路(CNN ) 在影像分類等任務中很受歡迎,原因在於它們能建構模式層次結構,例如先表示線條、再表示這些線條的邊緣,這使得CNN 能夠建立在層之間的資訊上,並表示複雜的視覺數據。
CNN 具有捲積層,由過濾器組成,這些過濾器會在輸入中“滑動”並產生“特徵圖”,允許檢測輸入中的模式。同時,CNN 可使用池化層來減少特徵圖的大小,進而減少學習所需的資源。
圖註:Cecbur 展示的捲積神經網路
##定義了經典的CNN 後,我們就可以探索量子CNN (量子卷積神經網絡,QCNN)是如何利用這些傳統方法、並加以擴展。
Garg 和Ramakrishnan 認為,開發量子神經網路的一種常見方法,是開發一種“混合”方法,引入所謂的“量子卷積層”,這是一種基於隨機量子電路的變換,在經典CNN 中以附加元件出現。
下面展示了由Yanxuan Lü 等研究人員開發、並在MNIST 手寫數字資料集上進行測試的混合QCNN:
研究人員在論文「A Quantum Convolutional Neural Network for Image Classification」中,採用了量子電路和糾纏作為經典模型的一部分來獲取輸入影像,並產生預測作為輸出。
在這個方法中,QCNN 將影像資料作為輸入,並將其編碼為量子態|x>,然後使用量子卷積和池化層對其進行轉換來提取特徵;最後,使用強糾纏電路的全連接層進行分類,並透過測量得到預測。
其中,最佳化是透過隨機梯度下降(SGD)處理的,可用於減少訓練資料標籤與 QCNN 預測標籤之間的差異。聚焦於量子電路,量子卷積層中使用的閘門如下所示,其中包括了旋轉算子和 CNOT 閘。
在池化層測量量子位元的子集,所得出的結果會決定是否對其臨近的位元應用單一量子位元閘:
#全連通層由「通用單量子位元閘」和產生糾纏態的CNOT閘組成,為了將QCNN 與其他方法進行比較,研究人員使用了模擬QCNN 的MNIST 資料集。按照典型的方法,我們創建了一個訓練/測試資料集,並開發了一個由以下層組成的QCNN:
該QCNN 對數據集的測試集準確率達到了96.65%,而根據Papers with Code 的數據進行測試後,該數據集在經典CNN 中的最高準確度得分可達到99.91%。
要注意的是,該實驗只有兩類 MNIST 資料集被分類,這也意味著將其與其他 MNIST 模型效能完全比較會有其限制。
雖然研究人員在QCNN 開發了方法,但目前該領域的一個關鍵問題是,實現理論模型所需的硬件還不存在。此外,混合方法在經典 CNN 計算中同時引入量子演化層的測試方法,也面臨挑戰。
如果我們考慮量子計算的優勢之一,是可以解決“通過計算成本更低的技術解決經典棘手的問題”,那麼這些解決方案中的一個重要方面就在於「量子加速」。有研究人員認為,量子機器學習與經典實作相比,其優勢在於預期量子演算法可具有多項式、甚至指數級的加速時間。
然而,上文中展示的QCNN 方法有一個限制是,當我們需要對經典資料和測量進行一致解碼/編碼的演算法(如QCNN )時,「量子加速「增益是有限的;而目前,關於如何設計出最好的編碼/解碼和需要最小測量的協議、使其能夠受益於「量子加速」的資訊並不多。
糾纏已被證明是量子機器學習的一個重要性質,本文所提到的關於QCNN 利用強糾纏電路,可以產生糾纏態作為其全連通層的研究,使模型能夠進行預測。不僅如此,糾纏也在其他領域中被用於輔助深度學習模型,例如使用糾纏從圖像中提取重要特徵,以及在資料集中使用糾纏、可能意味著模型能夠從比之前預期更小的訓練資料集中學習等等。
本文提供了經典深度學習方法和量子深度學習方法的比較,並討論了利用量子層(包括強糾纏電路)產生預測的QCNN ,分析量子深度學習的好處和局限性,並介紹了糾纏在機器學習中更普遍的應用,這也意味著我們可以開始考慮量子深度學習的下一步,特別是QCNN 在更多領域中的應用。除此之外,量子硬體也在不斷進步,PsiQuantum 等公司更是提出了開發百萬量子位元的量子處理器目標。
隨著深度學習和量子運算領域研究的持續進行,我們可以期待看到量子深度學習的進一步發展。
以上是量子CNN對資料集的測試準確率高,但有局限性的詳細內容。更多資訊請關注PHP中文網其他相關文章!