搜尋
首頁科技週邊人工智慧保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用
編輯 | X

在光復用中,通道之間的正交性扮演著至關重要的角色。這種正交性確保了不同通道之間的訊號不會相互幹擾,從而實現了高效的資料傳輸。光復用系統能夠同時傳輸多個通道的數據,有效提高了光纖的利用率。然而,這種系統也不可避免地會施加複用容量的上限。

在此,廣東工業大學通感融合光子技術教育部重點實驗室開發一種基於深度神經網路的多模光纖(MMF)上的非正交光復用,稱為散斑光場檢索網路(Speckle light field retrieval network,SLRnet),它可以學習包含資訊編碼的多個非正交輸入光場與其對應的單強度輸出之間的複雜映射關係。

透過原理驗證實驗,SLRnet成功解決了MMF上非正交光復用的不適定問題。它能夠利用單發散斑輸出明確地檢索由相同偏振、波長和空間位置介導的多個非正交輸入訊號,保真度高達98%。這項研究為實現高容量光復用利用非正交通道鋪平了道路,是邁向這一目標的重要一步。

這項研究將推動光學和光子學領域的潛在應用,並為資訊科學與技術等更廣泛學科的探索提供新的啟示。

相關研究以《Non-orthogonal optical multiplexing empowered by deep learning》為題,於 2024 年 2 月 21 日發表在《Nature Communications》上。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

論文連結:https://www.nature.com/articles/s41467-024-45845-4

#光復用問題

重複使用(Multiplexing)是光通訊的基石,其中復用通道之間的物理正交性是大規模編碼訊息傳輸的先決條件。

考慮到多個正交訊號的解復用(Demultiplexing),傳輸矩陣方法(例如 MMF)甚至可以在強散射介質上解決這個問題。

最近,深度學習已廣泛應用於光學和光子學領域,用於光學元件和計算光學的逆向設計。具體來說,深度神經網路已被用來提高多重散射介質上正交復用的效能。

然而,迄今為止,所有報導的複用場景都嚴格依賴多路復用通道之間的物理正交性。目前還沒有嘗試利用深度學習的非線性建模能力來實現 MMF 上的非正交光復用。

不幸的是,即使在單模光纖中由相同偏振或波長介導的非正交通道的複用仍然非常具有挑戰性,這是由於缺乏有效的解復用方法或數位訊號處理負擔過重。因此,開發一種新的方法來解碼非正交輸入通道中編碼的資訊對於最終的光復用至關重要。

基於深度神經網路的 MMF 上的非正交光復用

在此,研究人員證明了在 SLRnet 的支持下可以透過 MMF 實現初步的非正交光復用。

作為概念驗證演示,可以利用非正交輸入通道實現透過MMF 的資訊重複傳輸,包括一般自然場景影像、不相關的隨機二進位資料和不屬於同一類型訓練資料集的影像,有利於實現光資訊的非正交複用傳輸。

透過資料驅動技術在非正交輸入通道和輸出之間建立複雜的關係,訓練有素的深度神經網路只需使用單次輸出強度即可檢索非正交通道的編碼資訊。即使是共享相同偏振、波長和輸入空間區域的非正交複用通道也可以被有效地解碼。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

圖 1:MMF 上的非正交光復用示意圖。 (來源:論文)

神經網路架構

深度神經網路能夠從MMF 的單一散斑輸出中檢索非正交光復用訊號.由任意偏振組合介導的多個振幅和相位編碼資訊在 MMF 中傳播後可以被 SLRnet 有效地檢索。

如圖 2a 所示,即使是具有相同偏振、波長和輸入空間區域的非正交輸入通道的典型場景也可以被明確解碼。這是透過深度神經網路實現的,其架構如圖 2b 所示,它是根據 MMF 獨特的多重散射過程的 Unet 的變體。它由全連接(FC)層和 ResUnet 組成。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

圖 2:透過深度學習實現 MMF 上的非正交光復用。 (資料來源:論文)

實驗結果

首先考慮 MMF 長度為 1m 的情況。圖 3a 展示了 SLRnet 訓練過程中具有任意偏振態組合的兩個複用光場通道的檢索保真度的演變。總的來說,在振幅和相位維度上將有四個編碼通道,根據偏振狀態,它們可以是非正交的。檢索到的保真度是透過皮爾森相關係數(PCC)來衡量的。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

圖 3:使用 SLRnet 的非正交複用效能。 (資料來源:論文)

從圖中可以看出,使用相同的 SLRnet 訓練配置檢索到的 PCC 在 100 個 epoch 後的演化大於 0.97。同時,十二個複用場景的檢索保真度的演變基本上相同,這展示了非正交復用對於任意偏振組合的出色穩健性。

此外,圖 3b 提供了分別使用不同的偏振組合在每個幅度和相位復用通道中檢索到的保真度。幅度和相位維度上的平均檢索保真度幾乎相同( ~ 0.98),這凸顯了 SLRnet 對多個非正交輸入通道中編碼的資訊進行解復用的能力。

為了對波前編碼的檢索資訊進行sensory 評估,四種偏振組合(0° 和0°、0° 和10°、0° 和90° 以及0° 和橢圓)的典型解復用結果如圖4 所示。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

圖 4:1 m MMF 上的非正交複用結果。 (資料來源:論文)

可以看出,使用相同偏振在輸入波前的振幅和相位上復用的四個灰階影像可以利用單次散斑輸出有效地解復用。在不同偏振組合下檢索到的其他結果的保真度相似,這表明即使編碼波前被 MMF 擾亂,SLRnet 也能夠實現前所未有的非正交輸入通道復用。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

圖 5:50 m MMF 上的非正交複用結果。 (資料來源:論文)

為了進一步鞏固 SLRnet 在更現實的場景中的優越性,提出了在 50 m MMF 上使用相同偏振態的非正交光復用結果,如圖 5 所示。從圖 4 和圖 5 可以看出,1 m MMF 的解復用結果比 50 m 情況要好,這是因為較長的 MMF 的散射特性更容易受到環境的影響。透過優化網路結構可以進一步提高解復用效能。研究表明,SLRnet 是 MMF 中復用非正交通道的有效手段。

保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用

圖 6:一般自然場景影像和不屬於 ImageNet 資料庫的影像在 1 m MMF 上非正交複用的結果。 (來源:論文)

最後,展示 SLRnet 對於不同影像集的通用性,研究顯示 SLRnet 具有良好的泛化性。

儘管現階段所提出的基於MMF 的非正交光復用概念不能直接用於通常需要統一保真度的醫療診斷,但高精度的非相關二進制數字信息的非正交復用表明,透過MMF 實現光資訊的非正交復用傳輸向前邁進了一步。

該研究不僅可以為利用高吞吐量MMF 進行通訊和資訊處理鋪平道路,而且還可能為光學及其他領域的光復用提供範式轉變,這可以大大提高光學系統的自由度和容量。

以上是保真度高達~98%,廣工大「AI+光學」研究登Nature子刊,深度學習賦能非正交光復用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
用帆板編碼的氛圍指南用帆板編碼的氛圍指南Apr 24, 2025 am 10:25 AM

毫不費力地將您的編碼願景帶入Codeium's Windsurf,這是您的AI驅動的編碼伴侶。 Windsurf簡化了整個軟件開發生命週期,從編碼和調試到優化,將過程轉換為INTU

使用RMGB v2.0探索圖像背景刪除使用RMGB v2.0探索圖像背景刪除Apr 24, 2025 am 10:20 AM

Braiai的RMGB v2.0:強大的開源背景拆卸模型 圖像分割模型正在徹底改變各個領域,而背景刪除是進步的關鍵領域。 Braiai的RMGB v2.0是最先進的開源M

評估大語模型中的毒性評估大語模型中的毒性Apr 24, 2025 am 10:14 AM

本文探討了大語言模型(LLM)中的毒性至關重要問題以及用於評估和減輕它的方法。 LLM,為從聊天機器人到內容生成的各種應用程序提供動力,需要強大的評估指標,機智

Rag Reranker的綜合指南Rag Reranker的綜合指南Apr 24, 2025 am 10:10 AM

檢索增強發電(RAG)系統正在轉換信息訪問,但其有效性取決於檢索到的數據的質量。 這是重讀者變得至關重要的地方 - 充當搜索結果的質量過濾器,以確保僅確保

如何使用Gemma 3&Docling構建多模式抹布?如何使用Gemma 3&Docling構建多模式抹布?Apr 24, 2025 am 10:04 AM

該教程通過在Google Colab中構建精緻的多式聯運檢索一代(RAG)管道來指導您。 我們將使用Gemma 3(用於語言和視覺),文檔(文檔轉換),Langchain等尖端工具

可擴展AI和機器學習應用的射線指南可擴展AI和機器學習應用的射線指南Apr 24, 2025 am 10:01 AM

雷:擴展AI和Python應用程序的有力框架 Ray是一個革命性的開源框架,旨在輕鬆擴展AI和Python應用程序。 它的直觀API使研究人員和開發人員可以通過其代碼過渡

如何將OpenAI MCP集成用於建築代理?如何將OpenAI MCP集成用於建築代理?Apr 24, 2025 am 09:58 AM

OpenAI通過支持人類的模型上下文協議(MCP)來涵蓋互操作性,這是一種開源標準,簡化了與不同數據系統的AI助手集成。這項合作為AI應用程序奠定了一個統一的框架

cache aigned Generation(CAG):它比抹布好嗎?cache aigned Generation(CAG):它比抹布好嗎?Apr 24, 2025 am 09:54 AM

緩存增強生成(CAG):一種更快,更有效的替代品 檢索演出的一代(RAG)通過動態融合外部知識徹底改變了AI。但是,它對外部資源的依賴引入了潛伏期和

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),