搜索
首页科技周边人工智能保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用
编辑 | X

在光复用中,通道之间的正交性扮演着至关重要的角色。这种正交性确保了不同通道之间的信号不会相互干扰,从而实现了高效的数据传输。光复用系统能够同时传输多个通道的数据,有效提高了光纤的利用率。然而,这种系统也不可避免地会施加复用容量的上限。

在此,广东工业大学通感融合光子技术教育部重点实验室开发一种基于深度神经网络的多模光纤(MMF)上的非正交光复用,称为散斑光场检索网络(Speckle light field retrieval network,SLRnet),它可以学习包含信息编码的多个非正交输入光场与其对应的单强度输出之间的复杂映射关系。

通过原理验证实验,SLRnet成功解决了MMF上非正交光复用的不适定问题。它能够利用单发散斑输出明确地检索由相同偏振、波长和空间位置介导的多个非正交输入信号,保真度高达98%。这项研究为实现高容量光复用利用非正交通道铺平了道路,是迈向这一目标的重要一步。

这项研究将推动光学和光子学领域的潜在应用,并为信息科学与技术等更广泛学科的探索提供新的启示。

相关研究以《Non-orthogonal optical multiplexing empowered by deep learning》为题,于 2024 年 2 月 21 日发表在《Nature Communications》上。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

论文链接:https://www.nature.com/articles/s41467-024-45845-4

光复用问题

复用(Multiplexing)是光通信的基石,其中复用通道之间的物理正交性是大规模编码信息传输的先决条件。

考虑到多个正交信号的解复用(Demultiplexing),传输矩阵方法(例如 MMF)甚至可以在强散射介质上解决这个问题。

最近,深度学习已广泛应用于光学和光子学领域,用于光学器件和计算光学的逆向设计。具体来说,深度神经网络已被用来提高多重散射介质上正交复用的性能。

然而,迄今为止,所有报道的复用场景都严格依赖于多路复用通道之间的物理正交性。目前还没有尝试利用深度学习的非线性建模能力来实现 MMF 上的非正交光复用。

不幸的是,即使在单模光纤中由相同偏振或波长介导的非正交信道的复用仍然非常具有挑战性,这是由于缺乏有效的解复用方法或数字信号处理负担过重。因此,开发一种新的方法来解码非正交输入通道中编码的信息对于最终的光复用至关重要。

基于深度神经网络的 MMF 上的非正交光复用

在此,研究人员证明了在 SLRnet 的支持下可以通过 MMF 实现初步的非正交光复用。

作为概念验证演示,可以利用非正交输入通道实现通过 MMF 的信息复用传输,包括一般自然场景图像、不相关的随机二进制数据和不属于同一类型训练数据集的图像,有利于实现光信息的非正交复用传输。

通过数据驱动技术在非正交输入通道和输出之间建立复杂的关系,训练有素的深度神经网络只需使用单次输出强度即可检索非正交通道的编码信息。即使是共享相同偏振、波长和输入空间区域的非正交复用通道也可以被有效地解码。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 1:MMF 上的非正交光复用示意图。(来源:论文)

神经网络架构

深度神经网络能够从 MMF 的单个散斑输出中检索非正交光复用信号。由任意偏振组合介导的多个幅度和相位编码信息在 MMF 中传播后可以被 SLRnet 有效地检索。

如图 2a 所示,即使是具有相同偏振、波长和输入空间区域的非正交输入通道的典型场景也可以被显式解码。这是通过深度神经网络实现的,其架构如图 2b 所示,它是根据 MMF 独特的多重散射过程的 Unet 的变体。它由全连接(FC)层和 ResUnet 组成。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 2:通过深度学习实现 MMF 上的非正交光复用。(来源:论文)

实验结果

首先考虑 MMF 长度为 1m 的情况。图 3a 展示了 SLRnet 训练过程中具有任意偏振态组合的两个复用光场通道的检索保真度的演变。总的来说,在幅度和相位维度上将有四个编码通道,根据偏振状态,它们可以是非正交的。检索到的保真度是通过皮尔逊相关系数(PCC)来衡量的。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 3:使用 SLRnet 的非正交复用性能。(来源:论文)

从图中可以看出,使用相同的 SLRnet 训练配置检索到的 PCC 在 100 个 epoch 后的演化大于 0.97。同时,十二个复用场景的检索保真度的演变基本相同,这展示了非正交复用对于任意偏振组合的出色稳健性。

此外,图 3b 提供了分别使用不同的偏振组合在每个幅度和相位复用通道中检索到的保真度。幅度和相位维度上的平均检索保真度几乎相同( ~ 0.98),这凸显了 SLRnet 对多个非正交输入通道中编码的信息进行解复用的能力。

为了对波前编码的检索信息进行 sensory 评估,四种偏振组合(0° 和 0°、0° 和 10°、0° 和 90° 以及 0° 和椭圆)的典型解复用结果如图 4 所示。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 4:1 m MMF 上的非正交复用结果。(来源:论文)

可以看出,使用相同偏振在输入波前的幅度和相位上复用的四个灰度图像可以利用单次散斑输出有效地解复用。在不同偏振组合下检索到的其他结果的保真度相似,这表明即使编码波前被 MMF 扰乱,SLRnet 也能够实现前所未有的非正交输入通道复用。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 5:50 m MMF 上的非正交复用结果。(来源:论文)

为了进一步巩固 SLRnet 在更现实的场景中的优越性,提出了在 50 m MMF 上使用相同偏振态的非正交光复用结果,如图 5 所示。从图 4 和图 5 可以看出,1 m MMF 的解复用结果比 50 m 情况要好,这是因为较长的 MMF 的散射特性更容易受到环境的影响。通过优化网络结构可以进一步提高解复用性能。研究表明,SLRnet 是 MMF 中复用非正交信道的有效手段。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 6:一般自然场景图像和不属于 ImageNet 数据库的图像在 1 m MMF 上非正交复用的结果。(来源:论文)

最后,展示 SLRnet 对于不同图像集的通用性,研究表明 SLRnet 具有良好的泛化性。

尽管现阶段所提出的基于 MMF 的非正交光复用概念不能直接用于通常需要统一保真度的医疗诊断,但高精度的非相关二进制数字信息的非正交复用表明,通过 MMF 实现光信息的非正交复用传输向前迈进了一步。

该研究不仅可以为利用高吞吐量 MMF 进行通信和信息处理铺平道路,而且还可能为光学及其他领域的光复用提供范式转变,这可以大大提高光学系统的自由度和容量。

以上是保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:机器之心。如有侵权,请联系admin@php.cn删除
拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?拥抱面部是否7B型号奥林匹克赛车击败克劳德3.7?Apr 23, 2025 am 11:49 AM

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

4个新的双子座功能您可以错过4个新的双子座功能您可以错过Apr 23, 2025 am 11:48 AM

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

Camunda为经纪人AI编排编写了新的分数Camunda为经纪人AI编排编写了新的分数Apr 23, 2025 am 11:46 AM

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

策划的企业AI体验是否有价值?策划的企业AI体验是否有价值?Apr 23, 2025 am 11:45 AM

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

如何为抹布找到最佳的多语言嵌入模型?如何为抹布找到最佳的多语言嵌入模型?Apr 23, 2025 am 11:44 AM

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

麝香:奥斯汀的机器人需要每10,000英里进行干预麝香:奥斯汀的机器人需要每10,000英里进行干预Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

AI震惊的枢轴:从工作工具到数字治疗师和生活教练AI震惊的枢轴:从工作工具到数字治疗师和生活教练Apr 23, 2025 am 11:41 AM

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将

公司竞争AI代理的采用公司竞争AI代理的采用Apr 23, 2025 am 11:40 AM

AI代理商的兴起正在改变业务格局。 与云革命相比,预计AI代理的影响呈指数增长,有望彻底改变知识工作。 模拟人类决策的能力

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境