搜索
首页科技周边人工智能边缘人工智能的梦想与挑战

边缘人工智能的梦想与挑战

在本文中,我们主要探讨两个主要问题,即在“小型机器”中实现人工智能的理由,以及开发人工智能小型机器将面临哪些挑战?

未来,在人工智能方面,我们应该有飞行汽车和机器人管家。甚至还可能遇到有感知能力的机器人决定起来反抗我们。虽然我们还没有发展到这种程度,但显然人工智能(AI)技术已经进入了我们的世界。

每次当我们让智能语音助手做一件事是,机器学习技术就会先搞明白你说了什么,并试图对你想让它做什么做出最好的决定。例如,每次视频网站或电商平台向你推荐“你可能喜欢的电影”或“你可能需要的商品”时,它都是基于复杂的机器学习算法,尽可能地向你提供具有说服力的建议,这显然比过去的促销活动更有吸引力。

虽然我们可能不是所有人都有自动驾驶汽车,但我们敏锐地意识到这一领域的发展以及自动导航提供的潜力。

人工智能技术承载着一个伟大的希望——机器可以根据周围的世界做出决定,像人类一样处理信息,甚至以一种优于人类的方式。但如果我们考虑一下上面的例子,就会发现只有“大型机器”才能实现人工智能的承诺,这些设备往往没有功率、尺寸或成本的限制。或者换句话说,它们会发热,有线路供电,体积很大,而且很昂贵。例如,Alexa 和 Netflix 这些全球领先的IT巨头企业依靠云中的大型耗电服务器(数据中心)来推断用户的意图。

虽然自动驾驶汽车很可能依赖电池,但考虑到这些电池必须转动车轮和转向,它们的能量容量是巨大的。与最昂贵的人工智能决策相比,它们是巨大的能源支出。

因此,尽管人工智能前景广阔,但“小机器”却被抛在了后面 。由较小电池供电或具有成本和尺寸限制的设备无法参与机器可以看到和听到的想法。今天,这些小机器只能利用简单的人工智能技术,也许是听一个关键词,或者从心率分析低维信号,如光电体积描记术 (PPG)。

如果小机器能看能听会怎样?

但是,小型机器能够看到和听到是否有价值?可能很多人很难想象像门铃摄像头这样利用自动驾驶或自然语言处理等技术的小设备。尽管如此,诸如词汇识别、语音识别和图像分析之类的不太复杂、处理密集程度较低的 AI 计算仍然存在机会:

  • 门铃摄像头和消费级安全摄像头通常会触发一些无趣的事件,例如风引起的植物运动、云引起的剧烈光线变化,甚至是狗或猫在镜头前面动等事件。这可能导致错误警报触发,导致房主开始忽略掉一些重要事件。因为,房主可能在世界不同的地方旅行,也可能正在睡觉,而他们的安全摄像机却对日出、云和日落引起的照明变化频繁发出警报。而更智能的摄像机则可以更加精准是识别物体变化,如人体的轮廓,进而避免误报干扰。
  • 门锁或其他接入点可以使用面部识别甚至语音识别来验证人员访问权限,在很多情况下无需钥匙或IC卡。
  • 许多摄像头希望在某些事件上触发:例如,跟踪摄像头可能希望在画面中出现某一种动物时触发,安全摄像头可能希望在画面中出现人或开门或脚步声等噪音时触发,并且有些摄像机可能想要通过语音命令触发等等。
  • 大词汇量命令在许多应用中都很有用。虽然有很多类似“Hey Alexa”、“Hey Siri” 解决方案,但如果开始考虑 20 个或更多单词的词汇,则可以在工业设备、家庭自动化、烹饪用具和许多其他设备中找到用于简化人机交互的用途。

这些例子只是表面上的。让小型机器看到、听到和解决以前需要人工干预的问题的想法是一个强大的想法,我们每天都在继续寻找创造性的新用例。

边缘人工智能的梦想与挑战

让小型机器能看和听的挑战是什么?

那么,如果人工智能对小型机器如此有价值,为什么我们还没有广泛应用呢?答案是计算能力。人工智能推理是神经网络模型计算的结果。把神经网络模型想象成你的大脑如何处理图片或声音的一个粗略的近似,把它分解成非常小的片段,然后当这些小片段组合在一起时识别出模式。

现代视觉问题的主力模型是卷积神经网络 (CNN)。这些模型在图像分析方面非常出色,在音频分析中也非常有用。挑战在于此类模型需要数百万或数十亿次数学计算。传统上,这些应用很难选择实施:

  • 使用廉价且低功耗的微控制器解决方案。虽然平均功耗可能很低,但 CNN 可能需要几秒钟的时间来计算,这意味着 AI 推理不是实时的,因此会消耗大量电池电量。
  • 购买可以在所需延迟内完成这些数学运算的昂贵且高性能的处理器。这些处理器通常很大,需要大量外部组件,包括散热器或类似的冷却组件。但是,它们执行 AI 推理的速度非常快。
  • 无法实施。低功耗微控制器解决方案将太慢而无法使用,而高性能处理器方法将打破成本、尺寸和功率预算。

我们需要的是一种嵌入式的人工智能解决方案,从头开始构建,以最大限度地减少CNN计算的能源消耗。与传统的微控制器或处理器解决方案相比,AI推断需要在一个数量级上执行,并且不需要内存等外部组件的帮助,这些外部组件会消耗能量、体积和成本。

如果人工智能推理解决方案可以消除机器视觉的能量损失,那么即使是最小的设备也可以看到并识别周围世界发生的事情。

幸运的是,我们正处于这场“小机器”革命的开端。现在的产品几乎可以消除人工智能推断的能源成本,并实现电池驱动的机器视觉。例如,一个微控制器可用于执行 AI 推理,同时仅消耗微焦耳的能量。


以上是边缘人工智能的梦想与挑战的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介绍 假设有一个农民每天在几周内观察农作物的进展。他研究了增长率,并开始思考他的植物在几周内可以生长的高度。从Th

软AI的兴起及其对当今企业的意义软AI的兴起及其对当今企业的意义Apr 15, 2025 am 11:36 AM

软AI(被定义为AI系统,旨在使用近似推理,模式识别和灵活的决策执行特定的狭窄任务 - 试图通过拥抱歧义来模仿类似人类的思维。 但是这对业务意味着什么

为AI前沿的不断发展的安全框架为AI前沿的不断发展的安全框架Apr 15, 2025 am 11:34 AM

答案很明确 - 只是云计算需要向云本地安全工具转变,AI需要专门为AI独特需求而设计的新型安全解决方案。 云计算和安全课程的兴起 在

生成AI的3种方法放大了企业家:当心平均值!生成AI的3种方法放大了企业家:当心平均值!Apr 15, 2025 am 11:33 AM

企业家,并使用AI和Generative AI来改善其业务。同时,重要的是要记住生成的AI,就像所有技术一样,都是一个放大器 - 使得伟大和平庸,更糟。严格的2024研究O

Andrew Ng的新简短课程Andrew Ng的新简短课程Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

大语言模型(LLM)中的幻觉是不可避免的吗?大语言模型(LLM)中的幻觉是不可避免的吗?Apr 15, 2025 am 11:31 AM

大型语言模型(LLM)和不可避免的幻觉问题 您可能使用了诸如Chatgpt,Claude和Gemini之类的AI模型。 这些都是大型语言模型(LLM)的示例,在大规模文本数据集上训练的功能强大的AI系统

60%的问题 -  AI搜索如何消耗您的流量60%的问题 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根据行业和搜索类型,AI概述可能导致有机交通下降15-64%。这种根本性的变化导致营销人员重新考虑其在数字可见性方面的整个策略。 新的

麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大学(Elon University)想象的数字未来中心的最新报告对近300名全球技术专家进行了调查。由此产生的报告“ 2035年成为人类”,得出的结论是,大多数人担心AI系统加深的采用

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)