随着深度学习技术的出现,最近几年来,视觉图像处理变得越来越受欢迎,在各个领域都得到了广泛应用,同时也涌现出了大量的从业人员。然而,许多人只会使用深度学习,并认为传统的图像处理算法已经过时了。我曾经听到有人说,图像处理已经变得非常普遍,传统的算法已经过时,门槛也很低,任何人都可以使用。说实话,听到这样的言论,有时候我真的很无语
今天正好有一些时间,我想谈谈这个问题。首先,让我们来分析一下,图像处理主要是做什么的?无论图像处理用在哪个行业,它的主要功能包括识别、分类、定位、检测、尺寸测量和视觉引导等
既然有人说深度学习已经取代了传统的图像处理技术,那么我今天就给大家举几个具体的案例来看看深度学习的应用情况。同时也要看看传统的图像处理技术是否仍然有它的用武之地
首先,让我们简单介绍一下上面提到的视觉主要功能是什么。识别和分类之间存在一定的关联。人脸识别、车牌识别、字符识别、条形码/二维码识别、产品类别识别、水果识别等都属于图像识别技术,识别完成后有时会直接给出识别结果,有时还需要进行分类。例如,在混装产线上识别出的产品需要进行分类装箱
重新写成中文: 定位方式有多种,有时只需大致知道目标位置,有时需要精确定位,以便机器人能够自动抓取。检测方式包括目标检测和缺陷检测等。目标检测通常只需知道场景中是否存在目标,而缺陷检测除了检测缺陷是否存在外,还需要确定缺陷的大小和类别
尺寸测量的目标非常明确,即通过视觉检测目标对象的特定尺寸是否符合要求。视觉引导是与机器人自动抓取相结合的,需要精确定位目标位置,同时还需要确定抓取的具体位置,以避免在机器人移动时目标可能会掉落
下面我将列举几个具体的案例,展示大家如何利用深度学习进行实现。由于企业不希望公开这些图像,因此下面的图片只截取了其中一小部分,无法确定具体内容
以下所有的例子都是企业实际需求,图像也是现场拍摄的。我们先来看一个简单的字符识别案例。这个案例的要求是判断这些字符是否正确,每秒钟需要处理20个字符,预算是每台视觉系统2万块钱,共有100条产线,总共需要200万块钱。你觉得应该做还是不做呢?虽然200万块钱已经不少了,但是每台视觉系统只需要2万块钱。那么做下来会有利润吗?另外,上位机识别到有错误的字符时,需要自动剔除
简单分析一下,每秒钟可以检测20个产品,也就是每个产品需要在50毫秒内完成。同时,上位机需要发送信号给剔除机构,为了确保信号的稳定性,需要预留20毫秒的时间。剩下的30毫秒用于拍照和图像处理。对于深度学习的训练,需要考虑工控机的配置。此外,还需要考虑PLC、剔除装置、相机、光源、镜头、机柜以及其他一些小配件的成本。人工现场调试的成本是多少?总的成本是多少?
再举一个例子。下面这张图片展示了焊接缺陷检测。焊接缺陷有很多种,有人曾经花了一周的时间利用深度学习进行训练和检测。他们告诉我检测结果非常好,但一个月后他们又来找我说无法承担成本,而且检测效果很差。大家思考一下,为什么会出现这种情况呢?
再举一个例子,下面这个图是一个条形码识别的例子,你看这个条形码很模糊,很难辨认吧?我们可以使用深度学习来识别它
举个例子,我们来看一下下面的图。我们需要检测两侧的粗细是否一致,还要检测表面是否有缺陷。那么,我们该如何运用深度学习来解决这个问题呢?曾经有人在现场调试了半年,但最终客户并不满意
如何使用深度学习来实现机器人自动抓取并检测抓取对象的倾斜角度,从而调整机器人的姿态?
如何使用深度学习来测量已使用一段时间的弹簧的尺寸,以判断其是否合格?还有其他类似的轴承、齿轮、螺纹等参数如何测量?
上述例子只是众多实际案例中的一小部分,类似的检测方式层出不穷,比如自动拧螺栓、无序抓取和微米级的精确定位等。然而,遗憾的是,很多人只会使用深度学习,有些人甚至连基本的图像概念都没有弄清楚,就断言图像处理已经过时,深度学习已经取代了其他图像处理方法。如果多接触实际案例,就不会说出这样的话来
很多人错误地认为,只需要将图像输入深度学习模型进行训练,如果效果不好就增加训练样本或调整参数,就能达到理想的效果。我只能说这种对图像的理解太过肤浅。人们最常见的图像应用是人脸识别和车牌识别等,对于这些识别任务,使用深度学习并没有太大问题,因为对于识别的要求并不高。即使识别时间很长,或者出现识别错误,也不会造成太大的问题。比如刷脸支付,如果无法识别出人脸,还可以选择手动支付;车牌识别和门禁系统,如果无法识别出车牌或人脸,也可以选择手动开门。但在全自动的应用场景下,这种情况是不允许出现的
对于产品缺陷的检测、分类和识别,深度学习是一种常用的方法,但也需要根据具体情况来决定。此外,在训练之前,通常还需要使用其他图像处理算法
有些人只是拿公开的数据集来训练深度学习模型,写写文章,这是没有问题的。但是,如果要在实际应用中应用这些模型,还有很长的路要走。我曾经熟悉的一家企业招聘了一些博士去从事视觉检测的工作,但是半年过去了却没有任何成果,结果被领导狠狠地批评了一番。你知道为什么吗?
深度学习在应用领域中有其一席之地,这是不可否认的事实。然而,它仅仅是视觉检测的一部分,并且在其他许多方面无法实现。目前的视觉检测技术仅能应用于一些简单场景,对于许多复杂场景,无论采用何种算法,都无法实现有效检测。因此,视觉图像处理算法还有很长的发展路程
深度学习训练图像时,通常需要对原图进行一些处理,例如滤波、增强、阈值分割、边缘检测和形态学运算。有时候,还需要对图像进行处理,然后直接提取图像特征进行深度学习训练。许多从事视觉工作的人都明白这个原理
以前曾经提到过,如果只是想撰写一篇论文,那么深入研究一个方向就足够了。深入进行理论研究也是有前途的,但对个人的理论能力要求较高。如果没有接触过实际的视觉应用,最好不要随意声称图像处理已经过时,其他的图像处理算法已经不再使用,深度学习已经取代了其他的图像处理算法
所以,我们是否还需要传统的图像处理算法呢?我认为这个问题的答案已经很明确了。如果还有不清楚的地方,请仔细思考一下,你接触过多少与视觉相关的项目,还有哪些是你不知道的,你是否真正理解视觉检测可以做什么以及如何去做呢?很少有视觉检测仅仅依靠单一的图像处理算法来实现。因此,在应用层面上,我们需要熟练掌握各种图像处理算法的使用,需要熟练掌握各种算法的组合应用,才能在视觉行业中游刃有余。很快就要到暑假了,暑假是非常好的学习时间,利用这段假期,利用这个学习平台,快速掌握图像处理相关算法的应用吧
以上是能否用深度学习替代其他图像处理算法?的详细内容。更多信息请关注PHP中文网其他相关文章!

对于那些可能是我专栏新手的人,我广泛探讨了AI的最新进展,包括体现AI,AI推理,AI中的高科技突破,及时的工程,AI培训,AI,AI RE RE等主题

欧洲雄心勃勃的AI大陆行动计划旨在将欧盟确立为人工智能的全球领导者。 一个关键要素是建立了AI Gigafactories网络,每个网络都有大约100,000个高级AI芯片 - 2倍的自动化合物的四倍

微软对AI代理申请的统一方法:企业的明显胜利 微软最近公告的新AI代理能力清晰而统一的演讲给人留下了深刻的印象。 与许多技术公告陷入困境不同

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

IBM的Z17大型机:集成AI用于增强业务运营 上个月,在IBM的纽约总部,我收到了Z17功能的预览。 以Z16的成功为基础(于2022年推出并证明持续的收入增长

解锁不可动摇的信心,消除了对外部验证的需求! 这五个CHATGPT提示将指导您完全自力更生和自我感知的变革转变。 只需复制,粘贴和自定义包围

人工智能安全与研究公司 Anthropic 最近的一项[研究]开始揭示这些复杂过程的真相,展现出一种令人不安地与我们自身认知领域相似的复杂性。自然智能和人工智能可能比我们想象的更相似。 窥探内部:Anthropic 可解释性研究 Anthropic 进行的研究的新发现代表了机制可解释性领域的重大进展,该领域旨在反向工程 AI 的内部计算——不仅仅观察 AI 做了什么,而是理解它在人工神经元层面如何做到这一点。 想象一下,试图通过绘制当有人看到特定物体或思考特定想法时哪些神经元会放电来理解大脑。A

高通的龙翼:企业和基础设施的战略飞跃 高通公司通过其新的Dragonwing品牌在全球范围内积极扩展其范围,以全球为目标。 这不仅仅是雷布兰


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

Atom编辑器mac版下载
最流行的的开源编辑器

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

SublimeText3 Linux新版
SublimeText3 Linux最新版

SublimeText3汉化版
中文版,非常好用