德国弗莱堡大学机器学习实验室负责人Frank Hutter 说,所有这些人类决策的结果是,复杂的模型最终是被"凭直觉设计",而不是系统地设计的。
一个名为自动机器学习(autoML)的不断发展的领域旨在消除这种猜测。其想法是让算法接管研究人员目前在设计模型时必须做出的决定。最终,这些技术可以使机器学习变得更容易获得。
尽管自动机器学习已经存在了近十年,但研究人员仍在努力改进它。近日,在巴尔的摩举行的一次新会议,展示了为提高autoML的准确性和简化其性能而做出的努力。
人们对 autoML 简化机器学习的潜力产生了浓厚的兴趣。亚马逊和谷歌等公司已经提供了利用 autoML 技术的低代码机器学习工具。如果这些技术变得更有效,它可以加速研究并让更多人使用机器学习。
这样做的目的是为了让人们可以选择他们想问的问题,将 autoML 工具指向它,并获得他们想要的结果。
这一愿景是"计算机科学的圣杯",怀俄明大学的计算机科学助理教授兼会议组织者Lars Kotthoff说,"你指定了问题,计算机就知道如何解决它,这就是你要做的一切。"但首先,研究人员必须弄清楚如何使这些技术更省时、更节能。
自动机器学习可以解决什么?
乍一看,autoML 的概念似乎是多余的——毕竟,机器学习已经是关于自动化从数据中获取洞察力的过程。但由于 autoML 算法在底层机器学习模型之上的抽象级别上运行,仅依赖这些模型的输出作为指导,因此它们可以节省时间和计算量。
研究人员可以将 autoML 技术应用于预先训练的模型以获得新的见解,而不会浪费计算能力来重复现有的研究。
例如,美国富士通研究所的研究科学家 Mehdi Bahrami 和他的合著者介绍了最近的工作,关于如何将BERT-sort算法与不同的预训练模型一起使用以适应新的目的。
BERT-sort 是一种算法,可以在对数据集进行训练时找出所谓的"语义顺序"。例如,给定的电影评论数据,它知道"伟大的"电影的排名要高于"好"和"坏"的电影。
借助 autoML 技术,还可以将学习到的语义顺序推广到对癌症诊断甚至外语文本进行分类,从而减少时间和计算量。
"BERT 需要数月的计算,而且非常昂贵,比如要花费 100 万美元来生成该模型并重复这些过程。"Bahrami 说,"因此,如果每个人都想做同样的事情,那就很昂贵——它不节能,对世界的可持续发展不利。"
尽管该领域显示出希望,但研究人员仍在寻找使 autoML 技术的计算效率更高的方法。例如,通过像神经架构搜索(NAS)这样的方法,构建和测试许多不同的模型以找到最合适的模型,完成所有这些迭代所需的能量可能很大。
自动机器学习还可以应用于不涉及神经网络的机器学习算法,例如创建随机决策森林或支持向量机来对数据进行分类。这些领域的研究正在持续进行中,已经有许多编码库可供想要将 autoML 技术整合到他们的项目中的人们使用。
Hutter表示,下一步是使用autoML量化不确定性并解决算法中的可信度和公平性问题。在这个愿景中,关于可信赖性和公平性的标准将类似于任何其他机器学习的约束条件,例如准确性。而autoML可以在这些算法发布之前捕获并自动纠正这些算法中发现的偏差。
神经架构搜索的持续进展
但是对于像深度学习这类应用,autoML还有很长的路要走。用于训练深度学习模型的数据,如图像、文档和录制的语音,通常是密集且复杂的。它需要巨大的计算能力来处理。除了在财力雄厚的大企业工作的研究人员之外,训练这些模型的成本和时间可能会让任何人望而却步。
该会议上的一项竞赛要求是参与者开发用于神经架构搜索的节能替代算法。这是一个相当大的挑战,因为这种技术具有"臭名昭著"的计算需求。它会自动循环遍历无数的深度学习模型,以帮助研究人员为他们的应用选择合适的模型,但该过程可能需要数月时间,成本超过一百万美元。
这些被称为零成本神经架构搜索代理的替代算法的目标是,通过大幅削减其对计算的需求,使神经架构搜索更容易获得、更环保。其结果只需要几秒钟就能运行,而不是几个月。目前,这些技术仍处于发展的早期阶段并且通常不可靠,但机器学习研究人员预测,它们有可能使模型选择过程更加高效。
以上是借助 autoML 技术更容易地开发AI的详细内容。更多信息请关注PHP中文网其他相关文章!

介绍 恭喜!您经营一家成功的业务。通过您的网页,社交媒体活动,网络研讨会,会议,免费资源和其他来源,您每天收集5000个电子邮件ID。下一个明显的步骤是

介绍 在当今快节奏的软件开发环境中,确保最佳应用程序性能至关重要。监视实时指标,例如响应时间,错误率和资源利用率可以帮助MAIN

“您有几个用户?”他扮演。 阿尔特曼回答说:“我认为我们上次说的是每周5亿个活跃者,而且它正在迅速增长。” “你告诉我,就像在短短几周内翻了一番,”安德森继续说道。 “我说那个私人

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

想象一下,拥有一个由AI驱动的助手,不仅可以响应您的查询,还可以自主收集信息,执行任务甚至处理多种类型的数据(TEXT,图像和代码)。听起来有未来派?在这个a


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

Dreamweaver CS6
视觉化网页开发工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。