我们将人工智能(AI)深度学习的又一年激动人心的发展抛在身后——这一年充满了显着的进步、争议,当然还有争议。在我们结束 2022 年并准备迎接 2023 年的到来之际,以下是今年深度学习领域最显着的总体趋势。
1. 规模仍然是一个重要因素
过去几年深度学习中一直保持不变的一个主题是创建更大的神经网络的驱动力。计算机资源的可用性使扩展神经网络以及专门的 AI 硬件、大型数据集以及变压器模型等规模友好架构的开发成为可能。
目前,公司正在通过将神经网络扩展到更大的规模来获得更好的结果。过去一年,DeepMind 发布了Gopher,一个 2800 亿参数的大型语言模型(LLM);谷歌发布了拥有 5400 亿个参数的Pathways 语言模型 ( PaLM )和多达 1.2 万亿个参数的通用语言模型 ( GLaM );微软和英伟达发布了Megatron-Turing NLG,一个 5300 亿参数的 LLM。
规模的有趣方面之一是涌现能力,其中较大的模型成功地完成了较小的模型不可能完成的任务。这种现象在 LLM 中特别有趣,随着规模的扩大,模型在更广泛的任务和基准测试中显示出有希望的结果。
然而,值得注意的是,即使在最大的模型中,深度学习的一些基本问题仍未解决(稍后会详细介绍)。
2. 无监督学习继续交付
许多成功的深度学习应用程序需要人类标记训练示例,也称为监督学习。但互联网上可用的大多数数据都没有带有监督学习所需的干净标签。数据注释既昂贵又缓慢,造成瓶颈。这就是为什么研究人员长期以来一直在寻求无监督学习的进步,在这种学习中,深度学习模型的训练不需要人工注释的数据。
近年来,这一领域取得了巨大的进步,尤其是在 LLM 领域,它们大多接受从互联网上收集的大量原始数据集的训练。虽然法学硕士在 2022 年继续取得进展,但我们也看到无监督学习技术的其他趋势越来越受欢迎。
例如,今年文本到图像的模型取得了惊人的进步。OpenAI 的DALL-E 2、谷歌的Imagen和 Stability AI 的Stable Diffusion等模型展示了无监督学习的力量。与需要注释良好的图像和描述对的旧文本到图像模型不同,这些模型使用互联网上已经存在的松散标题图像的大型数据集。他们的训练数据集的庞大规模(这仅是可能的,因为不需要手动标记)和字幕方案的可变性使这些模型能够找到文本和视觉信息之间的各种复杂模式。因此,它们在为各种描述生成图像方面更加灵活。
3. 多模态取得长足进步
文本到图像生成器还有另一个有趣的特性:它们在单个模型中组合了多种数据类型。能够处理多种模式使深度学习模型能够承担更复杂的任务。
多模态对于人类和动物的智能非常重要。例如,当你看到一棵树并听到风在它的树枝上沙沙作响时,你的大脑可以很快地将它们联系在一起。同样,当你看到“树”这个词时,你可以很快地联想到一棵树的形象,记住下雨后松树的味道,或者回忆起你以前有过的其他经历。
显然,多模态在使深度学习系统更加灵活方面发挥了重要作用。DeepMind 的Gato可能最好地展示了这一点,这是一种针对各种数据类型(包括图像、文本和本体感觉数据)进行训练的深度学习模型。Gato 在多项任务中表现出色,包括图像字幕、交互式对话、控制机械臂和玩游戏。这与旨在执行单一任务的经典深度学习模型形成对比。
一些研究人员已经提出了这样的概念,即我们只需要像 Gato 这样的系统来实现人工智能(AGI)。尽管许多科学家不同意这一观点,但可以肯定的是,多模态为深度学习带来了重要成就。
4. 深度学习的基本问题仍然存在
尽管深度学习取得了令人瞩目的成就,但该领域的一些问题仍未解决。其中包括因果关系、组合性、常识、推理、计划、直觉物理学以及抽象和类比。
这些是不同领域的科学家仍在研究的一些智力奥秘。纯粹的基于规模和数据的深度学习方法有助于在其中一些问题上取得渐进式进展,但未能提供明确的解决方案。
例如,较大的 LLM 可以在较长的文本中保持连贯性和一致性。但他们在需要细致的逐步推理和计划的任务上失败了。
同样,文本到图像生成器创建令人惊叹的图形,但在被要求绘制需要组合性或具有复杂描述的图像时会犯基本错误。
不同的科学家正在讨论和探索这些挑战,包括一些深度学习的先驱。其中最著名的是获得图灵奖的卷积神经网络 (CNN) 发明者 Yann LeCun,他最近写了一篇关于仅从文本中学习的 LLM的局限性的长文。LeCun 正在研究一种深度学习架构,该架构可以学习世界模型,并可以解决该领域目前面临的一些挑战。
深度学习已经走过了漫长的道路。但我们取得的进步越多,我们就越意识到创建真正智能系统的挑战。明年肯定会和今年一样令人兴奋。
以上是2022年深度学习的发展趋势与问题的详细内容。更多信息请关注PHP中文网其他相关文章!

轻松在家运行大型语言模型:LM Studio 使用指南 近年来,软件和硬件的进步使得在个人电脑上运行大型语言模型 (LLM) 成为可能。LM Studio 就是一个让这一过程变得轻松便捷的优秀工具。本文将深入探讨如何使用 LM Studio 在本地运行 LLM,涵盖关键步骤、潜在挑战以及在本地拥有 LLM 的优势。无论您是技术爱好者还是对最新 AI 技术感到好奇,本指南都将提供宝贵的见解和实用技巧。让我们开始吧! 概述 了解在本地运行 LLM 的基本要求。 在您的电脑上设置 LM Studi

盖伊·佩里(Guy Peri)是麦考密克(McCormick)的首席信息和数字官。尽管他的角色仅七个月,但Peri正在迅速促进公司数字能力的全面转变。他的职业生涯专注于数据和分析信息

介绍 人工智能(AI)不仅要理解单词,而且要理解情感,从而以人的触感做出反应。 这种复杂的互动对于AI和自然语言处理的快速前进的领域至关重要。 Th

介绍 在当今以数据为中心的世界中,利用先进的AI技术对于寻求竞争优势和提高效率的企业至关重要。 一系列强大的工具使数据科学家,分析师和开发人员都能构建,Depl

本周的AI景观爆炸了,来自Openai,Mistral AI,Nvidia,Deepseek和Hugging Face等行业巨头的开创性发行。 这些新型号有望提高功率,负担能力和可访问性,这在TR的进步中推动了

但是,该公司的Android应用不仅提供搜索功能,而且还充当AI助手,并充满了许多安全问题,可以将其用户暴露于数据盗用,帐户收购和恶意攻击中

您可以查看会议和贸易展览中正在发生的事情。您可以询问工程师在做什么,或咨询首席执行官。 您看的任何地方,事情都以惊人的速度发生变化。 工程师和非工程师 有什么区别

模拟火箭发射的火箭发射:综合指南 本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。 我们将介绍从定义火箭组件到分析模拟的所有内容


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

禅工作室 13.0.1
功能强大的PHP集成开发环境

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具