搜索
首页科技周边人工智能英伟达64个A100训练StyleGAN-T;九类生成式AI模型综述

目录:

  1. Quantum machine learning beyond kernel methods
  2. Wearable in-sensor reservoir computing using optoelectronic polymers with through-space charge-transport characteristics for multi-task learning
  3. Dash: Semi-Supervised Learning with Dynamic Thresholding
  4. StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis
  5. Open-Vocabulary Multi-Label Classification via Multi-Modal Knowledge Transfer
  6. ChatGPT is not all you need. A State of the Art Review of large Generative AI models
  7. ClimaX: A foundation model for weather and climate
  8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)

论文 1:Quantum machine learning beyond kernel methods

  • 作者:Sofiene Jerbi 等
  • 论文地址:https://www.nature.com/articles/s41467-023-36159-y

摘要:本文中,来自奥地利因斯布鲁克大学的研究团队确定了一个建设性框架,该框架捕获所有基于参数化量子电路的标准模型:线性量子模型

研究人员展示了使用量子信息论中的工具如何将数据重新上传电路有效地映射到量子希尔伯特空间中线性模型的更简单图像中。此外,根据量子比特数和需要学习的数据量来分析这些模型的实验相关资源需求。基于经典机器学习的最新结果,证明线性量子模型必须使用比数据重新上传模型多得多的量子比特才能解决某些学习任务,而核方法还需要多得多的数据点。

研究结果提供了对量子机器学习模型的更全面的了解,以及对不同模型与 NISQ 约束的兼容性的见解。


图片

这项工作中研究的量子机器学习模型。

推荐:超越核方法的量子机器学习,量子学习模型的统一框架。

论文 2:Wearable in-sensor reservoir computing using optoelectronic polymers with through-space charge-transport characteristics for multi-task learning

  • 作者:Xiaosong Wu 等
  • 论文地址:https://www.nature.com/articles/s41467-023-36205-9

摘要:传感器内多任务学习不仅是生物视觉的关键优点,也是人工智能的主要目标。然而,传统的硅视觉芯片存在大量时间以及能量开销。此外,训练传统的深度学习模型在边缘设备上既不可扩展也不可负担。

本文中,中科院和香港大学的研究团队提出了一种材料算法协同设计来模拟人类视网膜的学习范例,并且低开销。基于具有有效激子解离和贯穿空间电荷传输特性的瓶刷形半导体 p-NDI,开发了一种基于可穿戴晶体管的动态传感器储层计算系统,该系统在不同任务上表现出优异的可分离性、衰减记忆和回波状态特性。

与忆阻有机二极管上的「读出功能」相结合,RC 可识别手写字母和数字,并对各种服装进行分类,准确率分别为 98.04%、88.18% 和 91.76%(高于所有已报告的有机半导体)。

图片

传统半导体和 p-NDI 的光电流响应比较,以及传感器内 RC 系统的详细半导体设计原理。

推荐:低能耗低时耗,中科院 & 香港大学团队使用新方法进行多任务学习的可穿戴传感器内储层计算。

论文 3:Dash: Semi-Supervised Learning with Dynamic Thresholding

  • 作者:Yi Xu 等
  • 论文地址:https://proceedings.mlr.press/v139/xu21e/xu21e.pdf

摘要:这篇论文创新性地提出用动态阈值(dynamic threshold)的方式筛选无标签样本进行半监督学习(semi-supervised learning,SSL)的方法,我们改造了半监督学习的训练框架,在训练过程中对无标签样本的选择策略进行了改进,通过动态变化的阈值来选择更有效的无标签样本进行训练。Dash 是一个通用策略,可以轻松与现有的半监督学习方法集成

实验方面,我们在 CIFAR-10、CIFAR-100、STL-10 和 SVHN 等标准数据集上充分验证了其有效性。理论方面,论文从非凸优化的角度证明了 Dash 算法的收敛性质。


图片

Fixmatch 训练框架

推荐:达摩院开源半监督学习框架 Dash,刷新多项 SOTA。

论文 4:StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis

  • 作者:Axel Sauer 等
  • 论文地址:https://arxiv.org/pdf/2301.09515.pdf

摘要:扩散模型在文本到图像生成方面是最好的吗?不见得,英伟达等推出的新款 StyleGAN-T,结果表明 GAN 仍具有竞争力。StyleGAN-T 只需 0.1 秒即可生成 512×512 分辨率图像:

图片

推荐:GAN 强势归来?英伟达耗费 64 个 A100 训练 StyleGAN-T,优于扩散模型。

论文 5:Open-Vocabulary Multi-Label Classification via Multi-Modal Knowledge Transfer

  • 作者:Sunan He 等
  • 论文地址:https://arxiv.org/abs/2207.01887

摘要:在多标签分类系统中,经常遇到大量在训练集中未曾出现的标签,如何准确地识别这些标签是非常重要也极富挑战性的问题。

为此,腾讯优图实验室联合清华大学和深圳大学,提出了一种基于多模态知识迁移的框架 MKT,利用图文预训练模型强大的图文匹配能力,保留图像分类中关键的视觉一致性信息,实现多标签场景的 Open Vocabulary 分类。本工作已入选 AAAI 2023 Oral。


图片

ML-ZSL 和 MKT 方法比较。

推荐:AAAI 2023 Oral | 如何识别未知标签?多模态知识迁移框架实现新 SOTA。

论文 6:ChatGPT is not all you need. A State of the Art Review of large Generative AI models

  • 作者:Roberto Gozalo-Brizuela 等
  • 论文地址:https://arxiv.org/abs/2301.04655

摘要:过去两年,AI 领域里已经出现大量大型生成模型,如 ChatGPT 或 Stable Diffusion。具体而言,这些模型能够执行像通用问答系统或自动创建艺术图像等任务,这些任务正在彻底改变很多领域。

在近日由西班牙 Comillas Pontifical University 研究人员提交的综述论文中,作者试图以简洁的方式描述生成式 AI 对当前很多模型的影响,并对最近发布的主要生成式 AI 模型进行分类


图片

分类图示。

推荐:ChatGPT is not all you need,一文综述 6 大公司 9 类生成式 AI 模型。

论文 7:ClimaX: A foundation model for weather and climate

  • 作者:Tung Nguyen 等
  • 论文地址:https://arxiv.org/abs/2301.10343

摘要:微软自主系统与机器人研究小组以及微软研究院科学智能中心开发了 ClimaX,这是一种灵活且可推广的天气和气候科学深度学习模型,可以使用跨越不同变量、时空覆盖和物理基础的异构数据集进行训练。

ClimaX 使用新颖的编码和聚合块扩展了 Transformer 架构,这些块允许有效使用可用计算,同时保持通用性。ClimaX 在源自 CMIP6 的气候数据集上使用自我监督学习目标进行了预训练。然后可以对预训练的 ClimaX 进行微调,以解决广泛的气候和天气任务,包括那些涉及预训练期间看不到的大气变量和时空尺度的任务。

图片

预训练期间使用的 ClimaX 架构

推荐:微软团队发布第一个基于 AI 的天气和气候基础模型 ClimaX。

以上是英伟达64个A100训练StyleGAN-T;九类生成式AI模型综述的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
在LLMS中调用工具在LLMS中调用工具Apr 14, 2025 am 11:28 AM

大型语言模型(LLMS)的流行激增,工具称呼功能极大地扩展了其功能,而不是简单的文本生成。 现在,LLM可以处理复杂的自动化任务,例如Dynamic UI创建和自主a

多动症游戏,健康工具和AI聊天机器人如何改变全球健康多动症游戏,健康工具和AI聊天机器人如何改变全球健康Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

没有关于AI的投入:获胜者,失败者和机遇没有关于AI的投入:获胜者,失败者和机遇Apr 14, 2025 am 11:25 AM

“历史表明,尽管技术进步推动了经济增长,但它并不能自行确保公平的收入分配或促进包容性人类发展,”乌托德秘书长Rebeca Grynspan在序言中写道。

通过生成AI学习谈判技巧通过生成AI学习谈判技巧Apr 14, 2025 am 11:23 AM

易于使用,使用生成的AI作为您的谈判导师和陪练伙伴。 让我们来谈谈。 对创新AI突破的这种分析是我正在进行的《福布斯》列的最新覆盖范围的一部分,包括识别和解释

泰德(Ted)从Openai,Google,Meta透露出庭,与我自己自拍泰德(Ted)从Openai,Google,Meta透露出庭,与我自己自拍Apr 14, 2025 am 11:22 AM

在温哥华举行的TED2025会议昨天在4月11日举行了第36版。它有来自60多个国家 /地区的80个发言人,包括Sam Altman,Eric Sc​​hmidt和Palmer Luckey。泰德(Ted)的主题“人类重新构想”是量身定制的

约瑟夫·斯蒂格利兹(Joseph Stiglitz约瑟夫·斯蒂格利兹(Joseph StiglitzApr 14, 2025 am 11:21 AM

约瑟夫·斯蒂格利茨(Joseph Stiglitz)是2001年著名的经济学家,是诺贝尔经济奖的获得者。斯蒂格利茨认为,AI可能会使现有的不平等和合并权力恶化,并在几个主导公司的手中加剧,最终破坏了经济的经济。

什么是图形数据库?什么是图形数据库?Apr 14, 2025 am 11:19 AM

图数据库:通过关系彻底改变数据管理 随着数据的扩展及其特征在各个字段中的发展,图形数据库正在作为管理互连数据的变革解决方案的出现。与传统不同

LLM路由:策略,技术和Python实施LLM路由:策略,技术和Python实施Apr 14, 2025 am 11:14 AM

大型语言模型(LLM)路由:通过智​​能任务分配优化性能 LLM的快速发展的景观呈现出各种各样的模型,每个模型都具有独特的优势和劣势。 有些在创意内容gen上表现出色

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。