今年共選出 5 篇傑出論文獎以及 11 篇榮譽提名。
ICLR全稱為國際學習表徵會議(International Conference on Learning Representations),今年是第十二屆會議,於5月7日至11日在奧地利維也納舉辦。
在機器學習社群中,ICLR 是較為「年輕」的頂尖學術會議,它由深度學習巨頭、圖靈獎得主Yoshua Bengio 和 Yann LeCun 主辦,2013年才剛舉辦第一屆。不過 ICLR 很快就獲得了學術研究者們的廣泛認可,被認為是深度學習的頂級學術會議。
本屆會議共收到了 7262 篇提交論文,接收 2260 篇,整體接收率約為 31%,與去年持平(31.8%)。 此外 Spotlights 論文比例為 5%,Oral 論文比例為 1.2%。
比比起於往年,無論是參加人數或論文提交量,ICLR 的熱度可以說是有極大的提升。
歷屆ICLR 論文數據圖
在近日公佈的獲獎論文中,大會評選出了5 篇傑出論文獎和11 篇榮譽提名獎。
5 篇傑出論文獎
Outstanding Paper winners
論文:Generalization in diffusion models arises from geometry -adaptive harmonic representations
#論文網址:https://openreview.net/pdf?id=ANvmVS2Yr0
機構:紐約大學、法蘭西公學院
作者:Zahra Kadkhodaie 、Florentin Guth 、Eero P. Simoncelli 、Stéphane Mallat
本文對影像擴散模型的泛化和記憶方面進行了重要的深入分析。作者透過實證研究了影像生成模型何時從記憶輸入切換到泛化模式,並透過幾何自適應諧波表示與諧波分析的想法建立聯繫,從架構歸納偏差的角度進一步解釋了這一現象。本文涵蓋了我們對視覺生成模型理解中缺少的關鍵部分,對未來研究啟發巨大。
論文:Learning Interactive Real-World Simulators
- 論文網址:https://openreview. net/forum?id=sFyTZEqmUY
- 機構:UC 柏克萊、 Google DeepMind 、 MIT 、阿爾伯塔大學
跨多個來源聚合資料以訓練機器人基礎模型是長期目標。由於不同的機器人具有不同的感知運動接口,這給跨大規模資料集的訓練帶來了重大挑戰。
UniSim
,是朝著這個方向邁出的重要一步,也是一項工程壯舉,它利用了基於視覺感知和控制的文本描述的統一接口來聚合數據,並透過利用視覺和語言領域的最新發展來訓練機器人模擬器。 總結而言,本文探討了透過產生模型學習真實世界互動的通用模擬器 UniSim,邁出了建立通用模擬器的第一步。例如 UniSim 可以透過模擬「打開抽屜」等高階指令和低階指令的視覺結果來模擬人類和智慧體如何與世界互動。 ######本文將大量數據(包括網路文字 - 影像對,來自導航、人類活動、機器人動作等的豐富數據,以及來自模擬和渲染的數據)結合到一個條件影片生成框架中。然後透過仔細編排沿著不同軸的豐富數據,本文表明 UniSim 可以成功地合併不同軸數據的經驗並泛化到數據之外,透過對靜態場景和物件的細粒度運動控制來實現豐富的互動。 ###如下圖3 所示,UniSim 能夠模擬一系列豐富動作,例如廚房場景中洗手、拿碗、切胡蘿蔔、擦乾手這一系列動作;圖3 右上是按下不同的開關;圖3 下是兩個導航場景。
對應上圖3 右下的導航場景
上圖3 右下方的導航情境
Sue
- ##論文網址:https://openreview.net/forum?id=PdaPky8MUn
- 機構:特拉維夫大學、IBM
- 作者:Ido Amos、Jonathan Berant、Ankit Gupta
論文:Protein Discovery with Discrete Walk-Jump Sampling
- 論文網址:https:// openreview.net/forum?id=zMPHKOmQNb
- #機構:基因泰克、紐約大學
- 作者:Nathan C. Frey、Dan Berenberg、 Karina Zadorozhny、Joseph Kleinhenz、Julien Lafrance-Vanasse、Isidro Hotzel、Yan Wu、Stephen Ra、Richard Bonneau、Kyunghyun Cho、Andreas Loukas、Vladimir Gligorijevic、Saeed Saremi
論文:Vision Transformers Need Registers
- #論文網址:https://openreview.net/ forum?id=2dnO3LLiJ1
- 機構:Meta 等 ##作者:Timothée Darcet、Maxime Oquab、Julien Mairal、Piotr Bojanowski
- 這篇論文辨識了vision transformer 網路的特徵圖中的人工痕跡,這些痕跡以低資訊背景區域中的高範數tokens 為特徵。
作者提出了這種現象發生的關鍵假設,並提供了一個簡單而優雅的解決方案,使用額外的 register tokens 來解決這些痕跡,從而增強了模型在各種任務上的性能。從這項工作中獲得的見解還可以影響其他應用領域。
這篇論文行文極佳,為進行研究提供了一個很好的示範:「辨識問題,理解其發生的原因,然後提出解決方案。」
11篇榮譽提名除了5 篇傑出論文,ICLR 2024 也選出了11 篇榮譽提名獎。
論文:Amortizing intractable inference in large language models
- 機構:蒙特利爾大學、牛津大學
- #作者:Edward J Hu、Moksh Jain、Eric Elmoznino、Younesse Kaddar、Guillaume Lajoie、Yoshua Bengio、Nikolay Malkin
- 論文地址:https://openreview.net/forum? id=Ouj6p4ca60
- 這篇論文從貝葉斯推理的角度提出了一種在大型語言模型中替代自回歸解碼的有前景的方法,這可能會激發後續研究。
- 機構:DeepMind
- #作者:Ian Gemp、Luke Marris、Georgios Piliouras
- #論文網址:https://openreview.net/forum?id=cc8h3I3V4E
- #這是一篇寫得非常清晰的論文,對解決開發高效且可擴展的納許求解器這一重要問題意義重大。
論文:Beyond Weisfeiler-Lehman: A Quantitative Framework for GNN Expressiveness
機構:北京大學、北京智源人工智慧研究院
作者:張博航蓋景初杜逸恆葉啟威賀笛王立威
論文網址:https://openreview.net/forum?id=HSKaGOi7Ar
GNN 的表達能力是一個重要課題,而目前的解決方案仍然存在很大的限制。作者提出了一個基於同態計數的新表達理論(expressivity theory)。
論文:Flow Matching on General Geometries
#機構:Meta
- ##作者:Ricky T. Q. Chen、Yaron Lipman
- 論文地址:https://openreview.net/forum?id=g7ohDlTITL ##本文探討了在一般幾何在流形上進行生成建模這一具有挑戰性但又十分重要的問題,並提出了一個實用且高效的演算法。本文的呈現非常出色,並在廣泛的任務上進行了全面的實驗驗證。
- # 機構:中佛羅裡達大學、 Google DeepMind、阿姆斯特丹大學等
- 作者:Shashanka Venkataramanan、Mamshad Nayeem Rizve、Joao Carreira、Yuki M Asano、Yannis Avrithis
- 論文地址:https: //openreview.net/forum?id=Yen1lGns2o
- #本文提出了一種新穎的自監督圖像預訓練方法,即透過從連續視訊中學習。本文既貢獻了新類型的數據,也貢獻了一種從新數據中學習的方法。
- # 機構:香港城市大學、騰訊AI 實驗室、西安交通大學等
- 作者:Yichen Wu、Long-Kai Huang、Renzhen Wang、Deyu Meng、魏穎(Ying Wei)
- #論文地址:https://openreview.net/forum?id=TpD2aG1h0D
- #作者提出了一種新的元連續學習方差減少方法。此方法表現良好,不僅具有實際影響,而且還得到了 regret 分析的支持。
- 機構:伊利諾大學厄巴納-香檳分校、微軟
- 作者:Suyu Ge、Yunan Zhang、Liyuan Liu、Minjia Zhang、Jiawei Han、Jianfeng Gao
- 論文地址:https:/ /openreview.net/forum?id=uNrFpDPMyo
- #本文針對KV 快取壓縮問題(該問題對基於Transformer 的LLM 影響很大),透過一個簡單的想法來減少內存,並且無需耗費大量資源進行微調或重新訓練即可部署。這種方法非常簡單,事實證明它非常有效。
- 機構:史丹佛大學、哥倫比亞大學
- 作者:Yonatan Oren、Nicole Meister、Niladri S. Chatterji、Faisal Ladhak、Tatsunori Hashimoto
- 論文地址:https://openreview.net/forum?id= KS8mIvetg2
論文:Robust agents learn causal world models
- 機構:Google DeepMind
- 作者: Jonathan Richens、Tom Everitt
- 論文網址:https://openreview.net/forum?id=pOoKI3ouv1 ##這篇論文在奠定理論基礎方面取得了長足進展,以便理解因果推理在智能體推廣到新領域的能力中所起到的作用,對一系列相關領域也產生了影響。
- #機構:普林斯頓大學、哈佛大學等
- 作者:Gautam Reddy
- #論文網址:https://openreview.net/forum?id=aN4Jf6Cx69
機構:Granica Computing
######## ##作者:Germain Kolossov、Andrea Montanari、Pulkit Tandon#############論文網址:https://openreview.net/forum?id=HhfcNgQn6p########### ##這篇論文為資料子集選擇建立了統計基礎,並確定了流行的資料選擇方法的缺點。 ############參考連結:https://blog.iclr.cc/2024/05/06/iclr-2024-outstanding-paper-awards/##########以上是7262篇提交,ICLR 2024爆火,兩篇國內論文獲傑出論文提名的詳細內容。更多資訊請關注PHP中文網其他相關文章!

你可能听过以下犀利的观点:1.跟着NVIDIA的技术路线,可能永远也追不上NVIDIA的脚步。2.DSA或许有机会追赶上NVIDIA,但目前的状况是DSA濒临消亡,看不到任何希望另一方面,我们都知道现在大模型正处于风口位置,业界很多人想做大模型芯片,也有很多人想投大模型芯片。但是,大模型芯片的设计关键在哪,大带宽大内存的重要性好像大家都知道,但做出来的芯片跟NVIDIA相比,又有何不同?带着问题,本文尝试给大家一点启发。纯粹以观点为主的文章往往显得形式主义,我们可以通过一个架构的例子来说明Sam

2021年9月25日,阿里云发布了开源项目通义千问140亿参数模型Qwen-14B以及其对话模型Qwen-14B-Chat,并且可以免费商用。Qwen-14B在多个权威评测中表现出色,超过了同等规模的模型,甚至有些指标接近Llama2-70B。此前,阿里云还开源了70亿参数模型Qwen-7B,仅一个多月的时间下载量就突破了100万,成为开源社区的热门项目Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推

在法国巴黎举行了国际计算机视觉大会ICCV(InternationalConferenceonComputerVision)本周开幕作为全球计算机视觉领域顶级的学术会议,ICCV每两年召开一次。ICCV的热度一直以来都与CVPR不相上下,屡创新高在今天的开幕式上,ICCV官方公布了今年的论文数据:本届ICCV共有8068篇投稿,其中有2160篇被接收,录用率为26.8%,略高于上一届ICCV2021的录用率25.9%在论文主题方面,官方也公布了相关数据:多视角和传感器的3D技术热度最高在今天的开

随着智慧司法的兴起,智能化方法驱动的智能法律系统有望惠及不同群体。例如,为法律专业人员减轻文书工作,为普通民众提供法律咨询服务,为法学学生提供学习和考试辅导。由于法律知识的独特性和司法任务的多样性,此前的智慧司法研究方面主要着眼于为特定任务设计自动化算法,难以满足对司法领域提供支撑性服务的需求,离应用落地有不小的距离。而大型语言模型(LLMs)在不同的传统任务上展示出强大的能力,为智能法律系统的进一步发展带来希望。近日,复旦大学数据智能与社会计算实验室(FudanDISC)发布大语言模型驱动的中

8月31日,文心一言首次向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登录“文心一言官网”(https://yiyan.baidu.com)进行体验据报道,百度计划推出一系列经过全新重构的AI原生应用,以便让用户充分体验生成式AI的理解、生成、逻辑和记忆等四大核心能力今年3月16日,文心一言开启邀测。作为全球大厂中首个发布的生成式AI产品,文心一言的基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居第一。李彦宏表示,当文心

不得不说,Llama2的「二创」项目越来越硬核、有趣了。自Meta发布开源大模型Llama2以来,围绕着该模型的「二创」项目便多了起来。此前7月,特斯拉前AI总监、重回OpenAI的AndrejKarpathy利用周末时间,做了一个关于Llama2的有趣项目llama2.c,让用户在PyTorch中训练一个babyLlama2模型,然后使用近500行纯C、无任何依赖性的文件进行推理。今天,在Karpathyllama2.c项目的基础上,又有开发者创建了一个启动Llama2的演示操作系统,以及一个

保险行业对于社会民生和国民经济的重要性不言而喻。作为风险管理工具,保险为人民群众提供保障和福利,推动经济的稳定和可持续发展。在新的时代背景下,保险行业面临着新的机遇和挑战,需要不断创新和转型,以适应社会需求的变化和经济结构的调整近年来,中国的保险科技蓬勃发展。通过创新的商业模式和先进的技术手段,积极推动保险行业实现数字化和智能化转型。保险科技的目标是提升保险服务的便利性、个性化和智能化水平,以前所未有的速度改变传统保险业的面貌。这一发展趋势为保险行业注入了新的活力,使保险产品更贴近人民群众的实际

腾讯与中国宋庆龄基金会合作,于9月1日发布了名为“AI编程第一课”的公益项目。该项目旨在为全国零基础的青少年提供AI和编程启蒙平台。只需在微信中搜索“腾讯AI编程第一课”,即可通过官方小程序免费体验该项目由北京师范大学任学术指导单位,邀请全球顶尖高校专家联合参研。“AI编程第一课”首批上线内容结合中国航天、未来交通两项国家重大科技议题,原创趣味探索故事,通过剧本式、“玩中学”的方式,让青少年在1小时的学习实践中认识A


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

Atom編輯器mac版下載
最受歡迎的的開源編輯器

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

禪工作室 13.0.1
強大的PHP整合開發環境

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器