7262篇提交，ICLR 2024爆火，兩篇國內論文獲傑出論文提名-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

7262篇提交，ICLR 2024爆火，兩篇國內論文獲傑出論文提名

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 08, 2024 pm 08:34 PM

產業模擬器

今年共選出 5 篇傑出論文獎以及 11 篇榮譽提名。

ICLR全稱為國際學習表徵會議（International Conference on Learning Representations），今年是第十二屆會議，於5月7日至11日在奧地利維也納舉辦。

在機器學習社群中，ICLR 是較為「年輕」的頂尖學術會議，它由深度學習巨頭、圖靈獎得主Yoshua Bengio 和 Yann LeCun 主辦，2013年才剛舉辦第一屆。不過 ICLR 很快就獲得了學術研究者們的廣泛認可，被認為是深度學習的頂級學術會議。

本屆會議共收到了 7262 篇提交論文，接收 2260 篇，整體接收率約為 31%，與去年持平（31.8%）。此外 Spotlights 論文比例為 5%，Oral 論文比例為 1.2%。

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

比比起於往年，無論是參加人數或論文提交量，ICLR 的熱度可以說是有極大的提升。

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

^{歷屆ICLR 論文數據圖}

在近日公佈的獲獎論文中，大會評選出了5 篇傑出論文獎和11 篇榮譽提名獎。

5 篇傑出論文獎

Outstanding Paper winners

論文：Generalization in diffusion models arises from geometry -adaptive harmonic representations

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

#論文網址：https://openreview.net/pdf?id=ANvmVS2Yr0
機構：紐約大學、法蘭西公學院
作者：Zahra Kadkhodaie 、Florentin Guth 、Eero P. Simoncelli 、Stéphane Mallat

本文對影像擴散模型的泛化和記憶方面進行了重要的深入分析。作者透過實證研究了影像生成模型何時從記憶輸入切換到泛化模式，並透過幾何自適應諧波表示與諧波分析的想法建立聯繫，從架構歸納偏差的角度進一步解釋了這一現象。本文涵蓋了我們對視覺生成模型理解中缺少的關鍵部分，對未來研究啟發巨大。

論文：Learning Interactive Real-World Simulators 7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

論文網址：https://openreview. net/forum?id=sFyTZEqmUY
機構：UC 柏克萊、 Google DeepMind 、 MIT 、阿爾伯塔大學

#作者：Sherry Yang、 Yilun Du 、 Kamyar Ghasemipour、Jonathan Tompson、Leslie Kaelbling、Dale Schuurmans、Pieter Abbeel

跨多個來源聚合資料以訓練機器人基礎模型是長期目標。由於不同的機器人具有不同的感知運動接口，這給跨大規模資料集的訓練帶來了重大挑戰。

UniSim

，是朝著這個方向邁出的重要一步，也是一項工程壯舉，它利用了基於視覺感知和控制的文本描述的統一接口來聚合數據，並透過利用視覺和語言領域的最新發展來訓練機器人模擬器。

總結而言，本文探討了透過產生模型學習真實世界互動的通用模擬器 UniSim，邁出了建立通用模擬器的第一步。例如 UniSim 可以透過模擬「打開抽屜」等高階指令和低階指令的視覺結果來模擬人類和智慧體如何與世界互動。 ######本文將大量數據（包括網路文字 - 影像對，來自導航、人類活動、機器人動作等的豐富數據，以及來自模擬和渲染的數據）結合到一個條件影片生成框架中。然後透過仔細編排沿著不同軸的豐富數據，本文表明 UniSim 可以成功地合併不同軸數據的經驗並泛化到數據之外，透過對靜態場景和物件的細粒度運動控制來實現豐富的互動。 ###

如下圖3 所示，UniSim 能夠模擬一系列豐富動作，例如廚房場景中洗手、拿碗、切胡蘿蔔、擦乾手這一系列動作；圖3 右上是按下不同的開關；圖3 下是兩個導航場景。

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

^{對應上圖3 右下的導航場景}

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

^{上圖3 右下方的導航情境}

Sue

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

##論文網址：https://openreview.net/forum?id=PdaPky8MUn
機構：特拉維夫大學、IBM
作者：Ido Amos、Jonathan Berant、Ankit Gupta

這篇論文深入探討了最近提出的狀態空間模型和transformer 架構對建模長期序列依賴性的能力。

令人驚訝的是，作者發現從頭開始訓練 transformer 模型會導致其性能被低估，並且透過預訓練和微調設定可以實現顯著的效能提升。該論文在關注簡潔性和系統性見解方面表現極佳。

論文：Protein Discovery with Discrete Walk-Jump Sampling

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

論文網址：https:// openreview.net/forum?id=zMPHKOmQNb
#機構：基因泰克、紐約大學
作者：Nathan C. Frey、Dan Berenberg、 Karina Zadorozhny、Joseph Kleinhenz、Julien Lafrance-Vanasse、Isidro Hotzel、Yan Wu、Stephen Ra、Richard Bonneau、Kyunghyun Cho、Andreas Loukas、Vladimir Gligorijevic、Saeed Saremi

#這篇論文解決了基於序列的抗體設計問題，這是蛋白質序列生成模型的一個及時且重要的應用。

為此，作者引入了一種創新而有效的新建模方法，用來專門針對處理離散蛋白質序列資料的問題。除了在矽中驗證方法外，作者還進行了大量的濕法實驗室實驗，以測量體外抗體結合親和力，展示了他們生成方法的有效性。

論文：Vision Transformers Need Registers

7262篇提交，ICLR 2024爆火，两篇国内论文获杰出论文提名

#論文網址：https://openreview.net/ forum?id=2dnO3LLiJ1
機構：Meta 等

作者提出了這種現象發生的關鍵假設，並提供了一個簡單而優雅的解決方案，使用額外的 register tokens 來解決這些痕跡，從而增強了模型在各種任務上的性能。從這項工作中獲得的見解還可以影響其他應用領域。

這篇論文行文極佳，為進行研究提供了一個很好的示範：「辨識問題，理解其發生的原因，然後提出解決方案。」

11篇榮譽提名

除了5 篇傑出論文，ICLR 2024 也選出了11 篇榮譽提名獎。

論文：Amortizing intractable inference in large language models

論文：Approximating Nash Equilibria in Normal-Form Games via Stochastic Optimization

論文：Beyond Weisfeiler-Lehman: A Quantitative Framework for GNN Expressiveness

機構：北京大學、北京智源人工智慧研究院
作者：張博航蓋景初杜逸恆葉啟威賀笛王立威
論文網址：https://openreview.net/forum?id=HSKaGOi7Ar

GNN 的表達能力是一個重要課題，而目前的解決方案仍然存在很大的限制。作者提出了一個基於同態計數的新表達理論（expressivity theory）。

論文：Flow Matching on General Geometries

#機構：Meta
##作者：Ricky T. Q. Chen、Yaron Lipman
論文地址：https://openreview.net/forum?id=g7ohDlTITL

論文：Is ImageNet worth 1 video? Learning strong image encoders from 1 long unlabelled video

論文：Meta Continual Learning Revisited: Implicitly Enhancing Online Hessian Approximation via Variance Reduction

論文：Model Tells You What to Discard: Adaptive KV Cache Compression for LLMs

論文：Proving Test Set Contamination in Black-Box Language Models

作者：Yonatan Oren、Nicole Meister、Niladri S. Chatterji、Faisal Ladhak、Tatsunori Hashimoto
論文地址：https://openreview.net/forum?id= KS8mIvetg2

本文使用了一個簡單而優雅的方法，用於測試受監督的學習資料集是否已包含在大型語言模型的訓練中。

論文：Robust agents learn causal world models

機構：Google DeepMind
作者： Jonathan Richens、Tom Everitt
論文網址：https://openreview.net/forum?id=pOoKI3ouv1

論文：The mechanistic basis of data dependence and abrupt learning in an in-context classification task

論文：Towards a statistical theory of data selection under weak supervision

機構：Granica Computing

######## ##作者：Germain Kolossov、Andrea Montanari、Pulkit Tandon#############論文網址：https://openreview.net/forum?id=HhfcNgQn6p########### ##這篇論文為資料子集選擇建立了統計基礎，並確定了流行的資料選擇方法的缺點。 ############參考連結：https://blog.iclr.cc/2024/05/06/iclr-2024-outstanding-paper-awards/##########

以上是7262篇提交，ICLR 2024爆火，兩篇國內論文獲傑出論文提名的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：机器之心。如有侵權，請聯絡admin@php.cn刪除

印度的10個機器學習實習（2025）May 12, 2025 am 10:47 AM

在印度（2025）登陸您夢想中的機器學習實習！對於學生和早期職業專業人員來說，機器學習實習是一個有意義的職業的完美髮射台。跨不同部門的印度公司 - 尖端的基因

嘗試Fellou AI並向Google和Chatgpt說再見May 12, 2025 am 10:26 AM

在過去的一年中，在線瀏覽的景觀經歷了重大轉變。這種轉變始於增強，個性化的搜索結果，例如困惑和副駕駛等平台，並隨著Chatgpt的整合而加速了

個人黑客將是一隻非常兇猛的熊May 11, 2025 am 11:09 AM

網絡攻擊正在發展。通用網絡釣魚電子郵件的日子已經一去不復返了。網絡犯罪的未來是超個性化的，利用了容易獲得的在線數據和AI來製作高度針對性的攻擊。想像一個知道您的工作的騙子

教皇獅子座XIV揭示了AI如何影響他的名字選擇May 11, 2025 am 11:07 AM

新當選的教皇獅子座（Leo Xiv）在對紅衣主教學院的就職演講中，討論了他的同名人物教皇里奧XIII的影響，他的教皇（1878-1903）與汽車和汽車和汽車公司的黎明相吻合

Fastapi -MCP初學者和專家教程-Analytics VidhyaMay 11, 2025 am 10:56 AM

本教程演示瞭如何使用模型上下文協議（MCP）和FastAPI將大型語言模型（LLM）與外部工具集成在一起。我們將使用FastAPI構建一個簡單的Web應用程序，並將其轉換為MCP服務器，使您的L

dia-1.6b tts：最佳文本到二元格生成模型 - 分析vidhyaMay 11, 2025 am 10:27 AM

探索DIA-1.6B：由兩個本科生開發的開創性的文本對語音模型，零資金！這個16億個參數模型產生了非常現實的語音，包括諸如笑聲和打噴嚏之類的非語言提示。本文指南

AI可以使指導比以往任何時候都更有意義May 10, 2025 am 11:17 AM

我完全同意。我的成功與導師的指導密不可分。他們的見解，尤其是關於業務管理，構成了我的信念和實踐的基石。這種經驗強調了我對導師的承諾

AI發掘了採礦業的新潛力May 10, 2025 am 11:16 AM

AI 增强型矿业设备矿业作业环境恶劣且危险重重。人工智能系统通过将人类从最危险的环境中移除并增强人类能力，帮助提高整体效率和安全性。人工智能越来越多地用于为矿业作业中使用的自动驾驶卡车、钻机和装载机提供动力。这些 AI 驱动的车辆能够在危险环境中精确作业，从而提高安全性和生产力。一些公司已经开发出用于大型矿业作业的自动驾驶采矿车辆。在挑战性环境中运行的设备需要持续维护。然而，维护会使关键设备离线并消耗资源。更精确的维护意味着昂贵且必要的设备的正常运行时间增加以及显著的成本节约。 AI 驱动

See all articles