2024年6月14日-15日,第6屆北京智源大會將以線下與線上結合的形式召開,線下會場設於中關村國家自主創新示範區會議中心。 2024智源大會再次以全球視野,匯聚年度傑出工作研究者,交流新思想,探討新思路,引領新前沿。目前已正式開放報名管道。
北位智源大會倒數:11 天啊
生成模型論壇丨6月15日下午
生成功能建模是人工智慧的基礎範式之一,是邁向通用人工智慧的重要一環。隨著生成式建模方法的快速發展和模型規模的急速增長,以自回歸模型、擴散機率模型為代表的生成式人工智慧(如GPT系列、Sora、Stable Diffusion等)在文字、圖像、影片、跨模態等重要領域取得了一系列突破性進展。本討論壇聚焦生成式機率建模的未來發展,邀請4位生成式人工智慧一線專家學者,分享生成式建模的前沿進展,共同探討如何建構多模態統一的生成式建模方法等重要未來方向。
「論壇議程
#李崇軒,中國人民大學高瓴人工智慧學院副教授
李崇軒,中國人民大學高瓴人工智慧學院副教授、博士生導師,2010-2019年獲清華大學學士及博士學位。主要研究機器學習、深度生成模型,代表性工作部署於文到圖大模型DALL·E 2、Stable Diffusion和文到視頻大模型ViDu等。曾獲國際會議ICLR佳出論文獎、吳文俊優秀青年獎、吳文俊人工智慧一等獎、中國電腦學會優良博士論文等。入選博新計畫、北京市科技新星,主持參與多項國家自然科學基金、科技部主題。擔任ICLR、NeurIPS等國際會議領域主席。
#陳鍵飛,清華大學副教授 陳鍵飛於2014年和2019年分別在清華大學獲得了電腦科學的學士和博士學位,並在TSAIL組與朱軍教授合作。他的研究興趣包括高效機器學習,特別是量化神經網路、隨機最佳化演算法和機率推理演算法。在過去,他還開發了幾個可擴展的主題模型訓練系統。 2019年,陳鍵飛 因傑出的工作獲得了CCF優秀博士論文獎。他也曾在2009年獲得中國資訊學奧林匹克競賽金牌。 2018年,陳鍵飛 共同創立了RealAI,這是他職業生涯中的顯著成就。
演講主題及嘉賓介紹(依照發言先後順序)
########## ###1、############影片產生前#############沿進展###############報告簡介:###不同於影像生成,影片生成在內容一致性、長影片生成、運算資源消耗等方面均面臨巨大的挑戰。但是,視訊生成仍然在2023年取得了快速的發展,湧現出Stable Video Diffusion、Runway Gen-2、Video Diffusion Transformer、Sora等優秀模型。本報告首先介紹目前影片生成面臨的挑戰,然後詳細介紹最新的影片產生優秀模型,最後也對影片生成的技術發展進行展望。 ########################################盧志武,中國人民大學教授##### #
盧志武博士,中國人民大學高瓴人工智慧學院教授,博士生導師。 2005年畢業於北京大學數學科學學院資訊科學系,獲理學碩士學位;2011年畢業於香港城市大學計算機系,並獲PhD學位。研究方向為機器學習與電腦視覺。設計首個中文通用多模態預訓練模型文瀾BriVL。發表多模態領域首篇Nature子刊論文。早於OpenAI發布類Sora的視訊生成底座VDT。
2、Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction
報告簡介:講者將會介紹最新的視覺生成框架Visual AutoRegressive Modeling,基於Visual tokenizer結合transformer實作了Next Scale Prediction,第一次讓GPT風格的自回歸視覺生成,在效果、速度、Scaling能力多方面超越Diffusion,並迎來了視覺生成領域的Scaling Laws,本次分享將會帶大家介紹經典的擴散模型以及近期受到大家關注Auto Regressive模型的前沿進展。
江毅,位元組跳動GenAI 研究員
江毅,位元組跳動GenAI 研究員,畢業於浙江大學,他的代表性工作有Sparse R-CNN,ByteTrack,UNINEXT等。目前的研究興趣主要是電腦視覺和視覺生成基礎模型的研發,在CVPR,ICCV,NeurIPS,ICLR,ICML,ECCV等會議和期刊上發表論文30餘篇,其中多篇文章被錄用為Oral,Spotlight,他的工作在github開源並累積獲得20K star。
3、#視覺生成中的若干問題
報告簡介:近年來,視覺生成模型在人工智慧領域實現了突破性進展,吸引了業界廣泛的關注。然而,隨著科技的發展,該領域亟待解決的關鍵問題也日益凸顯,呼喚研究者投入更多心力進行深入探討。本報告旨在梳理並總結該領域面臨的若干重要問題,同時分享作者針對以下課題的初步思考與見解:一、探討生成模型的最終追求;二、視覺信號分割問題;三、Tokenizer存在的困境;四、擴散模型的內在衝突問題;五、擴散模型是否為最大似然估計。報告期望這些討論能引起學界的重視,並為推動該領域的持續創新與發展做出貢獻。
#古紓暘,微軟亞洲研究院視覺運算組研究員
#古紓暘,在中國科學技術大學自動化系於2017年和2022年分別獲得學士和博士學位,現為微軟亞洲研究院視覺計算組研究員,主要研究方向為電腦視覺中的生成模型。研究興趣主要包括生成對抗網絡和擴散模型的理論及應用,探索新一代生成模型,以及生成模型品質評估。目前已在CVPR、ICCV、ECCV等會議上發表多篇論文並擔任多個會議與期刊的審稿人。
個人主頁:https://cientgu.github.io/
4、大模型的高效平行推理方法
報告簡介:AIGC大模型已取得廣泛應用成果,然而其低效的順序推理過程常導致較差的使用者體驗和高昂的部署成本。本次報告將介紹如何從推理演算法的角度改善大模型的推理效率,並探討在模型架構、序列壓縮、快取最佳化等其他方面的加速手段。
#鄧志傑,上海交通大學清源研究院助理教授
#鄧志傑,上海交通大學電院清源研究院助理教授,博士生導師。主要研究方向為生成模型、機器學習。以第一/通訊作者在ICML、NeurIPS、ICLR、CVPR等會議及期刊發表論文20餘篇。獲英偉達先鋒研究獎。研究工作由國家自然科學基金、上海市科技創新行動計畫、CCF-百川-英博大模型基金等計畫支持。
5、圓桌討論
圓桌討論來賓:
#陳鍵飛丨清華大學副教授(主持人)
盧志武丨中國人民大學教授
################################################### #江 毅丨位元組跳動GenAI 負責人######古紓暘丨微軟亞洲研究院視覺計算組研究員######鄧志傑丨上海交通大學清源研究院助理教授##### #李崇軒丨中國人民大學副教授######################即時掃碼註冊,參與大會報名#########本屆大會採用線下與線上模式融合,報名通道已開啟,歡迎掃碼免費註冊。 ###由於線下席位有限,請儘早完成註冊,委員會將根據註冊次序審核,並在會前發送審核結果通知###。公開環節將向註冊用戶全程線上直播。 ############
以上是2024智源大會議程公開丨生成模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!