>기술 주변기기 >일체 포함 >2024 지능형 소스 회의 의제 공개丨 생성 모델

2024 지능형 소스 회의 의제 공개丨 생성 모델

王林
王林원래의
2024-06-08 16:08:31595검색

2024년 6월 14일과 15일에 제6회 베이징 지위안 컨퍼런스가 오프라인과 온라인을 결합하여 개최됩니다. 오프라인 장소는 중관춘 국가독립혁신시범구 컨퍼런스 센터에서 개최됩니다. 2024 Zhiyuan 컨퍼런스는 다시 한 번 글로벌 관점을 가진 올해의 뛰어난 연구자들을 모아 새로운 아이디어를 교환하고, 새로운 아이디어를 탐구하며, 새로운 개척을 주도합니다. 이제 등록 채널이 공식적으로 오픈되었습니다. ㅋㅋㅋ

세대 기능 모델링은 인공지능의 기초 중 하나 패러다임은 일반 인공지능을 향한 중요한 단계이다. 생성 모델링 방법의 급속한 발전과 모델 규모의 급속한 성장에 따라 자동회귀 모델과 확산 확률 모델로 대표되는 생성 인공지능(예: GPT 시리즈, Sora, Stable Diffusion 등)이 텍스트, 이미지, 비디오, 교차 양식(cross-modality)과 같은 중요한 영역에서 일련의 획기적인 발전이 이루어졌습니다. 이 포럼은 생성적 확률 모델링의 향후 발전에 초점을 맞추고 생성적 인공 지능 분야의 일선 전문가 및 학자 4명을 초대하여 생성적 모델링의 최첨단 진행 상황을 공유하고 다중 모드 통합 생성 모델링 방법을 구축하는 방법과 기타 중요한 사항에 대해 논의합니다. 앞으로의 문제.

포럼 아젠다

포럼 회장

Li , 중국 인민대학교 선임연구원 인공지능대학 부교수

Li Chongxuan, 중국 런민 대학교 힐하우스 인공 지능 학교의 부교수이자 박사 지도교수입니다. 그는 2010년부터 2019년까지 칭화대학교에서 학사 및 박사 학위를 받았습니다. 머신러닝과 딥 제너레이티브 모델을 주로 연구하고 있으며, 대표작으로는 텍스트-이미지 대형 모델 DALL·E 2, Stable Diffusion, 텍스트-비디오 대형 모델 ViDu 등이 있다. 그는 국제 컨퍼런스 ICLR 최우수 논문상, Wu Wenjun Outstanding Youth Award, Wu Wenjun 인공 지능 1등상, 중국 컴퓨터 연맹 우수 박사 논문을 수상했습니다. 복신기획(Boxin Plan)과 베이징 과학기술스타(Beijing Science and Technology Star)에 선정된 그는 국립자연과학재단과 과학기술부의 많은 프로젝트를 주도하고 참여했다. ICLR, NeurIPS 등 국제회의 의장직을 역임.

2024 지능형 소스 회의 의제 공개丨 생성 모델

2024 지능형 소스 회의 의제 공개丨 생성 모델

Chen Jianfei, Tsinghua University 부교수

Chen Jianfei는 201년에 Tsinghua University에서 컴퓨터 공학 학사 및 박사 학위를 받았습니다. 4와 2019를 각각 사용했으며 TSAIL 그룹은 Zhu Jun 교수와 협력했습니다. 그의 연구 관심 분야에는 효율적인 기계 학습, 특히 양자화된 신경망, 확률론적 최적화 알고리즘, 확률론적 추론 알고리즘이 포함됩니다. 과거에는 여러 가지 확장 가능한 주제 모델 교육 시스템도 개발했습니다. 2019년 Chen Jianfei는 뛰어난 업적으로 CCF 우수 박사 학위 논문 상을 수상했습니다. 2009년 중국정보올림피아드에서도 금메달을 땄다. 2018년 Chen Jianfei는 RealAI를 공동 창립하여 그의 경력에서 주목할만한 성과를 거두었습니다.

스피치 주제 및 게스트 소개
(말하는 순서)

2024 지능형 소스 회의 의제 공개丨 생성 모델

1,

영상 생성 전

진행에 따라

보고서 소개:
이미지 생성의 경우 비디오 생성은 콘텐츠 일관성, 긴 비디오 생성 및 컴퓨팅 리소스 소비 측면에서 큰 문제에 직면해 있습니다. 그러나 비디오 세대는 Stable Video Diffusion, Runway Gen-2, Video Diffusion Transformer, Sora 등 우수한 모델이 등장하면서 2023년에도 여전히 빠른 발전을 이루었습니다. 본 보고서는 먼저 현재 영상세대가 직면한 과제를 소개하고, 최신 우수 영상세대 모델을 상세하게 소개하며, 마지막으로 영상세대 기술 발전에 대한 전망을 제시한다.

Lu Zhiwu, 중국 인민대학교 교수

Lu Zhiwu 박사, 중국 인민 대학교 Hillhouse 인공 지능 학교 교수 겸 박사 지도교수. 2005년 북경대학교 수리과학부 정보과학과를 졸업하고 2011년 홍콩 시립대학교 컴퓨터공학과에서 박사학위를 취득했습니다. 그의 연구 방향은 머신러닝과 컴퓨터 비전이다. 최초의 중국 범용 다중 모드 사전 훈련 모델 Wenlan BriVL을 설계합니다. 다중 양식 분야에서 최초의 Nature 하위 저널 논문을 출판했습니다. OpenAI보다 먼저 Sora와 유사한 비디오 생성 기반 VDT를 출시했습니다.

2, Visual Autoregressive Modeling : 차세대 예측을 통한 확장 가능한 이미지 생성 소개 : 스피커는 최신 시각적 생성 프레임 워크 Visual Autoregreative Modeling을 소개합니다. 시각적 토크나이저는 Transformer와 결합하여 최초로 GPT 스타일 자동 회귀 시각적 생성을 가능하게 하는 Next Scale Prediction을 구현하고, 효과, 속도 및 스케일링 기능 측면에서 확산을 능가하고 시각적 생성 분야에서 스케일링 법칙을 도입합니다. 공유가 당신을 가져올 것입니다. 최근 모두의 관심을 끌고 있는 고전적인 확산 모델과 최첨단 진보된 Auto Regressive 모델을 소개합니다.

Jiang Yi, ByteDance GenAI 연구원

2024 지능형 소스 회의 의제 공개丨 생성 모델

Jiang Yi, ByteDance GenAI 연구원은 Zhejiang University를 졸업했습니다. 대표 작품으로는 Sparse R-CNN, ByteTrack, UNINEXT 등이 있습니다. 그의 현재 연구 관심 분야는 주로 컴퓨터 비전 및 시각적 생성 기본 모델의 연구 및 개발입니다. 그는 CVPR, ICCV, NeurIPS, ICLR, ICML, ECCV 등과 같은 컨퍼런스 및 저널에 30편 이상의 논문을 발표했습니다. Oral, Spotlight에 승인되었으며 그의 작품은 github에서 오픈 소스로 공개되었으며 20,000개의 별을 축적했습니다.

3 우려가 널리 퍼져 있습니다. 그러나 기술이 발전함에 따라 이 분야에서 해결해야 할 핵심 문제가 점점 더 부각되고 있어 연구자들은 심도 있는 논의에 더 많은 에너지를 투자해야 합니다. 이 보고서는 이 분야가 직면한 몇 가지 중요한 문제를 정리하고 요약하고 다음 주제에 대한 저자의 예비 생각과 통찰력을 공유하는 것을 목표로 합니다. 1. 생성 모델 탐색의 궁극적인 추구 2. 시각적 신호 분할 문제; 토크나이저의 딜레마 4. 확산 모델의 고유한 충돌 문제 5. 확산 모델이 최대 우도 추정인지 여부. 보고서는 이러한 논의가 학계의 관심을 끌고 이 분야의 지속적인 혁신과 발전을 촉진하는 데 기여하기를 희망합니다.

Microsoft Research Asia의 비주얼 컴퓨팅 그룹 연구원인 Gu Shuyan

Gu Shuyan은 University of Science and Technology 자동화학과에서 학사 학위를 받았습니다. 각각 2017년과 2022년에 중국에서 박사 학위를 취득했으며 현재 Microsoft Research Asia의 Visual Computing Group 연구원입니다. 그의 주요 연구 방향은 컴퓨터 비전의 생성 모델입니다. 연구 관심 분야는 주로 생성적 적대 네트워크 및 확산 모델의 이론 및 응용, 차세대 생성 모델 탐색, 생성 모델의 품질 평가 등이 있습니다. 그는 CVPR, ICCV, ECCV 및 기타 컨퍼런스에서 많은 논문을 발표했으며 많은 컨퍼런스 및 저널의 검토자로 활동했습니다.

개인 홈페이지: https://cientgu.github.io/

2024 지능형 소스 회의 의제 공개丨 생성 모델

4.

대형 모델을 위한 효율적인 병렬 추론 방법

보고서 소개:
AIGC 대형 모델이 광범위한 적용 성과를 거두었습니다. 그러나 비효율적인 순차적 추론 프로세스로 인해 사용자 경험이 저하되고 배포 비용이 높아지는 경우가 많습니다. 본 보고서에서는 추론 알고리즘 관점에서 대형 모델의 추론 효율성을 향상시키는 방법을 소개하고, 모델 아키텍처, 시퀀스 압축, 캐시 최적화 등 다른 측면에서 가속 방법을 탐색합니다.

Deng Zhijie,

Shanghai Jiao Tong University Qingyuan Research Institute 조교수

Deng Zhijie, Shanghai Jiao Tong University 전기공학부 Qingyuan 연구소 조교수 겸 박사 지도교수. 주요 연구방향은 생성모델과 머신러닝이다. 그는 ICML, NeurIPS, ICLR, CVPR 등의 학회 및 저널에 제1저자/교신저자로 20편 이상의 논문을 게재했습니다. NVIDIA Pioneer Research Award를 수상했습니다. 연구 작업은 중국 국립 자연과학 재단, 상하이 과학 기술 혁신 실행 계획, CCF-백천-인보 대형 모델 기금 및 기타 프로젝트의 지원을 받습니다.

5, 원탁 토론

원탁 토론 손님:

Chen Jianfei丨칭화대학교 부교수 진행자)

Lu Zhi Wu丨인민대학 교수 University of China

Jiang Yi丨ByteDance GenAI 대표

Gu Shuhu丨Microsoft Research Asia의 비주얼 컴퓨팅 그룹 연구원

Deng Zhijie丨Shanghai Jiao Tong University Qingyuan Research Institute의 조교수

Li Chongxuan丨부교수 at Renmin University of China

지금 등록하고 컨퍼런스 등록에 참여하려면 QR 코드를 스캔하세요.

이 컨퍼런스는 오프라인과 온라인 모드의 통합을 채택합니다. QR 스캔을 환영합니다. 무료로 등록할 수 있는 코드입니다. 오프라인 좌석이 제한되어 있으므로 최대한 빨리 등록을 완료해 주시기 바랍니다. 조직위원회에서는 등록 순서에 따라 검토한 후 회의 전에 검토 결과를 통보해 드립니다. 공개 세션은 등록된 사용자에게 온라인으로 생중계됩니다.

2024 지능형 소스 회의 의제 공개丨 생성 모델

위 내용은 2024 지능형 소스 회의 의제 공개丨 생성 모델의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.