>  기사  >  기술 주변기기  >  역량 정렬, 장문, Claude 3, 이번에는 대형 모델의 핵심 기술 경로에 대해 이야기하겠습니다.

역량 정렬, 장문, Claude 3, 이번에는 대형 모델의 핵심 기술 경로에 대해 이야기하겠습니다.

WBOY
WBOY원래의
2024-08-05 14:01:321018검색

대형 텍스트 모델이 새로운 수준에 도달했습니다. Claude 3는 수학, 프로그래밍, 다국어 이해, 비전 등 다차원에서 출시된 지 한 달도 안 된 GPT-4 및 Gemini 1.0 Ultra를 능가합니다. "빠르게 변화한다"는 말만으로는 현재 대형 모델 기술의 발전 추세를 설명하기에는 더 이상 충분하지 않습니다. 대형 모델 기술의 최신 진행 상황을 더 잘 공유하기 위해 2024년에 이 사이트는 Zhangjiang Science and Technology Investment, Zhangjiang Incubator 및 WAIC Circle이 업계의 일선 전문가를 초대하는 "대형 모델 기술 워크숍" 시리즈 활동을 공동으로 시작했습니다. 학계, 연구를 통해 최첨단 관찰과 통찰력을 제공합니다. 3월 22일 오후, 상하이 장장시 낙시안로 800호 케하이빌딩 A동 3층에서 주제는 '클로드 3 폭염이 온다, 텍스트 대형의 핵심 기술 경로에 대해 이야기하자'였다. 모델", Fudan University의 Waveform Intelligence, Amazon Cloud 기술 학자 및 기술 전문가가 심층적인 공유 및 교류를 진행할 예정입니다. 대형모델의 진행상황에 대해 고민하고 있는 전문관객들도 행사에 참여해 함께 소통하고 토론할 수 있다.

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

게스트 소개

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

연설 제목: 대형 모델 역량 정렬

연사:

  • Gui Yu

푸단대학교 자연어 처리 연구소 부연구원

연구 분야:

  • 사전 훈련된 모델
  • 인간과 같은 정렬
  • 에이전트 상호 작용

학업 성과:

  • 국제 수준 높은 학술 저널 및 컨퍼런스에 50편 이상의 논문 게재
  • 여러 인재 프로젝트 주최(국립자연과학재단) of China) , Computer Society, Artificial Intelligence Society)
  • 수상:

    • Qian Weichang 중국 정보 처리 과학 기술상 1등상
    • NeurIPS2023 Large Model Alignment Track Best Paper Award
    • COLING2018 Best Paper Nomination Award
    • NLPCC2019 우수논문상
    • CIPS 우수논문상
    • ACM 우수논문상
  • 선정 :

    • 중국과학기술협회 청년인재육성사업
    • 상하이 모닝스타 프로그램
    • 세계인공지능컨퍼런스 윤판 "Bright Star" 수상

      能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

      연설 제목: 매우 긴 텍스트 창의적 글쓰기의 대형 모델을 위한 교육 및 추론 솔루션

연자:

Zhou Wangchunshu, Waveform Intelligence CTO.

  • 베이항대학교 중불공과대학 학사 및 석사 학위 취득
  • 박사 학위 취득, ETH Zurich에서 공부, Ryan Cotterell & Mrinmaya Sachan 밑에서 공부
  • 2023년 4월 자퇴 AIWaves 설립, 회사의 공동 창립자 겸 CTO
  • 연구 방향은 주로 다음과 같습니다.

    • LLM 교육 및 프롬프트
    • 언어 에이전트
    • 길고 창의적인 텍스트 생성
    • NLP를 위한 효율적인 방법
    • 다중 모드 LLM
    • 상식추론 등
  • 2022년 바이두 장학금을 받았습니다
  • MSRA/Byte AI Lab/AI2 등에서 인턴으로 일했고, Bytedance AI Lab에서 연구원으로 일했습니다
  • Zhou Wang Chunshu는 NeurIPS/ICML/ICLR/ACL/EMNLP/NAACL과 같은 기계 학습 및 연구 분야 그는 자연어 처리 컨퍼런스에서 30개 이상의 기사를 발표했으며 이러한 컨퍼런스의 검토자 및 ARR/Action Editor/Area Chair로 활동하고 있습니다. *ACL.

    能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

    연설 제목: Claude 3 기술 분석 및 시나리오 데모

연사:

Lin Ye, Amazon Cloud Technology의 수석 솔루션 설계자. C++/C#/Java/PHP/Python/JS 및 기타 개발 언어에 능숙하며 Github 저장소를 한 자리에서 3000까지 지속적으로 개발했습니다. 그는 1,000만 명의 사용자를 지원하는 공유 자전거 APP를 구축했으며 여러 유명 자동차 회사 APP 개발에 참여했으며 2005년 Zhejiang ACM Award를 수상했습니다. 현재 그는 엔터프라이즈 클라우드 네이티브 아키텍처 및 GenAI 개발에 주력하고 있습니다. , 그의 역량을 기업 현장에 적용하기 위해 최선을 다하고 있습니다.

행사등록

"대형모델기술워크숍 1단계" 등록이 오픈되었습니다. 아래 QR코드를 스캔하시거나 하단의 "원본읽기"를 클릭하시면 행사등록페이지로 바로 이동됩니다.

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

본 이벤트와 관련된 문의사항은 어시스턴트(ID: 13661489516)를 추가하시거나 이메일(chenyinyi@jiqizhixin.com)로 문의해주세요.

위 내용은 역량 정렬, 장문, Claude 3, 이번에는 대형 모델의 핵심 기술 경로에 대해 이야기하겠습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.