Maison >Périphériques technologiques >IA >Alignement des capacités, texte long, Claude 3, cette fois nous parlerons des chemins techniques clés des grands modèles

Alignement des capacités, texte long, Claude 3, cette fois nous parlerons des chemins techniques clés des grands modèles

WBOY
WBOYoriginal
2024-08-05 14:01:321165parcourir

Le modèle de texte volumineux a atteint un nouveau niveau. Claude 3 surpasse GPT-4 et Gemini 1.0 Ultra, lancés il y a moins d'un mois, dans de multiples dimensions telles que les mathématiques, la programmation, la compréhension multilingue et la vision. « Une évolution rapide » ne suffit plus à décrire la tendance actuelle de développement de la technologie des grands modèles. Afin de mieux partager les derniers progrès en matière de technologie des grands modèles, en 2024, ce site, Zhangjiang Science and Technology Investment, Zhangjiang Incubator et WAIC Circle ont lancé conjointement la série d'activités « Large Model Technology Workshop », invitant des experts de première ligne de l'industrie, le monde universitaire et la recherche pour apporter des observations et des idées de pointe . Dans l'après-midi du 22 mars, au 3ème étage du bâtiment A, bâtiment Kehai, n° 800 Naxian Road, Zhangjiang, Shanghai, le thème était « Claude 3 La canicule arrive, parlons des principales voies techniques du texte en grand models", de l'Université de Fudan, Waveform Intelligence, des spécialistes de la technologie Amazon Cloud et des experts techniques procéderont à des partages et des échanges approfondis. Le public professionnel soucieux des progrès des grands modèles est invité à rejoindre l’événement et à communiquer et discuter ensemble.

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

Présentation de l'invité

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

Titre du discours : Alignement des capacités des grands modèles

Intervenant :

  • Gui Yu

Chercheur associé au Laboratoire de traitement du langage naturel de l'Université de Fudan

Domaine de recherche :

  • Modèle pré-entraîné
  • Alignement semblable à celui d'un humain
  • Interaction d'agent

Réalisations académiques :

  • Publication de plus de 50 articles dans des revues et conférences universitaires internationales de haut niveau
  • Hébergement de plusieurs projets de talents (National Natural Science Foundation of China), Computer Society, Artificial Intelligence Society)
  • Prix remportés :

    • Premier prix Qian Weichang en science et technologie du traitement de l'information chinois
    • NeurIPS2023 Large Model Alignment Track Best Paper Award
    • COLING2018 Best Paper Nomination Award
    • NLPCC2019 Outstanding Paper Award
    • CIPS Excellent Paper Award
    • ACM Excellent Paper Award
  • Sélectionné :

    • Projet de promotion des jeunes talents de l'Association chinoise pour la science et la technologie
    • Shanghai Morning Star Program
    • Conférence mondiale sur l'intelligence artificielle Yunfan Prix ​​"Bright Star"

      能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

      Titre du discours : Solution de formation et d'inférence pour les grands modèles d'écriture créative de textes ultra-longs

Intervenant :

Zhou Wangchunshu, CTO de Waveform Intelligence.

  • Diplômé du Collège d'ingénieurs sino-français de l'Université de Beihang avec un baccalauréat et un master
  • Ph.D. a étudié à l'ETH Zurich, sous la direction de Ryan Cotterell et Mrinmaya Sachan
  • A abandonné ses études en avril 2023 et a fondé AIWaves, en tant que cofondateur et directeur technique de l'entreprise.
  • Les axes de recherche comprennent principalement :

    • Formation et incitation LLM
    • agents linguistiques
    • génération de textes longs/créatifs
    • méthodes efficaces pour la PNL
    • LLM multimodaux
    • raisonnement de bon sens, etc.
  • A reçu une bourse Baidu en 2022
  • A travaillé comme stagiaire au MSRA/Byte AI Lab/AI2 et dans d'autres institutions, et a été chercheur scientifique au Bytedance AI Lab
  • Zhou Wang Chunshu a travaillé dans l'apprentissage automatique et des domaines de recherche tels que NeurIPS/ICML/ICLR/ACL/EMNLP/NAACL. Il a publié plus de 30 articles dans des conférences sur le traitement du langage naturel, et sert de réviseur pour ces conférences et de rédacteur d'action/président régional d'ARR/ *ACL.

    能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

    Titre du discours : Analyse technique Claude 3 et démonstration de scénario

Intervenant :

Lin Ye, architecte de solutions senior d'Amazon Cloud Technology. Bon en C++/C#/Java/PHP/Python/JS et dans d'autres langages de développement, et a continuellement développé un dépôt Github allant d'un chiffre à 3000. Il a construit une application de vélo partagé qui prend en charge 10 millions d'utilisateurs, a participé au développement d'un certain nombre d'applications de constructeurs automobiles bien connus et a remporté le Zhejiang ACM Award en 2005. Il se concentre désormais sur le développement de l'architecture native du cloud d'entreprise et de GenAI. , et s'engage à appliquer ses capacités à la scène commerciale.

Inscription à l'événement

Les inscriptions à l'« Atelier technologique des grands modèles Phase 1 » ont été ouvertes. Scannez le code QR ci-dessous ou cliquez sur « Lire l'original » en bas pour accéder directement à la page d'inscription à l'événement.

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

Pour les questions liées à cet événement, vous êtes invités à ajouter notre assistant (ID : 13661489516) ou à consulter par e-mail (chenyinyi@jiqizhixin.com).

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn