Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Fähigkeitsausrichtung, Langtext, Claude 3, dieses Mal werden wir über die wichtigsten technischen Pfade großer Modelle sprechen

Fähigkeitsausrichtung, Langtext, Claude 3, dieses Mal werden wir über die wichtigsten technischen Pfade großer Modelle sprechen

WBOY
WBOYOriginal
2024-08-05 14:01:321125Durchsuche

Das große Textmodell hat in mehreren Dimensionen wie Mathematik, Programmierung, Mehrsprachenverständnis und Vision ein neues Niveau erreicht. „Rasche Veränderung“ reicht nicht mehr aus, um den aktuellen Entwicklungstrend der Großmodelltechnik zu beschreiben. Um die neuesten Fortschritte in der Großmodelltechnologie besser zu teilen, starteten dieser Standort, Zhangjiang Science and Technology Investment, Zhangjiang Incubator und WAIC Circle im Jahr 2024 gemeinsam die Aktivitätsreihe „Large Model Technology Workshop“, zu der Experten aus der Industrie, Wissenschaft und Forschung, um innovative Beobachtungen und Erkenntnisse zu liefern. Am Nachmittag des 22. März lautete das Thema im 3. Stock des Gebäudes A, Kehai-Gebäude, Nr. 800 Naxian Road, Zhangjiang, Shanghai, „Claude 3. Die Hitzewelle steht vor der Tür, sprechen wir über die wichtigsten technischen Wege des Textgroßformats.“ models“ der Fudan-Universität, Waveform Intelligence, Amazon Cloud-Technologiewissenschaftler und technische Experten werden einen intensiven Austausch durchführen. Fachpublikum, dem der Fortschritt großer Modelle am Herzen liegt, ist herzlich willkommen, an der Veranstaltung teilzunehmen und gemeinsam zu kommunizieren und zu diskutieren.

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

Gastvorstellung

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

Vortragstitel: Large Model Capability Alignment

Sprecher:

  • Gui Yu

Assoziierter Forscher am Natural Language Processing. Laboratory der Fudan University

Forschung Feld:

  • Vortrainiertes Modell
  • Menschenähnliche Ausrichtung
  • Agenteninteraktion

Akademische Erfolge:

  • Mehr als 50 Artikel in hochrangigen internationalen Fachzeitschriften und Konferenzen veröffentlicht
  • Veranstaltung mehrerer Talentprojekte (National Natural Science Foundation). of China), Computer Society, Artificial Intelligence Society)
  • Gewonnene Auszeichnungen:

    • Qian Weichang First Prize in Chinese Information Processing Science and Technology Award
    • NeurIPS2023 Large Model Alignment Track Best Paper Award
    • COLING2018 Best Paper Nomination Award
    • NLPCC2019 Outstanding Paper Award
    • CIPS Excellent Paper Award
    • ACM Excellent Paper Award
  • Ausgewählt:

    • China Association for Science and Technology Youth Talent Promotion Project
    • Shanghai Morning Star Program
    • World Artificial Intelligence Conference Yunfan Auszeichnung „Bright Star“

      能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

      Vortragstitel: Trainings- und Inferenzlösung für große Modelle des kreativen Schreibens mit ultralangen Texten

Sprecher:

Zhou Wangchunshu, CTO von Waveform Intelligence.

  • Abschluss an der Sino-French Engineering College der Universität Beihang mit einem Bachelor- und einem Master-Abschluss.
  • Ph.D. studierte an der ETH Zürich bei Ryan Cotterell und Mrinmaya Sachan gründete AIWaves und fungierte als Mitbegründer und CTO des Unternehmens
  • Die Forschungsrichtungen umfassen hauptsächlich:
  • LLM-Training und -Prompting
    • Sprachagenten
    • Erstellung langer/kreativer Texte
    • effiziente Methoden für NLP
    • multimodale LLMs
    • gesundes Denken usw.
    Erhielt 2022 ein Baidu-Stipendium
  • Hatte als Praktikant bei MSRA/Byte AI Lab/AI2 und anderen Institutionen gearbeitet und war als Forschungswissenschaftler beim Bytedance AI Lab tätig
  • Zhou Wang Chunshu hat dort gearbeitet maschinelles Lernen und Forschungsbereiche wie NeurIPS/ICML/ICLR/ACL/EMNLP/NAACL. Er hat mehr als 30 Artikel auf Konferenzen zur Verarbeitung natürlicher Sprache veröffentlicht und fungiert als Gutachter für diese Konferenzen sowie als Action Editor/Area Chair von ARR/ *ACL.
  • 能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径Titel der Rede: Claude 3 technische Analyse und Szenariodemonstration

Sprecher:

Lin Ye, leitender Lösungsarchitekt von Amazon Cloud Technology. Gut in C++/C#/Java/PHP/Python/JS und anderen Entwicklungssprachen und hat kontinuierlich ein Github-Repo von einstelligen bis hin zu 3000 weiterentwickelt. Er hat eine gemeinsame Fahrrad-App entwickelt, die 10 Millionen Benutzer unterstützt, war an der Entwicklung einer Reihe bekannter Apps von Automobilherstellern beteiligt und gewann 2005 den Zhejiang ACM Award. Jetzt konzentriert er sich auf die Entwicklung von nativer Cloud-Architektur für Unternehmen und GenAI , und engagiert sich dafür, seine Fähigkeiten in der Unternehmensszene einzusetzen.

Veranstaltungsregistrierung

Die Registrierung für den „Großmodelltechnik-Workshop Phase 1“ ist geöffnet. Scannen Sie den untenstehenden QR-Code oder klicken Sie unten auf „Original lesen“, um direkt zur Veranstaltungsregistrierungsseite zu gelangen.

Bei Fragen zu dieser Veranstaltung können Sie gerne unseren Assistenten (ID: 13661489516) hinzufügen oder sich per E-Mail (chenyinyi@jiqizhixin.com) beraten. 能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

Das obige ist der detaillierte Inhalt vonFähigkeitsausrichtung, Langtext, Claude 3, dieses Mal werden wir über die wichtigsten technischen Pfade großer Modelle sprechen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn