Heim >Technologie-Peripheriegeräte >KI >Sprechen wir über die Wiederkehr von Sora: derjenige, zu dem man aufschaut, und derjenige, der vergessen wird
Am 16. Februar veröffentlichte OpenAI Sora, ein Blockbuster-Modell im Bereich der Videogenerierung.
Soras größter Einfluss auf den gesamten KI-Bereich besteht darin, wie bestehende Ideen und Frameworks zur Videogenerierung optimiert und korrigiert werden können. Dies löste auch eine Begeisterung für die Nachbildung von Sora aus, die bis heute anhält.
U-ViT-Architektur
VDT
Kann Soras vorherige Architektur/Technologie der Videogeneration weiterhin verwendet werden? Wie benutzt man?
Wer ist nach Sora vergessen? Zu wem wird aufgeschaut?
Wie sollen außer Sora andere Startups/Teams das machen? Was ist zu tun?
Wird Sora die Mainstream-Technologiearchitektur verändern? Wird die von DiT vertretene Architektur in Zukunft die Mainstream-Architekturwahl sein?
Sollte die heimische Technologiemacht Sora reproduzieren? Warum?
Fast 10 Teams sind dafür bekannt, Sora zu reproduzieren. Wie sieht das zukünftige Muster aus?
Warum OpenAI? Kann das Modell von OpenAI repliziert werden?
Wie sieht die globale Videogenerierungslandschaft nach Sora aus? Wie wird es sich entwickeln und verändern?
Was halten Sie davon, dass einige Star-Startups öffentlich erklären, dass sie Sora nicht machen werden?
Wo liegt die Zukunft multimodaler Großmodelle?
Wie betrachten Sie Soras Wirkung aus verschiedenen Perspektiven? (Perspektiven von Investoren, Nicht-Technikern, staatlichen Unternehmen, KI-Unternehmern, Praktikern usw.)
Welche gesellschaftliche Rolle spielt OpenAI? Was halten Sie von diesem Unternehmen?
...
Derzeit als neuer Herausgeber von Sina Weibo tätig Verantwortlich für Technologieforschung und -entwicklung, war zuvor als leitender technischer Experte bei Alibaba tätig und verantwortlich für das neue Technologieteam. Autor der Fachbücher „This is Search Engine: Detaillierte Erläuterung der Kerntechnologie“ und „Big Data Daily Record: Architecture and Algorithms“.
Fokus auf Spitzenforschung in Bereichen wie Videogenerierung und multimodales Vortraining. Das Modell, das er in Forschung und Entwicklung leitet, hat leistungsstarke Dienste für ByteDances Videogenerierung, kurze Videorezensionen, E-Commerce-Kundenservice, Toutiao, Problemlösung im Bildungsbereich und andere Unternehmen bereitgestellt und er hat acht verwandte Artikel als Erstautor in TPAMI veröffentlicht. ICML, CVPR, ACL und andere führende internationale Konferenzen und Zeitschriften und fungiert auch als Gutachter für TPAMI, ICML, NIPS, ICLR und andere Konferenzen. Das Basismodell der PixelDance-Videoerzeugung, dessen Forschung und Entwicklung er leitete, erreichte zum ersten Mal in der Branche eine Kombination aus hoher Dynamik und Stabilität und erzeugte zum ersten Mal eine 3-minütige kontinuierliche Handlungsanimation.
Gao Yizhao
卞正达
Tong Tong
Das obige ist der detaillierte Inhalt vonSprechen wir über die Wiederkehr von Sora: derjenige, zu dem man aufschaut, und derjenige, der vergessen wird. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!