Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle-KI-php.cn

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 12, 2024 am 08:51 AM

ai3d

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Das 19. Jahrhundert war die Zeit, in der die Kunstbewegung des Impressionismus populär war. Die Bewegung hatte Einfluss auf die Bereiche Malerei, Bildhauerei, Druckgrafik und andere Künste. Der Impressionismus zeichnete sich durch die Verwendung kurzer Staccato-Pinselstriche mit geringem Streben nach formaler Präzision aus und entwickelte sich später zum impressionistischen Kunststil. Kurz gesagt, die Pinselstriche des impressionistischen Künstlers sind unverändert, weisen offensichtliche Merkmale auf, streben nicht nach formaler Präzision und sind sogar etwas vage. Impressionistische Künstler führten die wissenschaftlichen Konzepte von Licht und Farbe in Gemälde ein und revolutionierten traditionelle Farbkonzepte.

In D3GA hat der Autor ein einzigartiges Ziel. Er hofft, durch das Gegenteil einen fotorealistischen Leistungseffekt zu erzielen. Um dieses Ziel zu erreichen, nutzte der Autor auf kreative Weise die Gaußsche Splatter-Technologie in D3GA als modernen „Segmentpinselstrich“, um die Struktur und das Erscheinungsbild virtueller Charaktere aufzubauen und einen stabilen Echtzeiteffekt zu erzielen.

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

„Sunrise·Impression“ ist das repräsentative Werk des berühmten impressionistischen Malers Monet.

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Um realistische menschliche Bilder zu erstellen, die neue Inhalte für Animationen generieren können, erfordert die Konstruktion von Avataren derzeit eine große Menge an Multiview-Daten. Dies liegt daran, dass monokulare Methoden nur eine begrenzte Genauigkeit aufweisen. Darüber hinaus erfordern bestehende Techniken eine komplexe Vorverarbeitung, einschließlich einer genauen 3D-Registrierung. Die Beschaffung dieser Registrierungsdaten erfordert jedoch eine Iteration und lässt sich nur schwer in einen End-to-End-Prozess integrieren. Darüber hinaus gibt es Methoden, die keine genaue Registrierung erfordern und auf neuronalen Strahlungsfeldern (NeRFs) basieren. Allerdings sind diese Methoden beim Echtzeit-Rendering oft langsam oder haben Schwierigkeiten bei der Kleidungsanimation.

Kerbl et al. schlugen eine Rendering-Methode namens 3D Gaussian Splatting (3DGS) vor, die auf der Grundlage der klassischen Surface Splatting-Rendering-Methode verbessert wurde. Im Vergleich zu modernsten Methoden, die auf neuronalen Strahlungsfeldern basieren, ist 3DGS in der Lage, qualitativ hochwertigere Bilder mit schnelleren Bildraten und ohne die Notwendigkeit einer hochpräzisen 3D-Initialisierung zu rendern.

Allerdings wurde 3DGS ursprünglich für statische Szenen entwickelt. Gegenwärtig haben einige Leute die auf Zeitbedingungen basierende Gaußsche Splating-Methode vorgeschlagen, mit der dynamische Szenen gerendert werden können. Diese Methode kann nur das wiedergeben, was zuvor beobachtet wurde, und ist daher nicht geeignet, neue oder bisher ungesehene Bewegungen auszudrücken.

Basierend auf dem angetriebenen neuronalen Strahlungsfeld modelliert der Autor das Aussehen und die Verformung von 3D-Menschen, indem er sie in einen normalisierten Raum platziert, aber 3D-Gaußsche Operatoren anstelle von Strahlungsfeldern verwendet. Neben einer besseren Leistung macht Gaussian Splatting die Verwendung der Kamerastrahl-Sampling-Heuristik überflüssig.

Das verbleibende Problem besteht darin, die Signale zu definieren, die diese Käfigverformungen auslösen. Aktuelle hochmoderne Technologien in fahrerbasierten Avataren erfordern dichte Eingangssignale, wie etwa RGB-D-Bilder oder sogar mehrere Kameras, aber diese Methoden sind möglicherweise nicht für Situationen geeignet, in denen die Übertragungsbandbreite relativ gering ist. In dieser Studie verwenden die Autoren kompaktere Eingaben, die auf menschlichen Posen basieren, einschließlich Skelettgelenkwinkeln und 3D-Gesichtsschlüsselpunkten in Form von Quaternionen.

Durch das Training individueller Modelle an neun hochwertigen Multi-View-Sequenzen, die eine Vielzahl von Körperformen, Bewegungen und Kleidung (nicht nur intime Kleidung) abdecken, können wir später neue Posen für jedes Motiv erstellen.

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Methodenübersicht

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Papierlink: https://arxiv.org/pdf/2311.08581.pdf
Projektlink: https://zielon.github.io/d3ga/

Derzeit verwendete Methoden Für die dynamische Volumetrisierung virtueller Zeichen werden entweder Punkte vom Deformationsraum in den kanonischen Raum abgebildet oder ausschließlich auf Vorwärtsabbildung zurückgegriffen. Auf Backmapping basierende Methoden neigen dazu, Fehler im kanonischen Raum anzuhäufen, da sie einen fehleranfälligen Backpass erfordern und bei der Modellierung perspektivenabhängiger Effekte problematisch sind.

Daher hat sich der Autor für die reine Vorwärtszuordnungsmethode entschieden. D3GA basiert auf 3DGS und wird durch neuronale Darstellung und Käfig erweitert, um die Farbe und die geometrische Form jedes dynamischen Teils des virtuellen Charakters zu modellieren.

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

D3GA verwendet die 3D-Pose ϕ, die Gesichtseinbettung κ, den Blickwinkel dk und den kanonischen Käfig v (und automatisch dekodierte Farbmerkmale hi), um das endgültige Render C¯ und das Hilfssegmentierungsrendering P¯ zu generieren. Die Eingabe auf der linken Seite wird über drei Netzwerke (ΨMLP, ΠMLP, ΓMLP) pro virtuellem Zeichenteil verarbeitet, um Käfigverschiebung Δv, Gaußsche Verformungen bi, qi, si und Farbe/Transparenz ci, oi zu erzeugen.

Nachdem die Käfigverformung die kanonische Gaußsche Funktion verformt, werden sie über Gleichung 9 in das endgültige Bild gerastert.

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Experimentelle Ergebnisse

D3GA wird anhand von Metriken wie SSIM, PSNR und der Wahrnehmungsmetrik LPIPS bewertet. Tabelle 1 zeigt, dass D3GA unter den Methoden, die nur LBS verwenden (d. h. es besteht keine Notwendigkeit, 3D-Daten für jeden Frame zu scannen), die beste Leistung bei PSNR und SSIM aufweist und bei diesen Indikatoren alle FFD-Methoden übertrifft, nur an zweiter Stelle nach BD FFD, trotz schlechtem Trainingssignal und fehlender Testbilder (DVA wurde mit allen 200 Kameras getestet).

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Der qualitative Vergleich zeigt, dass D3GA Kleidung besser modellieren kann als andere hochmoderne Methoden, insbesondere lockere Kleidung wie Röcke oder Jogginghosen (Abbildung 4). FFD steht für Free Deformation Mesh und enthält umfangreichere Trainingssignale als LBS-Netze (Abbildung 9).

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Im Vergleich zur volumenbasierten Methode kann die Methode des Autors die Kleidung des virtuellen Charakters trennen, und die Kleidung ist auch fahrbar. Abbildung 5 zeigt, dass jede einzelne Kleidungsstückschicht allein durch die Winkel der Knochengelenke gesteuert werden kann, ohne dass ein spezielles Kleidungsstückregistrierungsmodul erforderlich ist.

Kann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle

Das obige ist der detaillierte Inhalt vonKann die KI-Forschung auch vom Impressionismus lernen? Bei diesen lebensechten Menschen handelt es sich tatsächlich um 3D-Modelle. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Dieser Artikel ist reproduziert unter:51CTO.COM. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Verwandter Artikel

Die KI -Kompetenzlücke verlangsamt die VersorgungskettenApr 26, 2025 am 11:13 AM

Der Begriff "AI-fähige Belegschaft" wird häufig verwendet, aber was bedeutet das in der Lieferkettenindustrie wirklich? Nach Abe Eshkenazi, CEO des Association for Supply Chain Management (ASCM), bedeutet dies Fachkräfte, die kritisch sind

Wie ein Unternehmen leise daran arbeitet, die KI für immer zu verwandelnApr 26, 2025 am 11:12 AM

Die dezentrale KI -Revolution gewinnt leise an Dynamik. An diesem Freitag in Austin, Texas, markiert der Bittensor Endgame Summit einen entscheidenden Moment, in dem die dezentrale KI (DEAI) von Theorie zu praktischer Anwendung übergeht. Im Gegensatz zum glitzernden Werbespot

Nvidia veröffentlicht Nemo Microservices, um die Entwicklung der AI -Agenten zu optimierenApr 26, 2025 am 11:11 AM

Enterprise KI steht vor der Datenintegrationsprobleme Die Anwendung von Enterprise KI steht vor einer großen Herausforderung: Aufbau von Systemen, die die Genauigkeit und Praktikabilität durch kontinuierlich lernende Geschäftsdaten aufrechterhalten können. NEMO Microservices lösen dieses Problem, indem er das erstellt, was NVIDIA als "Datenschwungrad" beschreibt und KI -Systemen durch kontinuierliche Exposition gegenüber Unternehmensinformationen und Benutzerinteraktion relevant bleibt. Dieses neu gestartete Toolkit enthält fünf wichtige Microservices: Nemo Customizer behandelt die Feinabstimmung großer Sprachmodelle mit höherem Trainingsdurchsatz. NEMO Evaluator bietet eine vereinfachte Bewertung von KI -Modellen für benutzerdefinierte Benchmarks. NEMO -Leitplanken implementiert Sicherheitskontrollen, um die Einhaltung und Angemessenheit aufrechtzuerhalten

KI malt ein neues Bild für die Zukunft von Kunst und DesignApr 26, 2025 am 11:10 AM

AI: Die Zukunft von Kunst und Design Künstliche Intelligenz (KI) verändert das Kunst- und Designgebiet auf beispiellose Weise, und seine Auswirkungen beschränken sich nicht mehr auf Amateure, sondern beeinflussen jedoch die Fachkräfte. Kunstwerke und Designschemata, die von KI erzeugt wurden, ersetzen traditionelle materielle Bilder und Designer in vielen Transaktionsdesignaktivitäten wie Werbung, Social -Media -Bildgenerierung und Webdesign schnell. Professionelle Künstler und Designer finden jedoch auch den praktischen Wert von KI. Sie verwenden AI als Hilfsmittel, um neue ästhetische Möglichkeiten zu erforschen, verschiedene Stile zu mischen und neuartige visuelle Effekte zu erzeugen. KI hilft Künstlern und Designer, sich wiederholende Aufgaben zu automatisieren, verschiedene Designelemente vorzuschlagen und kreative Eingaben zu leisten. AI unterstützt den Stiltransfer, der einen Bildstil anwenden soll

Wie Zoom die Arbeit mit Agentic AI: Von Meetings bis Meilensteinen revolutioniertApr 26, 2025 am 11:09 AM

Zoom, ursprünglich für seine Video -Konferenz -Plattform bekannt, führt eine Revolution am Arbeitsplatz mit der innovativen Nutzung der Agenten -KI. Ein aktuelles Gespräch mit Zooms CTO, XD Huang, enthüllte die ehrgeizige Vision des Unternehmens. Definieren von Agenten AI Huang d

Die existenzielle Bedrohung für UniversitätenApr 26, 2025 am 11:08 AM

Wird AI die Bildung revolutionieren? Diese Frage führt zu ernsthafter Reflexion unter Pädagogen und Stakeholdern. Die Integration von KI in Bildung bietet sowohl Chancen als auch Herausforderungen. Wie Matthew Lynch von The Tech Edvocate bemerkt, Universität

Der Prototyp: Amerikanische Wissenschaftler suchen nach Jobs im AuslandApr 26, 2025 am 11:07 AM

Die Entwicklung wissenschaftlicher Forschung und Technologie in den Vereinigten Staaten kann vor Herausforderungen stehen, möglicherweise aufgrund von Budgetkürzungen. Nach der Natur stieg die Zahl der amerikanischen Wissenschaftler, die sich für Arbeitsplätze in Übersee bewerben, von Januar bis März 2025 im Vergleich zum gleichen Zeitraum von 2024 um 32%. Eine frühere Umfrage ergab, dass 75% der untersuchten Forscher über die Suche nach Arbeitsplätzen in Europa und Kanada in Betracht gezogen wurden. In den letzten Monaten wurden Hunderte von NIH- und NSF-Zuschüssen beendet, wobei die neuen Zuschüsse von NIH in diesem Jahr um etwa 2,3 Milliarden US-Dollar gesunken sind, ein Rückgang von fast einem Drittel. Der durchgesickerte Haushaltsvorschlag zeigt, dass die Trump -Administration mit einer möglichen Reduzierung von um bis zu 50%ein starkes Budget für wissenschaftliche Institutionen in Betracht zieht. Die Turbulenzen auf dem Gebiet der Grundlagenforschung haben sich auch auf einen der Hauptvorteile der Vereinigten Staaten ausgewirkt: die Gewinnung von Talenten in Übersee. 35

Alles über Open AIs neueste GPT 4.1 -Familie - Analytics VidhyaApr 26, 2025 am 10:19 AM

OpenAI enthüllt die leistungsstarke GPT-4.1-Serie: eine Familie von drei fortschrittlichen Sprachmodellen für reale Anwendungen. Dieser signifikante Sprung nach vorne bietet schnellere Reaktionszeiten, verbessertes Verständnis und drastisch reduzierte Kosten im Vergleich t t

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Assassin's Creed Shadows: Seashell Riddle -Lösung

4 Wochen vorByDDD

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

3 Wochen vorByDDD

Wo kann man die Kransteuerungsschlüsselkarten in Atomfall finden

4 Wochen vorByDDD

<🎜>: Dead Rails - wie man jede Herausforderung abschließt

1 Monate vorByDDD

Wie kann ich KB5055523 in Windows 11 nicht installieren?

2 Wochen vorByDDD

Heiße Werkzeuge

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.