Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Wissenschaftler entwickeln Sonarbrillen mit künstlicher Intelligenz, die das Lippenlesen mit einer Genauigkeit von 95 % erkennen können

Wissenschaftler entwickeln Sonarbrillen mit künstlicher Intelligenz, die das Lippenlesen mit einer Genauigkeit von 95 % erkennen können

WBOY
WBOYnach vorne
2023-04-10 14:31:111511Durchsuche

News vom 10. April: Forscher der Cornell University in den USA haben eine neue Technologie entwickelt, die lautlose Kommunikation über Sonarbrillen ermöglicht. Die Brille verwendet winzige Lautsprecher und Mikrofone, um vom Träger lautlos gesprochene Wörter zu lesen, sodass er eine Vielzahl von Aufgaben ausführen kann, ohne dass körperliche Eingaben erforderlich sind.

The EchoSpeech glasses (modeled here by lead scientist Ruidong Zhang) could be utilized to control devices, or even to help the voiceless communicate

Diese Technologie wurde unter der Leitung von Zhang Ruidong (Transliteration), einem Doktoranden an der Cornell University, entwickelt und ist eine Verbesserung, die auf einem ähnlichen Projekt basiert Dieses Projekt verwendet ein drahtloses Headset, während frühere Modelle auf Kameras angewiesen waren.

Laut IT House nutzt die Sonarbrille eine stille Spracherkennungsschnittstelle namens EchoSpeech, die Sonar zur Erkennung von Mundbewegungen verwendet und einen Deep-Learning-Algorithmus zur Analyse der Echoeigenschaften in Echtzeit verwendet. Dadurch kann das System vom Träger lautlos gesprochene Wörter mit einer Genauigkeit von etwa 95 % erkennen.

Eine der aufregendsten Aussichten dieser Technologie besteht darin, dass Menschen mit Sprachbehinderungen damit Gespräche lautlos in einen Sprachsynthesizer einspeisen und die Wörter dann laut aussprechen können. Die Brille könnte auch dazu verwendet werden, die Musikwiedergabe in einer ruhigen Bibliothek zu steuern oder Informationen bei einem lauten Konzert zu diktieren.

Die Technologie ist klein und stromsparend und greift nicht in die Privatsphäre ein, da keine Daten das Telefon des Benutzers verlassen. Auf diese Weise bestehen keine Datenschutzbedenken. Die Brille ist sehr bequem zu tragen und praktischer und praktikabler als andere verfügbare Technologien zur stillen Spracherkennung.

Forscher sagten, dass das System nur wenige Minuten an Trainingsdaten benötigt, um das Stimmmuster des Benutzers zu lernen. Sobald das Lernen abgeschlossen ist, kann es Schallwellen in Richtung des Gesichts des Benutzers senden und empfangen sowie Mundbewegungen erfassen. und gleichzeitig Deep-Learning-Algorithmen verwenden, um Echoeigenschaften zu analysieren. Das System ist derzeit in der Lage, 31 einzelne Befehle und eine Folge aufeinanderfolgender Zahlen mit einer Fehlerquote von weniger als 10 % zu erkennen.

Die aktuelle Version des Systems bietet ca. 10 Stunden Akkulaufzeit und kann drahtlos über Bluetooth mit dem Smartphone des Nutzers kommunizieren. Das Smartphone ist für die Verarbeitung und Vorhersage aller Daten verantwortlich und übermittelt die Ergebnisse an eine Reihe von „Aktionstasten“, mit denen es Musik abspielen, mit Smart-Geräten interagieren oder einen Sprachassistenten aktivieren kann.

Das Intelligent Computer Interface for Future Interaction (SciFi) Laboratory der Cornell University nutzt ein Cornell-Förderprogramm, um die Möglichkeit der Kommerzialisierung dieser Technologie zu untersuchen.

Das obige ist der detaillierte Inhalt vonWissenschaftler entwickeln Sonarbrillen mit künstlicher Intelligenz, die das Lippenlesen mit einer Genauigkeit von 95 % erkennen können. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen