suchen
HeimWeb-Frontendjs-TutorialKI-Aussprachetrainer

AI Pronunciation Trainer

In diesem Artikel stelle ich ein Projekt vor, an dem ich gerade arbeite: AI Pronunciation Trainer (hier online), ein Tool, das Ihnen dabei helfen soll, Ihre Aussprache mithilfe der Kraft künstlicher Intelligenz zu verbessern. Bei diesem Projekt handelt es sich um eine Überarbeitung des ursprünglichen KI-Aussprachetrainers von Thiagohgl, an dem ich mehrere Verbesserungen vorgenommen habe, um das Tool effektiver und benutzerfreundlicher zu machen.

Was es ist und was es tut

AI Pronunciation Trainer ist ein Tool, das künstliche Intelligenz nutzt, um Ihre Aussprache zu bewerten und Feedback zu geben, damit Sie sich verbessern und klarer verstanden werden. Verwenden Sie Silero STT/TTS-Modelle für Speech-to-Text- und Text-to-Speech-Funktionen, um eine genaue und zuverlässige Aussprachebewertung zu gewährleisten.

Refactor: Aktualisierung der Frontend- und Backend-Bibliotheken

Ich habe die Backend-Bibliotheken aktualisiert und insbesondere PyTorch auf Version 2.5.x gebracht. Ich habe auch die Version des deutschen Speech-to-Text-Modells geändert, um einen Fehler zu beheben, der die Verwendung von PyTorch nach Version 1.13.x verhinderte.
Außerdem: zum Frontend:

  • Aktualisierte Javascript-Bibliotheken mit den neuesten Versionen von jQuery (3.7.1) und Bootstrap (5.3.3)
  • Neues Frontend basierend auf Gradio 5.x
  • E2E-Tests mit Playwright hinzugefügt
  • Es wurde die Möglichkeit hinzugefügt, einen Satz mit freier Wahl zu schreiben, zu lesen und natürlich zu bewerten
  • Geführte Tour für neue Benutzer mit Driver.js und benutzerdefiniertem CSS/Javascript in Gradio-Blöcken
  • Wiedergabe einzelner Wörter in der Aufnahme, gefolgt von der „idealen“ Aussprache desselben Wortes, gelesen von der Text-to-Speech-Engine
  • Außerdem wurde eine Text-to-Speech-Funktion im Browser hinzugefügt (unter Windows 11 funktioniert sie nur, wenn die englischen und deutschen Sprachpakete installiert sind)

Online-Version: die Demo im HuggingFace-Bereich

Sie können mein Projekt online auf meinem HuggingFace Space ausprobieren. Mit dieser Online-Demo können Sie ohne Installation oder Konfiguration mit den Funktionen des Tools experimentieren. Der HuggingFace-Bereich bietet eine bequeme und leicht zugängliche Möglichkeit, den AI Pronunciation Trainer zu testen und zu sehen, wie er Ihnen dabei helfen kann, Ihre Aussprache zu verbessern. Bitte haben Sie etwas Geduld, manchmal ist es etwas langsam oder schläft, wenn es längere Zeit nicht verwendet wurde (lokal ist es viel schneller, insbesondere wenn Sie einen leistungsstarken Computer haben). Es gibt auch eine eingebettete Version des HuggingFace.

-Bereichs

Zukünftige Werke

Obwohl es recht gut funktioniert, gibt es offensichtlich Raum für Verbesserungen. Hier sind einige der zukünftigen Verbesserungen, die ich implementieren möchte:

  • Erhalten Sie Feedback vom Autor des Originalwerks zu meiner Dokumentation und Änderungen
  • Bitten Sie den Autor des Originalwerks um einige Erklärungen zu den architektonischen und funktionalen Entscheidungen, die er getroffen hat
  • Bewerten Sie den Übergang von PyTorch zur ONNX Runtime
  • Fügen Sie weitere E2E-Tests mit Playwright hinzu

Abschluss

Ich glaube, dass AI Pronunciation Trainer ein nützliches Werkzeug für alle ist, die ihre Aussprache selbstständig verbessern möchten. Mit der Leistungsfähigkeit der KI und den während der Umgestaltung vorgenommenen Verbesserungen liefert dieses Tool genaues und zuverlässiges Feedback, damit Sie klarer und sicherer sprechen können. Ich lade Sie ein, die HuggingFace Space-Demo auszuprobieren und zu verstehen, wie dieses Projekt Ihnen auf Ihrem Weg zu einer besseren Aussprache helfen kann.

Das obige ist der detaillierte Inhalt vonKI-Aussprachetrainer. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Python vs. JavaScript: Welche Sprache sollten Sie lernen?Python vs. JavaScript: Welche Sprache sollten Sie lernen?May 03, 2025 am 12:10 AM

Die Auswahl von Python oder JavaScript sollte auf Karriereentwicklung, Lernkurve und Ökosystem beruhen: 1) Karriereentwicklung: Python ist für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet, während JavaScript für die Entwicklung von Front-End- und Full-Stack-Entwicklung geeignet ist. 2) Lernkurve: Die Python -Syntax ist prägnant und für Anfänger geeignet; Die JavaScript -Syntax ist flexibel. 3) Ökosystem: Python hat reichhaltige wissenschaftliche Computerbibliotheken und JavaScript hat ein leistungsstarkes Front-End-Framework.

JavaScript -Frameworks: Stromversorgung moderner WebentwicklungJavaScript -Frameworks: Stromversorgung moderner WebentwicklungMay 02, 2025 am 12:04 AM

Die Kraft des JavaScript -Frameworks liegt in der Vereinfachung der Entwicklung, der Verbesserung der Benutzererfahrung und der Anwendungsleistung. Betrachten Sie bei der Auswahl eines Frameworks: 1. Projektgröße und Komplexität, 2. Teamerfahrung, 3. Ökosystem und Community -Unterstützung.

Die Beziehung zwischen JavaScript, C und BrowsernDie Beziehung zwischen JavaScript, C und BrowsernMay 01, 2025 am 12:06 AM

Einführung Ich weiß, dass Sie es vielleicht seltsam finden. Was genau muss JavaScript, C und Browser tun? Sie scheinen nicht miteinander verbunden zu sein, aber tatsächlich spielen sie eine sehr wichtige Rolle in der modernen Webentwicklung. Heute werden wir die enge Verbindung zwischen diesen drei diskutieren. In diesem Artikel erfahren Sie, wie JavaScript im Browser ausgeführt wird, die Rolle von C in der Browser -Engine und wie sie zusammenarbeiten, um das Rendern und die Interaktion von Webseiten voranzutreiben. Wir alle kennen die Beziehung zwischen JavaScript und Browser. JavaScript ist die Kernsprache der Front-End-Entwicklung. Es läuft direkt im Browser und macht Webseiten lebhaft und interessant. Haben Sie sich jemals gefragt, warum Javascr

Node.js Streams mit TypeScriptNode.js Streams mit TypeScriptApr 30, 2025 am 08:22 AM

Node.js zeichnet sich bei effizienten E/A aus, vor allem bei Streams. Streams verarbeiten Daten inkrementell und vermeiden Speicherüberladung-ideal für große Dateien, Netzwerkaufgaben und Echtzeitanwendungen. Die Kombination von Streams mit der TypeScript -Sicherheit erzeugt eine POWE

Python vs. JavaScript: Leistung und EffizienzüberlegungenPython vs. JavaScript: Leistung und EffizienzüberlegungenApr 30, 2025 am 12:08 AM

Die Unterschiede in der Leistung und der Effizienz zwischen Python und JavaScript spiegeln sich hauptsächlich in: 1 wider: 1) Als interpretierter Sprache läuft Python langsam, weist jedoch eine hohe Entwicklungseffizienz auf und ist für eine schnelle Prototypentwicklung geeignet. 2) JavaScript ist auf einen einzelnen Thread im Browser beschränkt, aber Multi-Threading- und Asynchronen-E/A können verwendet werden, um die Leistung in Node.js zu verbessern, und beide haben Vorteile in tatsächlichen Projekten.

Die Ursprünge von JavaScript: Erforschung seiner ImplementierungsspracheDie Ursprünge von JavaScript: Erforschung seiner ImplementierungsspracheApr 29, 2025 am 12:51 AM

JavaScript stammt aus dem Jahr 1995 und wurde von Brandon Ike erstellt und realisierte die Sprache in C. 1.C-Sprache bietet Programmierfunktionen auf hoher Leistung und Systemebene für JavaScript. 2. Die Speicherverwaltung und die Leistungsoptimierung von JavaScript basieren auf C -Sprache. 3. Die plattformübergreifende Funktion der C-Sprache hilft JavaScript, auf verschiedenen Betriebssystemen effizient zu laufen.

Hinter den Kulissen: Welche Sprache macht JavaScript?Hinter den Kulissen: Welche Sprache macht JavaScript?Apr 28, 2025 am 12:01 AM

JavaScript wird in Browsern und Node.js -Umgebungen ausgeführt und stützt sich auf die JavaScript -Engine, um Code zu analysieren und auszuführen. 1) abstrakter Syntaxbaum (AST) in der Parsenstufe erzeugen; 2) AST in die Kompilierungsphase in Bytecode oder Maschinencode umwandeln; 3) Führen Sie den kompilierten Code in der Ausführungsstufe aus.

Die Zukunft von Python und JavaScript: Trends und VorhersagenDie Zukunft von Python und JavaScript: Trends und VorhersagenApr 27, 2025 am 12:21 AM

Zu den zukünftigen Trends von Python und JavaScript gehören: 1. Python wird seine Position in den Bereichen wissenschaftlicher Computer und KI konsolidieren. JavaScript wird die Entwicklung der Web-Technologie fördern. Beide werden die Anwendungsszenarien in ihren jeweiligen Bereichen weiter erweitern und mehr Durchbrüche in der Leistung erzielen.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

MantisBT

MantisBT

Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

mPDF

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Herunterladen der Mac-Version des Atom-Editors

Herunterladen der Mac-Version des Atom-Editors

Der beliebteste Open-Source-Editor