In diesem Artikel stelle ich ein Projekt vor, an dem ich gerade arbeite: AI Pronunciation Trainer (hier online), ein Tool, das Ihnen dabei helfen soll, Ihre Aussprache mithilfe der Kraft künstlicher Intelligenz zu verbessern. Bei diesem Projekt handelt es sich um eine Überarbeitung des ursprünglichen KI-Aussprachetrainers von Thiagohgl, an dem ich mehrere Verbesserungen vorgenommen habe, um das Tool effektiver und benutzerfreundlicher zu machen.
Was es ist und was es tut
AI Pronunciation Trainer ist ein Tool, das künstliche Intelligenz nutzt, um Ihre Aussprache zu bewerten und Feedback zu geben, damit Sie sich verbessern und klarer verstanden werden. Verwenden Sie Silero STT/TTS-Modelle für Speech-to-Text- und Text-to-Speech-Funktionen, um eine genaue und zuverlässige Aussprachebewertung zu gewährleisten.
Refactor: Aktualisierung der Frontend- und Backend-Bibliotheken
Ich habe die Backend-Bibliotheken aktualisiert und insbesondere PyTorch auf Version 2.5.x gebracht. Ich habe auch die Version des deutschen Speech-to-Text-Modells geändert, um einen Fehler zu beheben, der die Verwendung von PyTorch nach Version 1.13.x verhinderte.
Außerdem: zum Frontend:
- Aktualisierte Javascript-Bibliotheken mit den neuesten Versionen von jQuery (3.7.1) und Bootstrap (5.3.3)
- Neues Frontend basierend auf Gradio 5.x
- E2E-Tests mit Playwright hinzugefügt
- Es wurde die Möglichkeit hinzugefügt, einen Satz mit freier Wahl zu schreiben, zu lesen und natürlich zu bewerten
- Geführte Tour für neue Benutzer mit Driver.js und benutzerdefiniertem CSS/Javascript in Gradio-Blöcken
- Wiedergabe einzelner Wörter in der Aufnahme, gefolgt von der „idealen“ Aussprache desselben Wortes, gelesen von der Text-to-Speech-Engine
- Außerdem wurde eine Text-to-Speech-Funktion im Browser hinzugefügt (unter Windows 11 funktioniert sie nur, wenn die englischen und deutschen Sprachpakete installiert sind)
Online-Version: die Demo im HuggingFace-Bereich
Sie können mein Projekt online auf meinem HuggingFace Space ausprobieren. Mit dieser Online-Demo können Sie ohne Installation oder Konfiguration mit den Funktionen des Tools experimentieren. Der HuggingFace-Bereich bietet eine bequeme und leicht zugängliche Möglichkeit, den AI Pronunciation Trainer zu testen und zu sehen, wie er Ihnen dabei helfen kann, Ihre Aussprache zu verbessern. Bitte haben Sie etwas Geduld, manchmal ist es etwas langsam oder schläft, wenn es längere Zeit nicht verwendet wurde (lokal ist es viel schneller, insbesondere wenn Sie einen leistungsstarken Computer haben). Es gibt auch eine eingebettete Version des HuggingFace.
-BereichsZukünftige Werke
Obwohl es recht gut funktioniert, gibt es offensichtlich Raum für Verbesserungen. Hier sind einige der zukünftigen Verbesserungen, die ich implementieren möchte:
- Erhalten Sie Feedback vom Autor des Originalwerks zu meiner Dokumentation und Änderungen
- Bitten Sie den Autor des Originalwerks um einige Erklärungen zu den architektonischen und funktionalen Entscheidungen, die er getroffen hat
- Bewerten Sie den Übergang von PyTorch zur ONNX Runtime
- Fügen Sie weitere E2E-Tests mit Playwright hinzu
Abschluss
Ich glaube, dass AI Pronunciation Trainer ein nützliches Werkzeug für alle ist, die ihre Aussprache selbstständig verbessern möchten. Mit der Leistungsfähigkeit der KI und den während der Umgestaltung vorgenommenen Verbesserungen liefert dieses Tool genaues und zuverlässiges Feedback, damit Sie klarer und sicherer sprechen können. Ich lade Sie ein, die HuggingFace Space-Demo auszuprobieren und zu verstehen, wie dieses Projekt Ihnen auf Ihrem Weg zu einer besseren Aussprache helfen kann.
Das obige ist der detaillierte Inhalt vonKI-Aussprachetrainer. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Die Auswahl von Python oder JavaScript sollte auf Karriereentwicklung, Lernkurve und Ökosystem beruhen: 1) Karriereentwicklung: Python ist für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet, während JavaScript für die Entwicklung von Front-End- und Full-Stack-Entwicklung geeignet ist. 2) Lernkurve: Die Python -Syntax ist prägnant und für Anfänger geeignet; Die JavaScript -Syntax ist flexibel. 3) Ökosystem: Python hat reichhaltige wissenschaftliche Computerbibliotheken und JavaScript hat ein leistungsstarkes Front-End-Framework.

Die Kraft des JavaScript -Frameworks liegt in der Vereinfachung der Entwicklung, der Verbesserung der Benutzererfahrung und der Anwendungsleistung. Betrachten Sie bei der Auswahl eines Frameworks: 1. Projektgröße und Komplexität, 2. Teamerfahrung, 3. Ökosystem und Community -Unterstützung.

Einführung Ich weiß, dass Sie es vielleicht seltsam finden. Was genau muss JavaScript, C und Browser tun? Sie scheinen nicht miteinander verbunden zu sein, aber tatsächlich spielen sie eine sehr wichtige Rolle in der modernen Webentwicklung. Heute werden wir die enge Verbindung zwischen diesen drei diskutieren. In diesem Artikel erfahren Sie, wie JavaScript im Browser ausgeführt wird, die Rolle von C in der Browser -Engine und wie sie zusammenarbeiten, um das Rendern und die Interaktion von Webseiten voranzutreiben. Wir alle kennen die Beziehung zwischen JavaScript und Browser. JavaScript ist die Kernsprache der Front-End-Entwicklung. Es läuft direkt im Browser und macht Webseiten lebhaft und interessant. Haben Sie sich jemals gefragt, warum Javascr

Node.js zeichnet sich bei effizienten E/A aus, vor allem bei Streams. Streams verarbeiten Daten inkrementell und vermeiden Speicherüberladung-ideal für große Dateien, Netzwerkaufgaben und Echtzeitanwendungen. Die Kombination von Streams mit der TypeScript -Sicherheit erzeugt eine POWE

Die Unterschiede in der Leistung und der Effizienz zwischen Python und JavaScript spiegeln sich hauptsächlich in: 1 wider: 1) Als interpretierter Sprache läuft Python langsam, weist jedoch eine hohe Entwicklungseffizienz auf und ist für eine schnelle Prototypentwicklung geeignet. 2) JavaScript ist auf einen einzelnen Thread im Browser beschränkt, aber Multi-Threading- und Asynchronen-E/A können verwendet werden, um die Leistung in Node.js zu verbessern, und beide haben Vorteile in tatsächlichen Projekten.

JavaScript stammt aus dem Jahr 1995 und wurde von Brandon Ike erstellt und realisierte die Sprache in C. 1.C-Sprache bietet Programmierfunktionen auf hoher Leistung und Systemebene für JavaScript. 2. Die Speicherverwaltung und die Leistungsoptimierung von JavaScript basieren auf C -Sprache. 3. Die plattformübergreifende Funktion der C-Sprache hilft JavaScript, auf verschiedenen Betriebssystemen effizient zu laufen.

JavaScript wird in Browsern und Node.js -Umgebungen ausgeführt und stützt sich auf die JavaScript -Engine, um Code zu analysieren und auszuführen. 1) abstrakter Syntaxbaum (AST) in der Parsenstufe erzeugen; 2) AST in die Kompilierungsphase in Bytecode oder Maschinencode umwandeln; 3) Führen Sie den kompilierten Code in der Ausführungsstufe aus.

Zu den zukünftigen Trends von Python und JavaScript gehören: 1. Python wird seine Position in den Bereichen wissenschaftlicher Computer und KI konsolidieren. JavaScript wird die Entwicklung der Web-Technologie fördern. Beide werden die Anwendungsszenarien in ihren jeweiligen Bereichen weiter erweitern und mehr Durchbrüche in der Leistung erzielen.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Herunterladen der Mac-Version des Atom-Editors
Der beliebteste Open-Source-Editor
