ホームページ >システムチュートリアル >Linux >スピーチノート:Linux用のオフラインの音声認識、テキストからスピーチ、翻訳アプリ
スピーチノート:Linuxのオフライン、プライバシーに焦点を当てたスピーチからテキスト、テキストへの語り方、翻訳ツール
音声ノートは、オフラインの音声からテキスト(STT)、テキストツースピック(TTS)、および機械翻訳(MT)機能を提供することにより、ユーザープライバシーを優先するオープンソースアプリケーションです。 これにより、データをインターネットに送信することなく、複数の言語でメモを作成、レビュー、翻訳できます。
主要な機能:
tts(テキストツースピーチ):
espeak-ng、mbrola、piper、rhvoice、coqui tts、模倣3、whisperspeech
これらのパッケージオプションを検討してください:
ベースパッケージ(net.mkiol.speechnote):
完全な機能ですが、かなりのディスク容量が必要です。 アドオンパッケージ:AMD(net.mkiol.speechnote.addon.amd)およびnvidia(net.mkiol.speechnote.addon.nvidia)のgpu加速度flatpak install flathub net.mkiol.SpeechNotegpu加速度。 Tinyパッケージ:
flatpak run net.mkiol.SpeechNote
またはアプリケーションメニューから起動します。
私の経験:
特定の英語モデルを備えたDebian 12システム(32GB RAM、32GB RAM、Intel Core I3 11世代、GPUなし)でのテストにより、TTSと翻訳が成功しましたが、STTのパフォーマンスは矛盾していました。さらなるテストが計画されています。
音声ノートは、オフラインのSTT、TTS、および翻訳が必要なLinuxユーザーにとって貴重なツールであり、プライバシーに重点を置いています。 モデルの選択はパフォーマンスに影響を与える可能性がありますが、そのオープンソースの性質と汎用性により、価値のあるオプションになります。 リソース:
音声ノートgithubリポジトリ
以上がスピーチノート:Linux用のオフラインの音声認識、テキストからスピーチ、翻訳アプリの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。