ホームページ >システムチュートリアル >Linux >スピーチノート:Linux用のオフラインの音声認識、テキストからスピーチ、翻訳アプリ

スピーチノート:Linux用のオフラインの音声認識、テキストからスピーチ、翻訳アプリ

William Shakespeare
William Shakespeareオリジナル
2025-03-10 10:10:11797ブラウズ

スピーチノート:Linuxのオフライン、プライバシーに焦点を当てたスピーチからテキスト、テキストへの語り方、翻訳ツール

音声ノートは、オフラインの音声からテキスト(STT)、テキストツースピック(TTS)、および機械翻訳(MT)機能を提供することにより、ユーザープライバシーを優先するオープンソースアプリケーションです。 これにより、データをインターネットに送信することなく、複数の言語でメモを作成、レビュー、翻訳できます。

主要な機能:

  • 完全なオフラインの機能:すべての処理はデバイスでローカルに発生し、プライバシーを保護します。
  • 多言語のサポート:
  • STT、TTS、およびMTの幅広い言語をサポートし、継続的な追加で。 複数のエンジンオプション:
  • 各機能のさまざまな処理エンジンで柔軟性を提供します(以下を参照)。
  • カスタムモデルサポート:高度なユーザーは、サポートされているエンジンと互換性のあるカスタムモデルを統合できます。
  • 無料およびオープンソース:Mozilla Public Licenseバージョン2.0で入手可能。
  • プラットフォーム:LinuxおよびSailfish OS。
  • で現在利用できます サポートされているエンジン:
  • stt(s​​peech-to-text):coqui stt、vosk、whisper.cpp、より速いwhisper、4月asr

tts(テキストツースピーチ):

espeak-ng、mbrola、piper、rhvoice、coqui tts、模倣3、whisperspeech
  • mt(機械翻訳):ベルガモット翻訳者
  • Linuxのインストール:
  • 音声ノートは、FlathubとArchユーザーリポジトリ(AUR)を介して簡単に入手できます。
  • flathub(ほとんどのLinux分布の場合):
フラットパックがインストールされていることを確認してください。次に、このコマンドを使用してください:

これらのパッケージオプションを検討してください:

ベースパッケージ(net.mkiol.speechnote):

完全な機能ですが、かなりのディスク容量が必要です。

アドオンパッケージ:AMD(net.mkiol.speechnote.addon.amd)およびnvidia(net.mkiol.speechnote.addon.nvidia)のgpu加速度
flatpak install flathub net.mkiol.SpeechNote
gpu加速度。

Tinyパッケージ:
    スペースが限られているユーザー向けのより小さな、基本的な機能。
  • Arch Linux/aur(Arch Linux、Endeavouros、Manjaro Linux):
  • パルやyay:
  • のようなaurヘルパーを使用します
  • 使用法:
    1. 起動: runflatpak run net.mkiol.SpeechNoteまたはアプリケーションメニューから起動します。
    2. 言語の選択:最初の起動により、言語の選択がガイドされます。 これは、後で「言語」タブで調整できます。
    3. モデルのダウンロード:STT、TTS、およびMTに必要なモデルファイルをダウンロードします。 各モデルの詳細については、[情報]ボタンをクリックします
    4. テキストからスピーチ:テキストを入力し、「読み取り」をクリックします
    5. スピーチツーテキスト:
    6. 「聞く」をクリックして、マイクに話しかけます 翻訳:
    7. 「翻訳者」セクションを使用して、テキストを入力し、ソースとターゲット言語を選択します。リアルタイム翻訳のために「入力して翻訳」を有効にします

    Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for LinuxSpeech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux私の経験:Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux 特定の英語モデルを備えたDebian 12システム(32GB RAM、32GB RAM、Intel Core I3 11世代、GPUなし)でのテストにより、TTSと翻訳が成功しましたが、STTのパフォーマンスは矛盾していました。さらなるテストが計画されています。Speech Note: An Offline Speech Recognition, Text-to-Speech and Translation App for Linux

    結論:

    音声ノートは、オフラインのSTT、TTS、および翻訳が必要なLinuxユーザーにとって貴重なツールであり、プライバシーに重点を置いています。 モデルの選択はパフォーマンスに影響を与える可能性がありますが、そのオープンソースの性質と汎用性により、価値のあるオプションになります。

    リソース:

    音声ノートgithubリポジトリ

以上がスピーチノート:Linux用のオフラインの音声認識、テキストからスピーチ、翻訳アプリの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。