検索
ホームページシステムチュートリアルLinuxLinuxでライブオーディオ転写にささやきAIを使用する方法

This guide details how to install and use Whisper AI for real-time speech-to-text transcription on Linux systems. Whisper AI, an OpenAI creation, offers high-accuracy transcription across multiple languages. While primarily designed for batch processing, this guide demonstrates real-time capabilities.

Understanding Whisper AI

Whisper AI is an open-source, deep-learning based model excelling at:

  • Multilingual speech transcription.
  • Handling accents and background noise.
  • Translating spoken language to English.

Its applications include live transcription services, voice assistants, and audio file transcription. While not inherently optimized for real-time use, it can be adapted with additional tools.

System Requirements

Before proceeding, ensure your Linux system meets these requirements:

Hardware:

  • Multi-core CPU (Intel/AMD)
  • At least 8GB RAM (16GB+ recommended)
  • NVIDIA GPU with CUDA (optional, but significantly improves speed)
  • 10GB+ free disk space

Software:

  • Linux distribution (Ubuntu, Debian, Arch, Fedora, etc.)
  • Python 3.8 or later
  • Pip package manager
  • FFmpeg

Installation Steps

  1. Update System Packages:

    sudo apt update     # Ubuntu
    sudo dnf update -y  # Fedora
    sudo pacman -Syu    # Arch
  2. Install Python and Pip:

    sudo apt install python3 python3-pip python3-venv -y     # Ubuntu
    sudo dnf install python3 python3-pip python3-virtualenv -y # Fedora
    sudo pacman -S python python-pip python-virtualenv       # Arch
  3. Install FFmpeg:

    sudo apt install ffmpeg     # Ubuntu
    sudo dnf install ffmpeg     # Fedora
    sudo pacman -S ffmpeg       # Arch
  4. Install Whisper AI: Create a virtual environment and install the package:

    python3 -m venv whisper_env
    source whisper_env/bin/activate
    pip install openai-whisper

    Verify installation with: whisper --help

    How to Use Whisper AI for Live Audio Transcription on Linux

  5. Transcribing an Audio File: Use the command whisper audio.mp3 to transcribe an audio file.

    How to Use Whisper AI for Live Audio Transcription on Linux

Real-time Transcription Script

To enable real-time transcription, create a Python script (real_time_transcription.py) with the following code:

import sounddevice as sd
import numpy as np
import whisper
import queue
import threading

# ... (Code as provided in the original input) ...

Run the script using python3 real_time_transcription.py. Speak clearly into your microphone; the transcription will appear in the terminal.

How to Use Whisper AI for Live Audio Transcription on Linux

Conclusion

This guide provides a comprehensive walkthrough of setting up Whisper AI for real-time transcription on Linux. Remember that a GPU will significantly enhance performance. Optimize your system for real-time processing for the best results.

以上がLinuxでライブオーディオ転写にささやきAIを使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
LinuxとWindowsの間のユーザーアカウント管理の違いは何ですか?LinuxとWindowsの間のユーザーアカウント管理の違いは何ですか?May 02, 2025 am 12:02 AM

ユーザーアカウント管理のLinuxとWindowsの主な違いは、許可モデルと管理ツールです。 Linuxは、UNIXベースの権限モデルとコマンドラインツール(useradd、usermod、userdelなど)を使用し、Windowsは独自のセキュリティモデルとグラフィカルユーザーインターフェイス(GUI)管理ツールを使用します。

Linuxのコマンドライン環境により、Windowsよりも安全かつ安全性が低くなりますか?Linuxのコマンドライン環境により、Windowsよりも安全かつ安全性が低くなりますか?May 01, 2025 am 12:03 AM

linux'scommandlinecanbemoresecurethanwindowsifmanaged correctly、butrequiresmoreuserknowledge.1)linux'sourcenatureallowsforquicksecurityupdates.2)MissuturaturecurationCanleadtovulnerabilities.windows'commandlinism command-contontontrollededblessed-blessedlestlessed

LinuxでUSBドライブを自動的にマウントする方法LinuxでUSBドライブを自動的にマウントする方法Apr 30, 2025 am 10:04 AM

このガイドでは、LinuxのブーツにUSBドライブを自動的に取り付け、時間と労力を節約する方法について説明します。 ステップ1:USBドライブを特定します LSBLKコマンドを使用して、すべてのブロックデバイスをリストします。 USBドライブにはラベルが付いている可能性があります /dev /sdb1、 /dev /sdc1など

2025年にLinux、Windows、Mac用の最高のクロスプラットフォームアプリ2025年にLinux、Windows、Mac用の最高のクロスプラットフォームアプリApr 30, 2025 am 09:57 AM

クロスプラットフォームアプリケーションは、ソフトウェア開発に革命をもたらし、Linux、Windows、MacOなどのオペレーティングシステム間でシームレスな機能を可能にします。 これにより、デバイスに基づいてアプリを切り替える必要性がなくなり、一貫した体験を提供します

2025年のAIおよび機械学習に最適なLinuxツール2025年のAIおよび機械学習に最適なLinuxツールApr 30, 2025 am 09:44 AM

人工知能(AI)は、ヘルスケアや金融から芸術や音楽などの創造的な分野に至るまで、多くのセクターを急速に変革しています。 Linuxは、オープンソースの性質、適応性、パフォーマンス機能を備えており、最高のPlatfoとして浮上しています

5 GUIのない​​最高の軽量Linuxディストリビューション5 GUIのない​​最高の軽量LinuxディストリビューションApr 30, 2025 am 09:38 AM

グラフィカルユーザーインターフェイス(GUI)なしで、高速で最小限で効率的なLinuxディストリビューションをお探しですか? 軽量のガイレスLinuxディストリビューションは、古いハードウェアやサーバーや組み込みシステムなどの特殊なタスクに最適です。彼らはより少ないresを消費します

Redhatディストリビューションにワイン10.0を設置する方法Redhatディストリビューションにワイン10.0を設置する方法Apr 30, 2025 am 09:32 AM

ワイン10.0安定バージョンリリース:LinuxでWindowsアプリケーションをより高いレベルに実行する このオープンソースと無料アプリケーションであるWineは、LinuxユーザーがUNIX/LinuxオペレーティングシステムでWindowsソフトウェアとゲームを実行できるようにし、10.0 Stableバージョンのリリースを紹介します。このバージョンには、ソースコードとバイナリパッケージのダウンロードが提供されており、Linux、Windows、Macなどのさまざまな分布をサポートしています。 このエディションは、1年の努力と8,600を超える改善を具体化し、多くのエキサイティングな改善をもたらします。重要なハイライトは次のとおりです。 Bluetoothデバイスの強化されたサポート。 HID入力デバイスのサポートを改善します。 32ビットおよび64ビットアプリケーションの最適化されたパフォーマンス。

RHELでSQL Serverをインストールして構成する方法RHELでSQL Serverをインストールして構成する方法Apr 30, 2025 am 09:27 AM

このチュートリアルは、rhel 8.xまたは9.xにSQL Server 2022をインストールし、SQLCMDコマンドラインツール、データベース作成、および基本クエリを介して接続することをガイドします。 前提条件 始める前に、次のことを確認してください サポートされているRHELバージョン(RHEL 8または9)。 sudo

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール