Heim >Backend-Entwicklung >Python-Tutorial >So zeichnen Sie Audio in Python auf: Sprache und Stille automatisch erkennen

So zeichnen Sie Audio in Python auf: Sprache und Stille automatisch erkennen

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOriginal: 2024-08-29 20:30:10655Durchsuche

How to Record Audio in Python: Automatically Detect Speech and Silence

Audio nur dann aufzuzeichnen, wenn jemand spricht, ist eine leistungsstarke Funktion, die in verschiedenen Anwendungen verwendet werden kann, von sprachaktivierten Assistenten bis hin zur Einsparung von Speicherplatz durch Eliminierung von Stillezeiten. In diesem Tutorial erfahren Sie, wie Sie Python-Code schreiben, der mit der Aufnahme beginnt, wenn Sprache erkannt wird, und stoppt, wenn Stille erkannt wird.

Voraussetzungen

Bevor Sie eintauchen, stellen Sie sicher, dass Sie über Folgendes verfügen:

Python 3.xauf Ihrem System installiert.
Grundkenntnisse in Python.
Vertrautheit mit Python-Bibliotheken wie Pyaudio, Numpy und Webrtcvad.

Schritt 1: Erforderliche Bibliotheken installieren?

Wir werden die folgenden Bibliotheken verwenden:

pyaudio: Zum Aufnehmen von Audio von Ihrem Mikrofon.
webrtcvad: Zur Sprachaktivitätserkennung.
numpy: Zur Verarbeitung von Audiodaten.

Sie können sie mit pip:
installieren

pip install pyaudio webrtcvad numpy

Schritt 2: Audiostream einrichten?

Zuerst richten wir den Audiostream ein, um die Audioeingabe von Ihrem Mikrofon zu erfassen.

import pyaudio

# Audio configuration
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 16000
CHUNK = 1024

# Initialize PyAudio
audio = pyaudio.PyAudio()

# Open stream
stream = audio.open(format=FORMAT,
                    channels=CHANNELS,
                    rate=RATE,
                    input=True,
                    frames_per_buffer=CHUNK)

Schritt 3: Sprachaktivitätserkennung (VAD) implementieren?

Wir verwenden die webrtcvad-Bibliothek, um zu erkennen, wenn jemand spricht. Die Bibliothek kann Audioframes als Sprache oder Nicht-Sprache klassifizieren.

import webrtcvad

# Initialize VAD
vad = webrtcvad.Vad()
vad.set_mode(1)  # 0: Aggressive filtering, 3: Less aggressive

def is_speech(frame, sample_rate):
    return vad.is_speech(frame, sample_rate)

Schritt 4: Audio-Frames erfassen und verarbeiten?

Lassen Sie uns nun fortlaufend Audiobilder erfassen und prüfen, ob sie Sprache enthalten.

def record_audio():
    frames = []
    recording = False

    print("Listening for speech...")

    while True:
        frame = stream.read(CHUNK)

        if is_speech(frame, RATE):
            if not recording:
                print("Recording started.")
                recording = True
            frames.append(frame)
        else:
            if recording:
                print("Silence detected, stopping recording.")
                break

    # Stop and close the stream
    stream.stop_stream()
    stream.close()
    audio.terminate()

    return frames

Schritt 5: Speichern des aufgenommenen Audios?

Zuletzt speichern wir das aufgenommene Audio in einer .wav-Datei.

import wave

def save_audio(frames, filename="output.wav"):
    wf = wave.open(filename, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(audio.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()

# Example usage
frames = record_audio()
save_audio(frames)
print("Audio saved as output.wav")

Abschluss ?

Mit nur wenigen Codezeilen haben Sie ein Python-Programm implementiert, das Sprache erkennt und nur die gesprochenen Teile aufzeichnet und Stille ignoriert. Diese Technik ist besonders nützlich für die Erstellung effizienter sprachaktivierter Systeme.

Fühlen Sie sich frei, mit der VAD-Aggressivität und den Audioeinstellungen zu experimentieren, um sie an Ihre spezifischen Bedürfnisse anzupassen. Viel Spaß beim Codieren! ?‍??‍?

Das obige ist der detaillierte Inhalt vonSo zeichnen Sie Audio in Python auf: Sprache und Stille automatisch erkennen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python numpy pip if for using finally this input

Stellungnahme：

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Vorheriger Artikel：So stellen Sie Django mit Hetzner und Dokku kostengünstig bereitNächster Artikel：So stellen Sie Django mit Hetzner und Dokku kostengünstig bereit

In Verbindung stehende Artikel

Mehr sehen