>백엔드 개발 >파이썬 튜토리얼 >Python 오디오 처리 라이브러리 pydub를 사용하는 방법

Python 오디오 처리 라이브러리 pydub를 사용하는 방법

WBOY
WBOY앞으로
2023-05-06 11:58:062170검색

    1. 설치

    pip를 사용하여 설치합니다(ffmpeg 종속성도 설치해야 하며, 설치하려면 conda 명령을 사용하는 것이 좋습니다. 환경을 구성할 필요가 없습니다):

    pip install pydub

    2. 오디오 파일 읽기

    from pydub import AudioSegment
    audio = AudioSegment.from_file("path/to/file")

    3. 오디오 재생

    from pydub.playback import play
    play(audio)

    5. 오디오 자르기

    duration = audio.duration_seconds # 单位为秒

    7. 볼륨 조정

    # 前10秒
    audio = audio[:10000]
    
    # 后10秒
    audio = audio[-10000:]
    
    # 从第10秒开始到第20秒结束
    audio = audio[10000:20000]
    
    # 从第10秒开始到结尾
    audio = audio[10000:]
    
    # 从开始到第10秒audio = audio[:10000]

    9. . 오디오 분할

    audio1 = AudioSegment.from_file("path/to/file1")
    audio2 = AudioSegment.from_file("path/to/file2")
    audio_combined = audio1 + audio2

    10. 전체 코드

    다음은 오디오 전후를 잘라서 저장하기 위해 오디오를 적절한 길이의 작은 세그먼트로 나누는 데 사용되는 전체 코드입니다.

    audio.export("path/to/new/file", format="mp3")

    적용 사례

    1. 오디오 파일을 지정된 형식으로 변환

    # 增加10分贝
    louder_audio = audio + 10
    
    # 减小10分贝
    quieter_audio = audio - 10

    2. 여러 오디오 파일을 하나의 파일로 병합

    # 等分分割,按大概每三分钟进行分割
    for i in range(1, 1000):
        if 3.3 >= (audio.duration_seconds / (60 * i)) >= 2.8:
            number = i
            break
    chunks = audio[::int(audio.duration_seconds / number * 1000 + 1)]  # 切割
    
    # 保存分割后的音频
    for i, chunk in enumerate(chunks):
        chunk.export("path/to/new/file{}.wav".format(title,i), format="wav")

    3. 오디오 볼륨 조정

    from pydub import AudioSegment
    
    # 读取音频文件
    audio = AudioSegment.from_file("path/to/file")
    
    # 输出视频时长
    print('视频时长:', audio.duration_seconds / 60)
    
    # 前后切割
    start = int(input('前切割n秒,不切割输入0'))*1000
    end = int(input('后切割n秒,不切割输入0'))*1000
    if start:
        audio = audio[start:-end]
    
    # 计算合适的分割长度
    for i in range(1, 1000):
        if 3.3 >= (audio.duration_seconds / (60 * i)) >= 2.8:
            number = i
            break
    chunks = audio[::int(audio.duration_seconds / number * 1000 + 1)] 
    # 保存分割后的音频
    for i, chunk in enumerate(chunks):
        print('分割后的时长:', chunk.duration_seconds / 60)
        chunk.export("path/to/new/file{}.wav".format(i), format="wav")

    사례: 노래 분할 빈 소리를 식별하여 오디오에서

    from pydub import AudioSegment
    
    # 读取音频文件
    audio = AudioSegment.from_file("path/to/file")
    
    # 转换为mp3格式并保存
    audio.export("path/to/new/file.mp3", format="mp3")

    먼저 AudioSegment.from_file() 메서드를 사용하여 오디오 파일을 읽고 분할 매개변수 min_silence_len, Silence_thresh 및 keep_silence를 설정하여 최소 무음 길이, 무음 임계값 및 무음 유지를 나타냅니다. 각각 길이. 그 중 묵음 임계값이 작을수록 더 많은 작은 세그먼트가 분할되지만 잘못된 분할이 발생할 수 있습니다. 반대로 묵음 임계값이 클수록 더 적은 수의 세그먼트가 분할되지만 분할이 누락될 수 있습니다.

    그런 다음 분할 수 num_segments, 즉 오디오 파일이 몇 개의 세그먼트로 분할되어 있는지 계산합니다. 여기서는 각 노래가 약 3분이라고 가정하고 몇 개의 세그먼트로 나누어야 하는지 계산합니다.

    마지막으로, 분할된 세그먼트 수가 기대치를 충족할 때까지 분할_on_silence() 메서드를 사용하여 오디오 파일을 분할하고, 분할 매개변수를 설정하고, 루프를 통해 무음 임계값을 지속적으로 조정합니다. 분할이 성공하면 루프에서 빠져나오고, 그렇지 않으면 계속 시도하세요. 대체로 pydub은 오디오 처리, 변환, 병합 및 기타 작업을 쉽게 수행할 수 있는 매우 실용적인 오디오 처리 라이브러리입니다. 동시에 pydub에는 벨소리 만들기, 볼륨 조정 등과 같은 풍부한 응용 프로그램 시나리오도 있습니다. pydub을 사용할 때 오디오 형식의 호환성 문제에 주의를 기울여야 한다는 점은 주목할 가치가 있습니다.

    또한 pydub를 통해 오디오 인코딩, 디코딩, 믹싱, 리샘플링과 같은 작업을 수행할 수도 있습니다. 다음은 몇 가지 일반적인 작업 예입니다.

    코딩, 디코딩, 믹싱, 리샘플링

    1. Codec

    from pydub import AudioSegment
    
    # 读取音频文件
    audio1 = AudioSegment.from_file("path/to/file1")
    audio2 = AudioSegment.from_file("path/to/file2")
    
    # 合并音频文件并保存
    combined_audio = audio1 + audio2
    combined_audio.export("path/to/new/file", format="wav")

    2. Mixing

    from pydub import AudioSegment
    
    # 读取音频文件
    audio = AudioSegment.from_file("path/to/file")
    
    # 切割并保存
    start = 10000
    end = 15000
    ringtone = audio[start:end]
    ringtone.export("path/to/new/file", format="mp3")

    3. Resampling

    from pydub import AudioSegment
    
    # 读取音频文件
    audio = AudioSegment.from_file("path/to/file")
    
    # 增加10分贝
    louder_audio = audio + 10
    
    # 减小10分贝
    quieter_audio = audio - 10
    
    # 保存调整后的音频
    louder_audio.export("path/to/new/file", format="wav")
    quieter_audio.export("path/to/new/file", format="wav")
    을 통해 오디오 코딩, 디코딩, 믹싱, 리샘플링 및 기타 작업을 쉽게 수행할 수 있습니다. pydub의 애플리케이션 시나리오를 확장합니다. 오디오 믹싱 작업을 수행할 때 두 오디오 파일의 샘플링 속도, 샘플링 비트 수 및 채널 수가 동일한지 확인해야 합니다.

    마지막으로 pydub의 장점과 단점을 정리해보겠습니다.

    장점:

    경량: pydub는 설치 및 사용이 쉬운 경량 오디오 처리 라이브러리입니다.

    풍부한 기능: pydub은 자르기, 병합, 변환, 볼륨 조정, 인코딩 및 디코딩, 믹싱, 리샘플링 등을 포함한 풍부한 오디오 처리 기능을 제공합니다.

    다양한 애플리케이션: pydub에는 오디오 처리, 벨소리 생성, 오디오 형식 변환, 음성 인식 등을 포함한 광범위한 애플리케이션 시나리오가 있습니다.

    단점:

    형식과의 제한된 호환성: pydub은 오디오 형식과의 호환성이 제한되어 있으며 모든 오디오 형식을 지원하지 않습니다. 오디오를 처리하기 전에 지원되는 형식으로 변환해야 합니다.

    보통의 성능: pydub이 대용량 파일을 처리할 때 성능은 평균 수준일 수 있으며, 이를 위해서는 일정량의 시간과 컴퓨팅 리소스가 필요합니다.

    스트리밍을 지원하지 않습니다. pydub는 스트리밍을 지원하지 않으며 전체 오디오 파일을 메모리로 읽어야 하므로 메모리 공간이 커집니다.

    요약하자면, pydub은 기능이 풍부하고 널리 사용되는 오디오 처리 라이브러리입니다. pydub을 사용할 때는 오디오 형식의 호환성 문제에 주의해야 하며, 대용량 파일을 처리할 때는 성능 및 메모리 사용량에 주의해야 합니다. 보다 복잡한 오디오 작업을 처리해야 하는 경우 보다 전문적인 다른 오디오 처리 라이브러리 사용을 고려할 수 있습니다.

    위 내용은 Python 오디오 처리 라이브러리 pydub를 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

    성명:
    이 기사는 yisu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제