Python 오디오 처리 라이브러리 pydub를 사용하는 방법-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python 오디오 처리 라이브러리 pydub를 사용하는 방법

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 06, 2023 am 11:58 AM

pythonpydub

1. 설치

pip를 사용하여 설치합니다(ffmpeg 종속성도 설치해야 하며, 설치하려면 conda 명령을 사용하는 것이 좋습니다. 환경을 구성할 필요가 없습니다):

pip install pydub

2. 오디오 파일 읽기

from pydub import AudioSegment
audio = AudioSegment.from_file("path/to/file")

3. 오디오 재생

from pydub.playback import play
play(audio)

5. 오디오 자르기

duration = audio.duration_seconds # 单位为秒

7. 볼륨 조정

# 前10秒
audio = audio[:10000]

# 后10秒
audio = audio[-10000:]

# 从第10秒开始到第20秒结束
audio = audio[10000:20000]

# 从第10秒开始到结尾
audio = audio[10000:]

# 从开始到第10秒audio = audio[:10000]

9. . 오디오 분할

audio1 = AudioSegment.from_file("path/to/file1")
audio2 = AudioSegment.from_file("path/to/file2")
audio_combined = audio1 + audio2

10. 전체 코드

다음은 오디오 전후를 잘라서 저장하기 위해 오디오를 적절한 길이의 작은 세그먼트로 나누는 데 사용되는 전체 코드입니다.

audio.export("path/to/new/file", format="mp3")

적용 사례

1. 오디오 파일을 지정된 형식으로 변환

# 增加10分贝
louder_audio = audio + 10

# 减小10分贝
quieter_audio = audio - 10

2. 여러 오디오 파일을 하나의 파일로 병합

# 等分分割，按大概每三分钟进行分割
for i in range(1, 1000):
    if 3.3 >= (audio.duration_seconds / (60 * i)) >= 2.8:
        number = i
        break
chunks = audio[::int(audio.duration_seconds / number * 1000 + 1)]  # 切割

# 保存分割后的音频
for i, chunk in enumerate(chunks):
    chunk.export("path/to/new/file{}.wav".format(title,i), format="wav")

3. 오디오 볼륨 조정

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file("path/to/file")

# 输出视频时长
print(&#39;视频时长:&#39;, audio.duration_seconds / 60)

# 前后切割
start = int(input(&#39;前切割n秒,不切割输入0&#39;))*1000
end = int(input(&#39;后切割n秒，不切割输入0&#39;))*1000
if start:
    audio = audio[start:-end]

# 计算合适的分割长度
for i in range(1, 1000):
    if 3.3 >= (audio.duration_seconds / (60 * i)) >= 2.8:
        number = i
        break
chunks = audio[::int(audio.duration_seconds / number * 1000 + 1)] 
# 保存分割后的音频
for i, chunk in enumerate(chunks):
    print(&#39;分割后的时长:&#39;, chunk.duration_seconds / 60)
    chunk.export("path/to/new/file{}.wav".format(i), format="wav")

사례: 노래 분할 빈 소리를 식별하여 오디오에서

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file("path/to/file")

# 转换为mp3格式并保存
audio.export("path/to/new/file.mp3", format="mp3")

먼저 AudioSegment.from_file() 메서드를 사용하여 오디오 파일을 읽고 분할 매개변수 min_silence_len, Silence_thresh 및 keep_silence를 설정하여 최소 무음 길이, 무음 임계값 및 무음 유지를 나타냅니다. 각각 길이. 그 중 묵음 임계값이 작을수록 더 많은 작은 세그먼트가 분할되지만 잘못된 분할이 발생할 수 있습니다. 반대로 묵음 임계값이 클수록 더 적은 수의 세그먼트가 분할되지만 분할이 누락될 수 있습니다.

그런 다음 분할 수 num_segments, 즉 오디오 파일이 몇 개의 세그먼트로 분할되어 있는지 계산합니다. 여기서는 각 노래가 약 3분이라고 가정하고 몇 개의 세그먼트로 나누어야 하는지 계산합니다.

마지막으로, 분할된 세그먼트 수가 기대치를 충족할 때까지 분할_on_silence() 메서드를 사용하여 오디오 파일을 분할하고, 분할 매개변수를 설정하고, 루프를 통해 무음 임계값을 지속적으로 조정합니다. 분할이 성공하면 루프에서 빠져나오고, 그렇지 않으면 계속 시도하세요. 대체로 pydub은 오디오 처리, 변환, 병합 및 기타 작업을 쉽게 수행할 수 있는 매우 실용적인 오디오 처리 라이브러리입니다. 동시에 pydub에는 벨소리 만들기, 볼륨 조정 등과 같은 풍부한 응용 프로그램 시나리오도 있습니다. pydub을 사용할 때 오디오 형식의 호환성 문제에 주의를 기울여야 한다는 점은 주목할 가치가 있습니다.

또한 pydub를 통해 오디오 인코딩, 디코딩, 믹싱, 리샘플링과 같은 작업을 수행할 수도 있습니다. 다음은 몇 가지 일반적인 작업 예입니다.

코딩, 디코딩, 믹싱, 리샘플링

1. Codec

from pydub import AudioSegment

# 读取音频文件
audio1 = AudioSegment.from_file("path/to/file1")
audio2 = AudioSegment.from_file("path/to/file2")

# 合并音频文件并保存
combined_audio = audio1 + audio2
combined_audio.export("path/to/new/file", format="wav")

2. Mixing

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file("path/to/file")

# 切割并保存
start = 10000
end = 15000
ringtone = audio[start:end]
ringtone.export("path/to/new/file", format="mp3")

3. Resampling

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file("path/to/file")

# 增加10分贝
louder_audio = audio + 10

# 减小10分贝
quieter_audio = audio - 10

# 保存调整后的音频
louder_audio.export("path/to/new/file", format="wav")
quieter_audio.export("path/to/new/file", format="wav")

을 통해 오디오 코딩, 디코딩, 믹싱, 리샘플링 및 기타 작업을 쉽게 수행할 수 있습니다. pydub의 애플리케이션 시나리오를 확장합니다. 오디오 믹싱 작업을 수행할 때 두 오디오 파일의 샘플링 속도, 샘플링 비트 수 및 채널 수가 동일한지 확인해야 합니다.

마지막으로 pydub의 장점과 단점을 정리해보겠습니다.

장점:

경량: pydub는 설치 및 사용이 쉬운 경량 오디오 처리 라이브러리입니다.

풍부한 기능: pydub은 자르기, 병합, 변환, 볼륨 조정, 인코딩 및 디코딩, 믹싱, 리샘플링 등을 포함한 풍부한 오디오 처리 기능을 제공합니다.

다양한 애플리케이션: pydub에는 오디오 처리, 벨소리 생성, 오디오 형식 변환, 음성 인식 등을 포함한 광범위한 애플리케이션 시나리오가 있습니다.

단점:

형식과의 제한된 호환성: pydub은 오디오 형식과의 호환성이 제한되어 있으며 모든 오디오 형식을 지원하지 않습니다. 오디오를 처리하기 전에 지원되는 형식으로 변환해야 합니다.

보통의 성능: pydub이 대용량 파일을 처리할 때 성능은 평균 수준일 수 있으며, 이를 위해서는 일정량의 시간과 컴퓨팅 리소스가 필요합니다.

스트리밍을 지원하지 않습니다. pydub는 스트리밍을 지원하지 않으며 전체 오디오 파일을 메모리로 읽어야 하므로 메모리 공간이 커집니다.

요약하자면, pydub은 기능이 풍부하고 널리 사용되는 오디오 처리 라이브러리입니다. pydub을 사용할 때는 오디오 형식의 호환성 문제에 주의해야 하며, 대용량 파일을 처리할 때는 성능 및 메모리 사용량에 주의해야 합니다. 보다 복잡한 오디오 작업을 처리해야 하는 경우 보다 전문적인 다른 오디오 처리 라이브러리 사용을 고려할 수 있습니다.

위 내용은 Python 오디오 처리 라이브러리 pydub를 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 亿速云에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

2 시간의 파이썬 계획 : 현실적인 접근Apr 11, 2025 am 12:04 AM

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

파이썬 : 기본 응용 프로그램 탐색Apr 10, 2025 am 09:41 AM

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 같은 작업에 적합합니다.

2 시간 안에 얼마나 많은 파이썬을 배울 수 있습니까?Apr 09, 2025 pm 04:33 PM

2 시간 이내에 파이썬의 기본 사항을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우십시오. 이를 통해 간단한 파이썬 프로그램 작성을 시작하는 데 도움이됩니다.

10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법?Apr 02, 2025 am 07:18 AM

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까?Apr 02, 2025 am 07:15 AM

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

Python 3.6에 피클 파일을로드 할 때 '__builtin__'모듈을 찾을 수없는 경우 어떻게해야합니까?Apr 02, 2025 am 07:12 AM

Python 3.6에 피클 파일로드 3.6 환경 보고서 오류 : modulenotfounderror : nomodulename ...

경치 좋은 스팟 코멘트 분석에서 Jieba Word 세분화의 정확성을 향상시키는 방법은 무엇입니까?Apr 02, 2025 am 07:09 AM

경치 좋은 스팟 댓글 분석에서 Jieba Word 세분화 문제를 해결하는 방법은 무엇입니까? 경치가 좋은 스팟 댓글 및 분석을 수행 할 때 종종 Jieba Word 세분화 도구를 사용하여 텍스트를 처리합니다 ...

정규 표현식을 사용하여 첫 번째 닫힌 태그와 정지와 일치하는 방법은 무엇입니까?Apr 02, 2025 am 07:06 AM

정규 표현식을 사용하여 첫 번째 닫힌 태그와 정지와 일치하는 방법은 무엇입니까? HTML 또는 기타 마크 업 언어를 다룰 때는 정규 표현식이 종종 필요합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

드림위버 CS6

시각적 웹 개발 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.