>백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 Huawei Cloud 인터페이스에 연결하여 오디오 트랜스코딩 기능을 구현하는 방법을 가르칩니다.

Python을 사용하여 Huawei Cloud 인터페이스에 연결하여 오디오 트랜스코딩 기능을 구현하는 방법을 가르칩니다.

PHPz
PHPz원래의
2023-07-05 16:25:071175검색

Python을 사용하여 Huawei Cloud 인터페이스에 연결하여 오디오 전사 기능을 구현하는 방법을 가르칩니다.

현대 사회에서는 음성 인식 기술의 광범위한 적용이 다양한 분야에서 추세가 되었습니다. 사람들은 추가 분석 및 처리를 위해 오디오 파일을 텍스트로 변환해야 하는 경우가 많습니다. Huawei Cloud는 강력한 오디오 전사 서비스를 제공합니다. 이 기사에서는 Python을 사용하여 Huawei Cloud 인터페이스에 연결하여 오디오 전사 기능을 구현하는 방법을 설명합니다.

1단계: Huawei Cloud 계정 등록 및 프로젝트 생성

먼저 Huawei Cloud 계정을 등록하고 새 프로젝트를 생성해야 합니다. Huawei Cloud 콘솔에 로그인하고 새 액세스 키를 생성한 후 후속 단계에서 사용할 액세스 키 ID 및 액세스 키 비밀번호를 적어 두십시오.

2단계: 필요한 Python 라이브러리 설치

Huawei Cloud 인터페이스에 연결하기 전에 Python HTTP 라이브러리와 Alibaba Cloud SDK를 로컬에 설치해야 합니다. 터미널 또는 명령줄 창을 열고 다음 명령을 실행하여 필수 라이브러리를 설치합니다.

pip install requests
pip install huaweicloud-sdk-core
pip install huaweicloud-sdk-asr

3단계: 트랜스코딩 코드 작성

다음으로 Python으로 코드를 작성하고 Huawei Cloud 인터페이스에 연결한 후 오디오 트랜스코딩을 사용합니다. 그것에 의해 제공되는 서비스. 먼저 필요한 라이브러리를 가져옵니다.

import requests
from huaweicloudSdkcore.auth.credentials import GlobalCredentials
from huaweicloudSdkcore.region.region import Region
from huaweicloudSdkasr.v1 import asrClient
from huaweicloudSdkasr.v1.region.region import Region
from huaweicloudSdkcore.exceptions import exceptions

다음으로 1단계에서 기록한 액세스 키 ID 및 액세스 키 비밀, 오디오 파일 경로 및 오디오 형식을 포함하여 Huawei Cloud 인터페이스에 필요한 일부 매개변수를 정의합니다.

ak = "your_access_key_id"
sk = "your_access_key_secret"
project_id = "your_project_id"
region = "cn-north-1"
audio_file = "/path/to/your/audio/file.wav"

그런 다음 Huawei Cloud 인터페이스의 클라이언트를 생성합니다:

credentials = GlobalCredentials.get_credentials(ak, sk)
asr_client = asrClient.AsrClient.new_builder() 
    .with_http_config(http_proxy=None, https_proxy=None, no_proxy=None) 
    .with_credentials(credentials) 
    .with_default_headers({"x-language": "zh-cn"}) 
    .with_region(Region(region)) 
    .build()

다음으로 오디오 파일의 바이너리 데이터를 읽고 이를 Base64 인코딩으로 변환합니다:

with open(audio_file, mode='rb') as file:
    audio_data = file.read()
    audio_base64 = base64.b64encode(audio_data).decode()

마지막으로 Huawei Cloud 인터페이스를 호출하고 오디오 데이터를 인터페이스에 전달합니다. 변환 작성 및 전사 결과 얻기:

request_body = {
    "data": audio_base64,
    "encode_type": "wav",
    "sample_rate": 16000
}

response = asr_client.create_task(request_body=request_body, project_id=project_id).result

task_id = response.body["result"]["task_id"]

while response.body["status"] != "done":
    response = asr_client.get_task_result(task_id=task_id, project_id=project_id).result
    time.sleep(1)

result = response.body["result"]["result"]

이 시점에서 오디오 전사 기능을 성공적으로 완료했습니다. 전사 결과를 인쇄하거나 텍스트 파일로 저장하세요.

print(result)

with open("/path/to/your/output/file.txt", mode='w', encoding='utf-8') as file:
    file.write(result)

위는 Python을 사용하여 Huawei Cloud 인터페이스에 연결하여 오디오 전사 기능을 구현하는 완전한 코드 예입니다.

요약:

이 기사의 소개와 코드 예제를 통해 Python을 사용하여 Huawei Cloud 인터페이스에 연결하고 오디오 파일 트랜스코딩 기능을 구현하는 방법을 배웠습니다. 오디오 전사는 음성 인식, 음성 번역 등과 같은 다양한 시나리오에서 중요한 응용 프로그램을 가지고 있습니다. Huawei Cloud가 제공하는 효율적이고 정확한 오디오 전사 서비스를 사용하면 작업 효율성과 정확성을 크게 향상시킬 수 있습니다. 이 글이 여러분에게 도움이 되길 바라며, 실제 프로젝트에서 오디오 전사 기술을 성공적으로 적용할 수 있기를 바랍니다!

위 내용은 Python을 사용하여 Huawei Cloud 인터페이스에 연결하여 오디오 트랜스코딩 기능을 구현하는 방법을 가르칩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.