Maison >développement back-end >Tutoriel Python >Apprenez à utiliser Python pour vous connecter à l'interface Huawei Cloud afin d'implémenter la fonction de transcodage audio

Apprenez à utiliser Python pour vous connecter à l'interface Huawei Cloud afin d'implémenter la fonction de transcodage audio

PHPz
PHPzoriginal
2023-07-05 16:25:071210parcourir

Apprenez à utiliser Python pour vous connecter à l'interface Huawei Cloud afin de mettre en œuvre la fonction de transcription audio

Dans la société moderne, l'application généralisée de la technologie de reconnaissance vocale est devenue une tendance dans divers domaines. Les utilisateurs ont souvent besoin de convertir des fichiers audio en texte pour une analyse et un traitement plus approfondis. Huawei Cloud fournit un puissant service de transcription audio. Cet article vous apprendra comment utiliser Python pour vous connecter à l'interface Huawei Cloud afin d'implémenter la fonction de transcription audio.

Étape 1 : Enregistrez un compte Huawei Cloud et créez un projet

Tout d'abord, vous devez enregistrer un compte Huawei Cloud et créer un nouveau projet. Connectez-vous à la console Huawei Cloud, créez une nouvelle clé d'accès et notez l'ID de la clé d'accès et le secret de la clé d'accès, qui seront utilisés dans les étapes suivantes.

Étape 2 : Installez les bibliothèques Python nécessaires

Avant de vous connecter à l'interface Huawei Cloud, vous devez installer localement la bibliothèque HTTP Python et le SDK Alibaba Cloud. Ouvrez une fenêtre de terminal ou de ligne de commande et exécutez la commande suivante pour installer les bibliothèques requises :

pip install requests
pip install huaweicloud-sdk-core
pip install huaweicloud-sdk-asr

Étape 3 : Écrivez le code de transcodage

Ensuite, écrivez le code en Python, connectez-vous à l'interface Huawei Cloud et utilisez le transcodage audio service fourni par celui-ci. Tout d'abord, importez les bibliothèques nécessaires :

import requests
from huaweicloudSdkcore.auth.credentials import GlobalCredentials
from huaweicloudSdkcore.region.region import Region
from huaweicloudSdkasr.v1 import asrClient
from huaweicloudSdkasr.v1.region.region import Region
from huaweicloudSdkcore.exceptions import exceptions

Ensuite, définissez certains paramètres requis pour l'interface Huawei Cloud, notamment l'ID de clé d'accès et le secret de clé d'accès que vous avez enregistrés à la première étape, le chemin du fichier audio et le format audio :

ak = "your_access_key_id"
sk = "your_access_key_secret"
project_id = "your_project_id"
region = "cn-north-1"
audio_file = "/path/to/your/audio/file.wav"

Ensuite, créez un client d'interface Huawei Cloud :

credentials = GlobalCredentials.get_credentials(ak, sk)
asr_client = asrClient.AsrClient.new_builder() 
    .with_http_config(http_proxy=None, https_proxy=None, no_proxy=None) 
    .with_credentials(credentials) 
    .with_default_headers({"x-language": "zh-cn"}) 
    .with_region(Region(region)) 
    .build()

Ensuite, lisez les données binaires du fichier audio et convertissez-le en encodage Base64 :

with open(audio_file, mode='rb') as file:
    audio_data = file.read()
    audio_base64 = base64.b64encode(audio_data).decode()

Enfin, appelez l'interface Huawei Cloud et transmettez les données audio à l'interface pour la conversion. Écrivez et obtenez les résultats de la transcription :

request_body = {
    "data": audio_base64,
    "encode_type": "wav",
    "sample_rate": 16000
}

response = asr_client.create_task(request_body=request_body, project_id=project_id).result

task_id = response.body["result"]["task_id"]

while response.body["status"] != "done":
    response = asr_client.get_task_result(task_id=task_id, project_id=project_id).result
    time.sleep(1)

result = response.body["result"]["result"]

À ce stade, vous avez terminé avec succès la fonction de transcription audio. Imprimez le résultat de la transcription ou enregistrez-le sous forme de fichier texte :

print(result)

with open("/path/to/your/output/file.txt", mode='w', encoding='utf-8') as file:
    file.write(result)

Ce qui précède est un exemple de code complet d'utilisation de Python pour se connecter à l'interface Huawei Cloud afin d'implémenter la fonction de transcription audio.

Résumé :

Grâce à l'introduction et aux exemples de code de cet article, vous avez appris à utiliser Python pour vous connecter à l'interface Huawei Cloud et implémenter la fonction de transcodage de fichiers audio. La transcription audio a des applications importantes dans de nombreux scénarios, tels que la reconnaissance vocale, la traduction vocale, etc. L'utilisation du service de transcription audio efficace et précis fourni par Huawei Cloud peut considérablement améliorer l'efficacité et la précision du travail. J'espère que cet article vous sera utile et j'espère que vous pourrez appliquer avec succès la technologie de transcription audio dans des projets réels !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn