Maison >développement back-end >tutoriel php >Comment utiliser l'API Google Cloud Speech en PHP pour la reconnaissance et la conversion vocales

Comment utiliser l'API Google Cloud Speech en PHP pour la reconnaissance et la conversion vocales

PHPz
PHPzoriginal
2023-06-25 10:39:101691parcourir

Avec la popularité de l'interaction vocale, l'importance de la technologie de reconnaissance et de conversion vocale est devenue de plus en plus importante. L'API Google Cloud Speech est un puissant outil de reconnaissance et de conversion vocale qui peut aider les développeurs à mettre en œuvre plus facilement les fonctions vocales.

Cet article explique comment utiliser l'API Google Cloud Speech pour la reconnaissance et la conversion vocales en PHP, y compris la préparation de l'environnement, les étapes d'utilisation et les précautions.

Prérequis

Avant d'utiliser l'API Google Cloud Speech pour la reconnaissance vocale, vous devez remplir les conditions préalables suivantes :

  • Un compte Google Cloud Platform
  • Créez un projet et activez l'API Cloud Speech
  • Créez un compte de service et obtenez la clé privée JSON
  • Installez la bibliothèque client Google Cloud PHP

Si vous avez rempli les conditions ci-dessus, vous pouvez passer à l'étape suivante.

Étapes d'utilisation

Les étapes spécifiques pour utiliser l'API Google Cloud Speech pour la reconnaissance vocale sont les suivantes :

Étape 1 : Créer un client

Vous devez d'abord créer un client API Google Cloud Speech, le code est le suivant :

require 'vendor/autoload.php';

use GoogleCloudSpeechV1SpeechClient;

$speechClient = new SpeechClient([
    'credentials' => 'path/to/your/credentials.json'
]);

Parmi eux, supplier/autoload.php est le chargeur automatique de la bibliothèque client Google Cloud PHP. Le paramètre credentials doit pointer vers le chemin d'accès au fichier de clé privée JSON que vous avez téléchargé. vendor/autoload.php 是 Google Cloud PHP 客户端库的自动加载器。credentials 参数需要指向您下载的 JSON 私钥文件的路径。

第二步:创建配置

接下来需要创建语音识别的配置。代码如下:

$config = [
    'languageCode' => 'en-US'
];

其中,languageCode 指定了语音的语言代码,这里以英语为例。更多语言代码请参考 Google 官方文档。

第三步:读取音频文件

接下来需要读取要进行语音识别的音频文件。代码如下:

$content = file_get_contents('path/to/audio/file');

其中,path/to/audio/file 是要进行语音识别的音频文件的路径。

第四步:创建 audio

然后需要创建音频对象。代码如下:

$audio = new RecognitionAudio();
$audio->setContent($content);

第五步:创建请求

接着需要创建请求对象。代码如下:

$request = new RecognizeRequest();
$request->setConfig($config);
$request->setAudio($audio);

第六步:发送请求

最后需要发送请求并获取结果。代码如下:

$response = $speechClient->recognize($request);

$results = $response->getResults();
foreach ($results as $result) {
    foreach ($result->getAlternatives() as $alternative) {
        echo $alternative->getTranscript() . PHP_EOL;
    }
}

其中,recognize 方法发送了语音识别请求,并返回识别结果。而识别结果包含多个 Result 对象,每个 Result 对象包含多个可能的转换结果 Alternative,可以使用 getTranscript

Étape 2 : Créer la configuration

Ensuite, vous devez créer la configuration pour la reconnaissance vocale. Le code est le suivant :
    rrreee
  • Parmi eux, langageCode précise le code de langue de la voix. Ici, l'anglais est utilisé comme exemple. Pour plus de codes de langue, veuillez vous référer à la documentation officielle de Google.
  • Étape 3 : Lire le fichier audio
  • Ensuite, vous devez lire le fichier audio pour la reconnaissance vocale. Le code est le suivant :
  • rrreee
Parmi eux, path/to/audio/file est le chemin du fichier audio à utiliser pour la reconnaissance vocale.

Étape 4 : Créer de l'audio

Ensuite, vous devez créer l'objet audio. Le code est le suivant : 🎜rrreee🎜Étape 5 : Créer une requête🎜🎜Ensuite, vous devez créer un objet de requête. Le code est le suivant : 🎜rrreee🎜Étape 6 : Envoyer la demande🎜🎜Enfin, vous devez envoyer la demande et obtenir le résultat. Le code est le suivant : 🎜rrreee🎜Parmi eux, la méthode recognize envoie une requête de reconnaissance vocale et renvoie le résultat de la reconnaissance. Le résultat de la reconnaissance contient plusieurs objets Result, et chaque objet Result contient plusieurs résultats de conversion possibles Alternative. Vous pouvez utiliser getTranscript La méthode obtient les résultats de la conversion de texte. 🎜🎜Notes🎜🎜🎜L'API Google Cloud Speech prend en charge plusieurs formats audio, tels que FLAC, WAV, MP3, etc. 🎜🎜L'API Google Cloud Speech prend en charge plusieurs langues, mais la précision et la vitesse de reconnaissance des différentes langues peuvent varier. 🎜🎜L'API Google Cloud Speech est un service payant Avant de l'utiliser, vous devez évaluer votre utilisation et choisir un plan de service approprié. 🎜🎜🎜Résumé🎜🎜Cet article décrit comment utiliser l'API Google Cloud Speech en PHP pour la reconnaissance et la conversion vocales. Avant d'utiliser cette API, vous devez remplir les conditions préalables pertinentes et suivre les étapes ci-dessus. Dans le même temps, vous devez également prêter attention à des problèmes tels que le format audio, la prise en charge linguistique et le paiement. J'espère que cet article vous a été utile lors de l'utilisation de l'API Google Cloud Speech. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn