ホームページ  >  記事  >  バックエンド開発  >  PHP での自然な音声生成の初心者ガイド

PHP での自然な音声生成の初心者ガイド

王林
王林オリジナル
2023-06-11 09:49:391388ブラウズ

PHP はサーバーサイドのスクリプト言語としてますます広く使用されており、開発が続けられています。人間とコンピューターのインタラクションを実現する過程において、自然言語生成テクノロジーは常に重要な部分を占めてきました。コンピュータが音声を通じて人間とコンピュータの対話を実行できるようになれば、多くの分野に革命的な変化をもたらす可能性があります。 PHP には優れた自然音声生成ツールが数多くありますが、この記事では PHP を使用して自然音声を生成する方法を紹介します。

1. 自然音声生成技術とは

自然音声生成とは、コンピュータを通じて人間の音声に似た音声を生成すること、つまり人間が発した音に似た音声を取得することです。 . コンピュータが音声を通じて人々と対話できるようにします。

現在の自然音声生成技術は通常 2 つのカテゴリに分類されます。1 つはテキストベースの自然音声生成で、もう 1 つは音声合成に基づく自然音声生成です。

テキストベースの自然音声生成では、入力テキストを音声信号に変換する必要があります。これには、音声合成テクノロジーを使用して、テキストを人間の音声に似た音声信号に変換する必要があります。

音声合成による自然音声生成とは、入力された音声信号をテキスト情報に変換して処理し、自然言語生成技術を用いて新たな音声信号を生成する処理です。

2. 自然音声生成技術の応用分野

自然音声生成技術の応用分野は非常に広く、その中で最も一般的なのは音声合成です。音声合成技術は、次のような多くの分野に応用できます:

1. オフィスオートメーション分野: 自動音声応答機、音声アラームコマンドシステム、自動電話対話システムなど。

2. 交通管制分野:音声ナビゲーションシステム、音声駐車管理システム、交通指令システムなど。

3. 電子読書分野: オーディオノベル放送システム、オーディオ電子書籍リーダーなど。

4. 医療分野: たとえば、自然言語理解および分析システム、自然言語は医療診断や処方の補助ツールとして使用されます。

5. エンターテインメント分野: ゲームのBGMでの音声プロンプト、インテリジェントな音声対話と自然な会話体験など。

3. PHP で自然音声生成テクノロジを使用する方法

PHP 開発者にとって、ほとんどのアプリケーションは、自然音声生成を実現するために既製のライブラリまたは API を使用します。 PHP 言語は、その強力な処理能力と豊富な関数ライブラリにより、多数の自然音声生成ツールを確立しました。

1. Baidu TTS

Baidu TTS は Baidu Voice の音声合成 API であり、高速で、複数の言語をサポートし、無料です。中国語、英語、フランス語、韓国語、日本語など16言語に対応。さらに、性別選択機能や音声フォーマットの選択もサポートしており、実際のニーズに合わせて選択できます。

オーディオ合成 API を呼び出すには、いくつかの簡単な手順のみが必要です。

  • アクセス トークンを取得する
  • パラメータを設定する
  • リクエストを送信する
  • mp3 をダウンロード

以下は Baidu TTS を使用した音声合成のサンプル コードです:

<?php
require 'AipSpeech.php';
const APP_ID = '你的 App ID';
const API_KEY = '你的 Api Key';
const SECRET_KEY = '你的 Secret Key';

$client = new AipSpeech(APP_ID, API_KEY, SECRET_KEY);

$text = "欢迎使用百度语音合成";

$result = $client->synthesis($text, 'zh', 1, array(
    'vol' => 5,
));

// 识别正确返回语音二进制 错误则返回json 参照下面错误码
if(!is_array($result)){
    file_put_contents('audio.mp3', $result);
}
?>

2. Tencent AI 開発プラットフォーム

Tencent AI 開発プラットフォームまた、API インターフェイスを通じて呼び出すことができる自然音声生成ツールも提供します。 Baidu TTS と同様に、開発者は Tencent が提供する ACCESS TOKEN の取得、パラメータの設定、リクエストの送信などの手順に従ってさえいれば、音声合成を実現できます。

次は、Tencent AI 開発プラットフォームを使用して音声合成を実現する方法を紹介します:

<?php

require_once 'TencentSpeechAPI.php';

$speech = new TencentSpeechAPI(APPID, APPKEY, PATH_TO_PRIVATE_KEY_FILE); 

$speech->set_option(array(
    'speed' => 100
));

$text = '你好';

$file = uniqid() . '.wav';

$result = $speech->speaking_word($text, $file);

/*判断请求是否成功*/
if(NULL != $result){

    /*请求成功,打印服务器返回的输入流*/

    file_put_contents($file, $result);

    echo $file;

}else{

    /*请求失败*/

    echo "语音合成失败,请检查您的网络或输入文字内容。";
}
?>

3. IBM Watson

Baidu TTS と Tencent AI 開発プラットフォームに加えて、 IBM Watson は、音声テキスト変換、感情分析、スパム フィルタリング、言語翻訳など、多くの自然言語生成 API も提供します。その中でも、IBM Watsonのspeech-to-text機能は音声をテキストに変換することができます。音声コンテンツを処理する場合、利用するにはIBM Watson公式WebサイトでAPI KEYを申請する必要があります。

IBM Watson を使用した音声合成のサンプル コードは次のとおりです。

<?php
include 'IbmWatsonSpeechToText.php';

$apiKey = '你的APIKEY';

$url = 'https://stream.watsonplatform.net/text-to-speech/api';

$format = 'wav';

$voice = 'en-US_MichaelVoice';

$text = 'Hello World';

$newAudioName = 'output.wav';

$conversion = new IbmWatsonSpeechToText($apiKey, $url);

$conversion -> voice($voice);
$conversion -> format($format);
$conversion -> generateAudio($text, $newAudioName);
?>

4. まとめ

自然音声生成は、多くの分野に応用できる非常に重要な技術です。医療、ゲーム、教育など。 PHP は、音声合成やその他の自然言語生成タスクの実装に使用できる、一般的なサーバー側スクリプト言語です。この記事を通じて、PHP を使用して自然な音声生成を実現するための具体的な手順とツールを学びました。上記の 3 つの自然音声生成ツールを自分のニーズに応じて選択し、自然な音声生成を実現する過程で多くの有益な経験を積むことができます。

以上がPHP での自然な音声生成の初心者ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。