人工知能技術の継続的な発展に伴い、音声認識技術の人気はますます高まっています。 Web 開発では、音声認識の実装も重要なタスクになっています。
PHP は、Web 開発の分野で広く使用されている言語であり、音声認識も実装できます。この記事では、PHPで音声認識を実装する方法を紹介します。
Baidu 音声認識 API は、現在、より成熟しており、人気のある音声認識 API の 1 つです。 Baidu Speech Recognition APIを利用することで音声認識機能を簡単に実装できます。
まず、Baidu Developer Platform にアプリケーションを登録して作成し、アプリケーションの App ID と App Key を取得する必要があります。
次に、PHP を使用して POST リクエストを送信し、音声ファイルを Baidu 音声認識 API に転送する必要があります。以下はサンプル コードです:
//语音文件路径 $audio_file = "audio.pcm"; //将语音文件读取为字符串 $file_content = file_get_contents($audio_file); //设置POST请求的header $header = array( "Content-Type: audio/pcm;rate=8000", "Content-Length: " . strlen($file_content), "Referer: http://yuyin.baidu.com/" ); //构造POST请求 $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, "http://vop.baidu.com/server_api"); curl_setopt($ch, CURLOPT_POSTFIELDS, $file_content); curl_setopt($ch, CURLOPT_HTTPHEADER, $header); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_POST, true); //设置App ID和App Key $app_id = "your_app_id"; $app_key = "your_app_key"; curl_setopt($ch, CURLOPT_USERPWD, $app_id . ":" . $app_key); //发送POST请求 $response = curl_exec($ch); //解析返回结果 $result = json_decode($response, true); if (isset($result['result'][0])) { echo $result['result'][0]; } else { echo "识别失败"; }
Baidu 音声認識 API に加えて、Google 音声認識 API も非常に成熟した人気のある API です。音声認識 API。音声認識機能は、Google Speech Recognition API を使用して簡単に実装することもできます。
まず、Google Cloud Console でプロジェクトを作成し、Google Cloud Speech-to-Text API を有効にする必要があります。
次に、PHP を使用して POST リクエストを送信し、音声ファイルを Google Speech Recognition API に転送する必要があります。以下はサンプル コードです:
//语音文件路径 $audio_file = "audio.flac"; //将语音文件读取为字符串 $file_content = file_get_contents($audio_file); //构造POST请求 $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, "https://speech.googleapis.com/v1/speech:recognize"); curl_setopt($ch, CURLOPT_POSTFIELDS, $file_content); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_POST, true); //设置API密钥 $api_key = "your_api_key"; curl_setopt($ch, CURLOPT_HTTPHEADER, array("Content-Type: application/json", "Authorization: Bearer ".$api_key)); //设置请求体 $request_data = array( "config" => array( "encoding" => "FLAC", "sampleRateHertz" => 16000, "languageCode" => "zh-CN", ), "audio" => array( "content" => base64_encode($file_content), ), ); curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($request_data)); //发送POST请求 $response = curl_exec($ch); //解析返回结果 $result = json_decode($response, true); if (isset($result['results'][0]['alternatives'][0]['transcript'])) { echo $result['results'][0]['alternatives'][0]['transcript']; } else { echo "识别失败"; }
要約
上記は、PHP で音声認識を実装する 2 つの方法です。Baidu Speech Recognition API を使用する方法と Google Speech Recognition API を使用する方法です。これら 2 つの方法は音声認識を実現する上で比較的成熟しており、一般的に使用されているため、実際のニーズや個人の好みに応じてどちらの方法を選択するか選択できます。
以上がPHPで音声認識を実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。