Rumah >Peranti teknologi >industri IT >Cara Bermula Dengan API Teks-Ke-Teks Google Cloud

Cara Bermula Dengan API Teks-Ke-Teks Google Cloud

Jennifer Aniston
Jennifer Anistonasal
2025-02-09 10:24:10114semak imbas

How to Get Started With Google Cloud's Text-to-Speech API

Tutorial ini membimbing anda melalui penyediaan dan menggunakan API teks-ke-ucapan Google Cloud, memberikan contoh kod dan penjelasan.

faedah utama API teks-ke-ucapan Google Cloud:

API teks-ke-ucapan Google Cloud mengubah teks ke dalam ucapan semulajadi, sesuai untuk aplikasi seperti alat kebolehaksesan, pembantu maya, platform e-pembelajaran, buku audio, aplikasi pembelajaran bahasa, bahan pemasaran, dan sistem telekomunikasi.

Bermula: Prasyarat dan Persediaan:

Untuk menggunakan API, anda memerlukan akaun Platform Awan Google (GCP), kemahiran pengaturcaraan Python asas, dan editor teks. Proses ini melibatkan membolehkan API, mewujudkan kelayakan API, mengkonfigurasi persekitaran Python anda, menulis skrip Python, menjalankan skrip, dan secara pilihan menyesuaikan tetapan suara dan audio.

Panduan langkah demi langkah:

    Dayakan API Teks-ke-SPEECH:
  1. Akses konsol GCP anda, pilih atau buat projek, cari API teks-ke-speek di perpustakaan API, dan membolehkannya.

  2. Buat kelayakan API:
  3. Di bahagian Kredensial GCP, buat akaun perkhidmatan, berikan peranan "pengguna API API AGUR-AWAY", dan muat turun fail kunci JSON. Pastikan fail ini selamat.

  4. Sediakan persekitaran python anda:
  5. Pasang Google Cloud SDK dan perpustakaan

    menggunakan PIP. Tetapkan pembolehubah persekitaran untuk menunjuk ke laluan fail kunci JSON anda. google-cloud-texttospeech GOOGLE_APPLICATION_CREDENTIALS

  6. Buat skrip python:
  7. Gunakan kod berikut (atau versi yang diubahsuai) untuk mensintesis ucapan:

<code class="language-python">from google.cloud import texttospeech

def synthesize_speech(text, output_filename):
    client = texttospeech.TextToSpeechClient()
    input_text = texttospeech.SynthesisInput(text=text)
    voice = texttospeech.VoiceSelectionParams(
        language_code="en-US", ssml_gender=texttospeech.SsmlVoiceGender.FEMALE
    )
    audio_config = texttospeech.AudioConfig(audio_encoding=texttospeech.AudioEncoding.MP3)
    response = client.synthesize_speech(input=input_text, voice=voice, audio_config=audio_config)
    with open(output_filename, "wb") as out:
        out.write(response.audio_content)
    print(f"Audio saved to '{output_filename}'")

synthesize_speech("Hello, world!", "output.mp3")</code>
    Jalankan skrip:
  1. Jalankan skrip Python anda dari terminal anda. Ini akan menghasilkan fail mp3.

  2. menyesuaikan (pilihan):
  3. Ubah suai parameter suara (kod bahasa, jantina, dan lain -lain) dan tetapan audio (pengekodan, kadar sampel) dalam skrip untuk hasil yang disesuaikan. Rujuk dokumentasi API untuk pilihan yang tersedia.

  4. Pilihan konfigurasi lanjutan:

API menawarkan penyesuaian yang luas:

Pengekodan audio:
    mengawal format audio output (mp3, wav, dan lain -lain).
  • Kadar sampel audio:
  • Laraskan kualiti audio.
  • kod bahasa:
  • Tentukan bahasa untuk sintesis pertuturan.
  • Pemilihan suara:
  • Pilih dari pelbagai suara.
  • SSML Sokongan:
  • Gunakan bahasa markup sintesis pertuturan untuk kawalan lanjutan ke atas sebutan dan intonasi.
  • Kesimpulan:

Tutorial ini menyediakan asas untuk menggunakan API teks-ke-ucapan Google Cloud. Terokai dokumentasi API untuk ciri -ciri dan keupayaan yang lebih canggih untuk mengintegrasikan alat yang berkuasa ini ke dalam projek anda.

Soalan Lazim (Soalan Lazim):

Bahagian Soalan Lazim dari teks asal telah diringkaskan dan diubahsuai untuk keringkasan dan kejelasan:

  • Kos: API tidak percuma; Harga didasarkan pada penggunaan watak, tetapi peringkat bebas wujud.
  • Penggunaan Komersial: dibenarkan, tertakluk kepada syarat perkhidmatan Google.
  • Sokongan bahasa: lebih dari 40 bahasa dan varian.
  • Penyesuaian suara: pilihan penyesuaian yang luas tersedia.
  • Penggunaan Luar Talian: Tidak mungkin; Sambungan internet diperlukan.
  • Kualiti audio: ucapan yang berkualiti tinggi, semulajadi.
  • penciptaan audiobook: sesuai untuk penciptaan audiobook, tetapi pertimbangkan jumlah data dan kos.
ingat untuk berunding dengan dokumentasi API Text-to-Speech Google Cloud rasmi untuk maklumat yang paling terkini dan penjelasan terperinci.

Atas ialah kandungan terperinci Cara Bermula Dengan API Teks-Ke-Teks Google Cloud. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn