Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Gunakan Python untuk berhubung dengan antara muka AI Baidu untuk menjadikan program anda lebih menarik

Gunakan Python untuk berhubung dengan antara muka AI Baidu untuk menjadikan program anda lebih menarik

WBOY
WBOYasal
2023-08-12 08:27:251538semak imbas

Gunakan Python untuk berhubung dengan antara muka AI Baidu untuk menjadikan program anda lebih menarik

Gunakan Python untuk berhubung dengan antara muka Baidu AI untuk menjadikan program anda lebih menarik

Dengan pembangunan kecerdasan buatan, API (Antara Muka Pengaturcaraan Aplikasi) telah menjadi alat standard untuk pelbagai pembangun perisian. API boleh menyediakan pelbagai fungsi kepada perisian, menjadikan program lebih pintar dan menarik. Antara muka AI Baidu kini merupakan antara antara muka paling popular di kalangan pembangun. Artikel ini akan memperkenalkan cara menggunakan Python untuk menyambung dengan antara muka Baidu AI untuk menjadikan program anda lebih menarik.

Pertama, kita perlu mendaftar akaun di Baidu AI Open Platform (https://ai.baidu.com/) dan membuat aplikasi. Selepas penciptaan berjaya, anda akan mendapat Kunci API dan Kunci Rahsia, yang akan digunakan dalam program Python kami.

Seterusnya, kami akan menggunakan antara muka pengecaman teks dan antara muka sintesis pertuturan dalam Baidu AI sebagai contoh.

  1. Antara muka pengecaman teks

Antara muka pengecaman teks boleh mengekstrak teks daripada gambar dan boleh digunakan pada senario seperti pengimbasan dokumen automatik dan pengurusan perpustakaan.

Mula-mula, anda perlu memasang Python SDK Baidu AI dan masukkan arahan berikut dalam terminal:

pip install baidu-aip

Kemudian, import perpustakaan yang berkaitan ke dalam program Python anda:

from aip import AipOcr

Seterusnya, tambahkan API yang anda perolehi daripada buka Baidu AI platform Isikan Kunci, Kunci Rahsia dan id aplikasi ke dalam kod berikut:

APP_ID = 'your app id'
API_KEY = 'your api key'
SECRET_KEY = 'your secret key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

Kini, kita boleh menggunakan objek yang dibuat di atas untuk mengenal pasti teks dalam imej. Katakan kita mempunyai imej bernama "image.png", kita boleh menggunakan kod berikut untuk pengecaman teks:

def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

image = get_file_content("image.png")

result = client.basicGeneral(image)
for word in result['words_result']:
    print(word['words'])

Kod di atas mula-mula mentakrifkan fungsi get_file_content, yang digunakan untuk membaca kandungan imej . Kemudian, hantar kandungan imej kepada kaedah basicGeneral antara muka pengecaman teks, lalui hasil yang dikembalikan dan cetak teks yang diiktiraf. get_file_content,该函数用于读取图片内容。然后,将图片内容传递给文字识别接口的basicGeneral方法,并遍历返回的结果,打印出识别到的文字。

  1. 语音合成接口

语音合成接口可以将文字转化成语音,并可以设置音色和语速。可以应用于阅读软件、智能助手等场景。

同样地,我们需要安装百度AI的Python SDK,并导入相关库:

from aip import AipSpeech

然后,将你在百度AI开放平台获得的API Key、Secret Key和应用id填入下面的代码中:

APP_ID = 'your app id'
API_KEY = 'your api key'
SECRET_KEY = 'your secret key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

假设我们要将一段文字合成成语音,我们可以使用以下代码:

text = "欢迎来到百度AI开放平台"

result = client.synthesis(text, 'zh', 1, {
    'vol': 5,
    'per': 4,
})

if not isinstance(result, dict):
    with open('audio.mp3', 'wb') as f:
        f.write(result)

以上代码将文字"欢迎来到百度AI开放平台"传递给语音合成接口的synthesis

    Antara muka sintesis pertuturan

    🎜Antara muka sintesis pertuturan boleh menukar teks kepada pertuturan, dan boleh menetapkan timbre dan kelajuan pertuturan. Ia boleh digunakan pada senario seperti perisian membaca dan pembantu pintar. 🎜🎜Begitu juga, kita perlu memasang Python SDK Baidu AI dan mengimport perpustakaan yang berkaitan: 🎜rrreee🎜Kemudian, isikan Kunci API, Kunci Rahsia dan id aplikasi yang anda perolehi daripada platform terbuka Baidu AI ke dalam kod berikut: 🎜rrreee 🎜 Katakan kita ingin mensintesis sekeping teks ke dalam pertuturan, kita boleh menggunakan kod berikut: 🎜rrreee🎜Kod di atas menghantar teks "Selamat Datang ke Baidu AI Open Platform" kepada kaedah sintesis pertuturan antara muka sintesis, dan Bahasa ditetapkan kepada bahasa Cina, kelantangan ditetapkan kepada 5, dan nada ditetapkan kepada Du Xiaoyao. Kemudian, tulis kandungan suara yang dikembalikan ke dalam fail "audio.mp3". 🎜🎜Dengan menyambung dengan antara muka Baidu AI, kami boleh menjadikan program ini mempunyai fungsi yang lebih menarik. Antara muka pengecaman teks membolehkan program kami membaca maklumat teks dalam gambar, manakala antara muka sintesis pertuturan membolehkan program kami mempunyai keupayaan untuk mengeluarkan pertuturan. Menggunakan antara muka Baidu AI, kami boleh menambahkan lebih banyak keseronokan dan kecerdasan pada program kami. 🎜

Atas ialah kandungan terperinci Gunakan Python untuk berhubung dengan antara muka AI Baidu untuk menjadikan program anda lebih menarik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn