cari
RumahPeranti teknologiAIMemanfaatkan Embeddings Teks dengan API Terbuka: Panduan Praktikal

Embeddings teks adalah asas pemprosesan bahasa semulajadi (NLP), memberikan perwakilan berangka teks di mana perkataan atau frasa menjadi vektor padat nombor sebenar. Ini membolehkan mesin memahami makna dan hubungan semantik antara kata -kata, meningkatkan keupayaan mereka untuk memproses bahasa manusia.

Embeddings ini penting untuk tugas -tugas seperti klasifikasi teks, pengambilan maklumat, dan pengesanan kesamaan semantik. OpenAI mengesyorkan model ADA V2 untuk menciptakannya, memanfaatkan kekuatan siri GPT dalam menangkap makna dan persatuan kontekstual dalam teks.

Sebelum meneruskan, kebiasaan dengan API OpenAI dan OpenAI Python Pakej diandaikan (lihat " Memahami kluster, terutamanya k-means, juga membantu (berunding "Pengenalan kepada K-means clustering dengan scikit-learn dalam python").

atau pengenalan topik.

  • Pengambilan maklumat: Mendapatkan maklumat yang berkaitan dengan pertanyaan tertentu, meniru fungsi enjin carian.
  • Interaksi. os , openai , scipy.spatial.distance , sklearn.cluster.kmeans , dan umap.umap . Pasangnya dengan menggunakan:
     Pip Install -u Openai Scipy Plotly-Express ScIKit-Learn Umap-Learn 

    Import perpustakaan yang diperlukan:

    Openai API Key:
     openai.api_key = "<your_api_key_here>" </your_api_key_here>
    (ingat untuk menggantikan dengan kunci sebenar anda. model teks-embeddddddddddddddding-ADA-ADA-ADA- 002 untuk menghasilkan embeddings: def get_embeddddding (teks_to_embed): response = openai.embeddddding.create (model = "teks-embeddddddddddddddddd-ada-ada-002" Embedding

    Dataset dan analisis:

    Contoh ini menggunakan dataset Kajian Alat Muzik Amazon (tersedia di Kaggle atau github pengarang). Untuk kecekapan, sampel 100 ulasan digunakan.

     Pandas import sebagai pd data_url = "https://raw.githubusercontent.com/keitazoana/experimentation-data/main/musical_instruments_Reviews.csv" review_df = pd.cd. = review_df.sample (100) review_df ["embedding"] = review_df ["reviewText"]. astype (str) .apply (get_embedding) review_df.reset_index (drop = true, inplace = true) <code> scipy.spatial.distance.pdist () </code>, mengukur persamaan antara embeddings kajian. Jarak yang lebih kecil menunjukkan persamaan yang lebih besar.  <p> <strong> Analisis cluster (k-means): </strong> </p> <p> Kumpulan kluster K-Means yang sama. Di sini, tiga kelompok digunakan: </p> <pre class="brush:php;toolbar:false"> kmeans = kmeans (n_clusters = 3) kmeans.fit (review_df ["embedding"]. = Umap () embeddings_2d = reducer.fit_transform (review_df ["embedding"]. Tolist ()) 

    Visualisasi:

    y=embeddings_2d[:, 1], color=kmeans.labels_) fig.show()

    Leveraging Text Embeddings with the OpenAI API: A Practical Guide

    Penjelajahan lanjut: Imej dimasukkan seperti yang diminta.

    Atas ialah kandungan terperinci Memanfaatkan Embeddings Teks dengan API Terbuka: Panduan Praktikal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

    Kenyataan
    Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
    Otak Over Bots: Panduan Jutawan untuk Berkembang Melalui PerubahanOtak Over Bots: Panduan Jutawan untuk Berkembang Melalui PerubahanApr 23, 2025 am 11:16 AM

    Kecerdasan Umum Buatan (AGI) telah tiba, mengantar dalam tempoh transformasi global yang belum pernah terjadi sebelumnya. McKinsey & Company mentakrifkan AGI sebagai AI dengan keupayaan peringkat manusia, pembangunan yang berpotensi membawa kepada "Singularity,"

    Apa yang saya pelajari menguji berpuluh -puluh agen AI pada tahun 2025Apa yang saya pelajari menguji berpuluh -puluh agen AI pada tahun 2025Apr 23, 2025 am 11:13 AM

    Kemajuan pesat AI memandu perniagaan untuk mengintegrasikan ejen AI ke dalam operasi mereka. Tinjauan IBM dan Morning Consult baru -baru ini mendedahkan bahawa majoriti (99%) pemaju AI perusahaan secara aktif meneroka atau membangunkan AI Agent TEC

    Membina model asas AI dan AI generatif yang pakar melakukan terapi kesihatan mentalMembina model asas AI dan AI generatif yang pakar melakukan terapi kesihatan mentalApr 23, 2025 am 11:12 AM

    Membangunkan AI yang mampu menyediakan terapi kesihatan mental pakar adalah usaha yang signifikan. Pemula secara agresif mengejar jalan yang mencabar ini, menarik modal usaha yang besar. Penyelidik akademik secara aktif meneroka feasibilnya

    The Prompt: Bot Sokongan Pelanggan Kursor membentuk polisiThe Prompt: Bot Sokongan Pelanggan Kursor membentuk polisiApr 23, 2025 am 11:11 AM

    Perisian pengekodan AI adalah kemarahan. Satu alat yang sangat popular adalah kursor, yang dibina oleh permulaan AI yang baru muncul, yang telah menjadi salah satu permulaan yang paling pesat berkembang sepanjang masa. Tetapi kursor tidak kebal terhadap halusinasi - kecenderungan AI untuk mak

    Bagaimana Nvidia Isaac GR00T N1 Menentukan semula Robotik Humanoid?Bagaimana Nvidia Isaac GR00T N1 Menentukan semula Robotik Humanoid?Apr 23, 2025 am 11:07 AM

    Nvidia Isaac Gr00t N1: Memimpin Inovasi Teknologi Robot Manusia NVIDIA Isaac GR00T N1 telah mencapai lonjakan ke hadapan dalam bidang robot humanoid, dengan sempurna menggabungkan teknologi AI canggih dengan akses sumber terbuka. Sebagai model asas terbuka pertama di dunia untuk kesimpulan robot humanoid sejagat, teknologi ini membolehkan robot memahami arahan bahasa, memproses data visual, dan melaksanakan tugas -tugas operasi yang kompleks dalam pelbagai persekitaran. Jadual Kandungan Penjelasan terperinci mengenai seni bina teknikal Panduan Pemasangan Lengkap Pelaksanaan aliran kerja yang komprehensif Penjanaan data sintetik terobosan Metrik penempatan dan prestasi Alat pembangunan peringkat perusahaan Sumber pemula Meringkaskan Penjelasan terperinci mengenai seni bina teknikal Rangka Kerja Kognitif Sistem Dual Sistem 1 (Pemikiran Pantas):

    Menilai model bahasa dengan metrik bleuMenilai model bahasa dengan metrik bleuApr 23, 2025 am 11:05 AM

    Menilai Model Bahasa: menyelam mendalam ke dalam metrik bleu dan seterusnya Dalam bidang kecerdasan buatan, menilai prestasi model bahasa memberikan cabaran yang unik. Tidak seperti tugas seperti pengiktirafan imej atau ramalan berangka, EV

    Meneroka Rangka Kerja Autogen Microsoft untuk Aliran Kerja AgentikMeneroka Rangka Kerja Autogen Microsoft untuk Aliran Kerja AgentikApr 23, 2025 am 10:59 AM

    Kemajuan pesat AI generatif memerlukan peralihan dari yang didorong oleh manusia untuk pelaksanaan tugas autonomi. Di sinilah aliran kerja agentik dan ejen AI masuk -agen bertindak sebagai "anggota badan" kepada "otak" model, yang membolehkan Ind

    Bina kain audio dengan Assemblyai, Qdrant & DeepSeek-R1Bina kain audio dengan Assemblyai, Qdrant & DeepSeek-R1Apr 23, 2025 am 10:48 AM

    Panduan ini menunjukkan membina chatbot berkuasa AI yang mengubah rakaman audio (mesyuarat, podcast, wawancara) ke dalam perbualan interaktif. Ia memanfaatkan pemasangan untuk transkripsi, qdrant untuk penyimpanan data yang cekap, dan DeepSeek-R1 VI

    See all articles

    Alat AI Hot

    Undresser.AI Undress

    Undresser.AI Undress

    Apl berkuasa AI untuk mencipta foto bogel yang realistik

    AI Clothes Remover

    AI Clothes Remover

    Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

    Undress AI Tool

    Undress AI Tool

    Gambar buka pakaian secara percuma

    Clothoff.io

    Clothoff.io

    Penyingkiran pakaian AI

    Video Face Swap

    Video Face Swap

    Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

    Alat panas

    Muat turun versi mac editor Atom

    Muat turun versi mac editor Atom

    Editor sumber terbuka yang paling popular

    DVWA

    DVWA

    Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

    SublimeText3 versi Mac

    SublimeText3 versi Mac

    Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

    Notepad++7.3.1

    Notepad++7.3.1

    Editor kod yang mudah digunakan dan percuma

    SublimeText3 versi Inggeris

    SublimeText3 versi Inggeris

    Disyorkan: Versi Win, menyokong gesaan kod!