Embeddings teks adalah asas pemprosesan bahasa semulajadi (NLP), memberikan perwakilan berangka teks di mana perkataan atau frasa menjadi vektor padat nombor sebenar. Ini membolehkan mesin memahami makna dan hubungan semantik antara kata -kata, meningkatkan keupayaan mereka untuk memproses bahasa manusia.
Embeddings ini penting untuk tugas -tugas seperti klasifikasi teks, pengambilan maklumat, dan pengesanan kesamaan semantik. OpenAI mengesyorkan model ADA V2 untuk menciptakannya, memanfaatkan kekuatan siri GPT dalam menangkap makna dan persatuan kontekstual dalam teks.
Sebelum meneruskan, kebiasaan dengan API OpenAI dan OpenAI
Python Pakej diandaikan (lihat " Memahami kluster, terutamanya k-means, juga membantu (berunding "Pengenalan kepada K-means clustering dengan scikit-learn dalam python").
atau pengenalan topik.
os
, openai
, scipy.spatial.distance
, sklearn.cluster.kmeans
, dan umap.umap
. Pasangnya dengan menggunakan: Pip Install -u Openai Scipy Plotly-Express ScIKit-Learn Umap-Learn
Import perpustakaan yang diperlukan:
Openai API Key:openai.api_key = "<your_api_key_here>" </your_api_key_here>(ingat untuk menggantikan
Dataset dan analisis:
Contoh ini menggunakan dataset Kajian Alat Muzik Amazon (tersedia di Kaggle atau github pengarang). Untuk kecekapan, sampel 100 ulasan digunakan.
Pandas import sebagai pd data_url = "https://raw.githubusercontent.com/keitazoana/experimentation-data/main/musical_instruments_Reviews.csv" review_df = pd.cd. = review_df.sample (100) review_df ["embedding"] = review_df ["reviewText"]. astype (str) .apply (get_embedding) review_df.reset_index (drop = true, inplace = true) <code> scipy.spatial.distance.pdist () </code>, mengukur persamaan antara embeddings kajian. Jarak yang lebih kecil menunjukkan persamaan yang lebih besar. <p> <strong> Analisis cluster (k-means): </strong> </p> <p> Kumpulan kluster K-Means yang sama. Di sini, tiga kelompok digunakan: </p> <pre class="brush:php;toolbar:false"> kmeans = kmeans (n_clusters = 3) kmeans.fit (review_df ["embedding"]. = Umap () embeddings_2d = reducer.fit_transform (review_df ["embedding"]. Tolist ())
Visualisasi:
y=embeddings_2d[:, 1], color=kmeans.labels_) fig.show()
Penjelajahan lanjut: Imej dimasukkan seperti yang diminta.
Atas ialah kandungan terperinci Memanfaatkan Embeddings Teks dengan API Terbuka: Panduan Praktikal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kecerdasan Umum Buatan (AGI) telah tiba, mengantar dalam tempoh transformasi global yang belum pernah terjadi sebelumnya. McKinsey & Company mentakrifkan AGI sebagai AI dengan keupayaan peringkat manusia, pembangunan yang berpotensi membawa kepada "Singularity,"

Kemajuan pesat AI memandu perniagaan untuk mengintegrasikan ejen AI ke dalam operasi mereka. Tinjauan IBM dan Morning Consult baru -baru ini mendedahkan bahawa majoriti (99%) pemaju AI perusahaan secara aktif meneroka atau membangunkan AI Agent TEC

Membangunkan AI yang mampu menyediakan terapi kesihatan mental pakar adalah usaha yang signifikan. Pemula secara agresif mengejar jalan yang mencabar ini, menarik modal usaha yang besar. Penyelidik akademik secara aktif meneroka feasibilnya

Perisian pengekodan AI adalah kemarahan. Satu alat yang sangat popular adalah kursor, yang dibina oleh permulaan AI yang baru muncul, yang telah menjadi salah satu permulaan yang paling pesat berkembang sepanjang masa. Tetapi kursor tidak kebal terhadap halusinasi - kecenderungan AI untuk mak

Nvidia Isaac Gr00t N1: Memimpin Inovasi Teknologi Robot Manusia NVIDIA Isaac GR00T N1 telah mencapai lonjakan ke hadapan dalam bidang robot humanoid, dengan sempurna menggabungkan teknologi AI canggih dengan akses sumber terbuka. Sebagai model asas terbuka pertama di dunia untuk kesimpulan robot humanoid sejagat, teknologi ini membolehkan robot memahami arahan bahasa, memproses data visual, dan melaksanakan tugas -tugas operasi yang kompleks dalam pelbagai persekitaran. Jadual Kandungan Penjelasan terperinci mengenai seni bina teknikal Panduan Pemasangan Lengkap Pelaksanaan aliran kerja yang komprehensif Penjanaan data sintetik terobosan Metrik penempatan dan prestasi Alat pembangunan peringkat perusahaan Sumber pemula Meringkaskan Penjelasan terperinci mengenai seni bina teknikal Rangka Kerja Kognitif Sistem Dual Sistem 1 (Pemikiran Pantas):

Menilai Model Bahasa: menyelam mendalam ke dalam metrik bleu dan seterusnya Dalam bidang kecerdasan buatan, menilai prestasi model bahasa memberikan cabaran yang unik. Tidak seperti tugas seperti pengiktirafan imej atau ramalan berangka, EV

Kemajuan pesat AI generatif memerlukan peralihan dari yang didorong oleh manusia untuk pelaksanaan tugas autonomi. Di sinilah aliran kerja agentik dan ejen AI masuk -agen bertindak sebagai "anggota badan" kepada "otak" model, yang membolehkan Ind

Panduan ini menunjukkan membina chatbot berkuasa AI yang mengubah rakaman audio (mesyuarat, podcast, wawancara) ke dalam perbualan interaktif. Ia memanfaatkan pemasangan untuk transkripsi, qdrant untuk penyimpanan data yang cekap, dan DeepSeek-R1 VI


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular

DVWA
Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Inggeris
Disyorkan: Versi Win, menyokong gesaan kod!