cari
RumahPeranti teknologiAITutorial GPT-4O dan Langgraph: Bina Aplikasi TNT-LLM

TNT-LLM Microsoft: merevolusikan penjanaan taksonomi dan klasifikasi teks

Microsoft telah melancarkan TNT-LLM, sistem pecah tanah yang mengautomasikan penciptaan taksonomi dan klasifikasi teks, melampaui kaedah tradisional dalam kedua-dua kelajuan dan ketepatan. Pendekatan inovatif ini memanfaatkan kuasa model bahasa besar (LLMS) untuk menyelaraskan dan skala penjanaan taksonomi dan pengelas, meminimumkan campur tangan manual. Ini amat bermanfaat untuk aplikasi seperti Bing Copilot, di mana menguruskan data teks yang dinamik dan pelbagai adalah yang paling utama.

Artikel ini menunjukkan pelaksanaan TNT-LLM menggunakan GPT-4O dan Langgraph untuk clustering artikel berita yang efisien. Untuk maklumat lanjut mengenai GPT-4O dan Langgraph, rujuk sumber-sumber ini:

  • Apa itu GPT-4O Openai?
  • tutorial API GPT-4O: Bermula dengan API OpenAI
  • tutorial langgraph: Apakah langgraph dan cara menggunakannya?

Kertas penyelidikan TNT-LLM yang asal, "TNT-LLM: Perlombongan Teks pada skala dengan model bahasa yang besar," memberikan butiran komprehensif mengenai sistem.

Memahami TNT-LLM

TNT-LLM (klasifikasi taksonomi dan teks menggunakan model bahasa yang besar) adalah rangka kerja dua peringkat yang direka untuk menjana dan mengklasifikasikan taksonomi dari data teks.

Fasa 1: Generasi Taksonomi

Fasa awal ini menggunakan sampel dokumen teks dan arahan tertentu (mis., "Menjana taksonomi kepada artikel berita kluster"). LLM meringkaskan setiap dokumen, mengeluarkan maklumat utama. Melalui penghalusan berulang, LLM membina, mengubah, dan menyempurnakan taksonomi, mengakibatkan hierarki label dan deskripsi berstruktur untuk pengkategorian artikel berita yang berkesan.

GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application Sumber: Mengtting Wan et al.

Fasa 2: Klasifikasi Teks

Fasa kedua menggunakan taksonomi yang dihasilkan untuk melabelkan dataset yang lebih besar. LLM menggunakan label ini, mewujudkan data latihan untuk pengelas ringan (seperti regresi logistik). Pengelas terlatih ini dengan cekap melabelkan keseluruhan dataset atau melakukan klasifikasi masa nyata.

Sumber: Mengtting Wan et al. GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application

sifat yang boleh disesuaikan TNT-LLM menjadikannya sesuai untuk pelbagai tugas klasifikasi teks, termasuk pengesanan niat dan pengkategorian topik.

Kelebihan TNT-LLM

TNT-LLM menawarkan kelebihan yang ketara untuk perlombongan dan klasifikasi teks berskala besar:

  • Generasi Taksonomi Automatik: mengautomasikan penciptaan taksonomi terperinci dan ditafsirkan dari teks mentah, menghapuskan keperluan untuk usaha manual dan kepakaran domain yang luas.
  • Klasifikasi berskala: Membolehkan klasifikasi teks berskala menggunakan model ringan yang mengendalikan dataset besar dan klasifikasi masa nyata dengan cekap.
  • keberkesanan kos: Mengoptimumkan penggunaan sumber melalui penggunaan LLM bertingkat (mis., GPT-4 untuk penjanaan taksonomi, GPT-3.5-Turbo untuk ringkasan, dan regresi logistik untuk klasifikasi akhir).
  • output berkualiti tinggi:
  • penjanaan taksonomi berulang memastikan pengkategorian berkualiti tinggi, relevan, dan tepat.
  • Intervensi manusia yang minimum:
  • Mengurangkan input manual, meminimumkan potensi kecenderungan dan ketidakkonsistenan.
  • fleksibiliti:
  • menyesuaikan diri dengan tugas dan domain klasifikasi teks yang pelbagai, menyokong integrasi dengan pelbagai LLM, kaedah embedding, dan pengelas. Melaksanakan TNT-LLM
Panduan pelaksanaan langkah demi langkah berikut:

Pemasangan:

Pasang pakej yang diperlukan:

Tetapkan pembolehubah persekitaran untuk kekunci API dan nama model:

pip install langgraph langchain langchain_openai

Konsep teras:
export AZURE_OPENAI_API_KEY='your_api_key_here'
export AZURE_OPENAI_MODEL='your_deployment_name_here'
export AZURE_OPENAI_ENDPOINT='deployment_endpoint'

Dokumen:
    Data teks mentah (artikel, log sembang) berstruktur menggunakan kelas
  • . Doc taksonomi:
  • kelompok niat atau topik yang dikategorikan, yang diuruskan oleh kelas
  • . TaxonomyGenerationState
  • Membina aplikasi TNT-LLM yang mudah:

Bahagian berikut terperinci langkah pelaksanaan, menggunakan coretan kod untuk menggambarkan proses utama. Oleh kerana panjang kod asal, pembiakan lengkap di sini adalah tidak praktikal. Walau bagaimanapun, yang berikut memberikan gambaran tersusun mengenai proses:

    Langkah 0: Tentukan kelas graf kelas, dataset beban, dan memulakan GPT-4O:
  • Ini melibatkan menentukan struktur data dan memuatkan dataset artikel berita. Model GPT-4O diasaskan untuk digunakan sepanjang saluran paip.

  • Langkah 1: meringkaskan dokumen:
  • Setiap dokumen diringkaskan menggunakan prompt LLM.

  • Langkah 2: Buat miniatches:
  • Dokumen yang diringkaskan dibahagikan kepada minibatches untuk pemprosesan selari.

  • Langkah 3: Menjana taksonomi awal:
  • Taksonomi awal dihasilkan dari minibatch pertama.

  • Langkah 4: Kemas kini Taksonomi:
  • Taksonomi ini dikemas kini secara berulang sebagai minibatches berikutnya diproses.

  • Langkah 5: Tinjauan Taksonomi:
  • Taksonomi akhir dikaji semula untuk ketepatan dan kaitan.

  • Langkah 6: Mengatur saluran paip TNT-LLM dengan Stategraph: Stategraph mengendalikan pelaksanaan pelbagai langkah.

  • Langkah 7: Clustering dan memaparkan taksonomi artikel berita TNT-LLM: Taksonomi akhir dipaparkan, menunjukkan kelompok artikel berita.

Kesimpulan

TNT-LLM menawarkan penyelesaian yang kuat dan cekap untuk perlombongan dan klasifikasi teks berskala besar. Keupayaan automasinya dengan ketara mengurangkan masa dan sumber yang diperlukan untuk menganalisis data teks yang tidak berstruktur, membolehkan pengambilan keputusan yang didorong oleh data merentasi pelbagai domain. Potensi untuk pembangunan dan aplikasi selanjutnya merentasi industri adalah besar. Bagi mereka yang berminat dalam pembangunan aplikasi LLM selanjutnya, kursus mengenai "membangunkan aplikasi LLM dengan Langchain" adalah disyorkan.

GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application

Atas ialah kandungan terperinci Tutorial GPT-4O dan Langgraph: Bina Aplikasi TNT-LLM. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Ketika penggunaan AI, syarikat beralih dari SEO ke GEOKetika penggunaan AI, syarikat beralih dari SEO ke GEOMay 05, 2025 am 11:09 AM

Dengan letupan aplikasi AI, perusahaan beralih dari pengoptimuman enjin carian tradisional (SEO) kepada pengoptimuman enjin generatif (GEO). Google mengetuai peralihan. Ciri "AI Gambaran Keseluruhan" telah berkhidmat lebih dari satu bilion pengguna, memberikan jawapan penuh sebelum pengguna mengklik pada pautan. [^2] Peserta lain juga meningkat dengan pesat. Chatgpt, Microsoft Copilot dan kebingungan mencipta kategori "enjin jawapan" baru yang sepenuhnya memintas hasil carian tradisional. Sekiranya perniagaan anda tidak muncul dalam jawapan yang dihasilkan oleh AI ini, pelanggan berpotensi tidak dapat menemui anda-walaupun anda berpangkat tinggi dalam hasil carian tradisional. Dari SEO ke GEO - apa sebenarnya maksudnya? Selama beberapa dekad

Pertaruhan besar di mana laluan ini akan mendorong AI hari ini untuk menjadi AGI yang berhargaPertaruhan besar di mana laluan ini akan mendorong AI hari ini untuk menjadi AGI yang berhargaMay 05, 2025 am 11:08 AM

Mari kita meneroka jalan yang berpotensi untuk kecerdasan umum buatan (AGI). Analisis ini adalah sebahagian daripada lajur Forbes saya yang berterusan mengenai kemajuan AI, menyelidiki kerumitan mencapai AGI dan Superintelligence Buatan (ASI). (Lihat Seni Berkaitan

Adakah anda melatih chatbot anda, atau sebaliknya?Adakah anda melatih chatbot anda, atau sebaliknya?May 05, 2025 am 11:07 AM

Interaksi Komputer Manusia: Tarian Adaptasi yang halus Berinteraksi dengan chatbot AI adalah seperti mengambil bahagian dalam tarian pengaruh bersama yang halus. Soalan, respons, dan keutamaan anda secara beransur -ansur membentuk sistem untuk memenuhi keperluan anda dengan lebih baik. Model bahasa moden menyesuaikan diri dengan keutamaan pengguna melalui mekanisme maklum balas yang jelas dan pengiktirafan corak tersirat. Mereka mempelajari gaya komunikasi anda, ingat pilihan anda, dan secara beransur -ansur menyesuaikan respons mereka agar sesuai dengan harapan anda. Namun, ketika kami melatih rakan kongsi digital kami, sesuatu yang sama pentingnya berlaku dalam arah sebaliknya. Interaksi kami dengan sistem ini secara halus membentuk semula corak komunikasi kita sendiri, proses pemikiran, dan juga jangkaan perbualan interpersonal. Interaksi kami dengan sistem AI telah mula membentuk semula jangkaan interaksi interpersonal kami. Kami menyesuaikan diri dengan tindak balas segera,

California Taps AI ke Permit Pemulihan Wildfire CepatCalifornia Taps AI ke Permit Pemulihan Wildfire CepatMay 04, 2025 am 11:10 AM

AI menyelaraskan pemulihan kebakaran hutan yang membenarkan Firma teknologi Australia Archistar's AI Software, menggunakan pembelajaran mesin dan penglihatan komputer, mengautomasikan penilaian rancangan bangunan untuk mematuhi peraturan tempatan. Kepentingan pra-pengesahan ini

Apa yang kita boleh belajar dari kerajaan digital berkuasa AI EstoniaApa yang kita boleh belajar dari kerajaan digital berkuasa AI EstoniaMay 04, 2025 am 11:09 AM

Kerajaan Digital Estonia: Model untuk AS? AS berjuang dengan ketidakcekapan birokrasi, tetapi Estonia menawarkan alternatif yang menarik. Negara kecil ini mempunyai hampir 100% kerajaan yang berpusatkan rakyat yang dikuasai oleh AI. Ini bukan

Perancangan perkahwinan melalui ai generatifPerancangan perkahwinan melalui ai generatifMay 04, 2025 am 11:08 AM

Merancang perkahwinan adalah tugas yang monumental, selalunya menggembirakan walaupun pasangan yang paling teratur. Artikel ini, sebahagian daripada siri Forbes yang berterusan mengenai kesan AI (lihat pautan di sini), meneroka bagaimana AI generatif dapat merevolusikan perancangan perkahwinan. Perkahwinan pl

Apakah ejen AI pertahanan digital?Apakah ejen AI pertahanan digital?May 04, 2025 am 11:07 AM

Perniagaan semakin memanfaatkan ejen AI untuk jualan, sementara kerajaan menggunakannya untuk pelbagai tugas yang ditetapkan. Walau bagaimanapun, penyokong pengguna menyerlahkan keperluan bagi individu untuk memiliki ejen AI mereka sendiri sebagai pertahanan terhadap yang sering disasarkan

Panduan Pemimpin Perniagaan untuk Pengoptimuman Enjin Generatif (GEO)Panduan Pemimpin Perniagaan untuk Pengoptimuman Enjin Generatif (GEO)May 03, 2025 am 11:14 AM

Google mengetuai peralihan ini. Ciri "AI Gambaran Keseluruhan" sudah melayani lebih daripada satu bilion pengguna, memberikan jawapan lengkap sebelum ada yang mengklik pautan. [^2] Pemain lain juga mendapat tanah dengan cepat. Chatgpt, microsoft copilot, dan pe

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

SublimeText3 versi Inggeris

SublimeText3 versi Inggeris

Disyorkan: Versi Win, menyokong gesaan kod!

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

MantisBT

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.