Rumah >Peranti teknologi >AI >Chitrarth-1: VLM berbilang bahasa oleh Makmal Krutrim AI
Landskap AI India berkembang pesat, dengan kemajuan dan inovasi yang ketara muncul. Krutrim AI Labs, sebuah syarikat kumpulan Ola, adalah pemain utama dalam pertumbuhan ini, baru-baru ini melancarkan Chitrarth-1, model bahasa penglihatan yang terobosan (VLM). Direka untuk konteks linguistik dan budaya India yang pelbagai, Chitrarth-1 menyokong sepuluh bahasa India utama ditambah bahasa Inggeris, menangani keperluan kritikal untuk penyelesaian AI berbilang bahasa. Artikel ini menyelidiki Chitrarth-1 dan implikasinya untuk keupayaan AI yang berkembang di India.
Jadual Kandungan
Apa itu Chitrarth-1?
Chitrarth-1 (menggabungkan "chitra"-imej dan "artha"-makna) adalah parameter 7.5 bilion VLM yang mengintegrasikan bahasa lanjutan dan pemprosesan penglihatan. Dibina untuk memenuhi keperluan linguistik India yang pelbagai, ia menyokong Hindi, Bengali, Telugu, Tamil, Marathi, Gujarati, Kannada, Malayalam, Odia, Assam, dan Inggeris. Model ini merangkumi komitmen Krutrim untuk membangunkan AI "untuk negara kita, negara kita, dan bagi warganegara kita." Penggunaan dataset yang kaya dan berbilang bahasa meminimumkan kecenderungan dan memastikan prestasi yang mantap merentasi bahasa indik dan bahasa Inggeris, mempromosikan akses AI yang saksama. Penyelidikan mengenai Chitrarth-1 diterbitkan dalam jurnal akademik terkemuka, termasuk Neurips dan Persidangan Kesembilan mengenai Terjemahan Mesin.
Chitrarth-1 menggunakan Krutrim-7b LLM sebagai asasnya, dipertingkatkan oleh pengekod penglihatan berdasarkan model SIGLIP (SIGLIP-SO400M-PATCH14-384). Komponen seni bina utama termasuk:
pengekod visi siglip pra-terlatih untuk pengekstrakan ciri imej.
Latihan Chitrarth-1 melibatkan dua fasa menggunakan dataset yang luas dan berbilang bahasa:
Fasa 1: Penyesuai Pra-Training Fasa 2: Penalaan Arahan Prestasi dan penanda aras
Lapisan pemetaan linear yang boleh dilatih untuk ciri -ciri imej projek ke ruang token LLM.
Untuk maklumat lanjut, klik di sini.
Mengakses Chitrarth-1
Chitrarth-1 boleh diakses melalui:
Contoh keupayaan Chitrarth-1 termasuk analisis imej, generasi kapsyen imej, dan analisis skrin UI/UX (imej yang disediakan dalam artikel asal).
Krutrim AI Labs, pembahagian kumpulan OLA, komited untuk membina masa depan pengkomputeran AI. Dengan Chitrarth-1, dan persembahan lain seperti GPU sebagai perkhidmatan, AI Studio, dan banyak lagi, mereka mewujudkan standard baru untuk AI yang sensitif, budaya, memupuk landskap teknologi yang lebih adil.
Atas ialah kandungan terperinci Chitrarth-1: VLM berbilang bahasa oleh Makmal Krutrim AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!