Heim >Technologie-Peripheriegeräte >KI >Chitrarth-1: Ein mehrsprachiger VLM von KruTrim AI Labs
Die KI -Landschaft in Indien entwickelt sich schnell weiter, wobei erhebliche Fortschritte und Innovationen auftauchen. KruTrim Ai Labs, ein Unternehmen der OLA-Gruppe, ist ein wichtiger Akteur in diesem Wachstum und enthüllt kürzlich Chitrarth-1, ein bahnbrechendes Vision-Sprachmodell (VLM). Chitrarth-1 wurde für den vielfältigen sprachlichen und kulturellen Kontext Indiens entwickelt und unterstützt zehn wichtige indische Sprachen und Englisch und befasst sich mit einem kritischen Bedarf an mehrsprachigen KI-Lösungen. Dieser Artikel befasst sich mit Chitrarth-1 und seinen Auswirkungen auf die wachsenden KI-Fähigkeiten Indiens.
Inhaltsverzeichnis
Was ist Chitrarth-1?
Chitrarth-1 (kombiniert "Chitra"-Image und "Artha"-Bedeutung) ist ein 7,5-Milliarden-Parameter-VLM, das erweiterte Sprach- und Vision-Verarbeitung integriert. Es wurde gebaut, um Indiens vielfältigen sprachlichen Bedürfnissen zu erfüllen, und unterstützt Hindi, Bengali, Telugu, Tamil, Marathi, Gujarati, Kannada, Malayalam, Odia, Assamese und English. Dieses Modell verkörpert KruTrims Engagement für die Entwicklung von KI "für unser Land, unseres Landes und für unsere Bürger". Die Verwendung eines reichhaltigen, mehrsprachigen Datensatzes minimiert die Verzerrung und gewährleistet eine robuste Leistung für indic -Sprachen und Englisch, wodurch der gerechte KI -Zugriff fördert. Die Forschung zu Chitrarth-1 wird in führenden akademischen Zeitschriften veröffentlicht, einschließlich Neurips und der neunten Konferenz über maschinelle Übersetzung.
Chitrarth-1 Architektur und Spezifikationen
Chitrarth-1 verwendet das KruTRIM-7B LLM als Fundament, das durch einen Sehcodierer basierend auf dem Modell Siglip (Siglip-SO400M-Patch14-384) verbessert wird. Zu den wichtigsten architektonischen Komponenten gehören:
Trainingsdaten und Methodik
Chitrarth-1s Training umfasste zwei Phasen mit einem riesigen, mehrsprachigen Datensatz:
Phase 1: Adapter vor der Training
Phase 2: Anweisungsabstimmung
Leistung und Benchmarks
Chitrarth-1 wurde streng gegen führende VLMs wie IDEFICS 2 (7B) und Palo 7B getestet, wodurch sie an verschiedenen Benchmarks konsequent übertroffen werden und gleichzeitig die Wettbewerbsfähigkeit bei Aufgaben wie TextVQA und Vizwiz aufrechterhalten werden. Es übertrifft auch die Lama 3.2 11b Vision in wichtigen Metriken. KruTrim führte Bharatbench vor, eine neue Bewertungssuite für zehn unterressende Indic-Sprachen in drei Aufgaben, die eine Grundlinie für zukünftige Forschungen festlegte und die Fähigkeit von Chitrarth-1 hervorhebt, diese Sprachen effektiv zu bewältigen. Probe Bharatbench -Ergebnisse sind unten gezeigt:
Language | POPE | LLaVA-Bench | MMVet |
---|---|---|---|
Telugu | 79.9 | 54.8 | 43.76 |
Hindi | 78.68 | 51.5 | 38.85 |
Bengali | 83.24 | 53.7 | 33.24 |
Malayalam | 85.29 | 55.5 | 25.36 |
Kannada | 85.52 | 58.1 | 46.19 |
English | 87.63 | 67.9 | 30.49 |
Für weitere Details klicken Sie hier.
Zugriff auf Chitrarth-1
Chitrarth-1 ist zugänglich über:
Chitrarth-1 in Aktion
Beispiele für die Funktionen von Chitrarth-1 umfassen Bildanalyse, Bildunterschriftengenerierung und UI/UX-Bildschirmanalyse (Bilder im Originalartikel).
Schlussfolgerung
KruTrim AI Labs, eine Abteilung der OLA -Gruppe, ist bestrebt, die Zukunft des AI -Computing aufzubauen. Mit Chitrarth-1 und anderen Angeboten wie GPU als Service, AI-Studio und vielem mehr stellen sie einen neuen Standard für integrative, kulturell sensible KI fest, die eine gerechtere technologische Landschaft fördert.
Das obige ist der detaillierte Inhalt vonChitrarth-1: Ein mehrsprachiger VLM von KruTrim AI Labs. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!