印度的AI景觀正在迅速發展,並有重大的進步和創新。 OLA集團公司Krutrim AI Labs是這一增長的關鍵參與者,最近揭示了Chitrarth-1,這是一種開創性的視覺語言模型(VLM)。 Chitrarth-1專為印度多樣化的語言和文化背景而設計,支持十種主要的印度語言以及英語,這是針對多語言AI解決方案的關鍵需求。本文深入研究了Chitrarth-1及其對印度不斷擴展的AI功能的影響。 目錄的
表什麼是chitrarth-1?
- > chitrarth-1體系結構和規格
- 培訓數據和方法
- 階段1:適配器預訓練
- >階段2:指令調整
- >訪問Chitrarth-1
- > Chitrarth-1在Action
中 結論 - 什麼是chitrarth-1?
> chitrarth-1(結合“ chitra” - 圖像和“ artha” - 含義)是一個7.5億個參數VLM,集成了先進的語言和視覺處理。 它為滿足印度多種語言需求而建造的支持印地語,孟加拉語,泰盧固語,泰米爾語,馬拉地語,古吉拉特語,卡納達語,馬拉雅拉姆語,奧迪亞,阿薩姆語和英語。 該模型體現了克魯特里姆(Krutrim)對“為我們的國家,國家和我們的公民開發AI的承諾”。 它使用豐富的多語言數據集可以最大程度地減少偏見,並確保跨指示語言和英語的穩健性能,從而促進公平的AI訪問。 Chitrarth-1的研究發表在領先的學術期刊上,包括Neurips和第九次機器翻譯會議。
>
> chitrarth-1利用krutrim-7b llm作為基礎,通過基於siglip(siglip-so400m-patch14-384)模型的視覺編碼器增強。 關鍵建築組件包括:
>用於圖像特徵提取的預訓練的siglip視覺編碼器。>可訓練的線性映射層,以將項目圖像特徵到LLM的令牌空間中。
- 培訓數據和方法 Chitrarth-1的培訓涉及兩個階段,使用了龐大的多語言數據集:
階段1:適配器預訓練
- 在使用開源模型轉換為多種指示語言的不同數據集上進行了預先訓練。
- 維持英語和指示語言的平衡表示,以確保公平的表現。 旨在避免對任何單一語言的偏見,優化效率和魯棒性。
- >
階段2:指令調整
在復雜的指令數據集上進行了微調,以增強多模式推理功能。- >利用了基於英語的指令調查數據集及其多語言翻譯。 >
- 包括一個視覺語言數據集,其中包含不同的印度圖像(個性,紀念碑,藝術品,美食)。
- 合併平衡域表示的高質量專有英語文本數據。
- 性能和基準測試
Chitrarth-1對IdeFics 2(7b)和Palo 7b等領先的VLM進行了嚴格的測試,在各種基准上表現不佳,同時在諸如TextVQA和Vizwiz等任務上保持競爭力。它還超過了關鍵指標中的Llama 3.2 11B視覺指導。 克魯特里姆(Krutrim)推出了Bharatbench,這是一個新的評估套件,用於在三個任務中使用十種資源不足的指示語言,為將來的研究建立了基線,並突出了Chitrarth-1有效地處理這些語言的能力。 樣本Bharatbench結果如下所示:
有關更多詳細信息,請單擊此處。
>訪問Chitrarth-1
> Chitrarth-1可以通過以下方式訪問:
- >擁抱面:直接使用或微調。 (單擊此處訪問)
- github:(原始文章中提供的代碼) >
- krutrim雲:(單擊此處探索) >
> Chitrarth-1在Action
結論
OLA集團的一個部門> krutrim AI實驗室致力於建立AI計算的未來。 以Chitrarth-1以及其他產品(例如GPU)作為服務,AI工作室等等,他們正在建立一個新的包容性,具有文化敏感的AI的標準,從而促進了更公平的技術景觀。
以上是Chitrarth-1:Krutrim AI實驗室的多語言VLM的詳細內容。更多資訊請關注PHP中文網其他相關文章!

AI簡化了野火恢復允許 澳大利亞科技公司Archistar的AI軟件,利用機器學習和計算機視覺,可以自動評估建築計劃以符合當地法規。這種驗證前具有重要意義

愛沙尼亞的數字政府:美國的典範? 美國在官僚主義的效率低下方面掙扎,但愛沙尼亞提供了令人信服的選擇。 這個小國擁有由AI支持的近100%數字化的,以公民為中心的政府。 這不是

計劃婚禮是一項艱鉅的任務,即使是最有條理的夫婦,也常常壓倒了婚禮。 本文是關於AI影響的持續福布斯系列的一部分(請參閱此處的鏈接),探討了生成AI如何徹底改變婚禮計劃。 婚禮上

企業越來越多地利用AI代理商進行銷售,而政府則將其用於各種既定任務。 但是,消費者倡導強調個人需要擁有自己的AI代理人作為對經常定位的辯護的必要性

Google正在領導這一轉變。它的“ AI概述”功能已經為10億用戶提供服務,在任何人單擊鏈接之前提供完整的答案。 [^2] 其他球員也正在迅速獲得地面。 Chatgpt,Microsoft Copilot和PE

2022年,他創立了社會工程防禦初創公司Doppel,以此做到這一點。隨著網絡犯罪分子越來越高級的AI模型來渦輪增壓,Doppel的AI系統幫助企業對其進行了大規模的對抗 - 更快,更快,

瞧,通過與合適的世界模型進行交互,可以實質上提高生成的AI和LLM。 讓我們來談談。 對創新AI突破的這種分析是我正在進行的《福布斯》列的最新覆蓋範圍的一部分,包括

勞動節2050年。全國范圍內的公園充滿了享受傳統燒烤的家庭,而懷舊遊行則穿過城市街道。然而,慶祝活動現在具有像博物館般的品質 - 歷史重演而不是紀念C


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

WebStorm Mac版
好用的JavaScript開發工具