印度的AI景观正在迅速发展,并有重大的进步和创新。 OLA集团公司Krutrim AI Labs是这一增长的关键参与者,最近揭示了Chitrarth-1,这是一种开创性的视觉语言模型(VLM)。 Chitrarth-1专为印度多样化的语言和文化背景而设计,支持十种主要的印度语言以及英语,这是针对多语言AI解决方案的关键需求。本文深入研究了Chitrarth-1及其对印度不断扩展的AI功能的影响。 目录的
表什么是chitrarth-1?
- > chitrarth-1体系结构和规格
- 培训数据和方法
- 阶段1:适配器预训练
- >阶段2:指令调整
- >访问Chitrarth-1
- > Chitrarth-1在Action
中 结论 - 什么是chitrarth-1?
> chitrarth-1(结合“ chitra” - 图像和“ artha” - 含义)是一个7.5亿个参数VLM,集成了先进的语言和视觉处理。 它为满足印度多种语言需求而建造的支持印地语,孟加拉语,泰卢固语,泰米尔语,马拉地语,古吉拉特语,卡纳达语,马拉雅拉姆语,奥迪亚,阿萨姆语和英语。 该模型体现了克鲁特里姆(Krutrim)对“为我们的国家,国家和我们的公民开发AI的承诺”。 它使用丰富的多语言数据集可以最大程度地减少偏见,并确保跨指示语言和英语的稳健性能,从而促进公平的AI访问。 Chitrarth-1的研究发表在领先的学术期刊上,包括Neurips和第九次机器翻译会议。
>
> chitrarth-1利用krutrim-7b llm作为基础,通过基于siglip(siglip-so400m-patch14-384)模型的视觉编码器增强。 关键建筑组件包括:
>用于图像特征提取的预训练的siglip视觉编码器。>可训练的线性映射层,以将项目图像特征到LLM的令牌空间中。
- 培训数据和方法 Chitrarth-1的培训涉及两个阶段,使用了庞大的多语言数据集:
阶段1:适配器预训练
- 在使用开源模型转换为多种指示语言的不同数据集上进行了预先训练。
- 维持英语和指示语言的平衡表示,以确保公平的表现。 旨在避免对任何单一语言的偏见,优化效率和鲁棒性。
- >
阶段2:指令调整
在复杂的指令数据集上进行了微调,以增强多模式推理功能。- >利用了基于英语的指令调查数据集及其多语言翻译。 >
- 包括一个视觉语言数据集,其中包含不同的印度图像(个性,纪念碑,艺术品,美食)。
- 合并平衡域表示的高质量专有英语文本数据。
- 性能和基准测试
Chitrarth-1对IdeFics 2(7b)和Palo 7b等领先的VLM进行了严格的测试,在各种基准上表现不佳,同时在诸如TextVQA和Vizwiz等任务上保持竞争力。它还超过了关键指标中的Llama 3.2 11B视觉指导。 克鲁特里姆(Krutrim)推出了Bharatbench,这是一个新的评估套件,用于在三个任务中使用十种资源不足的指示语言,为将来的研究建立了基线,并突出了Chitrarth-1有效地处理这些语言的能力。 样本Bharatbench结果如下所示:
有关更多详细信息,请单击此处。
>访问Chitrarth-1
> Chitrarth-1可以通过以下方式访问:
- >拥抱面:直接使用或微调。 (单击此处访问)
- github:(原始文章中提供的代码) >
- krutrim云:(单击此处探索) >
> Chitrarth-1在Action
结论
OLA集团的一个部门> krutrim AI实验室致力于建立AI计算的未来。 以Chitrarth-1以及其他产品(例如GPU)作为服务,AI工作室等等,他们正在建立一个新的包容性,具有文化敏感的AI的标准,从而促进了更公平的技术景观。
以上是Chitrarth-1:Krutrim AI实验室的多语言VLM的详细内容。更多信息请关注PHP中文网其他相关文章!

Google正在领导这一转变。它的“ AI概述”功能已经为10亿用户提供服务,在任何人单击链接之前提供完整的答案。[^2] 其他球员也正在迅速获得地面。 Chatgpt,Microsoft Copilot和PE

2022年,他创立了社会工程防御初创公司Doppel,以此做到这一点。随着网络犯罪分子越来越高级的AI模型来涡轮增压,Doppel的AI系统帮助企业对其进行了大规模的对抗 - 更快,更快,

瞧,通过与合适的世界模型进行交互,可以实质上提高生成的AI和LLM。 让我们来谈谈。 对创新AI突破的这种分析是我正在进行的《福布斯》列的最新覆盖范围的一部分,包括

劳动节2050年。全国范围内的公园充满了享受传统烧烤的家庭,而怀旧游行则穿过城市街道。然而,庆祝活动现在具有像博物馆般的品质 - 历史重演而不是纪念C

为了帮助解决这一紧急且令人不安的趋势,在2025年2月的TEM期刊上进行了同行评审的文章,提供了有关该技术深击目前面对的最清晰,数据驱动的评估之一。 研究员

从大大减少制定新药所需的时间到创造更绿色的能源,企业将有巨大的机会打破新的地面。 不过,有一个很大的问题:严重缺乏技能的人

几年前,科学家发现某些类型的细菌似乎通过发电而不是吸收氧气而呼吸,但是它们是如何做到的,这是一个谜。一项发表在“杂志”杂志上的新研究确定了这种情况的发生方式:Microb

在本周的RSAC 2025会议上,Snyk举办了一个及时的小组,标题为“前100天:AI,Policy&Cybersecurity Collide如何相撞”,其中包括全明星阵容:前CISA董事Jen Easterly;妮可·珀洛斯(Nicole Perlroth),前记者和帕特纳(Partne)


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

Atom编辑器mac版下载
最流行的的开源编辑器

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 Linux新版
SublimeText3 Linux最新版

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境