印度的AI景觀正在迅速發展,並有重大的進步和創新。 OLA集團公司Krutrim AI Labs是這一增長的關鍵參與者,最近揭示了Chitrarth-1,這是一種開創性的視覺語言模型(VLM)。 Chitrarth-1專為印度多樣化的語言和文化背景而設計,支持十種主要的印度語言以及英語,這是針對多語言AI解決方案的關鍵需求。本文深入研究了Chitrarth-1及其對印度不斷擴展的AI功能的影響。 目錄的
表什麼是chitrarth-1?
- > chitrarth-1體系結構和規格
- 培訓數據和方法
- 階段1:適配器預訓練
- >階段2:指令調整
- >訪問Chitrarth-1
- > Chitrarth-1在Action
中 結論 - 什麼是chitrarth-1?
> chitrarth-1(結合“ chitra” - 圖像和“ artha” - 含義)是一個7.5億個參數VLM,集成了先進的語言和視覺處理。 它為滿足印度多種語言需求而建造的支持印地語,孟加拉語,泰盧固語,泰米爾語,馬拉地語,古吉拉特語,卡納達語,馬拉雅拉姆語,奧迪亞,阿薩姆語和英語。 該模型體現了克魯特里姆(Krutrim)對“為我們的國家,國家和我們的公民開發AI的承諾”。 它使用豐富的多語言數據集可以最大程度地減少偏見,並確保跨指示語言和英語的穩健性能,從而促進公平的AI訪問。 Chitrarth-1的研究發表在領先的學術期刊上,包括Neurips和第九次機器翻譯會議。
>
> chitrarth-1利用krutrim-7b llm作為基礎,通過基於siglip(siglip-so400m-patch14-384)模型的視覺編碼器增強。 關鍵建築組件包括:
>用於圖像特徵提取的預訓練的siglip視覺編碼器。>可訓練的線性映射層,以將項目圖像特徵到LLM的令牌空間中。
- 培訓數據和方法 Chitrarth-1的培訓涉及兩個階段,使用了龐大的多語言數據集:
階段1:適配器預訓練
- 在使用開源模型轉換為多種指示語言的不同數據集上進行了預先訓練。
- 維持英語和指示語言的平衡表示,以確保公平的表現。 旨在避免對任何單一語言的偏見,優化效率和魯棒性。
- >
階段2:指令調整
在復雜的指令數據集上進行了微調,以增強多模式推理功能。- >利用了基於英語的指令調查數據集及其多語言翻譯。 >
- 包括一個視覺語言數據集,其中包含不同的印度圖像(個性,紀念碑,藝術品,美食)。
- 合併平衡域表示的高質量專有英語文本數據。
- 性能和基準測試
Chitrarth-1對IdeFics 2(7b)和Palo 7b等領先的VLM進行了嚴格的測試,在各種基准上表現不佳,同時在諸如TextVQA和Vizwiz等任務上保持競爭力。它還超過了關鍵指標中的Llama 3.2 11B視覺指導。 克魯特里姆(Krutrim)推出了Bharatbench,這是一個新的評估套件,用於在三個任務中使用十種資源不足的指示語言,為將來的研究建立了基線,並突出了Chitrarth-1有效地處理這些語言的能力。 樣本Bharatbench結果如下所示:
有關更多詳細信息,請單擊此處。
>訪問Chitrarth-1
> Chitrarth-1可以通過以下方式訪問:
- >擁抱面:直接使用或微調。 (單擊此處訪問)
- github:(原始文章中提供的代碼) >
- krutrim雲:(單擊此處探索) >
> Chitrarth-1在Action
結論
OLA集團的一個部門> krutrim AI實驗室致力於建立AI計算的未來。 以Chitrarth-1以及其他產品(例如GPU)作為服務,AI工作室等等,他們正在建立一個新的包容性,具有文化敏感的AI的標準,從而促進了更公平的技術景觀。
以上是Chitrarth-1:Krutrim AI實驗室的多語言VLM的詳細內容。更多資訊請關注PHP中文網其他相關文章!

對於那些可能是我專欄新手的人,我廣泛探討了AI的最新進展,包括體現AI,AI推理,AI中的高科技突破,及時的工程,AI培訓,AI,AI RE RE等主題

歐洲雄心勃勃的AI大陸行動計劃旨在將歐盟確立為人工智能的全球領導者。 一個關鍵要素是建立了AI Gigafactories網絡,每個網絡都有大約100,000個高級AI芯片 - 2倍的自動化合物的四倍

微軟對AI代理申請的統一方法:企業的明顯勝利 微軟最近公告的新AI代理能力清晰而統一的演講給人留下了深刻的印象。 與許多技術公告陷入困境不同

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

IBM的Z17大型機:集成AI用於增強業務運營 上個月,在IBM的紐約總部,我收到了Z17功能的預覽。 以Z16的成功為基礎(於2022年推出並證明持續的收入增長

解鎖不可動搖的信心,消除了對外部驗證的需求! 這五個CHATGPT提示將指導您完全自力更生和自我感知的變革轉變。 只需複制,粘貼和自定義包圍

人工智能安全與研究公司 Anthropic 最近的一項[研究]開始揭示這些複雜過程的真相,展現出一種令人不安地與我們自身認知領域相似的複雜性。自然智能和人工智能可能比我們想像的更相似。 窺探內部:Anthropic 可解釋性研究 Anthropic 進行的研究的新發現代表了機制可解釋性領域的重大進展,該領域旨在反向工程 AI 的內部計算——不僅僅觀察 AI 做了什麼,而是理解它在人工神經元層面如何做到這一點。 想像一下,試圖通過繪製當有人看到特定物體或思考特定想法時哪些神經元會放電來理解大腦。 A

高通的龍翼:企業和基礎設施的戰略飛躍 高通公司通過其新的Dragonwing品牌在全球範圍內積極擴展其範圍,以全球為目標。 這不僅僅是雷布蘭


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

SublimeText3漢化版
中文版,非常好用

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。