찾다
기술 주변기기일체 포함Chitrarth-1 : Krutrim AI Labs의 다국어 VLM

인도의 AI 환경은 빠르게 발전하고 있으며, 상당한 발전과 혁신이 떠오르고 있습니다. Ola Group 회사 인 Krutrim AI Labs는이 성장의 핵심 플레이어로, 최근 획기적인 비전 언어 모델 (VLM) 인 Chitrarth-1을 발표했습니다. 인도의 다양한 언어 및 문화적 맥락을 위해 설계된 Chitrarth-1은 10 개의 주요 인도 언어와 영어를 지원하며 다국어 AI 솔루션에 대한 중요한 요구를 해결합니다. 이 기사는 Chitrarth-1과 인도의 AI 기능 확장에 대한 영향을 탐구합니다. 목차

chitrarth-1은 무엇입니까? Chitrarth-1 아키텍처 및 사양 훈련 데이터 및 방법론 1 단계 : 어댑터 사전 훈련

    2 단계 : 명령 튜닝
  • 성능 및 벤치 마크 에 액세스 chitrarth-1 chitrarth-1의 행동
  • 결론
    • Chitrarth-1은 무엇입니까?
    • Chitrarth-1 ( "Chitra"-이미지와 "Artha"-의미)는 고급 언어 및 비전 처리를 통합하는 7.5 억 개의 매개 변수 VLM입니다. 인도의 다양한 언어 적 요구를 제공하기 위해 지어진이 도시는 힌디어, 벵골어, 텔루구 어, 타밀어, 마라 티어, 구자라트티, 칸나다어, 말라 얄 람어, 오디아, 아삼 어 및 영어를 지원합니다. 이 모델은 "우리 나라, 국가, 시민들을 위해 AI를 개발하려는 Krutrim의 약속을 구현합니다. 풍부하고 다국어 데이터 세트를 사용하면 편견을 최소화하고 Indic Languages ​​및 English에서 강력한 성능을 보장하여 공평한 AI 액세스를 촉진합니다. Chitrarth-1에 대한 연구는 Neurips 및 Machine Translation에 관한 9 번째 회의를 포함한 주요 학술 저널에 발표되었습니다. Chitrarth-1 아키텍처 및 사양
    • Chitrarth-1은 Siglip (Siglip-SO400M-PATCH14-384) 모델을 기반으로 한 비전 인코더에 의해 향상된 기초로 Krutrim-7B LLM을 기초로 사용합니다. 주요 아키텍처 구성 요소는 다음과 같습니다
    • 이미지 기능 추출을위한 미리 훈련 된 Siglip Vision Encoder LLM의 토큰 공간에 이미지 기능을 제공하기위한 훈련 가능한 선형 매핑 레이어. 광학적 인 성능 향상을위한 명령어를 따르는 이미지 텍스트 데이터 세트로 미세 조정
    • 훈련 데이터 및 방법론
    • Chitrarth-1의 훈련은 광대 한 다국어 데이터 세트를 사용하여 두 단계를 포함했습니다.
    • 1 단계 : 어댑터 사전 훈련

        오픈 소스 모델을 사용하여 여러 인디언 언어로 변환 된 다양한 데이터 세트에서 미리 훈련되었습니다. 는 공평한 성능을 보장하기 위해 영어 및 인디언의 균형 잡힌 표현을 유지했습니다. 단일 언어에 대한 편견을 피하고 효율성과 견고성을 최적화하도록 설계되었습니다.
      • 2 단계 : 명령 튜닝
      • 복잡한 명령 데이터 세트에서 미세 조정하여 멀티 모달 추론 기능을 향상시킵니다. 는 영어 기반의 명령 조정 데이터 세트와 다국어 번역을 활용했습니다 는 다양한 인도 이미지 (성격, 기념물, 예술 작품, 요리)를 특징으로하는 비전 언어 데이터 세트를 포함했습니다. 균형 도메인 표현을위한 고품질 독점 영어 텍스트 데이터.
      • 성능 및 벤치 마크

      Chitrarth-1은 Idefics 2 (7b) 및 Palo 7B와 같은 주요 VLM에 대해 엄격하게 테스트되었으며 TextVQA 및 Vizwiz와 같은 작업에 대한 경쟁력을 유지하면서 다양한 벤치 마크에서 지속적으로 성능이 우수합니다. 또한 주요 지표에서 LLAMA 3.2 11B 비전 지시를 능가합니다. Krutrim은 세 가지 작업에 걸쳐 10 개의 자원 부족 인디 언어에 대한 새로운 평가 제품군 인 Bharatbench를 소개하여 향후 연구를위한 기준을 설정하고 Chitrarth-1의 언어를 효과적으로 처리 할 수있는 능력을 강조했습니다. 샘플 Bharatbench 결과는 다음과 같습니다 자세한 내용은 여기를 클릭하십시오 chitrarth-1

      액세스

      Chitrarth-1은 다음을 통해 액세스 할 수 있습니다 포옹 얼굴 :

      직접 사용 또는 미세 조정. (방문하려면 여기를 클릭하십시오) github : (원본 기사에 제공된 코드) Krutrim Cloud : (탐색하려면 여기를 클릭하십시오)

      chitrarth-1의 행동
        Chitrarth-1의 기능의 예에는 이미지 분석, 이미지 캡션 생성 및 UI/UX 화면 분석 (원본 기사에 제공된 이미지)이 포함됩니다.
      • 결론
      • OLA 그룹의 부서 인 Krutrim AI Labs는 AI 컴퓨팅의 미래를 구축하기 위해 노력하고 있습니다. Chitrarth-1 및 GPU와 같은 기타 제품을 서비스, AI 스튜디오 등으로, 그들은 포용적이고 문화적으로 민감한 AI에 대한 새로운 표준을 구축하여보다 공평한 기술 환경을 조성하고 있습니다.

위 내용은 Chitrarth-1 : Krutrim AI Labs의 다국어 VLM의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
98% 정확한 것을 들어 본 적이없는 Deepfake 탐지기98% 정확한 것을 들어 본 적이없는 Deepfake 탐지기May 03, 2025 am 11:10 AM

이 긴급하고 불안정한 트렌드를 해결하기 위해 2025 년 2 월 Tem Journal의 동료 검토 기사는 기술 심해가 현재 어디에 있는지에 대한 가장 명확하고 데이터 중심 평가 중 하나를 제공합니다. 연구원

양자 재능 전쟁 : 숨겨진 위기 위협 기술 기술양자 재능 전쟁 : 숨겨진 위기 위협 기술 기술May 03, 2025 am 11:09 AM

신약을 공식화하는 데 걸리는 시간을 크게 줄이는 것부터 녹색 에너지 생성에 이르기까지 기업이 새로운 지평을 열 수있는 큰 기회가있을 것입니다. 그래도 큰 문제가 있습니다. 기술을 가진 사람들이 심각하게 부족합니다.

프로토 타입 :이 박테리아는 전기를 생성 할 수 있습니다프로토 타입 :이 박테리아는 전기를 생성 할 수 있습니다May 03, 2025 am 11:08 AM

몇 년 전, 과학자들은 특정 종류의 박테리아가 산소를 섭취하기보다는 전기를 생성하여 호흡하는 것처럼 보이지만, 그렇게 한 방법은 미스터리였습니다. 저널 Cell에 발표 된 새로운 연구는 이런 일이 어떻게 발생하는지 식별합니다 : Microb

AI 및 사이버 보안 : 새로운 행정부의 100 일 계산AI 및 사이버 보안 : 새로운 행정부의 100 일 계산May 03, 2025 am 11:07 AM

이번 주 RSAC 2025 컨퍼런스에서 Snyk은 All-Star 라인업을 특징으로하는 AI, AI, Policy & Cybersecurity Collide "라는 제목의 적시 패널을 주최했습니다. Jen Easterly, 전 CISA 디렉터; Nicole Perlroth, 전 기자이자 Partne

AI 게임 개발AI 게임 개발May 02, 2025 am 11:17 AM

격변 게임 : AI 에이전트와의 게임 개발 혁명 Blizzard 및 Obsidian과 같은 업계 대기업의 재향 군인으로 구성된 게임 개발 스튜디오 인 Upheaval은 혁신적인 AI 구동 Platfor로 게임 제작에 혁명을 일으킬 준비가되어 있습니다.

Uber는 Robotaxi 상점이되기를 원합니다. 제공자가 그들을 허락할까요?Uber는 Robotaxi 상점이되기를 원합니다. 제공자가 그들을 허락할까요?May 02, 2025 am 11:16 AM

Uber의 Robotaxi 전략 : 자율 주행 차량을위한 승차원 생태계 최근 Curbivore 컨퍼런스에서 Uber의 Richard Willder는 Robotaxi 제공 업체를위한 승마 플랫폼이되기위한 전략을 공개했습니다. 그들의 지배적 인 위치를 활용합니다

비디오 게임을하는 AI 요원은 미래의 로봇을 변화시킬 것입니다비디오 게임을하는 AI 요원은 미래의 로봇을 변화시킬 것입니다May 02, 2025 am 11:15 AM

비디오 게임은 특히 자율적 인 에이전트 및 실제 로봇의 개발에서 최첨단 AI 연구를위한 귀중한 테스트 근거로 입증되며, 인공 일반 정보 (AGI)에 대한 탐구에 잠재적으로 기여할 수 있습니다. 에이

스타트 업 산업 단지, VC 3.0 및 James Currier 's Manifesto스타트 업 산업 단지, VC 3.0 및 James Currier 's ManifestoMay 02, 2025 am 11:14 AM

진화하는 벤처 캐피탈 환경의 영향은 미디어, 재무 보고서 및 일상적인 대화에서 분명합니다. 그러나 투자자, 신생 기업 및 자금에 대한 구체적인 결과는 종종 간과됩니다. 벤처 캐피탈 3.0 : 패러다임

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

맨티스BT

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

SecList

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구