Baichuan Intelligent는 Baichuan-13B AI 모델을 출시하며 '130억 개의 매개변수가 오픈 소스이며 상업적으로 사용될 수 있다'고 주장했습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

Baichuan Intelligent는 Baichuan-13B AI 모델을 출시하며 '130억 개의 매개변수가 오픈 소스이며 상업적으로 사용될 수 있다'고 주장했습니다.

王林

Jul 19, 2023 pm 08:37 PM

IT Home은 7월 11일 Wang Xiaochuan의 자회사인 Baichuan Intelligence가 오늘 "130억 매개변수 오픈 소스 및 상용화 가능"으로 알려진 Baichuan-13B 대형 모델을 출시했다고 보도했습니다.

百川智能发布Baichuan-13B AI模型，号称“130亿参数开源可商用”

▲ 사진 출처 Baichuang-13B GitHub 페이지

공식 소개에 따르면 Baichuan-13B는 Baichuan-7B 이후 Baichuan Intelligence가 개발한 130억 개의 매개변수를 포함하는 오픈소스 상용 대규모 언어 모델입니다. 중국어와 중국어 모두에서 동일한 크기의 모델 중에서 가장 좋은 결과를 얻었습니다. 영어 벤치마크. 이 릴리스에는 사전 훈련(Baichuan-13B-Base)과 정렬(Baichuan-13B-Chat)의 두 가지 버전이 포함되어 있습니다.

百川智能发布Baichuan-13B AI模型，号称“130亿参数开源可商用”

▲ 사진 출처 Baichuang-13B GitHub 페이지

바이촨-13B는 다음과 같은 특징을 가지고 있다고 공식적으로 주장했습니다:

더 큰 크기, 더 많은 데이터: Baichuan-13B는 Baichuan-7B를 기반으로 매개변수 수를 130억 개로 더욱 확장했으며 고품질 코퍼스에서 1.4조 개의 토큰을 훈련하여 LLaMA-13B를 40% 초과했습니다. 13B 크기에서 가장 많은 양의 학습 데이터를 보유한 모델입니다. 중국어 및 영어 이중 언어를 지원하고 ALiBi 위치 인코딩을 사용하며 컨텍스트 창 길이는 4096입니다.

오픈 소스 사전 훈련 및 정렬 모델 동시: 사전 훈련 모델은 개발자를 위한 "기반"인 반면, 일반 사용자의 대다수는 대화 기능이 있는 정렬 모델에 대한 더 강한 요구를 가지고 있습니다. 따라서 이 프로젝트에는 강력한 대화 기능을 갖춘 정렬 모델(Baichuan-13B-Chat)도 있으며, 즉시 사용할 수 있고 몇 줄의 코드로 쉽게 배포할 수 있습니다.

보다 효율적인 추론: 더 광범위한 사용자의 사용을 지원하기 위해 프로젝트는 int8 및 int4의 양자화된 버전도 오픈 소스로 제공했습니다. 효과 손실이 거의 없으며 NVIDIA RTX3090과 같은 소비자급 그래픽 카드에 배포할 수 있습니다.

오픈 소스, 상업용 무료: Baichuan-13B는 학술 연구에 완전히 개방되어 있을 뿐만 아니라 개발자도 이메일을 통해 신청하고 공식 상업용 라이선스를 취득한 후 무료로 사용할 수 있습니다.

현재 해당 모델은 HuggingFace, GitHub, Model Scope에 공개되어 있습니다. 관심 있는 IT Home 친구들은 가서 자세히 알아볼 수 있습니다.

위 내용은 Baichuan Intelligent는 Baichuan-13B AI 모델을 출시하며 '130억 개의 매개변수가 오픈 소스이며 상업적으로 사용될 수 있다'고 주장했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 搜狐에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

Dagster와 데이터 품질 검사 자동화Apr 11, 2025 am 11:44 AM

데이터 품질 보증 : Dagster로 점검 자동화 및 큰 기대치 데이터 품질이 높다는 것은 데이터 중심 비즈니스에 중요합니다. 데이터 볼륨 및 소스가 증가함에 따라 수동 품질 관리는 비효율적이며 오류가 발생하기 쉽습니다.

메인 프레임은 AI 시대에 역할을합니까?Apr 11, 2025 am 11:42 AM

메인 프레임 : AI 혁명의 이름없는 영웅 서버는 일반 목적 애플리케이션 및 여러 클라이언트를 처리하는 데 탁월하지만 메인 프레임은 대량의 미션 크리티컬 작업을 위해 구축됩니다. 이 강력한 시스템은 자주 무거움에서 발견됩니다

비즈니스에 적합한 LLM을 선택하는 방법은 무엇입니까? - 분석 VidhyaApr 11, 2025 am 11:37 AM

비즈니스에 적합한 대형 언어 모델 (LLM) 선택 : 포괄적 인 가이드 GPT-4O, LLAMA 및 Claude와 같은 LLM의 빠른 확산은 비즈니스에 중요한 도전과 관련하여 특정 요구에 대한 최적의 모델을 선택합니다.

AI 50 2025 : AI 에이전트는 채팅을 넘어갑니다Apr 11, 2025 am 11:33 AM

2025 : AI는 질문에 대한 답변을 넘어 작업 완료로 이동합니다 인공 지능이 새로운 시대에 들어가고 있습니다. 전년도 AI는 주로 쿼리에 응답하고 컨텐츠를 생성하는 데 주로 초점을 맞추었지만 2025 년은 AIC Activel 로의 큰 전환을 기록했습니다.

자동화 법칙, NTT 연구 세부 사항 'AI의 물리학'그룹Apr 11, 2025 am 11:32 AM

AI 안전을 보장하려면 강력한 가드 레일을 구축하고 편견 및 환각이없는 설명 가능한 AI 서비스를 개발해야합니다. 지능은 현명 할뿐만 아니라 신뢰할 수 있고 책임이 있어야합니다. NTT Research의 새로 형성된 예술 물리학

Mistral Barge 2 vs Claude 3.5 Sonnet : 어느 것이 더 낫습니까?Apr 11, 2025 am 11:30 AM

소개 인공 지능의 역동적 인 영역에서 혁신은 결코 서지 않으며 새로운 모델이 지속적으로 등장하여주의와 적용을 위해 경쟁합니다. 최신의 획기적인 중에는 Mistral Barge 2와 Anther가 있습니다.

다음은 Perplexity 리더의 Deepseek에 대한 더 많은 생각입니다.Apr 11, 2025 am 11:28 AM

Deepseek의 획기적인 성공은 사후 분석 후에 계속해서 연료를 공급하여 현재 글로벌 AI 환경 내에서 모델 혁신에 대한 반영을 촉구합니다. 이 분석은 시장 영향을 넘어서 진행중인 연구에 대한 영향에 중점을 둡니다.

유출 된 Shopify 메모는 AI에 대한 황소 접근을 보여줍니다Apr 11, 2025 am 11:24 AM

Shopify Internal Memo 유출 : AI를 포용하고 산업 벤치 마크가 되십시오. 유출 된 내부 Shopify 메모는 회사가 AI를 적극적으로 수용하고 기본적인 기대로 취급하고 있음을 보여줍니다. 각서에서 Tobias Lütke의 CEO는 AI의 적용이 직원의 일상 업무에 통합되어 본능적 인 반응이되어야한다고 강조했다. "Shopify의 사명은 미래의 최고의 비즈니스가 성장하고 성장하도록 돕기 위해 논란의 여지가없는 최고의 소프트웨어 플랫폼을 구축하는 것입니다. 그렇게하려면, 우리는 기술을 미리 유지하고 상인들이 이전 상상력을 넘어 성공을 달성하도록 돕기 위해 모든 최고의 도구를 사용해야합니다. 그리고이를 위해서는 한 발 앞서 나아가 야합니다." 이 사전 예방 적 변화가 필요한 이유는 무엇입니까? lüt

See all articles