iFlytek은 1월 30일 Spark Cognitive Large Model에 대한 V3.5 업그레이드 컨퍼런스를 개최할 예정입니다. iFlytek 회장 Liu Qingfeng과 연구소장 Liu Cong은 최초의 국가 산업용 컴퓨팅 파워 트레이닝을 기반으로 한 iFlytek Spark V3.5를 공식 출시했습니다.
아이플라이텍(iFlytek)은 2023년 10월 24일 수조 개의 매개변수를 가진 대형 모델의 훈련을 지원하는 Wanka 국내 최초의 컴퓨팅 파워 플랫폼 'Feixing No.1'을 출시하고 공식 출시할 예정이라고 발표했습니다. 출시 후 90일 이상 동안 iFlytek Spark는 GPT-4를 벤치마킹하기 위해 "Flying Star One"을 기반으로 더 큰 매개변수 규모의 대규모 모델 훈련을 시작했으며 그 결과 1월 30일에 iFlytek Spark V3가 출시되었습니다. 5 업그레이드가 출시되었습니다. .
National Open Large Model 교육을 기반으로 National Open Large Model Fire V3.5는 언어 이해, 텍스트 생성, 지식 질문 및 답변, 논리적 추론, 수학적 능력, 코딩 능력 및 다중 언어의 7가지 측면에서 포괄적인 업그레이드를 달성했습니다. 모달 능력. 그 중 언어 이해력과 수학 능력은 GPT-4+Turbo를 초과하고, 코드는 GPT-4+Turbo+96%에 도달하며, 다중 모드 이해 능력은 GPT-4V+91%에 도달합니다.
현재 iFlytek Spark는 China Pacific Insurance와의 협력, Spark Pacific Insurance와의 협력, 그리고 Spark Pacific Plan을 통해 보험, 은행, 에너지, 자동차, 통신 등 분야의 선도 기업에 힘을 실어주고 있습니다. 지식 서비스, 사무, 감사, 전시 산업 등이 보험 분야에서 디지털 노동 적용을 위한 벤치마크를 만들기 위해 교통은행과 협력하여 고객 서비스, 전시 산업, 사무, 연구 개발을 강화합니다. 등, 은행 분야에서 코드 기능 적용을 위한 벤치마크를 만드는 데 중점을 두고 국가 에너지 그룹과 협력하여 석탄, 전력, 운송, 화학 산업 등에 힘을 실어 금융 분야에 대한 대규모 모델 적용 벤치마크를 만듭니다. 중앙 기업 그룹의 통합 연결; 국가 에너지 그룹과 공동으로 석탄, 전기, 운송, 화학 산업 등에 힘을 실어 중앙 기업 그룹의 통합 연결을 위한 대규모 모델 적용 벤치마크를 만듭니다.
또한, 국내 컴퓨팅 파워에 깊이 적응한 'iFlytek Spark 오픈소스 대형 모델'이 선도적인 장면 적용 효과를 최초로 출시했으며, Shengsi 오픈소스 커뮤니티가 공동으로 최초로 출시했습니다.
이 오픈 소스에는 기본 모델 iFlytekSpark-13B-base, 미세 조정 모델 iFlytekSpark-13B-chat, 미세 조정 도구 iFlytekSpark-13B-Lora 및 사용자 정의 도구 iFlytekSpark -13B-Charater. 학술 기업 연구에서는 전체 스택 자율적이고 제어 가능한 Spark 최적화 제품군을 기반으로 전용 대형 모델을 보다 편리하게 교육할 수 있습니다.
Liu Qingfeng은 Spark 오픈소스 대형 모델이 기술적으로 차별화된 장점을 형성했다고 밝혔습니다. Spark Open Source-13B는 심층적인 연구와 분석을 통해 텍스트 생성, 언어 이해, 텍스트 재작성, 업계 Q&A, 기계 번역 등과 같은 일반적인 기업 시나리오에서 잘 알려진 여러 공개 평가 작업에서 최고 수준에 속합니다. 학습 보조, 언어 이해 등의 영역에서 최적화를 통해 성능이 대폭 향상되었으며, 복잡한 자연어 작업을 처리할 때 더욱 편리해졌습니다.
"Flying Star One" 훈련을 기반으로 Spark 오픈 소스 대형 모델의 풀 스택 국내 적응 및 최적화가 간단하고 사용하기 쉬우며 최고의 장면 적용 효과와 함께 훈련 전략이 Ascend 컴퓨팅 성능에 극도로 최적화되어 있습니다. , 훈련 효율은 A100의 90%에 도달합니다. 이는 Ascend AI 하드웨어를 더욱 심층적으로 최적화했을 뿐만 아니라 국제 선진 수준을 따라잡기 위한 국내 컴퓨팅 파워의 결단력과 능력을 보여줍니다.
오픈소스는 더 많은 시나리오가 구현되어야 생태학적 협력을 더 잘 강화할 수 있습니다. 현재 Huawei Shengsi 오픈 소스 커뮤니티는 학술 및 기업 연구에 완전히 무료로 제공되는 동시에 학술 협력과 산업 탐구를 강화하는 Spark Large Model 오픈 소스 버전-13B를 공식 출시했습니다.
2024년 iFlytek Spark 대형 모델의 개발을 기대하면서 Liu Qingfeng은 다음 세 가지 점을 지적했습니다. "첫째, 우리는 가장 발전된 국제 수준에 대해 일반 대형 모델의 기본 기능을 계속 벤치마킹해야 하며, 더 작은 컴퓨팅 성능을 포함한 알고리즘 연구."우리는 명확하고 격차를 확인해야 합니다. 현재 소규모 샘플 빠른 훈련, 다중 분석 등의 영역에서는 GPT-4의 최고 수준 사이에 여전히 격차가 있습니다. 모달 딥 러닝 트레이닝과 초복잡한 딥 이해를 바탕으로 iFlytek Spark는 올해 상반기 GPT-4의 현재 최고 수준을 따라잡았습니다. “오늘날의 일반적인 대형 모델이 반드시 인공지능의 미래 전체를 대변하는 것은 아닙니다. 뇌 과학 상호 작용, 적대 네트워크의 심층 연결 등 혁신 생태계 전체가 필요한 혁신은 아직 많이 남아 있지만, 우리는 앞으로 나아갈 용기와 기대를 가져야 합니다." Liu Qingfeng이 지적했습니다.
"둘째, 2024년에는 산업 응용뿐만 아니라 여러 핵심 기술 혁신에서 대형 모델을 연결하는 측면에서도 대형 모델의 품질과 품질이 진정으로 향상되어야 합니다. 중국 비즈니스계와 과학계는 초월을 달성할 것이라고 확신합니다. "
" 셋째, 고층 건물은 안전하고 제어 가능한 플랫폼 위에 건설되어야 하며, 독립적이고 제어 가능한 플랫폼에서 생태적 번영을 달성해야 합니다." Liu Qingfeng은 알고리즘, 데이터, 완전히 자율적이고 제어 가능한 번영하는 인공 지능 생태계.
위 내용은 iFlytek Spark V3.5는 국가 컴퓨팅 파워 플랫폼 "Flying Star One" 트레이닝을 기반으로 공식 출시되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!