찾다
기술 주변기기일체 포함Yancore Digital, 오프라인 장치 측 배포를 지원하는 대규모 Non-Attention 메커니즘 모델 출시

1월 24일, Shanghai Yanxinshuzhi Artificial Intelligence Technology Co., Ltd.는 Attention 메커니즘이 없는 대규모 일반 자연어 모델인 Yan 모델을 출시했습니다. Yancore Digital Intelligence 기자 회견에 따르면 Yan 모델은 Transformer 아키텍처를 대체하기 위해 자체 개발한 새로운 "Yan 아키텍처"를 사용하며 Transformer와 비교하여 Yan 아키텍처는 메모리 용량이 3배 증가하고 속도가 7배 증가했습니다. 5배 향상된 추론 처리량을 달성합니다. Yancore Digital, 오프라인 장치 측 배포를 지원하는 대규모 Non-Attention 메커니즘 모델 출시Yancore Digital Intelligence의 CEO인 Liu Fanping은 대규모로 유명한 Transformer의 높은 컴퓨팅 성능과 높은 비용이 실제 응용 분야에서 많은 중소기업의 의욕을 꺾었다고 믿습니다. 내부 아키텍처의 복잡성으로 인해 의사 결정 과정을 설명하기가 어렵습니다. 긴 시퀀스를 처리하는 데 따른 어려움과 통제할 수 없는 환각 문제로 인해 특정 핵심 분야 및 특수 시나리오에서 대규모 모델을 광범위하게 적용하는 것도 제한됩니다. 클라우드 컴퓨팅과 엣지 컴퓨팅이 대중화되면서 고성능, 저에너지 소비를 갖춘 대규모 AI 모델에 대한 업계 수요가 늘어나고 있습니다.
"전 세계적으로 많은 뛰어난 연구자들이 Transformer 아키텍처에 대한 과도한 의존을 근본적으로 해결하고 Transformer를 대체할 수 있는 더 나은 방법을 찾기 위해 노력해 왔습니다. 심지어 Transformer 논문의 저자 중 한 명인 Llion Jones도 'Transformer 이후의 가능성'을 탐구하고 있습니다. 진화 원리에 기반한 자연에서 영감을 받은 지능형 방법을 사용하여 다양한 각도에서 AI 프레임워크를 재정의하려고 시도합니다."
기자회견에서 Core Digital은 동일한 리소스 조건 하에서 훈련 효율성과 추론 처리량이 향상된다고 밝혔습니다. Yan 아키텍처 모델은 Transformer 아키텍처에 비해 각각 7배, 5배, 메모리 용량은 3배 향상되었습니다. Yan 아키텍처의 설계는 추론 중에 Yan 모델의 공간 복잡도를 일정하게 만듭니다. 따라서 Yan 모델은 Transformer가 직면한 긴 시퀀스 문제에 대해서도 잘 작동합니다. 비교 데이터에 따르면 단일 4090 24G 그래픽 카드에서 모델 출력 토큰의 길이가 2600을 초과하면 Transformer 모델은 비디오 메모리 부족으로 어려움을 겪는 반면 Yan 모델의 비디오 메모리 사용량은 항상 약 14G에서 안정적입니다. 이론적으로 무한 길이 추론이 가능합니다.

Yancore Digital, 오프라인 장치 측 배포를 지원하는 대규모 Non-Attention 메커니즘 모델 출시

또한 연구팀은 모델 내부 구조의 복잡성을 줄이기 위해 선형 계산 방법과 결합된 합리적인 상관 특성 함수 및 메모리 연산자를 개척했습니다. 새로운 아키텍처의 Yan 모델은 과거 자연어 처리의 '해석할 수 없는 블랙박스'를 열고 의사결정 프로세스의 투명성과 설명 가능성을 완전히 탐색하여 고위험 분야에서 대형 모델의 광범위한 사용을 촉진할 것입니다. 의료, 금융, 법률 등이다.

Yancore Digital, 오프라인 장치 측 배포를 지원하는 대규모 Non-Attention 메커니즘 모델 출시


Liu Fanping은 Yan 모델이 민영화된 배포 애플리케이션을 100% 지원하고 클리핑이나 압축 없이 주류 소비자급 CPU와 같은 최종 장치에서 손실 없이 실행될 수 있어 GPU에서 실행되는 다른 모델과 동일한 효과를 얻을 수 있다고 말했습니다. 기자회견에서 Yan은 오프라인 후 노트북에서 실행되는 실시간 클립을 보여줬고 Liu Fanping은 오프라인 엔드사이드 배포가 향후 Core Intelligence의 중요한 상용화 방향이 될 것이라고 말했습니다.

위 내용은 Yancore Digital, 오프라인 장치 측 배포를 지원하는 대규모 Non-Attention 메커니즘 모델 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 机器之心에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
신속한 엔지니어링에서 일련의 질문은 무엇입니까? - 분석 Vidhya신속한 엔지니어링에서 일련의 질문은 무엇입니까? - 분석 VidhyaApr 17, 2025 am 11:06 AM

일련의 질문 : 신속한 엔지니어링 혁명 각 질문이 이전의 질문을 기반으로하는 AI와의 대화를 상상해보십시오. 이것은 신속한 엔지니어링에서 일련의 질문 (COQ)의 힘입니다.

Mistral Nemo 액세스 : 기능, 응용 프로그램 및 시사점Mistral Nemo 액세스 : 기능, 응용 프로그램 및 시사점Apr 17, 2025 am 11:04 AM

Mistral Nemo : 강력한 오픈 소스 다국어 LLM Mistral AI와 Nvidia의 협력 노력 인 Mistral Nemo는 최첨단 자연 자연 언어 처리를 제공하는 최첨단 오픈 소스 대형 언어 모델 (LLM)입니다. 이 12 억 파

Excel의 둥근 함수는 무엇입니까? - 분석 VidhyaExcel의 둥근 함수는 무엇입니까? - 분석 VidhyaApr 17, 2025 am 10:56 AM

정확한 수치 데이터를 위해 Microsoft Excel의 라운드 기능을 마스터합니다 숫자는 스프레드 시트의 기본이지만 정확성과 가독성을 달성하려면 종종 원시 데이터 이상의 것이 필요합니다. Microsoft Excel의 라운드 기능은 TRA를위한 강력한 도구입니다.

llamaindex를 사용한 반사제 안내서llamaindex를 사용한 반사제 안내서Apr 17, 2025 am 10:41 AM

AI 인텔리전스 향상 : llamaindex를 가진 반사 AI 에이전트에 대한 깊은 다이빙 문제를 해결할뿐만 아니라 개선을위한 자체 사고 과정을 반영하는 AI를 상상해보십시오. 이것은 반사 AI 요원의 영역 이며이 기사는 탐구합니다.

랭케인으로 벡터 임베딩을 계산하고 저장하는 방법은 무엇입니까?랭케인으로 벡터 임베딩을 계산하고 저장하는 방법은 무엇입니까?Apr 17, 2025 am 10:37 AM

향상된 컨텐츠 검색을 위해 Langchain 및 벡터 임베딩을 활용합니다 이전 기사는 쿼리 관련 컨텐츠 추출을위한 데이터로드 및 분할 기술을 다루었습니다. 이 기사는 벡터 임베딩을 사용하여 고급 데이터 검색을 탐구합니다.

2025 년에 데이터 과학 신입생을 고용하는 상위 13 개 회사2025 년에 데이터 과학 신입생을 고용하는 상위 13 개 회사Apr 17, 2025 am 10:30 AM

데이터 과학 경력 : 2024 년 최고의 회사 및 성공을위한 팁 최근 데이터 과학 졸업생 및 최종 1 년간의 공학 학생들은 다국적 기업 (MNC)을 목표로합니다. 많은 옵션이 있습니다. 이 안내서는 데이터를 고용하는 주요 회사를 강조합니다

Genai와의 매력적인 고객 경험을 만드는 방법은 무엇입니까?Genai와의 매력적인 고객 경험을 만드는 방법은 무엇입니까?Apr 17, 2025 am 10:27 AM

생성 AI를 통한 고객 경험 향상 : 전략적 접근 고객 만족도가 가장 중요하며 비즈니스는 점점 탁월한 경험을 제공 할 필요성을 인식하고 있습니다. 고객의 70% 이상이 개인화 된 서비스를 원합니다

Flux.1, Gemma 2, Sam 2 등을 특징으로하는 AI 혁신Flux.1, Gemma 2, Sam 2 등을 특징으로하는 AI 혁신Apr 17, 2025 am 10:26 AM

AI 주간 다이제스트 : 획기적인 혁신 및 윤리적 고려 사항 AV 바이트에 다시 오신 것을 환영합니다. 이번 주 하이라이트는 텍스트-이미지 생성, Model Efficie의 놀라운 진행 상황을 보여줍니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기