찾다
기술 주변기기일체 포함빅 릴리스, '뇌형 과학' 또는 인공 지능 대형 언어 모델의 컴퓨팅 전력 소비 및 컨텍스트 길이 문제에 대한 최적의 솔루션!

SF와 과학의 거대한 사건 속에서 SF는 갑자기 현실로 빛납니다.

최근 선전 고등연구소에서는 선전공과대학 교육재단과 과학환상성장기금이 공상과학 소설과 AI의 출현을 배경으로 한 행사를 열었습니다. Luxi Technology라는 심천 팀은 Transformer를 기반으로 하지 않는 대규모 언어 모델인 NLM(Neuromorphic Generative Pre-trained Language Model)이라는 인공 지능 대규모 언어 모델을 처음으로 공개했습니다.

국내외의 많은 대형 모델과 달리 이 팀은 뇌와 같은 과학과 뇌와 같은 지능을 핵심으로 삼는 동시에 순환 신경망의 특성을 통합하고 뇌의 효율적인 컴퓨팅 특성에서 영감을 얻은 대규모 언어 모델을 개발합니다. .

빅 릴리스, 뇌형 과학 또는 인공 지능 대형 언어 모델의 컴퓨팅 전력 소비 및 컨텍스트 길이 문제에 대한 최적의 솔루션!

더 놀라운 점은 동일한 매개변수 수준에서 이 모델의 컴퓨팅 전력 소비가 Transformer 아키텍처의 1/22라는 것입니다. 컨텍스트 길이 문제에 대해 NLM도 완벽한 답변을 제공했습니다. 컨텍스트 길이 창은 무제한을 달성할 수 있습니다. 오픈 소스 LLM의 2k 제한이든 다른 컨텍스트 길이 제한인 32k나 100k이든 성장은 문제가 되지 않습니다.

뇌 영감 컴퓨팅이란 무엇인가요?

Brain-like Computing은 인간 두뇌의 구조와 기능을 모방한 컴퓨팅 모델로, 아키텍처, 설계 원리, 정보 처리 방법 측면에서 인간 두뇌의 신경망 연결을 시뮬레이션합니다. 이러한 컴퓨팅은 단순히 생물학적 신경망의 표면 특성을 시뮬레이션하는 것을 넘어 생물학적 신경망의 기본 구성, 즉 뉴런과 시냅스의 대규모 상호 연결을 통해 서열 정보를 처리하고 저장하는 방법을 심층적으로 설명합니다. .

기존 규칙 기반 알고리즘과 달리 뇌 영감 컴퓨팅은 상호 연결된 수많은 신경망을 사용하여 인간의 뇌처럼 자율적으로 정보를 학습하고 추출합니다. 이 접근 방식을 통해 컴퓨팅 시스템은 경험을 통해 학습하고, 새로운 상황에 적응하고, 복잡한 패턴을 이해하고, 고급 결정과 예측을 내릴 수 있습니다.

높은 수준의 적응성과 병렬 처리 기능으로 인해 뇌에서 영감을 받은 컴퓨팅 시스템은 빅데이터 처리, 이미지 및 음성 인식, 자연어 처리 및 기타 분야에서 매우 높은 효율성과 정확성을 보여주었습니다. 이러한 시스템은 복잡하고 변화하는 정보를 빠르게 처리할 수 있을 뿐만 아니라 광범위한 사전 프로그래밍 및 데이터 입력이 필요하지 않기 때문에 기존 컴퓨팅 아키텍처보다 훨씬 적은 에너지와 컴퓨팅 리소스를 소비합니다.

일반적으로 두뇌모형컴퓨팅은 새로운 컴퓨팅 패러다임을 열어갑니다. 이는 전통적인 인공 신경망을 뛰어넘어 스스로 학습하고, 스스로 조직하고, 심지어 어느 정도의 자기 인식도 할 수 있는 첨단 지능 시스템으로 나아가고 있습니다.

대형 뇌모형 모델의 발전

행사에서 Lu Xi 팀의 Zhou Peng 박사는 대형 두뇌형 모델의 구현 메커니즘을 자세히 설명했습니다.

뇌형 신경망이라고도 알려진 차세대 신경망 모델로서 이전 2세대 신경망의 단점을 극복했습니다.

- 신호를 0과 1로 전송하는 1세대 신경망(MLP 다층 퍼셉트론이라고도 함)은 지나치게 복잡한 작업을 처리할 수 없으며 컴퓨팅 성능도 많이 필요하지 않습니다.

-인공 신경망이라고도 알려진 2세대 신경망은 전송 신호를 [0-1]의 연속 간격으로 변경하는데, 이는 충분히 복잡하지만 컴퓨팅 파워 오버헤드도 급증했습니다.

- 뇌형 신경망이라고도 알려진 3세대 신경망은 신호를 펄스 시퀀스로 변환합니다. 이는 충분히 복잡할 뿐만 아니라 컴퓨팅 성능 비용을 제어할 수 있게 해줍니다. 이 펄스 시퀀스는 신경 구조의 역학을 모방하여 달성됩니다. 동시에, 시퀀스는 시간을 의미하며, 3세대 신경망은 정보에 있는 시간 정보를 효과적으로 통합하여 출력할 수 있습니다.

-이전 2세대 신경망과 비교하여 시간 차원의 시퀀스 정보를 더 효과적으로 처리하고 실제 세계를 더 효과적으로 이해할 수 있습니다.

빅 릴리스, 뇌형 과학 또는 인공 지능 대형 언어 모델의 컴퓨팅 전력 소비 및 컨텍스트 길이 문제에 대한 최적의 솔루션!

뇌와 유사한 알고리즘을 기반으로 한 대형 모델의 추론 원리도 Transformer와는 완전히 다릅니다. 추론 과정에서 Transformer 모델과 뇌 유사 모델의 작동 메커니즘에는 상당한 차이가 있습니다. Transformer 모델은 추론을 수행할 때마다 모든 상황별 정보를 고려하여 다음 토큰을 생성합니다. 이 작업은 채팅 중에 비유할 수 있으며, 단어를 말할 때마다 그날의 모든 경험을 기억해야 합니다. 이는 또한 매개변수가 계속 증가하는 동안 대규모 모델의 계산 비용이 계속 증가하는 주된 이유이기도 합니다.

상대적으로 말하면 뇌와 유사한 모델은 추론할 때 내부 상태와 토큰에만 의존하면 됩니다. 이는 말을 할 때 이전 상황을 모두 구체적으로 떠올릴 필요 없이 다음 단어가 무엇인지 불쑥 내뱉는 것과 비교할 수 있으며, 말의 내용 역시 이전 경험과 본질적으로 연관되어 있다. 이 메커니즘은 컴퓨팅 성능 오버헤드를 크게 줄여 인간의 두뇌가 작동하는 방식에 더 가깝게 만들어 성능을 크게 향상시키는 NLM 기능의 핵심입니다.

빅 릴리스, 뇌형 과학 또는 인공 지능 대형 언어 모델의 컴퓨팅 전력 소비 및 컨텍스트 길이 문제에 대한 최적의 솔루션!

또한 뇌에서 영감을 받은 기능으로 인해 제한된 컨텍스트 길이는 더 이상 문제가 되지 않습니다. 3세대 신경망을 사용하는 NLM 대형 모델은 다음 토큰을 처리하는 데 필요한 컴퓨팅 파워가 컨텍스트 길이와 관련이 없기 때문에 컨텍스트 길이 병목 현상이 없습니다. 공개적으로 사용 가능한 Transformer 아키텍처의 대규모 언어 모델의 컨텍스트 길이는 100k에 불과합니다. 컨텍스트 길이를 늘리는 것은 컴퓨팅 성능 오버헤드의 문제일 뿐만 아니라 "할 수 있는지"의 문제이기도 합니다.

NLM의 무한 길이 컨텍스트는 복잡한 재무 보고서를 연구하든, 수십만 단어의 소설을 읽든, 무제한 길이 컨텍스트를 통해 대형 모델이 "당신을 더 잘 이해하게" 만드는 등 대형 언어 모델 응용 프로그램의 상상력을 열어줄 것입니다. "는 현실이 될 수 있다.

루시팀의 눈에 비친 AI

이 행사에서 Luxi Technology의 창립자이자 CTO인 Zhou Peng 박사는 지혜로 모든 것에 힘을 실어주는 팀의 현재 사명을 설명했습니다.

인공지능 시대에는 인터넷과 전기가 이미 우리 주변 어디에나 있는 것처럼 인공지능도 모든 곳에서 대중화되어야 합니다. 현재의 인공지능은 성능 면에서는 인상적이지만, 그 운영 비용은 기업과 소비자에게 막대한 부담을 안겨준다. 대다수의 휴대폰, 시계, 태블릿 및 노트북은 현재 기술 하에서 생성 인공 지능 대형 언어 모델을 완전하고 체계적이며 효율적이며 고품질 방식으로 실행할 수 없습니다. 이에 관심이 있는 개발자.

행사에서 Luxi Technology는 청중에게 일반 Android 휴대폰의 오프라인 모드에서 "NLM-GPT" 대형 모델을 사용하여 업무와 생활에서 흔히 발생하는 다양한 작업을 완료하는 방법을 보여주며 행사를 최고조로 끌어 올렸습니다.

- 시연에 참가하는 휴대폰에는 시중에서 판매되는 일반적인 칩 아키텍처가 탑재되어 있으며 성능은 소비자 시장에서 사용되는 일반적인 Android 모델과 유사합니다. Luxi Technology는 전화기가 비행기 모드이고 인터넷에 연결되지 않은 상태에서 사용자와 실시간으로 전화로 대화하고, 사용자가 제기한 질문에 답하고, 시 창작 등의 작업을 완료할 수 있는 'NLM-GPT' 대형 모델을 시연했습니다. 레시피 작성, 지식 검색 및 파일 해석과 같은 지침은 매우 복잡하고 휴대폰 하드웨어의 고성능 매개변수가 필요하며 전통적으로 완료하려면 네트워킹이 필요합니다.

- 전체 시연 과정에서 휴대폰의 에너지 소비는 안정적이었고 일반 대기 시간에 미치는 영향은 최소화되었으며 휴대폰의 전반적인 성능에는 아무런 영향도 미치지 않았습니다.

- 이번 시연에서는 'NLM-GPT' 대형 모델이 스마트폰, 태블릿 등 소형 C-end 상용 기기에서 고효율, 저전력 소비, 트래픽 소비 제로 등 모든 시나리오에서 실행될 가능성이 있음을 성공적으로 입증했습니다. 이는 "NLM-GPT" 대형 모델의 강화 덕분에 휴대폰, 시계, 태블릿, 노트북 및 기타 장치가 인간의 진정한 의도를 보다 정확하고 효율적으로 이해할 수 있으며 다음과 같은 다양한 상황에서 사용할 수 있음을 의미합니다. 사무실, 연구, 소셜 네트워킹, 엔터테인먼트 등. 응용 시나리오에서 인간이 제시한 다양한 지시와 작업을 더 높은 품질로 완료하여 사회 생산과 인간 생활의 효율성과 품질을 크게 향상시킵니다.

Luxi Technology는 "뇌형 기술"이 구동하는 "생성 인공지능 대언어 모델"이 학습, 일, 생활 등 다양한 분야에서 인간의 사고, 지각, 행동을 종합적으로 확장하고 모든 인류의 전반적인 질을 향상시킬 것이라고 믿습니다. . 지혜. 두뇌와 유사한 기술의 강화 덕분에 인공지능은 더 이상 인간을 대체하는 새로운 지능형 에이전트가 아니라 인간이 세상을 바꾸고 더 나은 미래를 창조할 수 있는 효율적인 지능형 도구가 될 것입니다.

고대인들이 사냥개와 매를 훈련시켰듯이, 사냥개와 매의 출현으로 사냥꾼이라는 직업이 사라지지는 않을 것입니다. 반대로 사냥꾼은 이를 통해 사냥개와 매가 가지고 있지만 인간이 갖지 못한 힘을 터득해 먹이를 더 효율적으로 얻을 수 있고, 인류 집단의 성장과 인류 문명의 발전에 힘과 영양분을 제공할 수 있다.

앞으로 일상 업무와 생활에 인공지능 대형 언어 모델을 적용하는 것은 더 이상 복잡한 다중 프로세스 시스템 프로젝트가 아니라 "체크아웃 시 결제 코드 열기", "사진 찍을 때 셔터 누르기"와 같을 것입니다. ", ""원클릭 3방향 짧은 영상" 스와이프는 일반적으로 간단하고 자연스러우며 부드럽습니다. Lu Xi의 팀은 뇌와 유사한 컴퓨팅 분야에서 계속해서 연구하고, 자연이 인류에게 준 가장 귀중한 선물인 뇌에 대한 심층적인 연구를 수행하며, 뇌와 같은 지능을 일상 생활에 도입할 것입니다.

아마도 가까운 미래에 인간은 더 많은 새로운 인공지능 파트너를 갖게 될 것입니다. 그들의 몸에는 피가 흐르지 않으며, 그들의 지능은 인간을 대체할 수 없습니다. 뇌에서 영감을 받은 기술의 지원을 통해 그들은 우리와 협력하여 우주의 신비를 탐구하고 사회의 경계를 확장하며 더 나은 미래를 창조할 것입니다.

출처: 라이프데일리

(출처: 정의되지 않음)

더 흥미로운 정보를 보려면 애플리케이션 마켓에서 "Jimu News" 클라이언트를 다운로드하세요. 뉴스 단서를 제공하는 것을 환영하며 승인되면 비용이 지급됩니다. 24시간 신고 핫라인은 027-86777777입니다.

위 내용은 빅 릴리스, '뇌형 과학' 또는 인공 지능 대형 언어 모델의 컴퓨팅 전력 소비 및 컨텍스트 길이 문제에 대한 최적의 솔루션!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 搜狐에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
Huggingface Smollm으로 개인 AI 조수를 만드는 방법Huggingface Smollm으로 개인 AI 조수를 만드는 방법Apr 18, 2025 am 11:52 AM

ON-DEVICE AI의 힘을 활용 : 개인 챗봇 CLI 구축 최근에 개인 AI 조수의 개념은 공상 과학처럼 보였다. 기술 애호가 인 Alex, 똑똑하고 현지 AI 동반자를 꿈꾸는 것을 상상해보십시오.

정신 건강을위한 AI는 스탠포드 대학교의 흥미로운 새로운 이니셔티브를 통해주의 깊게 분석됩니다.정신 건강을위한 AI는 스탠포드 대학교의 흥미로운 새로운 이니셔티브를 통해주의 깊게 분석됩니다.Apr 18, 2025 am 11:49 AM

AI4MH의 첫 출시는 2025 년 4 월 15 일에 열렸으며, 유명한 정신과 의사이자 신경 과학자 인 Luminary Dr. Tom Insel 박사는 킥오프 스피커 역할을했습니다. Insel 박사는 정신 건강 연구 및 테크노에서 뛰어난 작업으로 유명합니다.

2025 WNBA 드래프트 클래스는 리그가 성장하고 온라인 괴롭힘과 싸우고 있습니다.2025 WNBA 드래프트 클래스는 리그가 성장하고 온라인 괴롭힘과 싸우고 있습니다.Apr 18, 2025 am 11:44 AM

Engelbert는 "WNBA가 모든 사람, 플레이어, 팬 및 기업 파트너가 안전하고 가치가 있으며 권한을 부여받는 공간으로 남아 있기를 원합니다. 아노

파이썬 내장 데이터 구조에 대한 포괄적 인 가이드 - 분석 Vidhya파이썬 내장 데이터 구조에 대한 포괄적 인 가이드 - 분석 VidhyaApr 18, 2025 am 11:43 AM

소개 Python은 특히 데이터 과학 및 생성 AI에서 프로그래밍 언어로 탁월합니다. 대규모 데이터 세트를 처리 할 때 효율적인 데이터 조작 (저장, 관리 및 액세스)이 중요합니다. 우리는 이전에 숫자와 st를 다루었습니다

대안과 비교하여 OpenAi의 새로운 모델의 첫인상대안과 비교하여 OpenAi의 새로운 모델의 첫인상Apr 18, 2025 am 11:41 AM

다이빙하기 전에 중요한 경고 : AI 성능은 비 결정적이며 고도로 사용하는 것이 중요합니다. 간단히 말하면 마일리지는 다를 수 있습니다. 이 기사 (또는 다른) 기사를 최종 단어로 취하지 마십시오. 대신 에이 모델을 자신의 시나리오에서 테스트하십시오.

AI 포트폴리오 | AI 경력을위한 포트폴리오를 구축하는 방법은 무엇입니까?AI 포트폴리오 | AI 경력을위한 포트폴리오를 구축하는 방법은 무엇입니까?Apr 18, 2025 am 11:40 AM

뛰어난 AI/ML 포트폴리오 구축 : 초보자 및 전문가를위한 안내서 인공 지능 (AI) 및 머신 러닝 (ML)의 역할을 확보하는 데 강력한 포트폴리오를 만드는 것이 중요합니다. 이 안내서는 포트폴리오 구축에 대한 조언을 제공합니다

보안 운영에 대한 에이전트 AI가 무엇을 의미 할 수 있는지보안 운영에 대한 에이전트 AI가 무엇을 의미 할 수 있는지Apr 18, 2025 am 11:36 AM

결과? 소진, 비 효율성 및 탐지와 동작 사이의 넓은 차이. 이 중 어느 것도 사이버 보안에서 일하는 사람에게는 충격이되지 않습니다. 그러나 에이전트 AI의 약속은 잠재적 인 전환점으로 부상했다. 이 새로운 수업

Google 대 Openai : AI 학생들을위한 AI 싸움Google 대 Openai : AI 학생들을위한 AI 싸움Apr 18, 2025 am 11:31 AM

장기 파트너십 대 즉각적인 영향? 2 주 전 Openai는 2025 년 5 월 말까지 미국과 캐나다 대학생들에게 Chatgpt Plus에 무료로 이용할 수있는 강력한 단기 제안으로 발전했습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

SecList

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.