일체 포함

LLM은 역사가 될까요? 오픈 소스 bGPT는 딥 러닝 패러다임을 뒤집을 수 있습니다. 바이너리를 직접 시뮬레이션하여 아날로그 디지털 세계의 새로운 시대를 열 수 있습니다!

LLM은 역사가 될까요? 오픈 소스 bGPT는 딥 러닝 패러다임을 뒤집을 수 있습니다. 바이너리를 직접 시뮬레이션하여 아날로그 디지털 세계의 새로운 시대를 열 수 있습니다!

PHPz

Mar 13, 2024 pm 07:20 PM

모델기차에뮬레이터

Microsoft Research Asia에서 출시한 최신 bGPT 성과인 이 바이트 기반 Transformer 모델은 디지털 세계를 탐험할 수 있는 새로운 문을 열어줍니다.

기존의 어휘 기반 언어 모델과 달리 bGPT는 특정 형식이나 작업에 제한을 받지 않고 원시 바이너리 데이터를 직접 처리할 수 있다는 점에서 독특합니다. 디지털 세계를 완전히 시뮬레이션하여 모델 개발의 새로운 가능성을 여는 것을 목표로 합니다.

종이: https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

https://www.php .cn/link/359499f804ea7988921bf86c9377fb95 모델:

https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad프로젝트 홈페이지:

https://www.php.cn/link/71af5961 4c 8b42af334933e9261e53be 연구 논문에서 연구팀은 모델링에 대한 bGPT의 엄청난 잠재력을 보여주었습니다. bGPT는 바이트 수준 처리를 수행함으로써 텍스트, 이미지 및 오디오를 생성할 수 있을 뿐만 아니라 형식 변환 알고리즘 및 CPU 상태 모델링을 포함한 컴퓨터 동작을 시뮬레이션할 수도 있습니다. 모든 데이터를 바이트 시퀀스로 처리하는 이러한 접근 방식을 통해 bGPT는 다양한 유형의 데이터를 동일한 프레임워크에 통합할 수 있습니다.

공개된 bGPT의 논문은 X(Twitter)에서 광범위한 토론을 불러일으켰으며, 딥 러닝 모델의 잠재적인 변화를 강조하고 모델이 디지털 세계의 다양한 활동을 진정으로 이해하고 시뮬레이션할 수 있는 새로운 가능성을 열었습니다.

바이너리 데이터: 디지털 세계를 구성하는 기본 DNA

바이너리 데이터는 우리가 매일 사용하는 컴퓨터 프로세서와 전자 제품의 운영 체제를 통해 실행되며 모든 것의 핵심입니다. 데이터, 장치 및 소프트웨어. 따라서 이러한 기반을 바탕으로 이진 데이터 시퀀스를 연구하여 디지털 시스템의 내부 논리를 이해하고 이를 통해 다양하고 복잡한 디지털 현상을 재구성하고 시뮬레이션하는 것이 bGPT의 목표입니다.

bGPT는 바이트 수준 처리를 통해 기존 AI 생성 및 작업 이해에 적용될 수 있을 뿐만 아니라 더 많은 비전통적 애플리케이션도 처리할 수 있습니다. 예를 들어, 이전 연구에서는 MIDI의 바이너리 특성으로 인해 직접 모델링을 피했던 음악 전송 및 저장을 위한 표준 형식인 MIDI를 직접 시뮬레이션할 수 있습니다.

하지만 bGPT는 당연히 이러한 작업에 적합하며 음악 데이터의 변환 알고리즘을 정확하게 시뮬레이션할 수 있어 ABC 표기법을 MIDI 형식으로 변환할 때 매우 낮은 오류율(0.0011 BPB)을 달성합니다.

실제 응용 프로그램에서 bGPT는 일반적으로 ABC 기호와 MIDI 파일 간의 변환을 정확하게 완료할 수 있으며 때로는 원본 파일의 오류를 수정하여 음악 변환을 더 정확하게 만들 수도 있습니다.

bGPT는 자동으로 ABC 표기법을 MIDI 형식으로 변환합니다(위). 원래 MIDI 데이터(아래)와 비교하면 주요 차이점이 강조됩니다. 원래 MIDI 데이터는 없지만 한 비트(아래 그림 참조) )로 인해 코드 반주의 연결이 끊기는 현상이 발생하지만, bGPT로 변환된 결과(위 그림 참조)가 이 간격을 올바르게 채워 코드 반주의 부드러움을 보장합니다.

연구팀은 또한 CPU 모델링을 하드웨어 동작 시뮬레이션의 대표적인 작업으로 간주합니다. 이 작업을 수행하려면 모델이 일련의 하위 수준 기계 명령을 입력으로 받아야 하며, 목표는 CPU 상태가 어떻게 되는지 정확하게 예측하는 것입니다. 프로그램이 중지될 때까지 각 명령이 실행된 후 업데이트됩니다.

이 작업에서 bGPT는 99.99% 이상의 정확도를 보여주어 기본 바이너리 데이터 처리에서 바이트 모델의 성능과 확장성을 입증했습니다.

프로그램과 초기 CPU 상태를 고려하면 bGPT는 프로그램이 종료될 때까지 CPU 실행의 전체 프로세스를 정확하게 예측할 수 있습니다. 이 예에서 bGPT는 모든 CPU 명령을 정확하게 처리합니다. 이해를 돕기 위해 실제 바이트 시퀀스는 더 읽기 쉬운 형식으로 변환됩니다.

바이트에서 모든 것까지: 경계를 허물고 통합 데이터 모델링으로 이동

bGPT는 기본 바이너리 데이터를 처리할 수 있을 뿐만 아니라 여러 데이터 유형을 통합 모델 아키텍처로 통합하여 모든 데이터를 바이트 시퀀스로 처리할 수 있습니다.

이 접근 방식은 데이터 모델링 프로세스를 단순화할 뿐만 아니라 특정 데이터 유형에 맞게 모델을 사용자 정의할 필요 없이 모든 데이터 소스로부터의 통합을 쉽게 만듭니다.

연구팀은 논문에 전통적인 텍스트, 이미지, 오디오 파일의 예를 제시하여 통합 데이터 모델링에서 bGPT의 능력을 입증했습니다. 그들이 훈련한 bGPT 모델에는 약 1억 개의 매개변수가 있습니다.

실험 결과 GPT-2(텍스트 모델), ViT(비주얼 모델), AST(오디오 모델)와 같은 크기의 모델과 비교했을 때 bGPT는 다양한 데이터 유형에서 비슷한 성능을 보이는 것으로 나타났습니다.

bGPT는 텍스트 생성에서 매우 뛰어난 성능을 발휘합니다. 바이트 수준 텍스트 인코딩 덕분에 모델은 어휘에 의존하지 않으므로 모든 언어를 지원할 수 있습니다.

계층화된 Transformer 아키텍처는 계산 오버헤드가 GPT-2와 유사하지만 최대 8KB의 텍스트를 생성할 수 있으며 이는 GPT-2의 길이 제한을 크게 초과합니다. Wikipedia 데이터에 대한 사전 학습 후 bGPT에서 생성된 텍스트는 스타일과 테마 모두에서 GPT-2와 유사하여 텍스트 생성에 있어 강력한 능력을 입증했습니다.

bGPT는 Wikipedia 데이터 세트에서 사전 훈련되었으며 생성된 텍스트 샘플의 품질과 주제 일관성은 GPT-2와 비슷합니다.

bGPT는 이미지 바이트 시퀀스에서 다음 바이트를 예측하여 이미지를 생성할 수 있습니다. 모델은 ImageNet 데이터 세트에서 사전 훈련되었으며 생성된 이미지의 해상도는 32x32픽셀입니다.

현재 규모에서는 바이트 시퀀스를 통해 이미지의 2차원 공간 관계를 정확하게 캡처하기 어렵기 때문에 생성된 이미지에 아티팩트와 노이즈가 발생하지만 텍스처와 빛 및 그림자 효과는 일반적으로 비교적 정확합니다.

또한 생성된 이미지는 정상적으로 BMP 파일로 디코딩될 수 있습니다. 연구팀은 OpenAI가 개발한 iGPT의 픽셀 시퀀스 모델링 방식과 유사하게 bGPT의 규모를 확장하면 더 높은 품질과 더 사실적인 영상 생성이 가능할 수 있다고 지적했다.

이러한 이미지는 ImageNet 데이터 세트에서 사전 훈련된 bGPT로 생성된 이미지 세트입니다. 이미지의 질감과 조명 효과는 일반적으로 정확하지만 생성된 이미지에서 주요 개체를 식별하는 것은 어려울 수 있습니다.

bGPT는 오디오 데이터를 바이트 시퀀스로 처리하고 8000Hz의 샘플링 속도로 1초 길이의 오디오 샘플을 생성할 수 있습니다.

이 모델은 LibriSpeech 데이터 세트에서 사전 훈련되었으며 Speech Commands v2 데이터 세트에서 더욱 미세 조정 및 시연되었습니다. bGPT에서 생성된 오디오 샘플은 높은 정확도를 유지하며 일부 샘플은 실제 오디오와 거의 구별할 수 없습니다. 다음은 오디오 생성 분야에서 bGPT의 기능을 보여주는 일련의 예입니다.

bGPT를 사용하여 바이트의 디지털 세계를 탐험하세요

전통 언어 모델은 아무리 강력하더라도 주로 자연어 텍스트 처리에 중점을 둡니다. bGPT 모델은 바이트 기반 처리 메커니즘을 통해 텍스트 처리의 한계를 깨고 새로운 데이터 처리 범주를 열었습니다.

이러한 발전을 통해 bGPT는 텍스트, 이미지, 오디오는 물론 알고리즘과 하드웨어의 기본 바이너리 데이터까지 포함한 다양한 데이터 유형을 원활하게 처리할 수 있게 되어 디지털 세계에 대한 포괄적인 시뮬레이션과 이해를 위한 기반을 마련하게 되었습니다.

bGPT는 강력한 기능을 보여주었지만 현재는 기존 그래픽 카드에서 최대 8KB의 바이트 시퀀스만 처리할 수 있는 등 계산 오버헤드 측면에서 한계가 있습니다. 데이터, 적용 측면에서는 분명한 한계가 있습니다. 향후 작업 계획은 보다 효율적인 알고리즘을 개발하고 하드웨어의 발전을 활용하는 데 중점을 두고 더 큰 데이터 시퀀스를 처리하는 능력을 향상시키는 것을 목표로 합니다.

전 세계의 기술 애호가들은 네트워크 가지치기 및 자체 학습 최적화부터 초대형 네트워크의 자체 재구성 기능에 이르기까지 bGPT의 미래 잠재력을 기대하기 시작했습니다. 공통 비전: bGPT는 결국 모든 유형의 바이트 데이터를 처리하고 출력할 수 있는 통합 모델을 실현하여 진정한 디지털 세계의 포괄적인 시뮬레이터가 될 수 있습니다.

연구팀은 bGPT의 코드와 모델을 오픈 소스로 공개했습니다. 이는 모델 아키텍처를 조정하지 않고도 자신의 데이터 세트에서 bGPT를 직접 훈련할 수 있고 디지털 분야에서 바이트 모델의 광범위한 전망을 탐색할 수 있음을 의미합니다.

위 내용은 LLM은 역사가 될까요? 오픈 소스 bGPT는 딥 러닝 패러다임을 뒤집을 수 있습니다. 바이너리를 직접 시뮬레이션하여 아날로그 디지털 세계의 새로운 시대를 열 수 있습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

메타의 새로운 AI 어시스턴트 : 생산성 부스터 또는 시간 싱크?May 01, 2025 am 11:18 AM

Meta는 NVIDIA, IBM 및 DELL과 같은 파트너와 함께 LLAMA 스택의 엔터프라이즈 수준 배포 통합을 확장했습니다. 보안 측면에서 Meta는 Llama Guard 4, Llamafirewall 및 Cyberseceval 4와 같은 새로운 도구를 출시했으며 AI 보안을 향상시키기 위해 LLAMA Defenders 프로그램을 시작했습니다. 또한 Meta는 공공 서비스, 건강 관리 및 교육을 개선하기 위해 노력하는 신생 기업을 포함하여 10 개의 글로벌 기관에 LLAMA Impact Grants의 150 만 달러를 배포했습니다. Llama 4에 의해 구동되는 새로운 Meta AI 응용 프로그램, Meta AI로 생각됩니다.

Gen Zers의 80%가 AI : 연구와 결혼 할 것입니다May 01, 2025 am 11:17 AM

인간 -AI 상호 작용을 개척하는 회사 인 Joi AI는 이러한 진화하는 관계를 설명하기 위해 "AI-Lationships"라는 용어를 도입했습니다. Joi AI의 관계 치료사 인 Jaime Bronstein은 이것이 인간 C를 대체하는 것이 아니라는 것을 분명히합니다.

AI는 인터넷의 봇 문제를 악화시키고 있습니다. 이 20 억 달러 규모의 스타트 업은 최전선에 있습니다May 01, 2025 am 11:16 AM

온라인 사기와 봇 공격은 비즈니스에 큰 도전을 제기합니다. 소매 업체는 봇과 싸우고, 은행은 전투 계정 인수 및 소셜 미디어 플랫폼이 사천자와 어려움을 겪고 있습니다. AI의 부상은이 문제를 악화시킨다

로봇에 판매 : 비즈니스를 만들거나 파괴 할 마케팅 혁명May 01, 2025 am 11:15 AM

AI 에이전트는 마케팅에 혁명을 일으킬 준비가되어 있으며 이전 기술 변화의 영향을 능가 할 수 있습니다. 생성 AI의 상당한 발전을 나타내는이 에이전트는 Chatgpt와 같은 정보뿐만 아니라 Actio도 취합니다.

컴퓨터 비전 기술이 NBA 플레이 오프를 혁신하는 방법May 01, 2025 am 11:14 AM

중요한 NBA 게임 4 결정에 대한 AI의 영향 두 가지 중추적 인 게임 4 NBA 매치업은 AI의 게임 변화 역할을 선보였습니다. 첫 번째로 덴버의 Nikola Jokic의 놓친 3 점은 Aaron Gordon의 마지막으로 골목길을 이끌었습니다. 소니의 매

AI가 재생 의학의 미래를 가속화하는 방법May 01, 2025 am 11:13 AM

전통적으로 전 세계적으로 재생 의학 전문 지식을 확장하여 광범위한 여행, 실습 교육 및 수년간의 멘토링을 요구했습니다. 이제 AI는이 환경을 변화시키고 지리적 한계를 극복하고 EN을 통한 진행 상황을 가속화하고 있습니다.

Intel Foundry Direct Connect 2025의 주요 테이크 아웃May 01, 2025 am 11:12 AM

인텔은 제조 공정을 선도적 인 위치로 반환하기 위해 노력하고 있으며 팹 반도체 고객을 유치하여 팹에서 칩을 만들려고 노력하고 있습니다. 이를 위해 인텔은 프로세스의 경쟁력을 증명할뿐만 아니라 파트너가 친숙하고 성숙한 워크 플로우, 일관되고 신뢰할 수있는 방식으로 칩을 제조 할 수 있음을 보여주기 위해 업계에 대한 신뢰를 더 많이 구축해야합니다. 오늘 내가 듣는 모든 것은 인텔 이이 목표를 향해 나아가고 있다고 믿게 만듭니다. 새로운 CEO 인 탄 리바이 (Tan Libai)의 기조 연설이 그 날을 시작했다. Tan Libai는 간단하고 간결합니다. 그는 Intel의 Foundry Services에서 몇 가지 과제를 간략하게 설명하고 회사가 이러한 과제를 해결하고 향후 인텔의 파운드리 서비스를위한 성공적인 경로를 계획하기 위해 취한 조치를 취했습니다. Tan Libai는 고객을 더 많이 만들기 위해 인텔의 OEM 서비스가 구현되는 과정에 대해 이야기했습니다.

ai 잘못 되었나요? 이제 보험이 있습니다May 01, 2025 am 11:11 AM

AI 위험과 관련된 점점 더 많은 문제를 해결하기 위해, 글로벌 특수 재보험 회사 인 Chaucer Group 및 Armilla AI는 TPL (Third-Party Liability) 보험 상품을 도입하기 위해 힘을 합쳤습니다. 이 정책은 비즈니스를 보호합니다

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.