>기술 주변기기 >일체 포함 >2024 년 상위 20 개 생성 AI 개발

2024 년 상위 20 개 생성 AI 개발

Christopher Nolan
Christopher Nolan원래의
2025-03-16 09:40:13976검색

2024 년에 생성 AI 분야는 혁신적인 돌파구를 만들었습니다. 일련의 혁신적인 혁신은 생성 AI 분야에 혁명을 일으키고 다양한 산업을 재구성하며 일상 경험을 향상시킵니다. 새로운 오픈 소스 모델 및 멀티 모달 기능에서 AI 에이전트 및 기타 기술에 이르기까지 2024 년의 발전은 기술적 경계를 뚫고 자하는 사람들의 공유 욕구를 반영합니다. 이 기사는 2024 년에 AI의 미래를 계속 형성 할 생성 AI 개발을 정의하는 데있어 10 가지 진보를 탐구 할 것입니다.

2024 년 생성 AI의 10 위 진보

2024 년 상위 20 개 생성 AI 개발

1. OpenAi는 ChatGpt 상점을 시작합니다

2024 년 1 월 10 일 : Openai는 사용자가 특정 작업에 대해 GPT를 생성, 사용자 정의 및 공유 할 수있는 플랫폼 인 ChatGpt 매장을 출시하면서 새해를 시작합니다. 이 개발은 GPT 빌드 도구와 수백만 개의 맞춤형 GPT를 개발자와 사용자가 이용할 수있게함으로써 AI 공간에 혁명을 일으켰습니다. 이 매장은 처음에는 유급 사용자에게만 개방되었지만 곧 모든 생계에서 혁신적인 응용 프로그램의 중심이되었습니다.

2. Microsoft는 Copilot Pro를 출시합니다

2024 년 1 월 15 일 : Microsoft는 Copilot Pro라는 고급 서비스를 시작하여 GPT-4 터보를 포함한 고급 모델에 우선적으로 액세스 할 수 있습니다. 10 월에 Microsoft는 "Copilot Voice"기능을 시작하여 사용자가 Copilot과 실시간 음성 대화를 할 수있었습니다. 오디오 이해 및 생성을 위해 OpenAI의 GPT-4O 모델을 사용합니다.

이 회사는 또한 "Think Deep"및 Copilot Vision과 같은 기능을 제공하는 초기 액세스 프로그램 인 Copilot Labs를 출시했습니다. "깊이있는 사고"를 통해 Colecilot은 복잡한 쿼리를 유추 할 수 있으며 "Copilot Vision"은 Copilot이 사용자를 탐색 할 때 웹 사이트를보고 논의 할 수 있습니다.

3. 의인성 발사 클로드 3

2024 년 3 월 4 일 : 텍스트 및 이미지를 처리 ​​할 수있는 멀티 모달 생성 AI 모델 시리즈 인 Claude 3의 Anthropic을 시작합니다. Claude 3 제품군에는 Haiku, Sonnet 및 Opus의 세 가지 모델이 포함되어 있으며 규모와 효율성이 높아집니다.

5 월에 Anthropic은 Claude Team Program 및 iOS 앱을 통해 Claude Chatbot 제품을 확장했습니다. 이 팀 프로그램은 중소기업을 위해 맞춤화되어 Claude의 고급 기능에 대한 확장 가능한 액세스를 제공합니다. 이 앱을 통해 모바일 장치에서 Claude의 세대 기능에 완벽하게 액세스 할 수 있습니다.

2024 년 상위 20 개 생성 AI 개발

2024 년 9 월, Anthropic은 고급 AI 도구가 필요한 대규모 조직을 위해 설계된 솔루션 인 Claude Enterprise를 출시했습니다. 주요 기능에는 사용자 정의 미세 조정, 확장 토큰 한도 및 향상된 데이터 보안이 포함됩니다.

그 후 11 월에 Anthropic은 Claude 3.5 베타의 출시를 발표했습니다. 이 모델에는 동적 메모리, 대기 시간 감소 및 효율성 향상과 같은 대화식 AI 기능이 발전했습니다.

4.인지 실험실은 Devin AI를 방출합니다

2024 년 3 월 12 일 : Cognition Labs는 소프트웨어 엔지니어링 작업을 수행 할 수있는 자율 AI 보조원 인 Devin AI를 출시합니다. 자연어 프롬프트에 따라 코드를 디버그하고 새 코드를 생성하며 소프트웨어 개발 문제를 해결할 수 있습니다.

5. Grok-1 오픈 소스

2024 년 3 월 17 일 : Elon Musk의 XAI는 Apache-2.0 라이센스에 따라 Grok-1 모델의 아키텍처 및 중량 매개 변수를 공개하여 오픈 소스로 만들었습니다. 이 움직임은 AI 커뮤니티 내에서 투명성과 협력을 촉진하도록 설계되었습니다. 3 월 말, Xai는 최신 모델 Grok-1.5를 발표했으며, 이는 추론 기능을 향상시키고 128,000 개의 토큰 컨텍스트 길이를 확장했습니다.

4 월, Xai는 Grok-1.5 Vision을 통해 Grok의 기능을 확장하여 멀티 모드 생성 AI 모델을 구축하기위한 첫 단계를 표시했습니다. 이 새로운 모델은 문서, 차트, 그래픽, 스크린 샷 및 사진을 포함한 다양한 시각적 정보를 처리 할 수 ​​있습니다.

8 월에 Xai는 Grok-2 및 Grok-2 Mini를 계속 발사하여 업그레이드 된 성능, 향상된 추론 및 이미지 생성 기능을 제공했습니다. 이 모델은 X 프리미엄 가입자가 제공하고 AI 생성 이미지를 플랫폼에 통합했습니다.

10 월 말, Grok은 시각적 업그레이드하여 이미지를 이해하고 분석 할 수 있도록했습니다. 이는 시각적 데이터 해석이 필요한 응용 프로그램에서 실용성을 넓 힙니다.

6. Blackwell Architecture 및 Nvidia Nim 마이크로 서비스 출시

2024 년 3 월 18 일 : GPU 기술 컨퍼런스 (GTC)에서 Nvidia는 생성 ​​AI 시대의 요구를 충족시키기 위해 Blackwell Architecture를 발표했습니다. 플래그십 제품 B100 및 B200 Data Center Accelerators는 Genai 워크로드의 성능 개선을 크게 제공합니다. Blackwell 플랫폼은 이러한 가속기를 Nvidia의 ARM 기반 Grace CPU와 통합하여 Genai 응용 프로그램에 대한 포괄적 인 솔루션을 제공합니다.

2024 년 상위 20 개 생성 AI 개발

이 행사에서 NVIDIA는 NVIDIA NIM (NVIDIA 지능형 마이크로 서비스)의 보호하에 일련의 생성 AI 마이크로 서비스 세트를 출시했습니다. 이 서비스를 통해 개발자는 광범위한 CUDA GPU를 기반으로 사용자 정의 AI 사본을 작성하고 배포 할 수 있습니다. 이는 데이터 처리, LLM 사용자 정의, 추론, 검색 강화 생성 및 보호 측정 구현에 도움이됩니다.

7. Elevenlabs는 전문적인 음성 복제를 시작합니다

2023 년 4 월 14 일 : Elevenlabs는 전문적인 음성 복제 서비스를 시작하여 사용자가 사운드의 거의 완벽한 디지털 복제본을 만들 수 있습니다. 최소 오디오 입력을 기반으로 작동하는 인스턴트 음성 클로닝 기능과 달리이 서비스는 더 넓은 데이터 세트를 기반으로 매우 현실적인 음성 출력을 생성합니다. 이 서비스의 출시는 2023 년 7 월 영어 클론을 시작했을 때 시작되었으며 8 월까지 서비스는 거의 30 개의 다른 언어로 확장되었습니다.

8. 메타 라마 3

2024 년 4 월 18 일 : Meta는 매개 변수 크기가 8b 및 70b의 3 세대 오픈 소스 LLM Llama 3을 출시했습니다. LLAMA 3은 공개적으로 이용 가능한 자원의 약 15 조 마커에 대해 교육을 받았으며 코딩, 추론 및 다국어 작업의 탁월한 성능을 보여줍니다.

이를 바탕으로 Meta는 7 월에 LLAMA 3.1을 출시했으며 최대 405b의 매개 변수가 있습니다. 다양한 벤치 마크 에서이 반복은 GPT-4O 및 Claude 3.5 Sonnet과 같은 모델을 능가합니다.

그런 다음 Meta는 9 월에 Llama 3.2를 개발하여 텍스트와 이미지를 처리 ​​할 수 ​​있습니다. 이 버전에는 각각 110 억과 900 억 매개 변수의 두 가지 시각적 모델이 있습니다. 또한 모바일 하드웨어에 최적화 된 매개 변수로 각각 10 억과 30 억의 매개 변수를 가진 가벼운 일반 텍스트 모델을 제공합니다.

9. OpenAi는 GPT-4O를 시작합니다

2024 년 5 월 13 일 : OpenAi는 GPT-4O ( "All-Around")를 출시합니다-텍스트, 이미지 및 오디오를 처리하고 생성 할 수있는 다국적 다중 모드 Genai 모델입니다. GPT-4O는 음성, 다국어 및 시각적 작업에서 새로운 벤치 마크를 설정하여 대규모 멀티 태스킹 언어 이해 (MMLU) 벤치 마크에서 88.7 점을 얻었습니다. 컨텍스트 창은 128,000 마커이며 전임자 인 GPT-4 터보보다 2 배 빠르고 가격의 절반이되는 API를 제공합니다. 이 모델은 AI 기능의 상당한 발전을 나타내며, 이는 다양한 양식에서보다 포괄적이고 효율적인 처리 기능을 제공합니다.

또한 읽기 : 2024 년의 Openai : Highs, Lows 및 그 사이의 모든 것

10. Google I/O 2024에 대한 주요 업데이트 : AI 개요 및 VEO

2024 년 5 월 14 일 : Google I/O 2024 컨퍼런스에서 Google은 생성 AI를 검색 플랫폼에 통합 할 것이라는 소식을 발표했습니다. 이 향상을 통해 사용자는 쿼리에서 생성 된 AI 요약을 수신하여보다 포괄적이고 포괄적 인 정보를 제공 할 수 있습니다. 이 기능은 원래 SGE (Search Generative Experience)로 명명되었으며 나중에 AI 개요로 이름이 바뀌 었습니다.

2024 년 상위 20 개 생성 AI 개발

이 행사에서 Google은 1 분 이상 고품질 1080p 비디오를 생성 할 수있는 고급 AI 비디오 생성 모델 인 VEO를 출시했습니다. 이 멀티 모달 모델은 텍스트, 이미지 및 비디오 신호를 해석하여 타임 랩스 사진 및 공중 장면을 포함하여 다양한 영화 스타일로 컨텐츠를 만듭니다. Google은 VEO의 기능을 YouTube 반바지와 같은 플랫폼에 통합하여 사용자의 컨텐츠 제작 도구를 향상시킬 계획입니다.

나머지 콘텐츠는 위와 유사하며 원래 의미를 변경하지 않고 이미지 형식과 위치를 유지합니다. 공간 제한으로 인해 여기에서 하나씩 확장하지 않습니다. 다시 쓰기는 유창하고 읽을 수 있어야합니다.

위 내용은 2024 년 상위 20 개 생성 AI 개발의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.