이번 주 AI 환경은 최첨단 모델과 도구를 공개하면서 주요 기업들이 상당한 발전을 목격했습니다. 주요 하이라이트로는 AI21 Labs의 Jamba 1.5, Anthropicai의 Claude 3 개선 사항 및 코딩 중심 모델 인 Dracarys의 Bindu Reddy의 출시가 포함됩니다. 신속한 엔지니어링 및 하이브리드 아키텍처에서 추가 발전이 이루어졌으며 AI 기능 및 응용 프로그램의 빠른 진화를 강조했습니다.
주요 개발
- 새로운 모델 : AI21 Labs는 LLAMA 3.1 70B와 같은 모델을 능가하는 더 빠른 추론과 우수한 장기 텍스트 성능을 자랑하는 강력한 모델 인 Jamba 1.5를 출시했습니다.
- 모델 개선 : Anthropicai 통합 라텍스 렌더링 및 클로드 3 로의 캐싱으로 수학적 능력과 효율성을 높입니다. Bindu Reddy의 Dracarys는 최고의 오픈 소스 코딩 모델로 등장했습니다.
- 연구 혁신 : 신속한 최적화 및 하이브리드 아키텍처의 상당한 진전은 복잡한 작업과 광범위한 상황을 처리 할 수있는 AI의 능력을 확대하고 있습니다.
- AI 도구 및 응용 프로그램 : Spellbook Associate (Legal Tech) 및 MLX Hub (Model Management)와 같은 새로운 도구는 AI의 실제 범위를 넓히고 있습니다.
- 업계 과제 : 이 보고서는 다단계 AI 워크 플로에서 높은 정확도를 달성하는 데있어 지속적인 어려움과 오픈 소스 대 폐쇄 소스 모델의 상대적인 장점을 둘러싼 지속적인 논의를 강조했습니다.
- 규제 환경 : AI 안전 및 규제를 둘러싼 지속적인 논쟁이 강조되었으며 캘리포니아의 SB 1047 및 오픈 소스 모델 규정에 대한 Anthropic의 위치에 중점을 둡니다.
AI 모델 발전 및 릴리스
AI21 Labs 'Jamba 1.5
AI21 Labs는 Jamba 모델로의 상당한 업그레이드 인 Jamba 1.5를 공개했습니다. 이 향상된 모델은 긴 상황을 처리하는 데 탁월하며 최대 2.5 배 빠른 추론 속도를 제공합니다. 벤치 마크 테스트는 LLAMA 3.1 70B와 같은 더 큰 모델을 능가하는 탁월한 성능을 보여줍니다.
- Jamba 1.5는 미니 (52b-12b 활성) 및 대형 (398b-94b 활성) 버전으로 제공되는 하이브리드 SSM-Transformer MOE 모델입니다.
- 주요 기능에는 256K 컨텍스트 창, 다국어 기능 및 장기 텍스트 응용 프로그램을위한 최적화 된 성능이 포함됩니다.
- Arena Hard Benchmark에서 인상적인 65.4 점수는 Llama 3.1 70b와 같은 대규모 경쟁자에 비해 성능의 이점을 강조합니다.
Anthropicai의 Claude 3 향상
Claude 3은 개선 된 수학 방정식 처리 및 Claude 3 Opus의 프롬프트 캐싱을위한 라텍스 렌더링을 포함하여 업데이트를 받았으며보다 효율적인 쿼리 처리로 이어졌습니다.
Bindu Reddy의 Dracarys
Bindu Reddy는 Dracarys를 출시했으며 코딩 작업을 위해 특별히 설계된 주요 오픈 소스 70B 클래스 모델로 제시되었습니다. 벤치 마크 테스트에서 LLAMA 3.1 70B 및 기타 모델보다 성능이 우수하며 포옹 얼굴에서 사용할 수 있습니다. 이 모델은 오픈 소스에 비해 코딩 성능의 현저한 개선을 보여줍니다.
기타 주목할만한 모델 : Mistral Nemo Minitron 8b, Phi-3.5 및 Flexora
Mistral Nemo Minitron 8b는 Llama 3.1 8b 및 Mistral 7b보다 우수한 성능을 보여줍니다. Microsoft의 PHI-3.5는 안전성과 성능으로 칭찬을 받았습니다. Flexora는 혁신적인 LORA 미세 조정 접근법을 도입하여 결과를 개선하면서 교육 매개 변수를 최대 50%줄였습니다.
AI 연구 및 방법론
신속한 엔지니어링 발전
신속한 최적화의 복잡성이 강조되어 광범위한 검색 공간 내에서 최적의 프롬프트를 식별하기가 어렵다는 점을 강조했습니다. AutoPrompt/GCG와 같은 간단한 알고리즘의 놀라운 효과가 주목되었습니다.
하이브리드 아키텍처
특히 긴 상황과 빠른 추론을위한 하이브리드 맘바/변압기 아키텍처의 효율에 대해 논의되었다.
AI 응용 프로그램 및 관련 도구
Spellbook Associate 및 기타 도구
법률 전문가를위한 AI 에이전트 인 Spellbook Associate는 작업을 자동화하고 프로젝트 계획을 조정합니다. 워크 플로와 같은 새로운 기능을 갖춘 Llamaindex 0.11도 출시되었습니다. Hugging Face Hub의 모델 관리를위한 명령 줄 도구 인 MLX Hub가 소개되었습니다.
AI 개발, 산업 동향 및 안전
도전과 고려 사항
이 보고서는 멀티 스텝 AI 에이전트 워크 플로에서 높은 정확도를 달성하는 데 어려움을 겪고 자율 주행 차량의 "마지막 마일 문제"와 비교했습니다. 오픈 소스와 폐쇄 소스 모델 간의 성과 트레이드 오프에 관한 지속적인 논쟁도 해결되었습니다.
규제 및 윤리적 측면
캘리포니아의 SB 1047과 Open-Source LLM 규제에 대한 Anthropic의 입장을 둘러싼 토론은 책임있는 AI 개발 및 배치에 대한 중요한 요구를 강조했습니다.
결론
지난주는 AI 필드에서 획기적인 모델 릴리스에서 책임있는 AI 개발에 대한 중요한 토론에 이르기까지 AI 필드에서 놀라운 진전을 보여주었습니다. Jamba 1.5 및 Dracarys와 같은 모델의 지속적인 혁신은 신속한 최적화 및 하이브리드 아키텍처의 발전과 함께 빠르게 진화하는 환경을 나타냅니다. 그러나 윤리적 영향과 규제 프레임 워크를 신중하게 고려해야 할 필요성은 AI가 사회 전체에 혜택을받을 수 있도록 가장 중요합니다.
위 내용은 AV 바이트 : 새로운 모델, 연구 발전 및 규제 토론의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

SublimeText3 영어 버전
권장 사항: Win 버전, 코드 프롬프트 지원!

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.
