Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.
"이제 Perplexity Labs의 Miqu와 Mistral-Medium이 동일한 모델이라는 것을 100% 확신합니다."
최근 "Mistral-Medium 모델 유출"에 관한 뉴스가 모두의 관심을 끌었습니다.
루머에 따르면 'Miqu'라는 새로운 모델에 대해 유출된 소식은 언어 모델의 감성 지능을 평가하는 벤치마크인 EQ-Bench와 관련이 있다고 합니다. 관련 자료에 따르면 EQ-Bench와 MMLU의 상관관계는 약 0.97, Arena Elo와의 상관관계는 약 0.94인 것으로 나타났다. 흥미롭게도 Miqu는 이번 벤치마크 평가에서 GPT-4를 제외한 모든 대형 모델을 직접 능가하며 점수는 Mistral-Medium에 매우 가깝습니다. 이 소식은 광범위한 관심과 토론을 불러일으켰습니다.
이미지 출처: https://x.com/N8Programs/status/1752441060133892503?s=20
오픈 소스 주소: https://huggingface.co/miqudev/miqu-1-70b
이러한 강력한 모델에 대해 프로젝트 게시자는 신비한 사람입니다.
누군가 "당신을 만든 사람"이라고 물었고 Miqu는 직접적으로 "나는 Mistral Al 팀에 의해 만들어졌습니다."라고 말했습니다.
누군가 두 모델 모두에게 동일한 테스트 문제를 보냈고, 받은 답변은 모두 러시아어로 표시되었습니다. 테스터는 "표준 퍼즐을 아는 것 같지만 장난꾸러기라면 러시아어로 답하도록 조정하는 것은 불가능하다"고 의심을 더했다.
번역 과정에서 표현이 거의 똑같았다. .
미쿠는 어디서 왔나요? 정말 미스트랄-미디엄인가요?
이틀 동안 진행된 뜨거운 토론에서 많은 개발자들이 두 모델을 비교한 결과 다음과 같은 가능성이 제시되었습니다.
1. Miqu는 Mistral-Medium입니다. 2. Miqu는 실제로 MistralAI의 모델입니다. 그러나 일부 초기 MoE 실험 버전 또는 기타 버전은
3입니다. Miqu는 Llama2의 미세 조정된 버전입니다.
앞서 첫 번째 가능성을 지지하는 개발자들이 제시한 이유를 소개했습니다. 사건이 전개됨에 따라 더 많은 개발자가 암호 해독 작업에 참여하고 두 모델에 대해 더 심층적인 테스트를 수행했습니다. 늦게까지 깨어 있던 Reddit 사용자가 실시한 테스트에 따르면 Miqu는 MistralAI 모델의 초기 버전에 더 가깝습니다.
개발자는 4개의 전문 독일어 온라인 데이터 보호 교육/시험에 모델을 적용했습니다. 테스트 데이터, 문제 및 모든 지침은 독일어로 되어 있고, 캐릭터 카드는 영어로 되어 있습니다. 이는 번역 기술과 언어 간 이해를 테스트합니다.
구체적인 테스트 방법은 다음과 같습니다.
- 정보를 제공하기 전에 모델에게 독일어로 지시합니다. "몇 가지 정보를 제공하겠습니다. 이 정보에 주의해 주세요. 하지만 대답할 때는 "OK"를 눌러 확인하세요. 이해하셨나요? 더 이상 말하지 마세요. "모델의 지시 사항 이해 및 실행 능력을 테스트하는 것입니다.
- 주제에 대한 모든 정보를 제공한 후 모델에게 질문하세요. 첫 번째 질문과 마지막 질문은 동일하지만 보기 순서와 문자(X/Y/Z)가 변경되는 객관식 질문(A/B/C)입니다. 각 시험에는 4~6개의 질문이 포함되어 있으며 총 18개의 객관식 문제가 있습니다.
- 모델이 제시한 정답 수를 기준으로 순위가 매겨지며, 강좌 정보 제공 후 답변을 먼저 고려하고, 동점일 경우 사전 정보 제공 없이 맹목적으로 답변합니다. 모든 테스트는 독립적인 단위이며 각 테스트 간에 컨텍스트가 지워지고 세션 간에 메모리나 상태가 유지되지 않습니다.
- 자세한 테스트 보고서는 다음과 같습니다.
miqudev/miqu-1-70b GGUF Q5_K_M, 32K context, Mistral 형식: 4+4+4+5=17/18 배수에 대해 정답만 제공됩니다. 선택 질문. 사전 정보 없이 질문에 답하고 정답을 제시하세요: 4+3+1+5=13/18. 지시대로 "OK"로 데이터 입력이 확인되지 않았습니다.
테스트 중에 개발자는 Miqu가 Mixtral과 많은 유사점을 가지고 있음을 발견했습니다. 뛰어난 이중 언어 철자법 및 문법, 답글에 메모 및 댓글 추가.
그러나 이번 개발자 테스트에서 Miqu는 Mixtral-8x7B-Instruct-v0.1(4비트)보다 성능이 나빴고 Mistral Small and Medium보다 여전히 뛰어났습니다. 하지만 Mixtral 8x7B Instruct보다 별로 좋지는 않습니다. 개발자는 Miqu가 유출된 MistralAI 모델, 즉 오래된 개념 증명 모델일 수 있다고 추측합니다.
이것은 지금까지 두 번째 주장을 뒷받침하는 가장 상세한 테스트입니다.
그러나 일부 개발자는 Miqu가 MistralAI와 아무 관련이 없으며 아키텍처가 Llama 70B와 "정확히 동일"하고 "전문 하이브리드 모델이 아니기" 때문에 Llama 70B에 더 가깝다고 믿습니다.
마찬가지로 일부 사람들은 테스트 후 Miqu가 실제로 Llama에 더 가깝다는 사실을 발견했습니다.
그러나 점수 차이로 볼 때 Miqu와 Llama 70B는 분명히 동일한 모델이 아닙니다.
그래서 누군가 Miqu가 Llama의 미세 조정 버전이거나 Mistral-Medium의 초기 버전이라고 결론을 내렸습니다.
전자가 사실이라면 Miqu는 Llama 70B에서 미세 조정된 것일 수 있습니다. Mistral-Medium 데이터 세트 :
후자가 사실이라면 Miqu는 Mistral API의 증류일 뿐이며 "미국의 가짜 달 착륙" 수준의 희극일 수 있습니다.
마지막 질문, 유출자가 누구야?
많은 X 플랫폼 사용자들이 제공한 단서에 따르면 유출 의심 모델은 원래 4chan이라는 웹사이트에 게시되었습니다. 이 웹사이트는 사용자가 등록하지 않고도 그래픽 및 텍스트 댓글을 게시할 수 있는 완전한 익명의 실시간 메시징 포럼입니다.
물론 이러한 결론은 주관적입니다. 모든 AI 연구자들에게 이 음모가 끝나려면 "진실"이 필요합니다.
참조 링크: https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/
위 내용은 Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

내 칼럼을 처음 접할 수있는 분들을 위해, 나는 구체화 된 AI, AI 추론, AI의 첨단 획기적인 혁신, AI 교육, AI의 수비, ai re

유럽의 야심 찬 AI 대륙 행동 계획은 EU를 인공 지능의 글로벌 리더로 설립하는 것을 목표로합니다. 핵심 요소는 AI Gigafactories 네트워크를 만드는 것입니다. 각각 약 100,000 개의 고급 AI 칩을 보유하고 있습니다 - Capaci의 4 배

AI 에이전트 애플리케이션에 대한 Microsoft의 통합 접근 방식 : 비즈니스를위한 명확한 승리 새로운 AI 에이전트 기능에 관한 Microsoft의 최근 발표는 명확하고 통합 된 프레젠테이션에 깊은 인상을 받았습니다. 많은 기술 발표와는 달리 TE에서 멍청한 것입니다

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

IBM의 Z17 메인 프레임 : 향상된 비즈니스 운영을 위해 AI를 통합합니다 지난 달, IBM의 뉴욕 본사에서 Z17의 기능을 미리 보았습니다. Z16의 성공을 기반으로 (2022 년에 시작되어 지속적인 수익을 보여주는 시연

흔들리지 않는 자신감을 해제하고 외부 검증의 필요성을 제거하십시오! 이 다섯 개의 chatgpt 프롬프트는 완전한 자립과 자기 인식의 변형적인 변화로 당신을 안내 할 것입니다. 간단히 괄호를 복사, 붙여 넣기 및 사용자 정의하십시오

인공 지능 보안 및 연구 회사 인 Anthropic의 최근 [연구]는 이러한 복잡한 과정에 대한 진실을 밝히기 시작하여 우리 자신의인지 영역과 방해가되는 복잡성을 보여줍니다. 자연 지능과 인공 지능은 우리가 생각하는 것보다 더 유사 할 수 있습니다. 내부 스누핑 : 의인성 해석 가능성 연구 Anthropic이 수행 한 연구에서 얻은 새로운 연구 결과는 AI의 내부 컴퓨팅을 역 엔지니어링하는 것을 목표로하는 기계적 해석 성 분야에서 상당한 발전을 나타냅니다. AI가하는 일을 관찰 할뿐만 아니라 인공 뉴런 수준에서 어떻게 수행하는지 이해합니다. 누군가가 특정한 대상을 보거나 특정한 아이디어에 대해 생각할 때 어떤 뉴런이 발사하는지 그림으로 뇌를 이해하려고한다고 상상해보십시오. 에이

Qualcomm 's Dragonwing : 기업 및 인프라로의 전략적 도약 Qualcomm은 새로운 Dragonwing 브랜드를 통해 전 세계적으로 엔터프라이즈 및 인프라 시장을 대상으로 모바일을 넘어 범위를 적극적으로 확장하고 있습니다. 이것은 단지 Rebran이 아닙니다


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

ZendStudio 13.5.1 맥
강력한 PHP 통합 개발 환경

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.
