찾다
기술 주변기기일체 포함Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

"이제 Perplexity Labs의 Miqu와 Mistral-Medium이 동일한 모델이라는 것을 100% 확신합니다."

최근 "Mistral-Medium 모델 유출"에 관한 뉴스가 모두의 관심을 끌었습니다.

루머에 따르면 'Miqu'라는 새로운 모델에 대해 유출된 소식은 언어 모델의 감성 지능을 평가하는 벤치마크인 EQ-Bench와 관련이 있다고 합니다. 관련 자료에 따르면 EQ-Bench와 MMLU의 상관관계는 약 0.97, Arena Elo와의 상관관계는 약 0.94인 것으로 나타났다. 흥미롭게도 Miqu는 이번 벤치마크 평가에서 GPT-4를 제외한 모든 대형 모델을 직접 능가하며 점수는 Mistral-Medium에 매우 가깝습니다. 이 소식은 광범위한 관심과 토론을 불러일으켰습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

이미지 출처: https://x.com/N8Programs/status/1752441060133892503?s=20

오픈 소스 주소: https://huggingface.co/miqudev/miqu-1-70b

이러한 강력한 모델에 대해 프로젝트 게시자는 신비한 사람입니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

누군가 "당신을 만든 사람"이라고 물었고 Miqu는 직접적으로 "나는 Mistral Al 팀에 의해 만들어졌습니다."라고 말했습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

누군가 두 모델 모두에게 동일한 테스트 문제를 보냈고, 받은 답변은 모두 러시아어로 표시되었습니다. 테스터는 "표준 퍼즐을 아는 것 같지만 장난꾸러기라면 러시아어로 답하도록 조정하는 것은 불가능하다"고 의심을 더했다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

번역 과정에서 표현이 거의 똑같았다. .

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

미쿠는 어디서 왔나요? 정말 미스트랄-미디엄인가요?

이틀 동안 진행된 뜨거운 토론에서 많은 개발자들이 두 모델을 비교한 결과 다음과 같은 가능성이 제시되었습니다.

1. Miqu는 Mistral-Medium입니다. 2. Miqu는 실제로 MistralAI의 모델입니다. 그러나 일부 초기 MoE 실험 버전 또는 기타 버전은

3입니다. Miqu는 Llama2의 미세 조정된 버전입니다.

앞서 첫 번째 가능성을 지지하는 개발자들이 제시한 이유를 소개했습니다. 사건이 전개됨에 따라 더 많은 개발자가 암호 해독 작업에 참여하고 두 모델에 대해 더 심층적인 테스트를 수행했습니다. 늦게까지 깨어 있던 Reddit 사용자가 실시한 테스트에 따르면 Miqu는 MistralAI 모델의 초기 버전에 더 가깝습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.개발자는 4개의 전문 독일어 온라인 데이터 보호 교육/시험에 모델을 적용했습니다. 테스트 데이터, 문제 및 모든 지침은 독일어로 되어 있고, 캐릭터 카드는 영어로 되어 있습니다. 이는 번역 기술과 언어 간 이해를 테스트합니다.

구체적인 테스트 방법은 다음과 같습니다.

    정보를 제공하기 전에 모델에게 독일어로 지시합니다. "몇 가지 정보를 제공하겠습니다. 이 정보에 주의해 주세요. 하지만 대답할 때는 "OK"를 눌러 확인하세요. 이해하셨나요? 더 이상 말하지 마세요. "모델의 지시 사항 이해 및 실행 능력을 테스트하는 것입니다.
  • 주제에 대한 모든 정보를 제공한 후 모델에게 질문하세요. 첫 번째 질문과 마지막 질문은 동일하지만 보기 순서와 문자(X/Y/Z)가 변경되는 객관식 질문(A/B/C)입니다. 각 시험에는 4~6개의 질문이 포함되어 있으며 총 18개의 객관식 문제가 있습니다.
  • 모델이 제시한 정답 수를 기준으로 순위가 매겨지며, 강좌 정보 제공 후 답변을 먼저 고려하고, 동점일 경우 사전 정보 제공 없이 맹목적으로 답변합니다. 모든 테스트는 독립적인 단위이며 각 테스트 간에 컨텍스트가 지워지고 세션 간에 메모리나 상태가 유지되지 않습니다.
  • 자세한 테스트 보고서는 다음과 같습니다.

miqudev/miqu-1-70b GGUF Q5_K_M, 32K context, Mistral 형식: 4+4+4+5=17/18 배수에 대해 정답만 제공됩니다. 선택 질문. 사전 정보 없이 질문에 답하고 정답을 제시하세요: 4+3+1+5=13/18. 지시대로 "OK"로 데이터 입력이 확인되지 않았습니다.

테스트 중에 개발자는 Miqu가 Mixtral과 많은 유사점을 가지고 있음을 발견했습니다. 뛰어난 이중 언어 철자법 및 문법, 답글에 메모 및 댓글 추가.

그러나 이번 개발자 테스트에서 Miqu는 Mixtral-8x7B-Instruct-v0.1(4비트)보다 성능이 나빴고 Mistral Small and Medium보다 여전히 뛰어났습니다. 하지만 Mixtral 8x7B Instruct보다 별로 좋지는 않습니다. 개발자는 Miqu가 유출된 MistralAI 모델, 즉 오래된 개념 증명 모델일 수 있다고 추측합니다.

이것은 지금까지 두 번째 주장을 뒷받침하는 가장 상세한 테스트입니다.

그러나 일부 개발자는 Miqu가 MistralAI와 아무 관련이 없으며 아키텍처가 Llama 70B와 "정확히 동일"하고 "전문 하이브리드 모델이 아니기" 때문에 Llama 70B에 더 가깝다고 믿습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

마찬가지로 일부 사람들은 테스트 후 Miqu가 실제로 Llama에 더 가깝다는 사실을 발견했습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

그러나 점수 차이로 볼 때 Miqu와 Llama 70B는 분명히 동일한 모델이 아닙니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

그래서 누군가 Miqu가 Llama의 미세 조정 버전이거나 Mistral-Medium의 초기 버전이라고 결론을 내렸습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

전자가 사실이라면 Miqu는 Llama 70B에서 미세 조정된 것일 수 있습니다. Mistral-Medium 데이터 세트 :

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

후자가 사실이라면 Miqu는 Mistral API의 증류일 뿐이며 "미국의 가짜 달 착륙" 수준의 희극일 수 있습니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

마지막 질문, 유출자가 누구야?

많은 X 플랫폼 사용자들이 제공한 단서에 따르면 유출 의심 모델은 원래 4chan이라는 웹사이트에 게시되었습니다. 이 웹사이트는 사용자가 등록하지 않고도 그래픽 및 텍스트 댓글을 게시할 수 있는 완전한 익명의 실시간 메시징 포럼입니다.

Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.

물론 이러한 결론은 주관적입니다. 모든 AI 연구자들에게 이 음모가 끝나려면 "진실"이 필요합니다.

참조 링크: https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/

위 내용은 Mistral-Medium이 실수로 유출되었나요? 목록에 오른 이 신비한 모델은 AI 커뮤니티에서 많은 논의를 불러일으켰습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 机器之心에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
최고의 프롬프트 엔지니어링 기술의 최신 연간 편집최고의 프롬프트 엔지니어링 기술의 최신 연간 편집Apr 10, 2025 am 11:22 AM

내 칼럼을 처음 접할 수있는 분들을 위해, 나는 구체화 된 AI, AI 추론, AI의 첨단 획기적인 혁신, AI 교육, AI의 수비, ai re

유럽의 AI 대륙 행동 계획 : 기가 팩토리, 데이터 실험실 및 녹색 AI유럽의 AI 대륙 행동 계획 : 기가 팩토리, 데이터 실험실 및 녹색 AIApr 10, 2025 am 11:21 AM

유럽의 야심 찬 AI 대륙 행동 계획은 EU를 인공 지능의 글로벌 리더로 설립하는 것을 목표로합니다. 핵심 요소는 AI Gigafactories 네트워크를 만드는 것입니다. 각각 약 100,000 개의 고급 AI 칩을 보유하고 있습니다 - Capaci의 4 배

Microsoft의 간단한 에이전트 스토리가 더 많은 팬을 만들기에 충분합니까?Microsoft의 간단한 에이전트 스토리가 더 많은 팬을 만들기에 충분합니까?Apr 10, 2025 am 11:20 AM

AI 에이전트 애플리케이션에 대한 Microsoft의 통합 접근 방식 : 비즈니스를위한 명확한 승리 새로운 AI 에이전트 기능에 관한 Microsoft의 최근 발표는 명확하고 통합 된 프레젠테이션에 깊은 인상을 받았습니다. 많은 기술 발표와는 달리 TE에서 멍청한 것입니다

직원에게 AI 전략 판매 : Shopify CEO의 선언문직원에게 AI 전략 판매 : Shopify CEO의 선언문Apr 10, 2025 am 11:19 AM

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

IBM은 전체 AI 통합으로 Z17 메인 프레임을 출시합니다IBM은 전체 AI 통합으로 Z17 메인 프레임을 출시합니다Apr 10, 2025 am 11:18 AM

IBM의 Z17 메인 프레임 : 향상된 비즈니스 운영을 위해 AI를 통합합니다 지난 달, IBM의 뉴욕 본사에서 Z17의 기능을 미리 보았습니다. Z16의 성공을 기반으로 (2022 년에 시작되어 지속적인 수익을 보여주는 시연

5 Chatgpt가 다른 사람에 따라 멈추고 자신을 완전히 믿으라고 프롬프트5 Chatgpt가 다른 사람에 따라 멈추고 자신을 완전히 믿으라고 프롬프트Apr 10, 2025 am 11:17 AM

흔들리지 않는 자신감을 해제하고 외부 검증의 필요성을 제거하십시오! 이 다섯 개의 chatgpt 프롬프트는 완전한 자립과 자기 인식의 변형적인 변화로 당신을 안내 할 것입니다. 간단히 괄호를 복사, 붙여 넣기 및 사용자 정의하십시오

AI는 당신의 마음과 위험합니다AI는 당신의 마음과 위험합니다Apr 10, 2025 am 11:16 AM

인공 지능 보안 및 연구 회사 인 Anthropic의 최근 [연구]는 이러한 복잡한 과정에 대한 진실을 밝히기 시작하여 우리 자신의인지 영역과 방해가되는 복잡성을 보여줍니다. 자연 지능과 인공 지능은 우리가 생각하는 것보다 더 유사 할 수 있습니다. 내부 스누핑 : 의인성 해석 가능성 연구 Anthropic이 수행 한 연구에서 얻은 새로운 연구 결과는 AI의 내부 컴퓨팅을 역 엔지니어링하는 것을 목표로하는 기계적 해석 성 분야에서 상당한 발전을 나타냅니다. AI가하는 일을 관찰 할뿐만 아니라 인공 뉴런 수준에서 어떻게 수행하는지 이해합니다. 누군가가 특정한 대상을 보거나 특정한 아이디어에 대해 생각할 때 어떤 뉴런이 발사하는지 그림으로 뇌를 이해하려고한다고 상상해보십시오. 에이

Dragonwing은 Qualcomm의 가장자리 모멘텀을 보여줍니다Dragonwing은 Qualcomm의 가장자리 모멘텀을 보여줍니다Apr 10, 2025 am 11:14 AM

Qualcomm 's Dragonwing : 기업 및 인프라로의 전략적 도약 Qualcomm은 새로운 Dragonwing 브랜드를 통해 전 세계적으로 엔터프라이즈 및 인프라 시장을 대상으로 모바일을 넘어 범위를 적극적으로 확장하고 있습니다. 이것은 단지 Rebran이 아닙니다

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

맨티스BT

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

SecList

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.