찾다
기술 주변기기일체 포함AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 '강'이 필요하다.

업계 정상회담에서 칭화대학교의 학자 과학자는 우리의 대형 AI 모델이 Wanka 클러스터에서 훈련되고 3시간마다 오류가 발생한다고 밝혔습니다. 좀 우스꽝스럽게 들리지만, 이것은 세계의 발전된 수준에 도달했습니다

전 세계적으로 인기를 끌고 있는 대형 AI 모델은 올해에도 단연 화제이며, 그 수는 계속해서 놀라운 수준에 도달하고 있습니다. “권력을 놓고 경쟁하는 수백 명의 경쟁자” 속에서 모두가 종종 중요한 문제를 간과합니다. 대규모 AI 모델이 가져오는 데이터의 급류는 상상보다 더 격동적입니다.

믿을 수 없을 만큼 엄청난 실패율처럼 들리는 “3시간에 한 번씩 오류가 발생한다”는 사실은 대형 모델 실무자, 심지어 “우등생”이 직면하는 표준입니다. 현재 업계의 일반적인 관행은 내결함성 체크포인트를 작성하는 것입니다. 3시간 이내에 오류가 보고되므로 2.5시간마다 중지하고 체크포인트를 작성하고 데이터를 저장한 후 다시 학습을 시작해야 합니다. 오류가 발생하면 작성된 체크포인트에서 복구하여 "처음부터 시작"하여 모든 작업을 헛되이 수행하는 것을 방지할 수 있습니다. 체크포인트는 많은 양의 데이터를 저장해야 하며 많은 시간을 소모합니다. 학술팀은 라마 2 아키텍처를 기반으로 대규모 모델을 개발했습니다. 데이터를 하드웨어에 한 번 저장하는 데는 10시간이 걸립니다. 저장 효율성은 개발 진행에 직접적인 영향을 미칩니다.

대규모 이기종 데이터가 마구 솟아오르는 급류라면, 스토리지 시스템은 데이터 흐름을 운반하는 강이다. 그 폭과 견고성이 데이터가 차단될지 아니면 정체할지를 직접적으로 결정하여 대규모 AI 모델의 생명선을 차단한다. 대형 모델 업계 전체의 생산성과 효율성은 스토리지에 따라 '상한'됐다고 할 수 있다.

이것이 AI 데이터 인프라로서 스토리지가 점점 더 주목받는 이유입니다.

AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 강이 필요하다.

11월 29일, '디지털 혁신 AI 미래' 2023년 중국 데이터 및 스토리지 서밋이 베이징에서 열렸습니다. 수곤스토리지가 대규모 AI 모델을 위한 스토리지 솔루션을 출시했다.

이번 기회를 통해 AI 대형 모델의 물결로 인해 스토리지에 발생한 부하 운반 문제와 수곤스토리지가 어떻게 지능형 산업을 선도하고 AI 대형 모델의 항해를 촉진하는지 알아보세요.

AI 대형 모델이 업계의 심해 영역에 진출하고 있으며 기존 저장 방식은 데이터 문제에 직면해 있습니다

최근 운남에 가보니 베이징, 상하이, 광저우 등 과학기술센터는 물론 쿤밍, 다리 등 2선, 3선 도시, 심지어 중국에서도 대형 모형 건설이 한창인 것을 알 수 있었습니다. 국경 지역, 대형 모형 산업 응용이 활발히 모색되고 있습니다.

모든 계층이 지능화를 향해 나아가면서 거의 모든 사람들이 대형 모델에 대한 뜨거운 관심을 불러일으켰습니다. 이때 대규모 AI 모델의 산업화 추세에 따라 스토리지 인프라 업그레이드가 필요하다는 핵심 이슈도 대두됐다.

모델 개발자가 훈련할 때마다 데이터는 스토리지 시스템에 다양한 문제를 제기합니다.

  1. 데이터 홍수의 영향. 업계에서 대형 모델을 구현하면서 많은 산업에서 독점 모델을 훈련하기 시작했습니다. 대량의 업계 데이터, 독점 데이터 및 새로운 주석 데이터가 대형 모델에 공급됩니다. 저장 시스템. 운남성의 한 데이터 기술 회사는 대규모 산업 모델을 고품질 데이터 세트, 문서 및 고객 개인 데이터로 교육해야 한다고 언급했습니다. 비용도 증가합니다.

AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 강이 필요하다.

2. 데이터 혼잡의 족쇄. 매우 큰 규모의 데이터 전처리는 느리고 시간이 많이 걸립니다. 수집, 분류, 재배치 및 기타 프로세스는 시간이 많이 걸리고 힘듭니다. 저장 성능이 유지되지 않으면 대용량 파일의 처리량이 느려지고 읽기 작업이 늘어납니다. 글쓰기, 체크포인트 대기 시간이 길어져 개발 진행이 지연되고 개발 비용이 증가하게 됩니다.

3. 복잡한 데이터의 저류. 또한 대규모 AI 모델은 파일 형식이 복잡하고 데이터 세트 유형이 다양하며 데이터 볼륨이 급증하는 등 대량의 이기종 데이터를 사용합니다. 기존 스토리지는 데이터 복잡성 문제에 대처하기 어렵고 소화 불량 문제가 발생하기 쉽습니다. 결과적으로 모델의 운영 효율성이 감소하고 훈련 컴퓨팅 전력 소비가 증가하며 값비싼 GPU 컴퓨팅 리소스를 완전히 "압축"할 수 없습니다. 예를 들어 윈난(Yunnan)의 지역 태양 관측소는 AI 과학 컴퓨팅 모델을 사용하여 태양의 실제 모습을 표현하기 위해 대규모 이미지를 학습하고 매일 2TB의 이미지 데이터를 생성하며 현재 스토리지 처리량 효율성이 낮아 로딩 속도가 느려집니다. 훈련 세트와 긴 데이터 처리 주기로 인해 연구 프로세스가 느려집니다.

4. 데이터 보안 문제. 현재 대규모 AI 모델은 다양한 산업에 깊이 침투해 있으며, 산업 또는 개인의 민감한 정보가 포함된 데이터를 포함하여 교육, 개발 및 애플리케이션 구현 중에 대규모 데이터 지원이 필요합니다. 데이터 유출로 인해 산업과 개인에게 손실이 발생합니다. 동시에 모델 보안 위험도 심각하게 받아들여야 합니다. 예를 들어, 플러그인에는 유해한 콘텐츠가 이식되어 범죄자가 사기 및 "중독"을 저지르는 도구가 되어 사회 및 산업 보안을 위험에 빠뜨릴 수 있습니다.

AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 강이 필요하다.

AI 대형 모델이 산업의 심해 영역으로 향하고 있습니다. 만족스러운 점은 이러한 기술 혁신이 각계각층에 깊이 접목되어 지능의 요구를 충족시키고 활력이 넘친다는 것입니다. 그러나 몇 가지 우려 사항도 있습니다. 데이터 엔지니어링은 많은 양의 데이터가 필요한 데이터 수집, 정리, 교육, 추론 배포, 피드백 튜닝을 포함하여 대규모 모델의 전체 수명 주기에서 중요한 역할을 합니다. 그러나 스토리지 문제가 병목 현상이 되어 대형 AI 모델이 모든 단계에서 데이터 정체, 오류 및 비효율성에 직면할 수 있으며, 이로 인해 업계의 경제성을 넘어서는 개발 주기가 매우 길어지고 대형 모델의 포괄적인 비용이 발생하게 됩니다.

데이터 침묵을 방지하고 대규모 모델의 산업 발전을 지원 및 육성하려면 저장 "강"을 준설해야 합니다. 수곤스토리지는 우리에게 귀중한 참고 사례를 찾아준 새로운 솔루션을 제공했습니다

고품질 데이터 '채널', 대형 모델 업계의 해답을 제시하는 수곤스토리지

대형 AI 모델 개발자들과 소통한 후 저는 명확한 결론에 도달했습니다. 대규모 AI 모델에 적합한 새로운 스토리지 시스템을 구축하려면 더 이상 논의가 필요하지 않습니다. 핵심은 누가 먼저 솔루션 업그레이드를 완료하고 실용적인 솔루션을 제공할 수 있느냐 하는 것입니다.

수곤스토리지는 업계의 스토리지 요구 사항을 파악하고 ParaStor 대형 모델 전용 스토리지를 기반으로 AI 대형 모델 스토리지 솔루션을 만들고, 자체적인 답변을 작성했습니다.

AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 강이 필요하다.

Sugon Storage AI 대형 모델 스토리지 클러스터에는 이기종 융합, 최고의 성능 및 기본 보안이라는 세 가지 주요 기능이 있습니다.

우선 수천억 개의 파일 저장 서비스를 제공할 수 있고, 확장 규모도 무제한에 가깝습니다. 또한 데이터 액세스 프로토콜 다양성 문제를 구체적으로 해결하고 파일 및 개체와 같은 다중 스토리지 프로토콜을 지원하여 서로 다른 스토리지 시스템 간의 데이터 복사를 방지합니다

둘째, AI 대형 모델 개발 과정에서 데이터 처리 효율성에 대한 높은 요구에 부응하여 Sugon Storage AI 대형 모델 스토리지 클러스터는 다단계 캐시 가속, XDS 데이터 가속 및 지능형과 같은 다중 데이터 IO 성능 최적화 기능을 제공할 수 있습니다. 고속 라우팅.

전체 프로세스에서 데이터 보안을 보장하기 위해 Sugon 스토리지 노드는 칩 수준의 보안 기능을 제공하고 국가 비밀 명령어 세트를 지원합니다. 다단계 신뢰성을 통해 스토리지 클러스터가 교육 및 개발의 전체 주기에 걸쳐 정책 및 향후 보안 동향에 맞춰 안정적으로 작동하도록 보장할 수 있습니다

어떤 사람들은 시중에 너무 많은 스토리지 솔루션이 있다고 물을 수도 있고, 어떤 사람들은 모델 개발에 대한 전문적인 지원을 제공한다고 광고하기도 합니다. 수곤스토리지 솔루션의 차별화된 가치는 무엇인가요?

AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 강이 필요하다.

각 회사의 기술 용어와 제품 세부 사항이 헷갈린다면, 수곤 스토리지 AI 대형 모델 스토리지 클러스터의 차별화된 가치를 기억하기 위해 몇 가지 단어를 사용하는 것이 좋습니다.

1. 고급. 이종 융합, 최고의 성능, 칩 수준의 기본 보안은 Sugon Storage의 기술 발전을 보여주며 특히 대용량 데이터 볼륨, 복잡하고 다양한 데이터 형식, 낮은 처리 효율성, 긴 저장 및 계산 시간 문제를 해결합니다. 모델 개발의 실제 문제점.

2. 신뢰할 수 있습니다. 고성능 AI 데이터 인프라는 수곤스토리지의 자체 개발 혁신을 기반으로 정보혁신 정책과 미래 보안 트렌드에 맞춰 더욱 안정적이고 안전하게 구현되며, 국내 대형 모델 서비스 제공업체가 해외 공급망 리스크를 피할 수 있도록 지원합니다. , 공급망 보안, 데이터 보안 및 모델 안전 및 기타 측면에서 대형 모델 산업의 발전을 보호합니다.

3. 종합. Sugon Storage는 네트워크, 컴퓨팅 및 플랫폼을 포괄하는 전면적인 AI 솔루션을 만들어 훈련 및 개발 주기 전반에 걸쳐 안정적인 운영을 지원함으로써 전체 비용을 절감하고 대형 모델 개발자 및 업계 고객이 걱정 없이 나아갈 수 있도록 해줍니다.

정리하자면, 수곤스토리지가 구축한 고품질 '채널'에서는 대규모 데이터를 효율적으로 처리할 수 있고, 대규모 AI 모델 개발이 가속화될 수 있으므로, 산업계와 기업이 주도적으로 대형 모델을 심층적으로 통합할 수 있습니다. 수직적 시나리오와 비즈니스를 통해 지능형 시대로 나아가세요.

제5패러다임의 새로운 출발점, 도약과 번영을 위해 경쟁하는 수많은 기업의 모습을 관찰

Turing Award 수상자 Jim Gray는 데이터 기반이 핵심인 네 번째 패러다임을 제안한 적이 있습니다. 대규모 언어 모델에서 "지능의 출현"과 함께 "지능 중심"의 다섯 번째 패러다임은 데이터와 지능의 유기적 결합에 더 중점을 두고 과학 혁명과 산업 혁명을 지원하는 새로운 기본 논리가 됩니다.

과거의 모든 것은 프롤로그입니다. 인공지능도 마찬가지고, 스토리지도 마찬가지입니다

AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 강이 필요하다.

이 컨퍼런스에서 Sugon Storage Company의 Hui Runhai 사장은 AI 스토리지 기술 혁신, 액체 냉각 스토리지 연구 및 개발 및 기타 분야에서 20년간의 업계 경험과 선도적인 관행을 인정받아 '스토리지 개척자'라는 칭호를 받았습니다. 그의 리더십 하에 Sugon 분산 파일 스토리지는 시장 점유율 1위를 차지하며 수년 동안 계속해서 시장을 선도해 왔습니다. AI 대형 모델을 위한 데이터 스토리지 솔루션은 수곤스토리지를 다시 한번 시대의 선두로 끌어올렸습니다.

수곤스토리지의 AI 대형 모델 스토리지 클러스터는 새로운 데이터 패러다임에 적응하고 데이터 인프라 혁신을 통해 대형 모델 산업화의 활발한 발전을 촉진하기 위해 패러다임 전환을 적극적으로 실천하고 있습니다

다음으로, 스토리지 산업의 새로운 패러다임이자 새로운 출발점인 수곤스토리지의 고품질 데이터 '강'에서 스트림을 놓고 경쟁하는 수백 개의 대형 산업 모델, 수천 개의 돛을 경주하는 AI 애플리케이션, 그리고 스마트 차이나를 향해 속도를 내고 있다.

위 내용은 AI 대형 모델이 산업의 바다를 향해 항해하고 있고, 이를 길잡이로 삼을 고품질 데이터 '강'이 필요하다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 搜狐에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
외삽에 대한 포괄적 인 가이드외삽에 대한 포괄적 인 가이드Apr 15, 2025 am 11:38 AM

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

소프트 AI의 부상과 오늘날 비즈니스의 의미소프트 AI의 부상과 오늘날 비즈니스의 의미Apr 15, 2025 am 11:36 AM

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

AI 국경을위한 진화 보안 프레임 워크AI 국경을위한 진화 보안 프레임 워크Apr 15, 2025 am 11:34 AM

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!Apr 15, 2025 am 11:33 AM

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Apr 15, 2025 am 11:32 AM

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLMS)에서 환각이 불가피합니까?대형 언어 모델 (LLMS)에서 환각이 불가피합니까?Apr 15, 2025 am 11:31 AM

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

60% 문제 - AI 검색이 트래픽을 배출하는 방법60% 문제 - AI 검색이 트래픽을 배출하는 방법Apr 15, 2025 am 11:28 AM

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

AI R & D의 중심에 인간 번성을하는 MIT Media LabAI R & D의 중심에 인간 번성을하는 MIT Media LabApr 15, 2025 am 11:26 AM

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

DVWA

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

에디트플러스 중국어 크랙 버전

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

안전한 시험 브라우저

안전한 시험 브라우저

안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.