>  기사  >  기술 주변기기  >  대형모델의 '골든파트너'가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시

대형모델의 '골든파트너'가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시

WBOY
WBOY앞으로
2023-07-06 08:37:55872검색

7월 4일, Tencent Cloud는 AI 네이티브(AI Native) 벡터 데이터베이스 Tencent Cloud VectorDB를 공식 출시했습니다. 이 데이터베이스는 대규모 모델 훈련, 추론, 지식 기반 보완과 같은 시나리오에서 널리 사용될 수 있습니다. 이는 액세스 계층, 컴퓨팅 계층에서 스토리지 계층까지 전체 수명 주기 AI를 제공하는 중국 최초의 벡터 데이터베이스입니다.

업계에서는 대형 모델의 "해마"라고 불리는 벡터 데이터베이스는 벡터 데이터를 저장하고 쿼리하도록 특별히 설계되었습니다. 보고서에 따르면 Tencent Cloud의 벡터 데이터베이스는 최대 10억 개의 벡터 검색 규모를 지원하며 대기 시간은 밀리초 수준으로 제어됩니다. 기존 독립형 플러그인 데이터베이스에 비해 검색 규모가 10배 증가했으며, 최대 쿼리 용량은 초당 백만 레벨(QPS)입니다.

Tencent Cloud는 AI 기본 벡터 데이터베이스를 정의합니다

대형 모델 시대가 도래하면서 기업의 대형 모델 수용은 필수가 되었습니다.

벡터 데이터베이스는 데이터를 벡터화하여 효율성을 크게 향상시키고 비용을 절감할 수 있습니다. 대형 모델의 높은 사전 훈련 비용, "장기 기억" 없음, 지식 업데이트 부족, 복잡한 프롬프트 단어 엔지니어링 문제를 해결하고 대형 모델의 시간 및 공간 제한을 극복하고 대형 모델의 구현을 가속화할 수 있습니다. 산업 시나리오의 모델.

통계에 따르면 Tencent Cloud 벡터 데이터베이스를 사용하여 대규모 모델 사전 훈련 데이터를 분류, 중복 제거 및 정리하면 벡터 데이터베이스를 모델 추론을 위한 외부 지식 기반으로 사용하는 경우 효율성이 10배 향상될 수 있습니다. 비용을 2~4배 정도 줄일 수 있습니다.

Tencent Cloud는 AI 네이티브의 개발 패러다임을 재정의하고 액세스 레이어, 컴퓨팅 레이어, 스토리지 레이어에 대한 포괄적인 AI 솔루션을 제공하여 사용자가 이를 벡터 AI 사용의 전체 라이프사이클에 적용할 수 있게 했다는 점에 주목할 필요가 있습니다. 능력.

구체적으로 액세스 계층에서 Tencent Cloud 벡터 데이터베이스는 자연어 텍스트 입력을 지원하고 "스칼라 + 벡터" 쿼리 방법을 채택하며 전체 메모리 인덱싱을 지원하고 초당 최대 100만 쿼리(QPS)를 지원합니다. 컴퓨팅 계층인 AI 네이티브 개발 패러다임은 기업이 스토리지 계층인 Tencent Cloud에서 개인 도메인 지식 기반을 구축할 때 전체 데이터 AI 계산을 실현하고 텍스트 분할(세분화) 및 벡터화(임베딩)와 같은 문제를 원스톱으로 해결할 수 있습니다. Vector 데이터베이스는 데이터의 지능형 스토리지 배포를 지원하여 기업이 스토리지 비용을 50% 절감할 수 있도록 지원합니다.

대형모델의 골든파트너가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시

예전에는 기업이 대규모 모델에 액세스하는 데 약 한 달이 걸렸습니다. Tencent Cloud 벡터 데이터베이스를 사용하면 3일 만에 완료할 수 있어 기업의 액세스 비용이 크게 절감됩니다.

Tencent Cloud 벡터 데이터베이스의 벡터화 기능(임베딩)은 권위 있는 기관에서 여러 차례 인정을 받은 것으로 알려져 있으며, 2021년에는 MS MARCO 목록에서 1위를 차지했으며 관련 결과가 NLP Summit ACL에 게시되었습니다.

Tencent Cloud Database의 Luo Yun 부사장은 AI 네이티브 시대가 도래했다고 말했습니다. "벡터 데이터베이스 + 대형 모델 + 데이터"는 '플라이휠 효과'를 생성하여 기업이 AI 네이티브 시대로 진입하는 데 공동으로 도움이 될 것입니다. )연대.

Tencent Cloud 벡터 데이터베이스는 데이터 액세스 효율성을 10배 향상시킵니다.

Tencent Cloud 벡터 데이터베이스는 매일 수천억 건의 검색을 처리하는 Tencent Group의 벡터 엔진(OLAMA)을 기반으로 합니다. Tencent 내부의 대규모 시나리오에서 실습한 결과 AI에 대한 데이터 액세스 효율성도 기존 솔루션보다 10배 더 높습니다. , 작동 안정성은 99.99%에 달하며 Tencent Video, QQ Browser, QQ Music 등 30개 이상의 국가급 제품에 사용되었습니다.

Tencent Cloud 벡터 데이터베이스는 제품의 운영 효율성을 향상시키는 데 효과적으로 도움을 줄 수 있습니다. 데이터에 따르면 Tencent Cloud 벡터 데이터베이스를 사용한 후 QQ Music의 1인당 청취 시간은 3.2% 증가했고 Tencent Video의 1인당 유효 노출 시간은 1.74% 증가했으며 QQ 브라우저 비용은 37.9% 감소했습니다.

Tencent Video 애플리케이션을 예로 들면, 동영상 라이브러리의 이미지, 오디오, 제목 텍스트 및 기타 콘텐츠는 Tencent Cloud 벡터 데이터베이스를 사용하여 월 평균 검색 및 계산량이 200억 회에 달하며 이는 저작권 요구 사항을 효과적으로 충족합니다. 보호, 원본 식별, 유사성 등 성적 검색과 같은 시나리오 요구 사항.

대형 모델 가속 벡터 데이터베이스는 급속한 발전기에 접어들었습니다. 동북증권에 따르면, 글로벌 벡터 데이터베이스 시장은 2030년까지 500억 달러에 이를 것으로 예상되며, 국내 벡터 데이터베이스 시장은 600억 위안을 초과할 것으로 예상됩니다.

벡터 데이터베이스는 기업이 대형 모델을 보다 효율적이고 편리하게 사용할 수 있도록 지원하여 데이터의 가치를 극대화합니다. 대형 모델의 지속적인 개발과 대중화로 AI 네이티브 벡터 데이터베이스는 기업 데이터 처리의 표준이 될 것입니다.

위 내용은 대형모델의 '골든파트너'가 여기 있다! Tencent Cloud, 10억 개 수준의 벡터 검색 기능을 제공하는 AI 기본 벡터 데이터베이스 공식 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 sohu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제