搜尋
首頁科技週邊人工智慧零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

Mar 11, 2024 pm 04:01 PM
產業向量資料庫010,000 件東西

3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。

向量数据库,又被称为 AI 时代的信息检索技术,是检索增强生成(Retrieval-Augmented Generation, RAG)内核技术之一。对大模型应用开发者来说,向量数据库是非常重要的基础设施,在一定程度上影响着大模型的性能表现。

在国际权威评测平台 ANN-Benchmarks 离线测试中,零一万物笛卡尔(Descartes)向量数据库登顶 6 份数据集评测第一名,比之前榜单上同业第一名有显著性能提升,部分数据集上的性能提升甚至超过 2 倍以上。

零一万物表示,笛卡尔向量数据库将用在近期即将正式亮相的 AI 产品中,未来也将结合工具提供给开发者。

向量数据库成 AI 2.0 基础设施
获资本市场青睐

随着大模型为代表的 AI 2.0 时代到来,图片、视频、自然语言等多模态的非结构化数据量陡增,区别于用来处理结构化数据的传统数据库。向量数据库专门用来存储、管理、查询和检索向量化的非结构化数据;它就像一块外接的记忆盘,可供大模型随时调用,以形成「长期记忆」,也被昵称为大模型记忆的「海马体」。

大模型天然有四个缺陷,向量数据库就像是量身定制的「特效药」,能精准解决每个痛点。

  • 实时信息:大模型训练时间长,更新慢,无法反应最新的信息,其知识存在「截止期」的挑战。向量数据库采用轻量化更新机制,可以快速补充最新信息。
  • 隐私保护:用户的安全隐私数据不宜直接提供给大模型训练,否则会有泄密风险,向量数据通过在推理阶段扮演信息传递的中间载体,破解了隐私保护的难关。
  • 幻觉矫正:大模型常表现出的推理失真或产生幻觉的现象,可以通过向量数据库提供的丰富知识参照,有效矫正和减轻此类问题。
  • 推理效率:大模型推理成本高,向量数据库能够作为一种缓存机制,避免每一次查询请求都需要重新执行复杂的推理计算,大大节省了计算资源。

AI 2.0 掀起的科技变革和平台变革,进一步强化了向量数据库的作用。Google、微软、Meta 等大厂的相关产品先后问世,Zilliz、Pinecone、Weaviate、Qdrant 等创业公司也异军突起。2023 年,OpenAI 的向量数据库合作方 Pinecone 完成了 B 轮 1.38 亿美元融资,国内初创企业 Fabarta ArcNeural 也完成了上亿元 Pre-A 轮融资。
 
挑战权威榜单
包揽评测六项第一

ANN-Benchmarks 是当下业界最权威的向量数据库性能测试工具,它可以展示不同算法在不同真实数据集下的表现。

在以下 6 份评测数据集涵盖 glove-25-angular、glove-100-angular、sift-128-euclidean、nytimes-256-angular、fashion-mnist-784-euclidean、gist-960-euclidean 六大数据集,横坐标代表召回、纵坐标代表 QPS (每秒内处理的请求数),曲线位置越偏右上角意味着算法性能越好,零一万物笛卡尔向量数据库在 6 项数据集评测中都处于最高位。

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

                                      截至 3 月 10 日,ANN-Benchmarks6 项评测中,零一万物笛卡尔(Descartes)向量数据库均居第一

「吞吐量 QPS」 是衡量信息检索系统(例如搜索引擎或数据库)查询处理能力的重要指标。在原榜单 TOP1 基础上,零一万物笛卡尔向量数据库实现了显著性能提升,部分数据集上的性能提升超过 2 倍以上,在 gist-960-euclidean 数据集维度更大幅领先榜单原 TOP1 286%。

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

                               零一万物笛卡尔向量数据库与原榜单 TOP1 QPS 性能对比

技术揭秘

令人好奇的是,笛卡尔如何实现上述优秀性能?

众所周知,RAG 是一种结合了检索和生成的技术,它通过从海量数据中检索查询到的信息,来增强语言模型的生成能力。和传统检索方法类似,从本质上讲,RAG 向量检索主要解决两大问题:

1. 通过建立某种索引结构,减少检索考察的候选集;
2. 降低单个向量计算的复杂度。

零一万物笛卡尔向量数据库在处理复杂查询、提高检索效率以及优化数据存储方面相比业界拥有显著的比较优势。针对第 1 个问题,零一万物团队有两大杀手锏:

零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一

  • 領先的全導航圖技術。 目前業內現況主要透過哈希、KD-Tree、VP-Tree 等方式,導航效果不夠精確,裁剪力道不夠,零一萬物研發的全局多層縮圖導航技術,圖上坐標系導航,既能保證精度,又能裁剪大量無關向量。
  • 首創自適應鄰居選擇策略,填補業界空白。 零一萬物自研的自適應鄰居選擇策略,突破了以往僅依賴真實topk 或固定邊選擇策略的局限,新策略使每個節點可以根據自身及鄰居的分佈特徵動態地選取最佳鄰居邊,更快收斂接近目標向量,從而讓RAG 向量檢索效能提高15%-30%。

針對第 2 個問題,零一萬物採用了兩層量化方案增強 RAG。零一萬物以兩級量化降低運算複雜度,同時列式儲存充分利用 SIMD 的同時能力,進一步發揮硬體能力,相較於傳統 PQ 查表,效能大幅提升到 2-3 倍。

除此之外,零一萬物還有索引結構最佳化、連結性保障等全端向量技術方案提升笛卡爾向量資料庫的效能。

全棧向量技術:精度更高、性能更強

透過上述全端向量技術的加持,讓零一萬物笛卡爾向量資料庫不僅登頂權威榜單ANN-Benchmarks6 項評測第一名。更在實際應用場景中具有精度更高、效能更強等核心優勢。

零一萬物笛卡爾向量資料庫目前聚焦於高效能向量資料庫。高效能向量資料庫通常是指向量資料集規模在千萬級及以下(如2,000 萬128 維浮點型向量),通常而言,高效能向量資料庫可以輕鬆應對百分之八九十的日常場景,例如幫助企業客戶建立私域知識庫、智慧客服系統;在自動駕駛領域,使用高效能向量資料庫可加速自動駕駛模型訓練等。

零一萬物高效能向量資料庫具有以下優點:



# #超高精度:
基於多層縮圖和座標系實現層間導航和圖上方位導航,以及圖連通性保障,實現精度大於99%,相同性能下,精度大幅領先業內水平。 ###############超高效能:###高效的邊選擇與裁切技術,千萬資料庫 ms 回應。 #####################以電商推薦場景為例,上架商品數量可能千萬級,每個商品可以由一個向量來表達。即使庫中向量數不算很大,如果電商用戶基數非常龐大,高峰時每秒用戶請求數非常大,可能達到幾十萬甚至上百萬的 QPS。使用高效能向量資料庫可以有效提升電商場景裡面搜尋、廣告業務的推薦效果,讓大家忍不住一直買買買。 ###############零一萬物表示,笛卡爾向量資料庫是團隊基於 RAG 的初步嘗試,將在近期發布的 AI 生產力產品中有效應用。未來各家大模型優化到一定程度後,向量資料庫的能力可能決定各家大模型的天花板。零一萬物後續會持續專注於研發與分享,為使用者帶來更好的技術與體驗。 ###

以上是零一萬物自研全導航圖向量資料庫,橫掃權威榜單6項第一的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
讓我們跳舞:結構化運動以微調我們的人類神經網讓我們跳舞:結構化運動以微調我們的人類神經網Apr 27, 2025 am 11:09 AM

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

新的Google洩漏揭示了雙子AI的訂閱更改新的Google洩漏揭示了雙子AI的訂閱更改Apr 27, 2025 am 11:08 AM

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

數據分析加速度如何求解AI的隱藏瓶頸數據分析加速度如何求解AI的隱藏瓶頸Apr 27, 2025 am 11:07 AM

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

Markitdown MCP可以將任何文檔轉換為Markdowns!Markitdown MCP可以將任何文檔轉換為Markdowns!Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

如何使用Google ADK進行建築代理? - 分析Vidhya如何使用Google ADK進行建築代理? - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

在LLM上使用SLM進行有效解決問題-Analytics Vidhya在LLM上使用SLM進行有效解決問題-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

如何將Google Gemini模型用於計算機視覺任務? - 分析Vidhya如何將Google Gemini模型用於計算機視覺任務? - 分析VidhyaApr 27, 2025 am 09:26 AM

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Apr 27, 2025 am 09:20 AM

2025年的AI景觀正在充滿活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到來。 這些尖端的車型分開了幾週,具有可比的高級功能和令人印象深刻的基準分數。這個深入的比較

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),