IT之家10 月26 日消息,Jina AI 在其官網發布新聞稿,宣布推出jina-embeddings-v2 模型,號稱是目前是唯一支援8K(8192 個token)上下文長度的開源產品,在功能和性能上與OpenAI 的text-embedding-ada-002 類似。
在MTEB排行榜方面,IT之家發現官方做出了以下解釋:
▲ 圖源 Jina AI 官網與OpenAI 的8K 模型text-embedding-ada-002 進行比較,jina-embedding-v2 在分類平均值、重排平均值、檢索平均值和摘要平均值方面均優於OpenAI 的text-embedding- ada-002
▲ 圖源 Jina AI 官網
官方表示,jina-embeddings-v2 模型,是從頭開始建立的。在過去的三個月裡,Jina AI 團隊進行了密集研發、資料收集和調整。
Jina AI 同時聲稱, jina-embeddings-v2 8K 的上下文長度有利於以下應用場景:
- 法律文件分析:確保對大量法律文本中的每一個細節進行捕捉和分析。
- 醫學研究:為了進行高階分析和發現,全面地嵌入科學論文。
- 文學分析:深入研究長篇內容,捕捉微妙的主題元素。
- 財務預測:透過詳細的財務報告獲得卓越的洞察力。
- 會話式 AI:提升聊天機器人對複雜使用者查詢的回應能力。
以上是Jina AI 推出全球首個開源 8K 文字嵌入模型,號稱超越 OpenAI的詳細內容。更多資訊請關注PHP中文網其他相關文章!