>多模式檢索儀(RAG)系統正在通過整合多種數據類型(TEXT,圖像,音頻和視頻)來徹底改變AI,從而獲得更多細微差別和上下文感知的響應。 這超過了傳統的抹布,這僅關注文本。 一個關鍵的進步是通訊嵌入,為視覺和文本數據創建了一個統一的空間,從而實現了無縫的跨模式交互。 高級模型會生成高質量的嵌入,改善信息檢索並彌合不同內容形式之間的差距,最終豐富用戶體驗。
學習目標
- 掌握了多模式抹布的基本原理及其優勢比傳統抹布。
- 了解嵌入統一文本和圖像嵌入空間中的作用。
- 比較剪輯模型的somic視覺嵌入,分析性能基準。
- >使用somic Vision和Text Embeddings在Python中實現多模式的RAG系統。
- 學習從PDF中提取和處理多模式檢索的文本和視覺數據。
*本文是*** 數據科學blogathon的一部分。
目錄的>
- 什麼是多模式的抹布?
- nive vision嵌入
- >雜誌嵌入的性能基準
- python實施多模式抹布,帶有通知嵌入
-
- >步驟1:安裝必要的庫
- >步驟2:設置OpenAI API鍵並導入庫
- > 步驟3:從PDF
- 中提取圖像 步驟4:從PDF
- 提取文本 步驟5:保存提取的文本和圖像
- 步驟6:塊文本數據
- >步驟7:加載名詞嵌入模型
- 步驟8:生成嵌入
- >步驟9:將文本嵌入在qdrant
- 中存儲 >步驟10:將圖像嵌入在qdrant
- 中 >步驟11:創建一個多模式獵犬
- 步驟12:用蘭鏈構建多模式抹布
查詢模型 - 結論
- 常見問題
>多模式抹布代表了一個顯著的AI進步,這是通過合併多種數據類型來基於傳統抹布的。與主要處理文本的傳統系統不同,多模式抹布處理並同時集成了多個數據表格。這導致了更全面的理解和背景感知的反應。
鍵多模式抹布組件:
>
媒體嵌入視覺與提名嵌入文本一起訓練,凍結文本編碼器並在圖像文本對上訓練視覺編碼器。這樣可以確保最佳的結果和與名詞嵌入文本嵌入的向後兼容性。 >雜誌嵌入的性能基準
解決剪貼模型限制:
python實施多模式抹布,帶有通知嵌入
本教程構建了一個多模式抹布系統,從包含文本和圖像的PDF檢索信息(使用帶有T4 GPU的Google Colab)。
>步驟1:安裝庫
>步驟2:設置OpenAI API鍵並導入庫
>>設置OpenAI API密鑰並導入所需的庫(Pymupdf,PIL,Langchain,OpenAI等)。 (為簡短而省略了代碼。)
步驟3:從PDF
中提取圖像>使用pymupdf從PDF提取圖像,然後將其保存到目錄中。 (為簡短而省略了代碼。)
步驟4:從PDF
提取文本>使用pymupdf從每個PDF頁面中提取文本。 (為簡短而省略了代碼。)
步驟5:保存提取的數據
>保存提取的圖像和文本。 (為簡短而省略了代碼。)
步驟6:塊文本數據
>使用Langchain'sRecursiveCharacterTextSplitter
將提取的文本分為較小的塊。 (為簡短而省略了代碼。)
>步驟7:加載名詞嵌入模型
>使用擁抱面孔的變形金剛加載Nomic的文本和視覺嵌入模型。 (為簡短而省略了代碼。)
步驟8:生成嵌入
生成文本和圖像嵌入。 (為簡短而省略了代碼。)
>步驟9:將文本嵌入在qdrant
中存儲>將文本嵌入在QDrant集合中。 (為簡短而省略了代碼。)
>步驟10:將圖像嵌入在qdrant
中>將圖像嵌入在單獨的QDrant集合中。 (為簡短而省略了代碼。)
>步驟11:創建一個多模式獵犬
>創建一個函數,以根據查詢檢索相關的文本和圖像嵌入。 (為簡短而省略了代碼。)
步驟12:用蘭鏈構建多模式抹布
>使用Langchain處理被檢索的數據並使用語言模型(例如GPT-4)生成響應。 (為簡短而省略了代碼。)
查詢模型
>示例查詢演示了系統從PDF中從文本和圖像中檢索信息的能力。 (示例查詢和輸出省略了,但在原始中存在。
結論
鑰匙要點
多模式抹布整合了多種數據類型,以更全面地理解。
nive vision嵌入統一視覺和文本數據以改進信息檢索。
該系統使用專門的處理,向量表示和存儲以進行有效檢索。
nimic嵌入視力克服了剪輯在單峰任務中的局限性。 -
- 常見問題
- (為簡潔而省略了常見問題,但以原始形式存在。)
>注意:為簡短而省略了代碼片段,但核心功能和步驟仍然準確地描述了。 原始輸入包含廣泛的代碼;包括所有這些都會使這一響應過長。 請參閱原始輸入以進行完整的代碼實現。
>
多模式抹布整合了多種數據類型,以更全面地理解。
nive vision嵌入統一視覺和文本數據以改進信息檢索。
該系統使用專門的處理,向量表示和存儲以進行有效檢索。
- nimic嵌入視力克服了剪輯在單峰任務中的局限性。
- 常見問題
- (為簡潔而省略了常見問題,但以原始形式存在。) >
注意:為簡短而省略了代碼片段,但核心功能和步驟仍然準確地描述了。 原始輸入包含廣泛的代碼;包括所有這些都會使這一響應過長。 請參閱原始輸入以進行完整的代碼實現。
>以上是用假嵌入增強破布系統的詳細內容。更多資訊請關注PHP中文網其他相關文章!

大型語言模型(LLMS)的流行激增,工具稱呼功能極大地擴展了其功能,而不是簡單的文本生成。 現在,LLM可以處理複雜的自動化任務,例如Dynamic UI創建和自主a

視頻遊戲可以緩解焦慮,建立焦點或支持多動症的孩子嗎? 隨著醫療保健在全球範圍內挑戰,尤其是在青年中的挑戰,創新者正在轉向一種不太可能的工具:視頻遊戲。現在是世界上最大的娛樂印度河之一

“歷史表明,儘管技術進步推動了經濟增長,但它並不能自行確保公平的收入分配或促進包容性人類發展,”烏托德秘書長Rebeca Grynspan在序言中寫道。

易於使用,使用生成的AI作為您的談判導師和陪練夥伴。 讓我們來談談。 對創新AI突破的這種分析是我正在進行的《福布斯》列的最新覆蓋範圍的一部分,包括識別和解釋

在溫哥華舉行的TED2025會議昨天在4月11日舉行了第36版。它的特色是來自60多個國家 /地區的80個發言人,包括Sam Altman,Eric Schmidt和Palmer Luckey。泰德(Ted)的主題“人類重新構想”是量身定制的

約瑟夫·斯蒂格利茨(Joseph Stiglitz)是2001年著名的經濟學家,是諾貝爾經濟獎的獲得者。斯蒂格利茨認為,AI可能會使現有的不平等和合併權力惡化,並在一些主導公司手中加劇,最終破壞了經濟上的經濟。

圖數據庫:通過關係徹底改變數據管理 隨著數據的擴展及其特徵在各個字段中的發展,圖形數據庫正在作為管理互連數據的變革解決方案的出現。與傳統不同

大型語言模型(LLM)路由:通過智能任務分配優化性能 LLM的快速發展的景觀呈現出各種各樣的模型,每個模型都具有獨特的優勢和劣勢。 有些在創意內容gen上表現出色


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境