處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。從這些文檔中檢索結構化的內容已成為當今一項艱鉅的任務。 Microsoft的Markitdown MCP(Markdown轉換協議)簡化了這一點。它將各種文件轉換為結構化的標記格式。這有助於開發人員和技術作家改善文檔工作流程。本文解釋了Markitdown MCP並顯示了其用法。我們將介紹設置MarkitDown MCP服務器,還將在此協議的上下文中討論MarkitDown。在下面還介紹了使用標記MCP服務器進行測試。
目錄
- 什麼是Markitdown MCP?
- Markitdown MCP的主要特徵
- 降級在工作流程中的作用
- 設置Markitdown MCP服務器進行集成
- 安裝
- 服務器配置
- 用標記MCP轉換的降價轉換
- 步驟1:首先導入必要的庫。
- 步驟2:初始化Groq LLM,這是免費的。您可以在這裡找到API鍵
- 步驟3:配置MCP服務器
- 步驟4:現在,定義異步功能
- 步驟5:此代碼調用run_conversion函數
- LLM管道中的實際用例
- 結論
- 常見問題
什麼是Markitdown MCP?
Markitdown MCP提供了用於文檔轉換的標準方法。它充當服務器端協議。它在後端使用Microsoft的Markitdown庫。服務器託管一個靜止的API。用戶將諸如PDF或Word文件之類的文檔發送到此服務器。然後,服務器處理這些文件。它使用高級解析和特定格式規則。輸出是保留原始文檔結構的標記文本。
Markitdown MCP的主要特徵
Markitdown MCP服務器包含幾個有用的功能:
- 寬格式支持:它將PDF,DOCX和PPTX(例如PPTX)等通用文件轉換為Markdown。
- 結構保存:它使用方法來理解和維護文檔佈局,例如標題和列表。
- 可配置的輸出:用戶可以調整設置以控制最終的標記樣式。
- 服務器操作:它作為服務器過程運行。這允許集成到自動化系統和雲設置中。
降級在工作流程中的作用
Markdown是文檔的流行格式。它的簡單語法使讀寫易於讀寫。像GitHub這樣的許多平台都很好地支持了它。靜態站點發生器經常使用它。將其他格式轉換為手動花費時間。 Markitdown MCP自動進行此轉換。這提供了明顯的好處:
- 有效的內容處理:將源文檔轉換為可用的降價。
- 一致的協作:標準格式可幫助團隊一起在文檔上共同努力。
- 流程自動化:在較大的自動化工作流程中包括文檔轉換。
設置Markitdown MCP服務器進行集成
我們可以使用GitHub Repo中提到的Docker Image(例如Claude,Windsurf,Cursor)等不同客戶端設置Markitdown MCP服務器。但是在這裡,我們將使用Langchain的MCP適配器創建本地MCP客戶端。我們需要運行服務器將其與Langchain一起使用。服務器支持不同的運行模式。
安裝
首先,安裝所需的Python軟件包。
PIP安裝MarkitDown-MCP langchain langchain_mcp_adapters langgraph langchain_groq
服務器配置
使用STDIO模式運行標記MCP服務器。此模式連接標準輸入和輸出流。它適用於基於腳本的集成。直接在終端運行以下內容。
Markitdown-MCP
服務器將開始運行一些警告。
我們還可以使用SSE(服務器範圍事件)模式。此模式適合Web應用程序或長期運行的連接。設置標記MCP服務器以測試特定方案時也很有用。
MarkitDown-MCP - -SSE--host 127.0.0.1-港口3001
選擇適合您集成計劃的模式。使用服務器通過STDIO本地測試通常是一個良好的開始。我們建議在本文中使用STDIO模式。
用標記MCP轉換的降價轉換
我們已經介紹瞭如何使用Langchain在我們以前的博客MCP客戶端服務器中使用Langchain在本地建立MCP服務器和客戶端設置的方法。
現在,本節顯示瞭如何與Markitdown MCP服務器一起使用Langchain。它可以自動化PDF文件轉換為Markdown。該示例通過Chatgroq採用了Groq的Llama模型。確保將GROQ API密鑰設置為環境變量,或將其直接傳遞給Chatgroq。
步驟1:首先導入必要的庫。
來自MCP Import客戶端,StdioServerParameters 來自mcp.client.stdio import stdio_client 來自langchain_mcp_adapters.tools import load_mcp_tools 來自langgraph.prebuilt導入create_react_agent 導入異步 來自langchain_groq導入changroq
步驟2:初始化Groq LLM,這是免費的。您可以在這裡找到API鍵
這是GROQ API密鑰:GROQ API鍵
#初始化groq型號 model = chatgroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“ your_api_key”)
步驟3:配置MCP服務器
我們正在使用stdioserverparameters,並在此處直接使用已安裝的標記MCP軟件包
server_params = stdioserverparameters( 命令=“ MarkitDown-MCP”, args = []#STDIO模式不需要其他參數 )
步驟4:現在,定義異步功能
當輸入時,這將採用PDF路徑,客戶端開始通信。 load_mcp_tools提供了與Markitdown MCP相互作用的功能。然後創建一個反應代理,使用模型和MCP工具。該代碼為PDF創建File_uri,並發送提示,要求代理使用MCP轉換文件。
異步def run_conversion(pdf_path:str): 與stdio_client(server_params)AS(讀,寫)的異步: 與客戶端的異步(讀,寫)作為會話: 等待session.initialize() 打印(“初始化MCP會話。”) #加載可用工具 工具=等待LOAD_MCP_TOOLS(會話) 打印(f“已加載工具:{[工具中的工具名稱]工具中的工具]}”) #創建反應代理 agent = create_reaeact_agent(型號,工具) 打印(“創建的反應代理。”) #準備文件URI(將本地路徑轉換為file:// uri) file_uri = f“ file:// {pdf_path}” #通過轉換請求調用代理 響應=等待代理。 AINVOKE({{ “消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉換為標記,只需返回MCP服務器的輸出)] })) #返回最後一條消息內容 返迴響應[“消息”] [ - 1] .content
步驟5:此代碼調用run_conversion函數
我們正在呼籲和提取響應中的降價。它將內容保存到pdf.md,最後將輸出打印在終端中。
如果__name__ ==“ __ -main __”: pdf_path =“/home/home/harsh/downloads/llm評估.pptx.pdf”#使用絕對路徑 結果= asyncio.run(run_conversion(pdf_path)) 以F:f的開放(“ pdf.md”,'w') F.Write(結果) 打印(“ \ nmarkDown轉換結果:”) 打印(結果)
輸出
完整代碼
來自MCP Import客戶端,StdioServerParameters 來自mcp.client.stdio import stdio_client 來自langchain_mcp_adapters.tools import load_mcp_tools 來自langgraph.prebuilt導入create_react_agent 導入異步 來自langchain_groq導入changroq #初始化groq型號 model = changroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“”) #配置MCP服務器 server_params = stdioserverparameters( 命令=“ MarkitDown-MCP”, args = []#STDIO模式不需要其他參數 ) 異步def run_conversion(pdf_path:str): 與stdio_client(server_params)AS(讀,寫)的異步: 與客戶端的異步(讀,寫)作為會話: 等待session.initialize() 打印(“初始化MCP會話。”) #加載可用工具 工具=等待LOAD_MCP_TOOLS(會話) 打印(f“已加載工具:{[工具中的工具名稱]工具中的工具]}”) #創建反應代理 agent = create_reaeact_agent(型號,工具) 打印(“創建的反應代理。”) #準備文件URI(將本地路徑轉換為file:// uri) file_uri = f“ file:// {pdf_path}” #通過轉換請求調用代理 響應=等待代理。 AINVOKE({{ “消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉換為標記,只是從MCP服務器中撤回輸出”)] })) #返回最後一條消息內容 返迴響應[“消息”] [ - 1] .content 如果__name__ ==“ __ -main __”: pdf_path =“/home/harsh/harsh/downloads/llm評估.pdf”#使用絕對路徑 結果= asyncio.run(run_conversion(pdf_path)) 以F:f的開放(“ pdf.md”,'w') F.Write(結果) 打印(“ \ nmarkDown轉換結果:”) 打印(結果)
檢查輸出
腳本生成一個pdf.md文件。該文件包含輸入PDF的降價版本。轉換質量取決於原始文檔的結構。 Markitdown MCP通常保留元素,例如:
- 標題(不同級別)
- 段落文字
- 列表(子彈和編號)
- 表(轉換為Markdown語法)
- 代碼塊
輸出
在輸出中,我們可以看到它成功地檢索了標題,內容以及降價格式的普通文本。
因此,運行本地服務器進行測試有助於評估不同的文檔類型。
也觀看:
LLM管道中的實際用例
集成標記MCP可以改善幾個AI工作流程:
- 知識基礎建設:將文檔轉換為降價。將此內容攝入知識庫或抹布系統。
- LLM內容準備:將源文件轉換為Markdown。為LLM摘要或分析任務準備一致的輸入。
- 文檔數據提取:將帶有表的文檔轉換為Markdown。這簡化了解析結構化數據。
- 文檔自動化:生成技術手冊。將源文件(例如Word文檔)轉換為靜態站點生成器的Markdown。
結論
Markitdown MCP提供了一種基於服務器的功能,用於文檔轉換的方法。它處理多種格式。它產生結構化的降價輸出。將其與LLMS集成可以使文檔處理任務的自動化。這種方法支持可擴展的文檔實踐。使用服務器進行測試使評估直接。通過其在這些工作流程中的實際應用,最好理解MAKITDOWN的MCP。
探索Markitdown MCP GitHub存儲庫以獲取更多信息。
常見問題
Q1。 Markitdown MCP的主要功能是什麼?Ans。 Markitdown MCP將PDF和Word文件等文檔轉換為結構化標記。它為此任務使用基於服務器的協議。
Q2。標記MCP服務器可以處理哪些文件格式?Ans。服務器處理PDF,DOCX,PPTX和HTML文件。其他格式可以根據核心庫支持。
Q3。 Langchain如何使用Markitdown MCP?Ans。 Langchain使用特殊工具與服務器進行通信。然後,代理可以通過此服務器請求文檔轉換。
Q4。 Markitdown MCP開源嗎?Ans。是的,它是Microsoft的開源軟件。用戶負責任何服務器託管成本。
Q5。我可以運行標記MCP服務器以進行測試嗎?Ans。是的,用於測試的服務器可以在本地運行。使用STDIO或SSE模式進行開發和評估。
以上是Markitdown MCP可以將任何文檔轉換為Markdowns!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

2025年的AI景觀正在充滿活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到來。 這些尖端的車型分開了幾週,具有可比的高級功能和令人印象深刻的基準分數。這個深入的比較


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Dreamweaver CS6
視覺化網頁開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

Atom編輯器mac版下載
最受歡迎的的開源編輯器

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。