搜尋
首頁科技週邊人工智慧Markitdown MCP可以將任何文檔轉換為Markdowns!

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。從這些文檔中檢索結構化的內容已成為當今一項艱鉅的任務。 Microsoft的Markitdown MCP(Markdown轉換協議)簡化了這一點。它將各種文件轉換為結構化的標記格式。這有助於開發人員和技術作家改善文檔工作流程。本文解釋了Markitdown MCP並顯示了其用法。我們將介紹設置MarkitDown MCP服務器,還將在此協議的上下文中討論MarkitDown。在下面還介紹了使用標記MCP服務器進行測試。

目錄

  • 什麼是Markitdown MCP?
    • Markitdown MCP的主要特徵
  • 降級在工作流程中的作用
  • 設置Markitdown MCP服務器進行集成
    • 安裝
    • 服務器配置
  • 用標記MCP轉換的降價轉換
    • 步驟1:首先導入必要的庫。
    • 步驟2:初始化Groq LLM,這是免費的。您可以在這裡找到API鍵
    • 步驟3:配置MCP服務器
    • 步驟4:現在,定義異步功能
    • 步驟5:此代碼調用run_conversion函數
  • LLM管道中的實際用例
  • 結論
  • 常見問題

什麼是Markitdown MCP?

Markitdown MCP提供了用於文檔轉換的標準方法。它充當服務器端協議。它在後端使用Microsoft的Markitdown庫。服務器託管一個靜止的API。用戶將諸如PDF或Word文件之類的文檔發送到此服務器。然後,服務器處理這些文件。它使用高級解析和特定格式規則。輸出是保留原始文檔結構的標記文本。

Markitdown MCP的主要特徵

Markitdown MCP服務器包含幾個有用的功能:

  • 寬格式支持:它將PDF,DOCX和PPTX(例如PPTX)等通用文件轉換為Markdown。
  • 結構保存:它使用方法來理解和維護文檔佈局,例如標題和列表。
  • 可配置的輸出:用戶可以調整設置以控制最終的標記樣式。
  • 服務器操作:它作為服務器過程運行。這允許集成到自動化系統和雲設置中。

降級在工作流程中的作用

Markdown是文檔的流行格式。它的簡單語法使讀寫易於讀寫。像GitHub這樣的許多平台都很好地支持了它。靜態站點發生器經常使用它。將其他格式轉換為手動花費時間。 Markitdown MCP自動進行此轉換。這提供了明顯的好處:

  • 有效的內容處理:將源文檔轉換為可用的降價。
  • 一致的協作:標準格式可幫助團隊一起在文檔上共同努力。
  • 流程自動化:在較大的自動化工作流程中包括文檔轉換。

設置Markitdown MCP服務器進行集成

我們可以使用GitHub Repo中提到的Docker Image(例如Claude,Windsurf,Cursor)等不同客戶端設置Markitdown MCP服務器。但是在這裡,我們將使用Langchain的MCP適配器創建本地MCP客戶端。我們需要運行服務器將其與Langchain一起使用。服務器支持不同的運行模式。

安裝

首先,安裝所需的Python軟件包。

 PIP安裝MarkitDown-MCP langchain langchain_mcp_adapters langgraph langchain_groq

服務器配置

使用STDIO模式運行標記MCP服務器。此模式連接標準輸入和輸出流。它適用於基於腳本的集成。直接在終端運行以下內容。

 Markitdown-MCP

服務器將開始運行一些警告。

Markitdown MCP可以將任何文檔轉換為Markdowns!

我們還可以使用SSE(服務器範圍事件)模式。此模式適合Web應用程序或長期運行的連接。設置標記MCP服務器以測試特定方案時也很有用。

 MarkitDown-MCP  -  -SSE--host 127.0.0.1-港口3001

選擇適合您集成計劃的模式。使用服務器通過STDIO本地測試通常是一個良好的開始。我們建議在本文中使用STDIO模式。

用標記MCP轉換的降價轉換

我們已經介紹瞭如何使用Langchain在我們以前的博客MCP客戶端服務器中使用Langchain在本地建立MCP服務器和客戶端設置的方法。

現在,本節顯示瞭如何與Markitdown MCP服務器一起使用Langchain。它可以自動化PDF文件轉換為Markdown。該示例通過Chatgroq採用了Groq的Llama模型。確保將GROQ API密鑰設置為環境變量,或將其直接傳遞給Chatgroq。

步驟1:首先導入必要的庫。

來自MCP Import客戶端,StdioServerParameters
來自mcp.client.stdio import stdio_client
來自langchain_mcp_adapters.tools import load_mcp_tools
來自langgraph.prebuilt導入create_react_agent
導入異步
來自langchain_groq導入changroq

步驟2:初始化Groq LLM,這是免費的。您可以在這裡找到API鍵

這是GROQ API密鑰:GROQ API鍵

#初始化groq型號
model = chatgroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“ your_api_key”)

步驟3:配置MCP服務器

我們正在使用stdioserverparameters,並在此處直接使用已安裝的標記MCP軟件包

server_params = stdioserverparameters(
命令=“ MarkitDown-MCP”,
args = []#STDIO模式不需要其他參數
)

步驟4:現在,定義異步功能

當輸入時,這將採用PDF路徑,客戶端開始通信。 load_mcp_tools提供了與Markitdown MCP相互作用的功能。然後創建一個反應代理,使用模型和MCP工具。該代碼為PDF創建File_uri,並發送提示,要求代理使用MCP轉換文件。

異步def run_conversion(pdf_path:str):
與stdio_client(server_params)AS(讀,寫)的異步:
與客戶端的異步(讀,寫)作為會話:

等待session.initialize()
打印(“初始化MCP會話。”)

#加載可用工具
工具=等待LOAD_MCP_TOOLS(會話)
打印(f“已加載工具:{[工具中的工具名稱]工具中的工具]}”)

#創建反應代理
agent = create_reaeact_agent(型號,工具)
打印(“創建的反應代理。”)

#準備文件URI(將本地路徑轉換為file:// uri)
file_uri = f“ file:// {pdf_path}”
#通過轉換請求調用代理
響應=等待代理。 AINVOKE({{

“消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉換為標記,只需返回MCP服務器的輸出)]

}))

#返回最後一條消息內容
返迴響應[“消息”] [ -  1] .content

步驟5:此代碼調用run_conversion函數

我們正在呼籲和提取響應中的降價。它將內容保存到pdf.md,最後將輸出打印在終端中。

如果__name__ ==“ __ -main __”:

pdf_path =“/home/home/harsh/downloads/llm評估.pptx.pdf”#使用絕對路徑
結果= asyncio.run(run_conversion(pdf_path))

以F:f的開放(“ pdf.md”,'w')
F.Write(結果)

打印(“ \ nmarkDown轉換結果:”)
打印(結果)

輸出

Markitdown MCP可以將任何文檔轉換為Markdowns!

完整代碼

來自MCP Import客戶端,StdioServerParameters
來自mcp.client.stdio import stdio_client

來自langchain_mcp_adapters.tools import load_mcp_tools
來自langgraph.prebuilt導入create_react_agent

導入異步
來自langchain_groq導入changroq
#初始化groq型號
model = changroq(model =“ meta-llama/llama-4-scout-17b-16e-Instruct”,api_key =“”)
#配置MCP服務器
server_params = stdioserverparameters(

命令=“ MarkitDown-MCP”,
args = []#STDIO模式不需要其他參數

)

異步def run_conversion(pdf_path:str):
與stdio_client(server_params)AS(讀,寫)的異步:

與客戶端的異步(讀,寫)作為會話:
等待session.initialize()

打印(“初始化MCP會話。”)
#加載可用工具
工具=等待LOAD_MCP_TOOLS(會話)

打印(f“已加載工具:{[工具中的工具名稱]工具中的工具]}”)
#創建反應代理

agent = create_reaeact_agent(型號,工具)
打印(“創建的反應代理。”)

#準備文件URI(將本地路徑轉換為file:// uri)

file_uri = f“ file:// {pdf_path}”
#通過轉換請求調用代理
響應=等待代理。 AINVOKE({{

“消息”:[(“用戶”,f“使用MarkitDown MCP將{file_uri}轉換為標記,只是從MCP服務器中撤回輸出”)]

}))

#返回最後一條消息內容
返迴響應[“消息”] [ -  1] .content

如果__name__ ==“ __ -main __”:
pdf_path =“/home/harsh/harsh/downloads/llm評估.pdf”#使用絕對路徑

結果= asyncio.run(run_conversion(pdf_path))
以F:f的開放(“ pdf.md”,'w')

F.Write(結果)
打印(“ \ nmarkDown轉換結果:”)
打印(結果)

檢查輸出

腳本生成一個pdf.md文件。該文件包含輸入PDF的降價版本。轉換質量取決於原始文檔的結構。 Markitdown MCP通常保留元素,例如:

  • 標題(不同級別)
  • 段落文字
  • 列表(子彈和編號)
  • 表(轉換為Markdown語法)
  • 代碼塊

輸出

Markitdown MCP可以將任何文檔轉換為Markdowns!

在輸出中,我們可以看到它成功地檢索了標題,內容以及降價格式的普通文本。

因此,運行本地服務器進行測試有助於評估不同的文檔類型。

也觀看:

LLM管道中的實際用例

集成標記MCP可以改善幾個AI工作流程:

  • 知識基礎建設:將文檔轉換為降價。將此內容攝入知識庫或抹布系統。
  • LLM內容準備:將源文件轉換為Markdown。為LLM摘要或分析任務準備一致的輸入。
  • 文檔數據提取:將帶有表的文檔轉換為Markdown。這簡化了解析結構化數據。
  • 文檔自動化:生成技術手冊。將源文件(例如Word文檔)轉換為靜態站點生成器的Markdown。

結論

Markitdown MCP提供了一種基於服務器的功能,用於文檔轉換的方法。它處理多種格式。它產生結構化的降價輸出。將其與LLMS集成可以使文檔處理任務的自動化。這種方法支持可擴展的文檔實踐。使用服務器進行測試使評估直接。通過其在這些工作流程中的實際應用,最好理解MAKITDOWN的MCP。

探索Markitdown MCP GitHub存儲庫以獲取更多信息。

常見問題

Q1。 Markitdown MCP的主要功能是什麼?

Ans。 Markitdown MCP將PDF和Word文件等文檔轉換為結構化標記。它為此任務使用基於服務器的協議。

Q2。標記MCP服務器可以處理哪些文件格式?

Ans。服務器處理PDF,DOCX,PPTX和HTML文件。其他格式可以根據核心庫支持。

Q3。 Langchain如何使用Markitdown MCP?

Ans。 Langchain使用特殊工具與服務器進行通信。然後,代理可以通過此服務器請求文檔轉換。

Q4。 Markitdown MCP開源嗎?

Ans。是的,它是Microsoft的開源軟件。用戶負責任何服務器託管成本。

Q5。我可以運行標記MCP服務器以進行測試嗎?

Ans。是的,用於測試的服務器可以在本地運行。使用STDIO或SSE模式進行開發和評估。

以上是Markitdown MCP可以將任何文檔轉換為Markdowns!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
讓我們跳舞:結構化運動以微調我們的人類神經網讓我們跳舞:結構化運動以微調我們的人類神經網Apr 27, 2025 am 11:09 AM

科學家已經廣泛研究了人類和更簡單的神經網絡(如秀麗隱桿線蟲中的神經網絡),以了解其功能。 但是,出現了一個關鍵問題:我們如何使自己的神經網絡與新穎的AI一起有效地工作

新的Google洩漏揭示了雙子AI的訂閱更改新的Google洩漏揭示了雙子AI的訂閱更改Apr 27, 2025 am 11:08 AM

Google的雙子座高級:新的訂閱層即將到來 目前,訪問Gemini Advanced需要$ 19.99/月Google One AI高級計劃。 但是,Android Authority報告暗示了即將發生的變化。 最新的Google P中的代碼

數據分析加速度如何求解AI的隱藏瓶頸數據分析加速度如何求解AI的隱藏瓶頸Apr 27, 2025 am 11:07 AM

儘管圍繞高級AI功能炒作,但企業AI部署中潛伏的巨大挑戰:數據處理瓶頸。首席執行官慶祝AI的進步時,工程師努力應對緩慢的查詢時間,管道超載,一個

Markitdown MCP可以將任何文檔轉換為Markdowns!Markitdown MCP可以將任何文檔轉換為Markdowns!Apr 27, 2025 am 09:47 AM

處理文檔不再只是在您的AI項目中打開文件,而是將混亂變成清晰度。諸如PDF,PowerPoints和Word之類的文檔以各種形狀和大小淹沒了我們的工作流程。檢索結構化

如何使用Google ADK進行建築代理? - 分析Vidhya如何使用Google ADK進行建築代理? - 分析VidhyaApr 27, 2025 am 09:42 AM

利用Google的代理開發套件(ADK)的力量創建具有現實世界功能的智能代理!該教程通過使用ADK來構建對話代理,並支持Gemini和GPT等各種語言模型。 w

在LLM上使用SLM進行有效解決問題-Analytics Vidhya在LLM上使用SLM進行有效解決問題-Analytics VidhyaApr 27, 2025 am 09:27 AM

摘要: 小型語言模型 (SLM) 專為效率而設計。在資源匱乏、實時性和隱私敏感的環境中,它們比大型語言模型 (LLM) 更勝一籌。 最適合專注型任務,尤其是在領域特異性、控制性和可解釋性比通用知識或創造力更重要的情況下。 SLM 並非 LLMs 的替代品,但在精度、速度和成本效益至關重要時,它們是理想之選。 技術幫助我們用更少的資源取得更多成就。它一直是推動者,而非驅動者。從蒸汽機時代到互聯網泡沫時期,技術的威力在於它幫助我們解決問題的程度。人工智能 (AI) 以及最近的生成式 AI 也不例

如何將Google Gemini模型用於計算機視覺任務? - 分析Vidhya如何將Google Gemini模型用於計算機視覺任務? - 分析VidhyaApr 27, 2025 am 09:26 AM

利用Google雙子座的力量用於計算機視覺:綜合指南 領先的AI聊天機器人Google Gemini擴展了其功能,超越了對話,以涵蓋強大的計算機視覺功能。 本指南詳細說明瞭如何利用

Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Gemini 2.0 Flash vs O4-Mini:Google可以比OpenAI更好嗎?Apr 27, 2025 am 09:20 AM

2025年的AI景觀正在充滿活力,而Google的Gemini 2.0 Flash和Openai的O4-Mini的到來。 這些尖端的車型分開了幾週,具有可比的高級功能和令人印象深刻的基準分數。這個深入的比較

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。