Dokumen pengendalian tidak lagi hanya mengenai pembukaan fail dalam projek AI anda, ini mengenai mengubah kekacauan menjadi kejelasan. Dokumen seperti PDF, PowerPoints, dan perkataan banjir aliran kerja kami dalam setiap bentuk dan saiz. Mengambil kandungan berstruktur dari dokumen -dokumen ini telah menjadi tugas besar hari ini. Markitdown MCP (Protokol Penukaran Markdown) dari Microsoft memudahkan ini. Ia menukarkan pelbagai fail ke dalam format markdown berstruktur. Ini membantu pemaju dan penulis teknikal meningkatkan aliran kerja dokumentasi. Artikel ini menerangkan Markitdown MCP dan menunjukkan penggunaannya. Kami akan meliputi penubuhan pelayan MCP Markitdown dan juga akan membincangkan Markitdown dalam konteks protokol ini. Menggunakan pelayan MCP Markitdown untuk ujian juga dilindungi di bawah.
Jadual Kandungan
- Apa itu mcp markitdown?
- Ciri -ciri utama Markitdown MCP
- Peranan markdown dalam aliran kerja
- Menyediakan pelayan MCP Markitdown untuk integrasi
- Pemasangan
- Konfigurasi pelayan
- Penukaran Markdown dengan Markitdown MCP
- Langkah 1: Import perpustakaan yang diperlukan terlebih dahulu.
- Langkah 2: Inisialisasi Groq LLM, ia bebas daripada kos. Anda boleh mencari kunci API di sini
- Langkah 3: Konfigurasikan pelayan MCP
- Langkah 4: Sekarang, tentukan fungsi tidak segerak
- Langkah 5: Kod ini memanggil fungsi run_conversion
- Kes penggunaan praktikal dalam saluran paip LLM
- Kesimpulan
- Soalan yang sering ditanya
Apa itu mcp markitdown?
Markitdown MCP menawarkan kaedah standard untuk penukaran dokumen. Ia bertindak sebagai protokol sisi pelayan. Ia menggunakan perpustakaan Markitdown Microsoft di backend. Pelayan menjadi tuan rumah API RESTful. Pengguna menghantar dokumen seperti PDFS atau fail perkataan ke pelayan ini. Pelayan kemudian memproses fail ini. Ia menggunakan parsing lanjutan dan peraturan pemformatan khusus. Output adalah teks markdown yang menyimpan struktur dokumen asal.
Ciri -ciri utama Markitdown MCP
Pelayan MCP Markitdown termasuk beberapa ciri berguna:
- Sokongan Format Luas: Ia Menukar Fail Biasa seperti PDF, Docx, dan PPTX ke Markdown.
- Pemeliharaan Struktur: Ia menggunakan kaedah untuk memahami dan mengekalkan susun atur dokumen seperti tajuk dan senarai.
- Output yang boleh dikonfigurasikan: Pengguna boleh menyesuaikan tetapan untuk mengawal gaya markdown akhir.
- Operasi Pelayan: Ia berjalan sebagai proses pelayan. Ini membolehkan integrasi ke dalam sistem automatik dan persediaan awan.
Peranan markdown dalam aliran kerja
Markdown adalah format popular untuk dokumentasi. Sintaks mudah menjadikannya mudah dibaca dan ditulis. Banyak platform seperti Github menyokongnya dengan baik. Penjana tapak statik sering menggunakannya. Menukar format lain ke Markdown secara manual memerlukan masa. Markitdown MCP mengautomasikan penukaran ini. Ini memberikan faedah yang jelas:
- Pengendalian kandungan yang cekap: Mengubah dokumen sumber ke dalam markdown yang boleh digunakan.
- Kerjasama yang konsisten: Format standard membantu pasukan bekerjasama dengan dokumen.
- Automasi Proses: Sertakan penukaran dokumen dalam aliran kerja automatik yang lebih besar.
Menyediakan pelayan MCP Markitdown untuk integrasi
Kami boleh menyediakan pelayan MCP Markitdown dengan pelanggan yang berbeza seperti Claude, Windsurf, kursor menggunakan imej Docker seperti yang disebutkan dalam repo GitHub. Tetapi di sini kami akan membuat pelanggan MCP tempatan menggunakan penyesuai MCP Langchain. Kami memerlukan pelayan untuk menggunakannya dengan Langchain. Pelayan menyokong mod berjalan yang berbeza.
Pemasangan
Pertama, pasang pakej Python yang diperlukan.
PIP memasang markitdown-mcp langchain langchain_mcp_adapters langgraph langchain_groq
Konfigurasi pelayan
Jalankan pelayan MCP Markitdown menggunakan mod stdio. Mod ini menghubungkan aliran input dan output standard. Ia berfungsi dengan baik untuk integrasi berasaskan skrip. Secara langsung jalankan yang berikut di terminal.
Markitdown-mcp
Pelayan akan mula berjalan dengan beberapa amaran.
Kami juga boleh menggunakan mod SSE (Server-Sent Events). Mod ini sesuai dengan aplikasi web atau sambungan jangka panjang. Ia juga berguna apabila menyediakan pelayan MCP Markitdown untuk menguji senario tertentu.
Markitdown-mcp --sse-HOST 127.0.0.1 --port 3001
Pilih mod yang sesuai dengan pelan integrasi anda. Menggunakan pelayan untuk ujian secara tempatan melalui Stdio sering menjadi permulaan yang baik. Kami mengesyorkan menggunakan mod stdio untuk artikel ini.
Penukaran Markdown dengan Markitdown MCP
Kami telah meliputi cara membina pelayan MCP dan persediaan klien secara tempatan menggunakan Langchain dalam pelayan klien MCP blog kami yang terdahulu menggunakan Langchain.
Sekarang, bahagian ini menunjukkan cara menggunakan Langchain dengan pelayan MCP Markitdown. Ia mengautomasikan penukaran fail PDF ke Markdown. Contohnya menggunakan model Llama Groq melalui Chatgroq. Pastikan untuk menyediakan kunci API Groq sebagai pemboleh ubah persekitaran atau lulus terus ke Chatgroq.
Langkah 1: Import perpustakaan yang diperlukan terlebih dahulu.
Dari klien import MCP, stdioserverparameters dari mcp.client.stdio import stdio_client dari langchain_mcp_adapters.tools import load_mcp_tools dari langgraph.prebuilt import create_react_agent Import Asyncio dari langchain_groq import chatgroq
Langkah 2: Inisialisasi Groq LLM, ia bebas daripada kos. Anda boleh mencari kunci API di sini
Inilah kekunci API Groq: Kunci API Groq
# Model Model Groq model = chatgroq (model = "meta-llama/llama-4-scout-17b-16e-instruct", api_key = "your_api_key")
Langkah 3: Konfigurasikan pelayan MCP
Kami menggunakan stdioserverparameters, dan terus menggunakan pakej MCP Markitdown yang dipasang di sini
server_params = stdioserverparameters ( perintah = "Markitdown-mcp", args = [] # tiada argumen tambahan yang diperlukan untuk mod stdio )
Langkah 4: Sekarang, tentukan fungsi tak segerak
Ini akan mengambil laluan PDF sebagai input, pelanggan memulakan komunikasi. LOAD_MCP_TOOLS menyediakan fungsi untuk interaksi Langchain dengan markitdown MCP. Kemudian ejen React dibuat, ia menggunakan model dan alat MCP. Kod membuat file_uri untuk pdf dan menghantar petikan meminta ejen untuk menukar fail menggunakan MCP.
async def run_conversion (pdf_path: str): async dengan stdio_client (server_params) sebagai (baca, tulis): Async dengan pelanggan (baca, tulis) sebagai sesi: menunggu sesi.initialize () Cetak ("Sesi MCP diasaskan.") # Memuatkan alat yang ada Alat = Menunggu LOAD_MCP_TOOLS (sesi) cetak (f "alat yang dimuatkan: {[tool.name untuk alat dalam alat]}") # Buat Ejen React agen = create_react_agent (model, alat) cetak ("Agen React dibuat.") # Sediakan fail URI (menukar laluan tempatan ke fail: // uri) file_uri = f "file: // {pdf_path}" # Memohon ejen dengan permintaan penukaran Response = Agent Agent.AinVoke ({{ "Mesej": [("User", F "Convert {file_uri} ke Markdown menggunakan markitdown MCP hanya mengembalikan output dari MCP Server")] }) # Kembalikan kandungan mesej terakhir Kembali Respons ["Mesej"] [-1] .Content
Langkah 5: Kod ini memanggil fungsi run_conversion
Kami memanggil dan mengekstrak markdown dari respons. Ia menjimatkan kandungan ke pdf.md, dan akhirnya mencetak output di terminal.
jika __name__ == "__main__": pdf_path = "/home/harsh/muat turun/llm evaluation.pptx.pdf" # Gunakan jalan mutlak hasil = asyncio.run (run_conversion (pdf_path)) dengan terbuka ("pdf.md", 'w') sebagai f: f.write (hasil) Cetak ("Hasil Penukaran Nmarkdown:") cetak (hasil)
Output
Kod penuh
Dari klien import MCP, stdioserverparameters dari mcp.client.stdio import stdio_client dari langchain_mcp_adapters.tools import load_mcp_tools dari langgraph.prebuilt import create_react_agent Import Asyncio dari langchain_groq import chatgroq # Model Model Groq model = chatgroq (model = "meta-llama/llama-4-scout-17b-16e-instruct", api_key = "") # Konfigurasikan pelayan MCP server_params = stdioserverparameters ( perintah = "Markitdown-mcp", args = [] # tiada argumen tambahan yang diperlukan untuk mod stdio ) async def run_conversion (pdf_path: str): async dengan stdio_client (server_params) sebagai (baca, tulis): Async dengan pelanggan (baca, tulis) sebagai sesi: menunggu sesi.initialize () Cetak ("Sesi MCP diasaskan.") # Memuatkan alat yang ada Alat = Menunggu LOAD_MCP_TOOLS (sesi) cetak (f "alat yang dimuatkan: {[tool.name untuk alat dalam alat]}") # Buat Ejen React agen = create_react_agent (model, alat) cetak ("Agen React dibuat.") # Sediakan fail URI (menukar laluan tempatan ke fail: // uri) file_uri = f "file: // {pdf_path}" # Memohon ejen dengan permintaan penukaran Response = Agent Agent.AinVoke ({{ "Mesej": [("Pengguna", F "Convert {file_uri} ke Markdown menggunakan markitdown MCP hanya mengalihkan output dari MCP Server")] }) # Kembalikan kandungan mesej terakhir Kembali Respons ["Mesej"] [-1] .Content jika __name__ == "__main__": pdf_path = "/home/harsh/muat turun/llm evaluation.pdf" # Gunakan jalan mutlak hasil = asyncio.run (run_conversion (pdf_path)) dengan terbuka ("pdf.md", 'w') sebagai f: f.write (hasil) Cetak ("Hasil Penukaran Nmarkdown:") cetak (hasil)
Memeriksa output
Skrip menghasilkan fail pdf.md. Fail ini memegang versi markdown pdf input. Kualiti penukaran bergantung kepada struktur dokumen asal. MCP Markitdown biasanya mengekalkan elemen seperti:
- Tajuk (pelbagai peringkat)
- Teks perenggan
- Senarai (Bulleted dan Nomored)
- Jadual (ditukar kepada sintaks Markdown)
- Blok kod
Output
Di sini dalam output, kita dapat melihat bahawa ia berjaya mengambil tajuk, kandungan, serta teks biasa dalam format markdown.
Oleh itu, menjalankan pelayan tempatan untuk ujian membantu menilai jenis dokumen yang berbeza.
Tonton juga:
Kes penggunaan praktikal dalam saluran paip LLM
Mengintegrasikan MCP Markitdown dapat meningkatkan beberapa aliran kerja AI:
- Bangunan asas pengetahuan : Menukar dokumen ke dalam markdown. Menelan kandungan ini ke dalam pangkalan pengetahuan atau sistem RAG.
- Penyediaan Kandungan LLM : Mengubah fail sumber ke dalam markdown. Sediakan input yang konsisten untuk ringkasan LLM atau tugas analisis.
- Pengekstrakan data dokumen : Tukar dokumen dengan jadual ke dalam markdown. Ini memudahkan parsing data berstruktur.
- Automasi Dokumentasi : Menjana manual teknikal. Tukar fail sumber seperti dokumen Word ke Markdown untuk penjana tapak statik.
Kesimpulan
Markitdown MCP menyediakan kaedah berasaskan pelayan untuk penukaran dokumen. Ia mengendalikan pelbagai format. Ia menghasilkan output markdown berstruktur. Mengintegrasikannya dengan LLMS membolehkan automasi tugas pemprosesan dokumen. Pendekatan ini menyokong amalan dokumentasi berskala. Menggunakan pelayan untuk ujian membuat penilaian mudah. MCP Markitdown lebih baik difahami melalui aplikasi praktikalnya dalam aliran kerja ini.
Terokai repositori Markitdown MCP Github untuk maklumat lanjut.
Soalan yang sering ditanya
Q1. Apakah fungsi utama Markitdown MCP?Ans. Markitdown MCP menukar dokumen seperti PDF dan fail perkataan ke dalam markdown berstruktur. Ia menggunakan protokol berasaskan pelayan untuk tugas ini.
S2. Format fail mana yang boleh proses pelayan MCP Markitdown?Ans. Pelayan mengendalikan fail PDF, DOCX, PPTX, dan HTML. Format lain boleh disokong bergantung kepada perpustakaan teras.
Q3. Bagaimanakah Langchain menggunakan MCP Markitdown?Ans. Langchain menggunakan alat khas untuk berkomunikasi dengan pelayan. Ejen kemudian boleh meminta penukaran dokumen melalui pelayan ini.
Q4. Adakah Sumber Terbuka MCP Markitdown?Ans. Ya, ia adalah perisian sumber terbuka dari Microsoft. Pengguna bertanggungjawab untuk sebarang kos hosting pelayan.
S5. Bolehkah saya menjalankan pelayan MCP markitdown untuk tujuan ujian?Ans. Ya, pelayan untuk ujian dapat berjalan di dalam negara. Gunakan mod stdio atau SSE untuk pembangunan dan penilaian.
Atas ialah kandungan terperinci Markitdown MCP boleh menukar mana -mana dokumen ke Markdowns!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Penyebaran dalaman yang tidak terkawal sistem AI yang canggih menimbulkan risiko yang signifikan, menurut laporan baru dari Apollo Research. Kekurangan pengawasan ini, lazim di kalangan firma AI utama, membolehkan hasil yang berpotensi bencana, mulai dari UNCON

Pengesan kebohongan tradisional sudah lapuk. Bergantung pada penunjuk yang disambungkan oleh gelang tangan, pengesan kebohongan yang mencetak tanda -tanda penting subjek dan tindak balas fizikal tidak tepat dalam mengenal pasti kebohongan. Inilah sebabnya mengapa keputusan pengesanan kebohongan biasanya tidak diterima pakai oleh mahkamah, walaupun ia telah membawa kepada banyak orang yang tidak bersalah yang dipenjara. Sebaliknya, kecerdasan buatan adalah enjin data yang kuat, dan prinsip kerja adalah untuk memerhatikan semua aspek. Ini bermakna saintis boleh menggunakan kecerdasan buatan kepada aplikasi yang mencari kebenaran melalui pelbagai cara. Satu pendekatan adalah untuk menganalisis tindak balas penting orang yang diinterogasi seperti pengesan dusta, tetapi dengan analisis perbandingan yang lebih terperinci dan tepat. Pendekatan lain adalah menggunakan markup linguistik untuk menganalisis apa yang orang katakan dan menggunakan logik dan penalaran. Seperti kata pepatah, satu pembohongan membiak kebohongan yang lain, dan akhirnya

Industri aeroangkasa, perintis inovasi, memanfaatkan AI untuk menangani cabaran yang paling rumit. Kerumitan Peningkatan Penerbangan Moden memerlukan automasi dan keupayaan perisikan masa nyata AI untuk keselamatan yang dipertingkatkan, dikurangkan oper

Perkembangan pesat robotik telah membawa kita kajian kes yang menarik. Robot N2 dari Noetix beratnya lebih dari 40 paun dan tinggi 3 kaki dan dikatakan dapat backflip. Robot G1 Unitree berat kira -kira dua kali saiz N2 dan kira -kira 4 kaki tinggi. Terdapat juga banyak robot humanoid yang lebih kecil yang menyertai pertandingan ini, dan terdapat juga robot yang didorong ke hadapan oleh peminat. Tafsiran data Setengah maraton menarik lebih daripada 12,000 penonton, tetapi hanya 21 robot humanoid yang mengambil bahagian. Walaupun kerajaan menegaskan bahawa robot yang mengambil bahagian menjalankan "latihan intensif" sebelum pertandingan, tidak semua robot menyelesaikan keseluruhan persaingan. Champion - Tiangong Ult Dibangunkan oleh Pusat Inovasi Robot Humanoid Beijing

Kecerdasan buatan, dalam bentuknya sekarang, tidak benar -benar pintar; Ia mahir meniru dan menyempurnakan data sedia ada. Kami tidak mewujudkan kecerdasan buatan, tetapi sebaliknya kesimpulan buatan -merapikan yang memproses maklumat, sementara manusia su

Laporan mendapati bahawa antara muka yang dikemas kini disembunyikan dalam kod untuk Google Photos Android versi 7.26, dan setiap kali anda melihat foto, satu baris lakaran muka yang baru dikesan dipaparkan di bahagian bawah skrin. Thumbnail wajah baru adalah tag nama yang hilang, jadi saya mengesyaki anda perlu mengkliknya secara individu untuk melihat lebih banyak maklumat mengenai setiap orang yang dikesan. Buat masa ini, ciri ini tidak memberikan maklumat selain daripada orang -orang yang ditemui oleh Google Foto dalam imej anda. Ciri ini belum tersedia, jadi kami tidak tahu bagaimana Google akan menggunakannya dengan tepat. Google boleh menggunakan gambar kecil untuk mempercepatkan mencari lebih banyak gambar orang terpilih, atau boleh digunakan untuk tujuan lain, seperti memilih individu untuk mengedit. Mari tunggu dan lihat. Buat masa ini

Penguatkuasaan penguatkuasaan telah mengguncang pembangunan AI dengan mengajar model untuk menyesuaikan berdasarkan maklum balas manusia. Ia menggabungkan asas pembelajaran yang diawasi dengan kemas kini berasaskan ganjaran untuk menjadikannya lebih selamat, lebih tepat, dan benar-benar membantu

Para saintis telah mengkaji secara meluas rangkaian saraf manusia dan mudah (seperti yang ada di C. elegans) untuk memahami fungsi mereka. Walau bagaimanapun, soalan penting timbul: Bagaimana kita menyesuaikan rangkaian saraf kita sendiri untuk berfungsi dengan berkesan bersama -sama dengan novel AI s


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

SublimeText3 Linux versi baharu
SublimeText3 Linux versi terkini

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

MantisBT
Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Dreamweaver CS6
Alat pembangunan web visual
