Rumah  >  Artikel  >  pembangunan bahagian belakang  >  golang md to word

golang md to word

PHPz
PHPzasal
2023-05-13 09:53:371256semak imbas

Semasa proses pembangunan perisian, kami selalunya perlu menukar teks atau bahasa penanda kepada format lain, seperti menukar teks md kepada dokumen perkataan, untuk berkongsi atau memaparkan hasil kerja kami dengan lebih baik dengan pelanggan atau rakan kongsi. Dalam artikel ini, kami akan memperkenalkan cara menggunakan Golang untuk menukar teks md kepada dokumen perkataan melalui perpustakaan pandoc.

1. Gambaran keseluruhan pandoc

Pandoc ialah penukar teks sumber terbuka percuma yang boleh menukar fail teks dan bahasa markup kepada pelbagai format, seperti HTML, EPUB, LaTeX, PDF dan Microsoft Dokumen perkataan. Pandoc menyokong hampir semua bahasa markup, termasuk Markdown, reStructuredText, HTML, LaTeX, DocBook, MediaWiki, TWiki dan Textile. Pandoc menyokong gaya dan templat tersuai serta menyediakan banyak pilihan untuk mengawal output.

2. Pasang Pandoc dan Go

Sebelum kita mula menggunakan Pandoc dan Go, kita perlu memasangnya terlebih dahulu. Langkah-langkah untuk memasang Pandoc adalah seperti berikut:

  1. Lawati https://github.com/jgm/pandoc/releases dan muat turun versi terkini untuk sistem pengendalian anda.
  2. Nyahzip fail yang dimuat turun mengikut sistem pengendalian anda.
  3. Tambahkan fail binari Pandoc pada pembolehubah persekitaran PATH sistem supaya Pandoc boleh dilaksanakan dari mana-mana lokasi.

Untuk memasang Go:

  1. Lawati https://golang.org/dl/ dan muat turun versi terkini untuk sistem pengendalian anda.
  2. Pasang pemasang Go yang dimuat turun dan ikut gesaan untuk menyelesaikan proses pemasangan.
  3. Konfigurasikan pembolehubah persekitaran PATH sistem supaya arahan Go boleh diakses dari mana-mana sahaja.

3. Pasang pandocfilters

pandocfilters ialah perpustakaan Python yang membolehkan anda menulis penapis Pandoc. Di Golang, kita boleh menggunakan Python sebagai penapis Pandoc dan memanggilnya melalui arahan pandoc untuk melengkapkan penukaran teks. Langkah-langkah untuk memasang pandocfilters adalah seperti berikut:

  1. Buka terminal atau tetingkap baris arahan dan masukkan arahan berikut:
pip3 install pandocfilters
  1. Tunggu pemasangan pandocfilters selesai .

4. Tulis program Golang

Kami akan menggunakan Golang untuk menulis program untuk menukar teks md kepada dokumen perkataan. Program ini terbahagi kepada dua bahagian: penapis Pandoc dan program Golang.

  1. Penapis Pandoc

Masukkan arahan berikut dalam terminal atau tetingkap baris arahan:

nano pandocfilters/md_to_docx.py

Kemudian tampal kod Python berikut:

#!/usr/bin/env python3

import sys
import panflute as pf
from pandocfilters import toJSONFilter

def action(elem, doc):
    if isinstance(elem, pf.CodeBlock) and 'csljson' in elem.classes:
        return pf.RawBlock(elem.text, format='latex')
    if isinstance(elem, pf.Para) and len(elem.content) == 1 and isinstance(elem.content[0], pf.RawInline):
        return pf.RawBlock(elem.content[0].text, format='latex')
    if isinstance(elem, pf.Str) and len(elem.text) == 1 and ord(elem.text) > 126:
        return pf.RawInline(r'unicode{%04X}' % ord(elem.text), format='latex')
    if isinstance(elem, pf.Str) and len(elem.text) > 1 and all(ord(c) <= 126 for c in elem.text):
        return pf.RawInline(elem.text, format='latex')
    if isinstance(elem, pf.Image) and elem.url.startswith('data:'):
        return pf.Para(pf.Ide

Simpan dan tutup fail.

  1. Program Golang

Masukkan arahan berikut dalam tetingkap terminal atau baris arahan:

nano md_to_docx.go

Kemudian tampal kod Golang berikut:

package main

import (
    "bytes"
    "io/ioutil"
    "os/exec"
)

func main() {
    // 读取Markdown文件
    data, err := ioutil.ReadFile("test.md")
    if err != nil {
        panic(err)
    }

    // 调用Pandoc过滤器转换Markdown为LaTeX
    cmd := exec.Command("pandoc", "--filter", "pandocfilters/md_to_docx.py", "-f", "markdown", "-t", "latex")
    cmd.Stdin = bytes.NewReader(data)
    out, err := cmd.Output()
    if err != nil {
        panic(err)
    }

    // 调用Pandoc将LaTeX转换为Word文档
    cmd = exec.Command("pandoc", "-f", "latex", "-t", "docx", "--lua-filter=/Users/username/pandocfilters/lua/uncite.lua")
    cmd.Stdin = bytes.NewReader(out)
    out, err = cmd.Output()
    if err != nil {
        panic(err)
    }

    // 将结果保存为Word文档
    err = ioutil.WriteFile("test.docx", out, 0644)
    if err != nil {
        panic(err)
    }
}

Simpan dan tutup fail.

5. Gunakan program Golang untuk menukar md kepada perkataan

Masukkan arahan berikut dalam tetingkap terminal atau baris arahan:

go run md_to_docx.go

Atur cara akan membaca test.md dalam fail direktori semasa dan tukarkannya kepada fail test.docx.

6. Ringkasan

Dalam artikel ini, kami memperkenalkan cara menggunakan Golang dan Pandoc untuk menukar teks Markdown kepada dokumen Word. Kami menggunakan penapis Pandoc untuk menukar Markdown kepada LaTeX, dan kemudian menggunakan Pandoc untuk menukar dokumen LaTeX kepada Word. Kami juga membincangkan cara menggunakan penapis Python dan Pandoc untuk penapisan teks. Dengan cara ini, kita boleh menggunakan Golang untuk memanggil skrip Python untuk penukaran teks. Kami juga membincangkan cara memasang pustaka Pandoc, Go dan pandocfilters serta menyepadukannya ke dalam penyelesaian yang lengkap.

Atas ialah kandungan terperinci golang md to word. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn