>백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 PDF에서 기본 해상도 이미지를 추출하는 방법

Python을 사용하여 PDF에서 기본 해상도 이미지를 추출하는 방법

Barbara Streisand
Barbara Streisand원래의
2024-10-22 07:50:031103검색

How to Extract Native Resolution Images from PDFs Using Python

Python의 PDF에서 기본 해상도 이미지 추출

PDF에서 정확한 이미지 추출을 위해서는 원본 해상도와 형식을 유지하는 것이 중요합니다. 이미지. PyMuPDF는 이 작업에 편리한 솔루션을 제공합니다.

시작하려면 PyMuPDF 모듈을 가져오고 대상 PDF 파일을 엽니다.

<code class="python">import fitz
doc = fitz.open("file.pdf")</code>

getPageImageList를 사용하여 페이지를 반복하고 이미지를 추출합니다.

<code class="python">for i in range(len(doc)):
    for img in doc.getPageImageList(i):
        xref = img[0]
        pix = fitz.Pixmap(doc, xref)</code>

이미지 유형에 따라 이미지를 PNG로 쓰거나 PNG로 쓰기 전에 CMYK 이미지를 RGB로 변환하세요.

<code class="python">if pix.n < 5:
            pix.writePNG("p%s-%s.png" % (i, xref))
else:               
            pix1 = fitz.Pixmap(fitz.csRGB, pix)
            pix1.writePNG("p%s-%s.png" % (i, xref))</code>

탐색할 추가 리소스는 다음과 같습니다.

  • [PyMuPDF 이미지 추출 문서](https://pymupdf.readthedocs.io/en/latest/image-extraction.html)
  • [FitZ 1.19.6에 대한 향상된 FitZ 이미지 추출]( https://stackoverflow.com/a/74345380)

이 Python 솔루션을 사용하면 기본 해상도와 형식을 유지하면서 PDF에서 이미지를 효율적으로 추출하여 정확한 재생 및 분석을 보장할 수 있습니다.

위 내용은 Python을 사용하여 PDF에서 기본 해상도 이미지를 추출하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.