Python의 PDF에서 기본 해상도 이미지 추출
PDF에서 정확한 이미지 추출을 위해서는 원본 해상도와 형식을 유지하는 것이 중요합니다. 이미지. PyMuPDF는 이 작업에 편리한 솔루션을 제공합니다.
시작하려면 PyMuPDF 모듈을 가져오고 대상 PDF 파일을 엽니다.
<code class="python">import fitz doc = fitz.open("file.pdf")</code>
getPageImageList를 사용하여 페이지를 반복하고 이미지를 추출합니다.
<code class="python">for i in range(len(doc)): for img in doc.getPageImageList(i): xref = img[0] pix = fitz.Pixmap(doc, xref)</code>
이미지 유형에 따라 이미지를 PNG로 쓰거나 PNG로 쓰기 전에 CMYK 이미지를 RGB로 변환하세요.
<code class="python">if pix.n < 5: pix.writePNG("p%s-%s.png" % (i, xref)) else: pix1 = fitz.Pixmap(fitz.csRGB, pix) pix1.writePNG("p%s-%s.png" % (i, xref))</code>
탐색할 추가 리소스는 다음과 같습니다.
이 Python 솔루션을 사용하면 기본 해상도와 형식을 유지하면서 PDF에서 이미지를 효율적으로 추출하여 정확한 재생 및 분석을 보장할 수 있습니다.
위 내용은 Python을 사용하여 PDF에서 기본 해상도 이미지를 추출하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!