Python을 사용하여 리샘플링 없이 PDF에서 고해상도 이미지를 추출하는 방법은 무엇입니까?-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Python을 사용하여 리샘플링 없이 PDF에서 고해상도 이미지를 추출하는 방법은 무엇입니까?

Mary-Kate Olsen

Oct 22, 2024 am 07:52 AM

How to Extract High-Resolution Images from PDFs Without Resampling Using Python?

Python에서 리샘플링 없이 PDF에서 이미지를 추출하는 방법은 무엇입니까?

PDF 문서에서 원본 해상도와 형식으로 이미지를 추출하려면 리샘플링을 수행하면 PyMuPDF 모듈을 활용할 수 있습니다. 이 Python 모듈을 사용하면 PDF 파일을 효율적으로 처리하고 해당 내용을 조작할 수 있습니다. PyMuPDF를 사용하여 이미지를 추출하는 방법은 다음과 같습니다.

<code class="python">import fitz

doc = fitz.open("input.pdf")
for page_num in range(len(doc)):
    for img in doc.getPageImageList(page_num):
        xref = img[0]
        pix = fitz.Pixmap(doc, xref)
        if pix.n <p>이 코드에서는 PDF 내의 페이지와 이미지를 반복합니다. 'xref' 변수는 이미지의 고유 식별자를 나타냅니다. 이미지의 색상 공간(RGB 또는 CMYK)에 따라 PNG 이미지를 직접 작성하거나 저장하기 전에 CMYK를 RGB로 변환합니다.</p>
<p>또는 fitz 버전 1.19.6을 사용하는 경우 다음을 사용할 수 있습니다. 더 나은 가시성을 위해 진행률 표시줄을 사용하여 추출을 수행하려면 다음 코드를 사용하세요.</p>
<pre class="brush:php;toolbar:false"><code class="python">import os
import fitz
from tqdm import tqdm

workdir = "path_to_pdf_folder"

for each_path in os.listdir(workdir):
    if ".pdf" in each_path:
        doc = fitz.Document(os.path.join(workdir, each_path))

        for i in tqdm(range(len(doc)), desc="pages"):
            for img in tqdm(doc.get_page_images(i), desc="page_images"):
                xref = img[0]
                image = doc.extract_image(xref)
                pix = fitz.Pixmap(doc, xref)
                pix.save(os.path.join(workdir, f"{each_path[:-4]}_p{i}-{xref}.png"))</code>

이 코드 조각을 사용하면 원본 해상도와 형식을 유지하면서 PDF에서 이미지를 추출할 수 있습니다.

위 내용은 Python을 사용하여 리샘플링 없이 PDF에서 고해상도 이미지를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

파이썬 : 편집과 해석에 대한 깊은 다이빙May 12, 2025 am 12:14 AM

Pythonusesahybridmodelofilationandlostretation : 1) ThePyThoninterPretreCeterCompileSsourcodeIntOplatform-IndependentBecode.

Python은 해석 된 또는 편집 된 언어입니까? 왜 중요한가?May 12, 2025 am 12:09 AM

Pythonisbothingretedandcompiled.1) 1) it 'scompiledtobytecodeforportabilityacrossplatforms.2) thebytecodeisthentenningreted, withfordiNamictyTeNgreted, WhithItmayBowerShiledlanguges.

파이썬에서 루프를 사용하여 목록을 연결할 수 있습니까?May 10, 2025 am 12:14 AM

예, youcanconcatenatelistsusingaloopinpython.1) useeparateloopsforeachlisttoAppenditemStoAresultlist.2) USEANESTEDLOOPTOINTERATEREATERVUNTIPLELISTSFORAMORECOCISOPPOACH.3) ApplyDingConcatenation, likefilterningevennumbers

Concatenate는 Python을 사용합니다 : 사용, Extend () 등May 10, 2025 am 12:12 AM

themostefficientmethodsforconcatenatinglistsinpythonare : 1) theextend () methodforin-placemodification, 2) itertools.chain () formemoryefficiencywithlargedatasets.theextend () methodModifiestHeoriginAllist, MakingItMemory-effectrequiretcautionsucution

파이썬 루프 : 예와 모범 사례May 10, 2025 am 12:05 AM

Pythonloopsincludeforandforandwhilleoops, withforloopsidealfor and with with with withlopsidealforcections and whileleloopsforcondition basedrepetition.bestpracticesinvolve : 1) 사용 listcomprehensionsforsimpletransformations, 2) forindex-valuepairs, 3) optingforrangeoverlistsformemor를 사용합니다

Python의 실행 모델 : 컴파일, 해석 또는 둘 다?May 10, 2025 am 12:04 AM

pythonisbothcompiledandlandingreted.

Python은 라인별로 실행됩니까?May 10, 2025 am 12:03 AM

Python은 엄격하게 라인 별 실행이 아니지만 통역사 메커니즘을 기반으로 최적화되고 조건부 실행입니다. 통역사는 코드를 PVM에 의해 실행 된 바이트 코드로 변환하며 상수 표현식을 사전 컴파일하거나 루프를 최적화 할 수 있습니다. 이러한 메커니즘을 이해하면 코드를 최적화하고 효율성을 향상시키는 데 도움이됩니다.

파이썬에서 두 목록을 연결하는 대안은 무엇입니까?May 09, 2025 am 12:16 AM

Python에는 두 개의 목록을 연결하는 방법이 많이 있습니다. 1. 연산자 사용 간단하지만 큰 목록에서는 비효율적입니다. 2. 효율적이지만 원래 목록을 수정하는 확장 방법을 사용하십시오. 3. 효율적이고 읽기 쉬운 = 연산자를 사용하십시오. 4. 메모리 효율적이지만 추가 가져 오기가 필요한 itertools.chain function을 사용하십시오. 5. 우아하지만 너무 복잡 할 수있는 목록 구문 분석을 사용하십시오. 선택 방법은 코드 컨텍스트 및 요구 사항을 기반으로해야합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.