집 >백엔드 개발 >파이썬 튜토리얼 >Python에서 고정 너비 파일 줄을 어떻게 효율적으로 구문 분석할 수 있나요?

Python에서 고정 너비 파일 줄을 어떻게 효율적으로 구문 분석할 수 있나요?

Barbara Streisand원래의: 2024-10-30 17:09:26531검색

How can I efficiently parse fixed-width file lines in Python?

고정 너비 파일 라인의 빠른 구문 분석

각 열이 한 라인에서 특정 수의 문자를 차지하는 고정 너비 파일을 구문 분석하는 것은 효율성이 필요한 작업일 수 있습니다. 이를 효율적으로 달성하는 방법에 대한 설명은 다음과 같습니다.

문제

처음 20자가 하나의 열을 나타내고 그 다음에는 21-30자가 두 번째 열을 나타내는 고정 너비 파일을 생각해 보세요. 에. 100자로 구성된 한 줄을 어떻게 효과적으로 해당 열로 구문 분석할 수 있나요?

해결책

1. 구조체 모듈:

Python 표준 라이브러리의 구조체 모듈을 활용하면 C 구현으로 인해 단순성과 속도를 모두 제공합니다. 아래 코드는 사용법을 보여줍니다:

<code class="python">import struct

fieldwidths = (2, -10, 24)
fmtstring = ' '.join('{}{}'.format(abs(fw), 'x' if fw <p>출력:</p>
<pre class="brush:php;toolbar:false">fmtstring: '2s 10x 24s', record size: 36 chars
fields: ('AB', 'MNOPQRSTUVWXYZ0123456789')

2. 최적화된 문자열 슬라이싱:

문자열 슬라이싱이 일반적으로 사용되지만 큰 줄의 경우 번거로울 수 있습니다. 최적화된 접근 방식은 다음과 같습니다.

<code class="python">from itertools import zip_longest
from itertools import accumulate

def make_parser(fieldwidths):
    # Calculate slice boundaries.
    cuts = tuple(cut for cut in accumulate(abs(fw) for fw in fieldwidths))
    # Create field slice tuples.
    flds = tuple(zip_longest(cuts, (0,)+cuts))[:-1]  # Ignore final value.
    # Construct the parsing function.
    parse = lambda line: tuple(line[i:j] for i, j in flds)
    parse.size = sum(abs(fw) for fw in fieldwidths)
    parse.fmtstring = ' '.join('{}{}'.format(abs(fw), 'x' if fw <p>출력:</p>
<pre class="brush:php;toolbar:false">fmtstring: '2s 10x 24s', record size: 36 chars
fields: ('AB', 'MNOPQRSTUVWXYZ0123456789')

위 내용은 Python에서 고정 너비 파일 줄을 어떻게 효율적으로 구문 분석할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python String for while Struct number this column

성명：

이전 기사：FastAPI에서 동일한 경로 매개변수를 사용하여 여러 API 엔드포인트를 정의하는 방법은 무엇입니까?다음 기사：FastAPI에서 동일한 경로 매개변수를 사용하여 여러 API 엔드포인트를 정의하는 방법은 무엇입니까?