Python에서 출력 파이핑 시 인코딩 유지
파이프를 통해 Python 프로그램의 표준 출력을 리디렉션할 때 인터프리터가 None으로 인코딩하면 유니코드 인코딩 오류가 발생합니다. 이 문제를 해결하려면 인코딩을 명시적으로 지정하는 것이 중요합니다.
Python이 터미널의 인코딩에 맞게 자동으로 조정되는 스크립트 실행과 달리 파이핑에는 수동 인코딩이 필요합니다. 일반적인 방법은 'utf-8'을 사용하여 출력을 인코딩하는 것입니다.
# -*- coding: utf-8 -*- print(u"åäö".encode('utf-8'))
이렇게 하면 대상 프로그램의 인코딩에 관계없이 파이프된 출력이 유니코드 표현과 일치하도록 보장됩니다.
여러 인코딩이 포함된 복잡한 시나리오의 경우 다음 원칙을 따르는 것이 좋습니다.
이 접근 방식을 사용하면 원활한 데이터 조작이 가능하고 인코딩 관련 오류를 방지할 수 있습니다.
ISO-8859-1과 UTF-8 사이를 변환하는 Python 프로그램의 예를 살펴보겠습니다. process:
import sys for line in sys.stdin: line = line.decode('iso8859-1') line = line.upper() line = line.encode('utf-8') sys.stdout.write(line)
이 경우 입력은 ISO-8859-1에서 디코딩되어 유니코드로 처리된 다음 출력 전에 UTF-8로 인코딩됩니다.
시스템 기본값 설정 전역적으로 인코딩하는 것은 ASCII 인코딩을 가정할 수 있는 모듈 및 라이브러리를 방해할 수 있으므로 권장되지 않습니다.
위 내용은 Python에서 출력을 파이프할 때 인코딩을 어떻게 보존할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!