1. Python에서 사용하는 xml.etree.ElementTree
라이브러리는 표준 UTF-8 형식 인코딩xml.etree.ElementTree
库只支持解析和生成标准的UTF-8格式的编码
2.常见GBK
或GB2312
等中文编码的 XML 文件,用以在老旧系统中保证 XML 对中文字符的记录能力
3.XML 文件开头有标识头,标识头指定了程序处理 XML 时应该使用的编码
4.要修改编码,不仅要修改文件整体的编码,还要将标识头中 encoding 部分的值修改
1.读取&解码:
使用二进制模式读取 XML 文件,将文件变为二进制流
将二进制流使用.encode()
方法,使用原文件的编码格式进行解析为字符串
2.处理标识头:使用.replace()
方法,替换字符串中的encoding="xxx"
GB2312
및 기타 중국어로 인코딩된 XML 파일은 기존 시스템에서 중국어 문자를 기록하는 XML 기능을 보장하는 데 사용됩니다3 XML 시작 부분에 헤더가 있습니다. 헤더는 XML
2. Python XML 파일 처리 아이디어
.encode( )
메서드를 사용하여 바이너리 스트림을 사용하고 원본 파일의 인코딩 형식을 문자열.replace()
메서드를 사용하세요. 문자열3에서 encoding="xxx"
부분을 교체합니다. 인코딩 및 저장: 새로운 인코딩 형식을 사용하여 문자열을 저장합니다
GBK < ;–> GB2312: 문제 없습니다
위 내용은 Python에서 XML 파일의 인코딩을 변환하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!