python에는 str object과 unicode object string이 있는데, 둘 다 문자의 바이트 인코딩을 저장할 수 있지만 유형이 다릅니다. 매우 중요하며 이것이 인코딩과 디코딩이 있는 이유입니다. Python에서
encode 및 decode의 의미는
encode
unicode ------------로 표현할 수 있습니다. - ------------> str
유니코드 <------------ - str
decode
몇 가지 일반적인 방법:
str_string.decode('codec')은 str_string을 변환하는 것입니다. 은 unicode_string, codec은 소스 str_string의 인코딩 방법
unicode_string.encode('codec')은 unicode_string을 str_string으로 변환하는 것, codec은 대상 str_string의 인코딩 방법
str_string.decode( 'from_codec').encode('to_codec')는 서로 다른 인코딩의 str_string 간 변환을 실현할 수 있습니다
예:
>>> t='Great Wall'
>>> t
'xb3xa4xb3xc7'
>>> t.decode('gb2312').encode('utf-8')
'xe9x95xbfxe5x9fx8e'
str_string.encode('codec')는 먼저 시스템의 기본 코덱을 호출하여 str_string을 unicode_string으로 변환한 다음 encode 매개 변수 코덱을 사용하여 최종 str_string으로 변환하는 것과 같습니다. str_string.decode('sys_codec').encode('코덱').
unicode_string.decode('codec')는 기본적으로 의미가 없습니다. 유니코드는 Python, UTF16 또는 UTF32(이미 Python 컴파일 시 결정됨)에서 하나의 유니코드 인코딩만 사용하며 인코딩 변환이 필요하지 않습니다.
참고: 기본 코덱은
import sys
sys.setdefaultencoding('utf-8')과 같이 site-packages 아래의 sitecustomize.py 파일에 지정되어 있습니다.
위 내용은 Python 문자 인코딩 변환 방법에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!