>  기사  >  백엔드 개발  >  Python 문자 인코딩 파일 방법 소개

Python 문자 인코딩 파일 방법 소개

高洛峰
高洛峰원래의
2017-03-26 17:55:521331검색

문자 인코딩 개발

ASCII 255는 영문과 숫자, 특수문자 1바이트만 지원

유니코드 중국어 및 영어 통합 2바이트

utf-8 중국어>3bytes 영어 > ;1bytes

bytes 유형

텍스트 데이터는 항상 str 유형으로 표현되는 유니코드, 바이너리 데이터는 bytes 유형으로 표현됩니다

바이너리 데이터는 비디오, 오디오 파일 및 전송에 사용됩니다. 소켓 네트워크 전송 데이터 등

문자열을 바이너리로 변환 str.encode("encoding=utf-8")

바이너리를 문자열로 변환 b'xe2x82'.decode("encoding=utf -8")

파일 핸들은 파일 객체의 메모리 주소입니다

문자 인코딩 및 트랜스코딩

한자는 ASCII 코드 테이블에 저장할 수 없습니다. 기본값 Windows의 시스템 문자 인코딩은 GBK입니다.

유니코드 문자 인코딩은 전 세계의 모든 문자를 저장할 수 있지만 모든 문자는 2바이트를 차지합니다.

영어 파일에는 4M가 필요합니다. 공백

utf-8 문자열을 gbk 문자로

두 개의 인코딩 문자열 변환은 먼저 유니코드 인코딩

유니코드(통합)로 변환해야 합니다. code, Unicode, Unicode)는 컴퓨터에서 사용되는 문자 인코딩입니다. 유니코드는 기존 문자 인코딩 체계의 한계를 해결하기 위해 만들어졌습니다.

깨진 문자가 나타나는 경우는 기본적으로 두 가지입니다. >1. 문자 인코딩이 없습니다

2. 이 프로그램을 작성할 때 다른 사람이 지정한 문자 세트가 우리가 사용하는 문자 세트와 잘못된 위치에 있습니다

Python 2.x 버전에서 Pyton이 .py 파일을 해석할 때 기본 인코딩은 ASCII 코드입니다

Python3의 기본값은 유니코드 인코딩입니다

python2의 기본 인코딩은 다음과 같습니다.

Python 문자 인코딩 파일 방법 소개str ="Hello"                    //이 문자열은 utf-8로 인코딩됩니다.

new_str=str.decode('utf-8') / / str의 원래 인코딩 형식을 decode 함수에 전달하여 유니코드 인코딩으로 변환

ret = new_str.encode('GBK') //유니코드 인코딩을 GBK 인코딩 문자열로 변환

str = u"Hello" 문자열 앞에 u 문자를 추가하면 문자열이 유니코드 인코딩

인코딩

으로 설정되었음을 나타냅니다. Python 인터프리터가 .py 파일의 코드를 로드하면 내용이 인코딩(기본 ascill)되므로 인코딩 유형을 지정하지 않으면

에서 중국어가 있으면 오류를 보고합니다.

Python의 작업 과정

python은 코드를 메모리로 읽어옵니다. 2. 어휘 및 구문 분석 3. 컴파일러에 넣습니다. ---》 바이트코드 생성 4. 바이트코드 실행 -- - 》기계어 코드 생성 CPU 실행

변수

문자열의 값은 메모리에 연속되어 있으므로 변경하려면 나중에 예약해야 합니다. 수정은 지원되지 않습니다.

문자열 특성은 한 번 수정하면 다시 생성됩니다

위 내용은 Python 문자 인코딩 파일 방법 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.