>  기사  >  백엔드 개발  >  Python을 사용하여 문자열(한자 포함)을 순회하는 방법 공유

Python을 사용하여 문자열(한자 포함)을 순회하는 방법 공유

Y2J
Y2J원래의
2017-05-02 15:01:501961검색

이 글에서는 파이썬 순회 문자열(한자 포함)의 세부 예시에 대한 관련 정보를 주로 소개합니다. 도움이 필요한 친구들은

파이썬 순회 문자열(한자 포함) 세부 예시

s = "中国china"
for j in s:
  print j

먼저 'a'의 인코딩은 무엇인가요? gbk

>>> a='中国'
>>> a

이렇게 해보세요. 6개 단어가 나오면 utf-8이라는 뜻입니다.


게다가 utf-8이든 gbk이든 여기서는 한 단어씩 꺼내기 때문에 이런 식으로 순회할 수 없습니다. 가상 머신은 a를 길이가 len(a)인 문자열로 처리합니다.


다음 단계는 순회 문제입니다.


대부분의 Linux 쉘은 기본적으로 utf-8이므로 한자 하나가 세 단어이므로 세 단어로 읽어야 합니다.

>>> a[:3]

를 시도해 보세요. "中" 문자


Windows의 기본 명령은 cp936, 즉 gbk입니다. 한자의 한 글자는 두 글자이므로 두 글자는 두 글자로 읽혀집니다(a[:2] ).

순회하는 또 다른 방법이 있는데, 문자열을 유니코드로 변환하여 중국어와 영어가 모두 하나의 단어가 되도록 하고, 순회하는 방법으로 for i를 사용할 수 있습니다. 이것의 장점은 중국어와 영어 문자가 모두 한 단어인 반면, utf-8과 gbk에서는 영문자가 한 단어만 차지한다는 점입니다.

s = u"中国china"
for j in s:
  print j

출력은 다음과 같습니다.

中
国
c
h
i
n
a

위 내용은 Python을 사용하여 문자열(한자 포함)을 순회하는 방법 공유의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.