Heim  >  Artikel  >  Backend-Entwicklung  >  Konvertierung des Python-Codierungstyps

Konvertierung des Python-Codierungstyps

高洛峰
高洛峰Original
2017-03-01 13:32:001096Durchsuche

Das Beispiel in diesem Artikel beschreibt die Konvertierungsmethode für den Python-Codierungstyp. Teilen Sie es als Referenz mit allen. Die Details lauten wie folgt:

1: Python und Unicode

Um mehrsprachige Texte korrekt zu verarbeiten, Python wurde nach Version 2.0 als Unicode-Zeichenfolge eingeführt.

2: Drucken in Python

Obwohl Python intern die Textkodierung zur Verarbeitung in Unicode-Kodierung konvertieren muss, wird die Terminalanzeige durch herkömmliche Python-Strings erledigt (In Tatsächlich kann die print-Anweisung von Python überhaupt keine Doppelbyte-Unicode-codierten Zeichen ausdrucken.

Pythons Druck führt automatisch eine Kodierungskonvertierung für die ausgegebene Unicode-Kodierung durch (bei anderen Nicht-Unicode-Kodierungen gibt print sie so aus, wie sie ist) (bei der Ausgabe an die Konsole), die Schreibmethode des Dateiobjekts jedoch Wenn einige Zeichenfolgen normal durch Drucken ausgegeben werden, ist das Schreiben in die Datei daher möglicherweise nicht unbedingt dasselbe wie das Drucken.

Unter Linux wird es entsprechend den Umgebungsvariablen konvertiert. Sie können es anzeigen, indem Sie den Befehl locale unter Linux verwenden. Die Implementierung der Druckanweisung besteht darin, den auszugebenden Inhalt an das Betriebssystem zu übertragen, und das Betriebssystem kodiert den Eingabebytestrom entsprechend der Kodierung des Systems.

>>>str='学习python'
>>> str
'\xe5\xad\xa6\xe4\xb9\xa0python' #asII编码
>>> print str
学习python
>>> str=u'学习python'
>>> str       ####unicode编码
'\xe5u\xad\xa6\xe4\xb9\xa0python'

3: in Python dekodieren

Andere Zeichensätze in Unicode-Kodierung konvertieren (nur chinesische Schriftzeichen erforderlich). (zu konvertieren)

>>> str='学习'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'

Auf diese Weise werden die chinesischen Zeichen codiert und konvertiert, und Python kann für die anschließende Verarbeitung verwendet werden (falls nicht konvertiert). , Python Die standardmäßige Kodierungskonvertierung wird basierend auf den Umgebungsvariablen des Computers durchgeführt, sodass möglicherweise verstümmelte Zeichen angezeigt werden)

4: in Python kodieren

Unicode in andere Zeichen konvertieren Sets

>>> str='学习'
>>> ustr=str.decode('utf-8')
>>> ustr
u'\u5b66\u4e60'
>>> ustr.encode('utf-8')
'\xe5\xad\xa6\xe4\xb9\xa0'
>>> print ustr.encode('utf-8')
学习

Weitere Artikel zur Konvertierung des Python-Codierungstyps finden Sie auf der chinesischen PHP-Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn