ホームページ >バックエンド開発 >Python チュートリアル >Python学習で学ばなければいけないバイト

Python学習で学ばなければいけないバイト

高洛峰
高洛峰オリジナル
2017-03-13 18:04:361776ブラウズ

PythonPython のバイトを学び理解するには、興味のある友人が参照してください

Python のバイトコードは b'xxx' の形式で表されます。 x は文字で表すことも、xnn の範囲は 00 ~ ff (16 進数)、合計 256 文字の ASCII エンコード形式で表すこともできます。

1. 基本的な操作

バイトの基本的な操作は、string と非常によく似ていることがわかります。直接変更する場合は、変更する前に bytearray に変換する必要があります:


In[40]: b = b"abcd\x64"
In[41]: b
Out[41]: b'abcdd'
In[42]: type(b)
Out[42]: bytes
In[43]: len(b)
Out[43]: 5
In[44]: b[4]
Out[44]: 100 # 100用十六进制表示就是\x64

2. バイトと文字の関係


実際、バイトは文字と非常に似ていることも前述しました。相互に変換されます。バイトは、特定のエンコード形式を通じて対応する文字に変換できます。バイトは encode() メソッドを介してエンコード メソッドを渡すことで文字に変換でき、文字は decode() メソッドを介してバイトに変換できます:

In[46]: barr = bytearray(b)
In[47]: type(barr)
Out[47]: bytearray
In[48]: barr[0] = 110
In[49]: barr
Out[49]: bytearray(b'nbcdd')

さまざまなエンコード メソッドを使用して解析された文字を確認できます。バイト方式とは全く異なりますので、エンコードとデコードで異なるエンコード方式を使用すると文字化けしたり、変換に失敗したりすることがあります。各エンコード方式に含まれるバイト タイプの数が異なるため、上記の例の xc8 は utf-8 の最大文字数を超えています。


3. アプリケーション

最も単純な例として、Baidu で Python を検索したときに返されるページをクロールしてみましょう。それが間違っている場合です。デコードされた結果を返すと、それは超長いバイト文字列になります。正しくデコードされると、通常の HTML ページを表示できます。

In[50]: s = "人生苦短,我用Python"
In[51]: b = s.encode('utf-8')
In[52]: b
Out[52]: b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe7\x94\xa8Python'
In[53]: c = s.encode('gb18030')
In[54]: c
Out[54]: b'\xc8\xcb\xc9\xfa\xbf\xe0\xb6\xcc\xa3\xac\xce\xd2\xd3\xc3Python'
In[55]: b.decode('utf-8')
Out[55]: '人生苦短,我用Python'
In[56]: c.decode('gb18030')
Out[56]: '人生苦短,我用Python'
In[57]: c.decode('utf-8')
Traceback (most recent call last):
 exec(code_obj, self.user_global_ns, self.user_ns)
 File "<ipython-input-57-8b50aa70bce9>", line 1, in <module>
 c.decode(&#39;utf-8&#39;)
UnicodeDecodeError: &#39;utf-8&#39; codec can&#39;t decode byte 0xc8 in position 0: invalid continuation byte
In[58]: b.decode(&#39;gb18030&#39;)
Out[58]: &#39;浜虹敓鑻︾煭锛屾垜鐢≒ython&#39;

以上がこの記事の全内容です、Pythonプログラミングを学習する皆さんのお役に立てれば幸いです。

以上がPython学習で学ばなければいけないバイトの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。