字符串 - Python编码问题？

Question

我用Python3的requests库从一个api请求一个json数据，然后试图去print出来： {代码...} 也试了一下方法： {代码...} 我这个name字符串有可能有中文，数字，英文，也有可能有阿拉伯文。或者只有他们之中的一个。我...

大家讲道理 · Answer

標準 JSON ではエンコーディングを指定する必要はありません。

簡体字中国語版の Windows を使用している場合、システムコンソールは GBK エンコードで文字を出力する必要がありますが、文字「U+062F د ARABIC LETTER DAL」は GBK エンコードに対応していないため、出力できません。

ファイルに書き込むか、アラビア語版の Windows をインストールするかを選択できます。または、より優れた Unicode サポートを備えた別のオペレーティングシステム/端末を使用してください。

高洛峰 · Answer

まず、なぜリクエストにこの問題が発生するのかを理解する必要があります

リクエストは、サーバーから返された応答ヘッダーの Content-Type から文字セットエンコーディングを取得します。コンテンツタイプに charset フィールドがある場合、リクエストはエンコーディングを正しく識別できます。それ以外の場合は、デフォルトの ISO-8859-1 を使用します。詳細については、この記事を読んでください。 Python リクエストライブラリ中国語のコーディングの問題

記事内ではいくつかの方法が言及されていますが、3.x ではこの問題が修正されているようです。

私の提案
まず手動でページにアクセスして、このページのヘッダー部分の文字セットがGBKであると仮定して、どのようなエンコーディングであるかを確認します

リーリー

字符串 - Python编码问题？

全員に返信(2)返信します