Python的編碼格式更改問題-Python教學-PHP中文網

首頁

後端開發

Python教學

Python的編碼格式更改問題

anonymity

Apr 20, 2019 pm 02:27 PM

encodingpython

今天寫python爬蟲，突然爬取的網頁異常，並報錯：UnicodeEncodeError: 'latin-1' codec can't encode characters in position 41-50: ordinal not in range(256)；UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal，這是一個明顯的編碼格式的問題。其實不只是python2或3，還是其他java,c等程式語言，常常會遇到編碼格式的問題，異常頭痛，尤其是ASCII、gbk、utf-8等編碼之間的轉換。於是查找資料、動手實踐，找到這樣的幾個方法。

首先關於python的系統編碼格式和輸入輸出格式，我們要如何查看呢？

Python的編碼格式更改問題

>>> import sys
>>> sys.getdefaultencoding()# 系统默认编码格式
&#39;UTF-8&#39;
>>> sys.stdout.encoding# 输入输出格式
&#39;US-ASCII&#39;

這種情況下表示，目前的命令列的輸入輸出編碼是ascii，所以需要手動改成設定環境變數LANG為utf-8：

export LANG="en_US.UTF-8"

如果是在ubuntu環境下，可以將上面這行指令加入~/.bashrc中一勞永逸解決問題，加入後執行下方指令使其生效或重新啟動生效。

source ~/.bashrc

或另一種方法是，只針對python設定對應編碼(同上，命令列運行或加入bashrc檔)：

PYTHONIOENCODING=&#39;utf_8&#39;
export PYTHONIOENCODING

gbk編碼範例圖：

Python的編碼格式更改問題

#ascii編碼表圖部分：

Python的編碼格式更改問題

#在平時程式碼編程時別忘了給上排加上：

# -*- coding: utf-8 -*-

設定python編碼可以使用命令列，但僅在本會話中生效

>>>sys.getdefaultencoding()查看当前编码(若报错，先执行>>>import sys >>>reload(sys));
>>>sys.setdefaultencoding(&#39;utf8&#39;)设置编码

在程式碼中重新載入SYS模組並設定uft-8也是可行的，但是在pycharm中會提示錯誤

import sys
reload(sys) 
sys.setdefaultencoding(&#39;utf8&#39;)
重启Python解释器，发现编码已被设置为utf8；
这是因为系统在Python启动的时候，自行调用该文件，设置系统的默认编码，而不需要每次都手动加上解决代码，属于一劳永逸的解决方法。

在平常開發時，我們都知道利用Decode和Encode進行轉碼作業。

Decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode(&#39;gb2312&#39;)，表示将gb2312编码的字符串str1转换成unicode编码。
Encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode(&#39;gb2312&#39;)，表示将unicode编码的字符串str2转换成gb2312编码。

在最新的python 3版本中，字串的型別是str，在記憶體中都是以Unicode表示，一個字元對應若干個位元組；

如果要在網路上傳輸，或儲存到磁碟上，就需要把str變成以位元組為單位的bytes。

以Unicode表示的str透過encode()方法可以編碼為指定的bytes，例如：

>>> &#39;ABC&#39;.encode(&#39;ascii&#39;)
b&#39;ABC&#39;
>>> &#39;中文&#39;.encode(&#39;utf-8&#39;)
b&#39;\xe4\xb8\xad\xe6\x96\x87&#39;
>>> &#39;中文&#39;.encode(&#39;ascii&#39;)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: &#39;ascii&#39; codec can&#39;t encode characters in position 0-1: ordinal not in range(128)

在操作字串時，我們經常遇到str和bytes的互相轉換。為了避免亂碼問題，應始終堅持使用UTF-8編碼對str和bytes進行轉換。

友誼連結【UTF-8編碼轉換工具】

【python3影片教學】

編碼格式最初只有幾種，由於電腦的普及，許多國家或組織的使用，編碼格式也變得越來越多，但是國際通用的依然是UTF-8，所以應該有個良好的程式設計習慣，多使用UTF-8編碼格式。在遇到編碼問題時，也盡量保持編碼格式的統一。

以上是Python的編碼格式更改問題的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

Python：自動化，腳本和任務管理Apr 16, 2025 am 12:14 AM

Python在自動化、腳本編寫和任務管理中表現出色。 1)自動化：通過標準庫如os、shutil實現文件備份。 2)腳本編寫：使用psutil庫監控系統資源。 3)任務管理：利用schedule庫調度任務。 Python的易用性和豐富庫支持使其在這些領域中成為首選工具。

Python和時間：充分利用您的學習時間Apr 14, 2025 am 12:02 AM

要在有限的時間內最大化學習Python的效率，可以使用Python的datetime、time和schedule模塊。 1.datetime模塊用於記錄和規劃學習時間。 2.time模塊幫助設置學習和休息時間。 3.schedule模塊自動化安排每週學習任務。

Python：遊戲，Guis等Apr 13, 2025 am 12:14 AM

Python在遊戲和GUI開發中表現出色。 1)遊戲開發使用Pygame，提供繪圖、音頻等功能，適合創建2D遊戲。 2)GUI開發可選擇Tkinter或PyQt，Tkinter簡單易用，PyQt功能豐富，適合專業開發。

Python vs.C：申請和用例Apr 12, 2025 am 12:01 AM

Python适合数据科学、Web开发和自动化任务，而C 适用于系统编程、游戏开发和嵌入式系统。Python以简洁和强大的生态系统著称，C 则以高性能和底层控制能力闻名。

2小時的Python計劃：一種現實的方法Apr 11, 2025 am 12:04 AM

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型，2.掌握控制流（條件語句和循環），3.理解函數的定義和使用，4.通過簡單示例和代碼片段快速上手Python編程。

Python：探索其主要應用程序Apr 10, 2025 am 09:41 AM

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中，Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域，NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面，Python適用於自動化測試和系統管理等任務。