搜尋
首頁後端開發Python教學淺談python學習之字元編碼與字串

淺談python學習之字元編碼與字串

Oct 29, 2018 pm 05:54 PM
python字串字元編碼

本篇文章帶給大家的內容是淺談python學習之字符編碼與字串。有一定的參考價值,有需要的朋友可以參考一下,希望對你們有幫助。

字元編碼是什麼?

例如漢字#”,可以用以下表示

十進制:20013

二進位:01001110 00101101(unicode)/11100100 10111000 10101101(utf-8)##十六

## u4e2d

ascii編碼

#ASCII
    編碼是
  • 1個位元組

  • 只能編碼純英文
  • 節省空間

  • ##unicode編碼Unicode編碼通常是2#個位元組。 (例如字母AASCII編碼是十進位的

    65
  • ,二進位的
  • 01000001

    ;A

    Unicode
  • 編碼是
  • 00000000 01000001

    .)uicode統一編碼,解決編碼衝突,亂碼問題消失

#比ascii多一倍的儲存空間,儲存和傳送時不划算(

UTF-8

解決 )utf-8編碼(可變長的unicode編碼)UTF-8編碼把一個Unicode字元根據不同的數字大小編碼成1-6個字節,常用的英文字母被編碼成1

個字節,漢字通常是3個字節,只有很生僻的字元才會被編碼成4 -6個位元組。 字元ASCII#UnicodeUTF-8A0100000100000000 01000001#01000001
##########x################################################################################################################################################# #01001110 00101101######11100100 10111000 10101101#############

1)如果你要傳輸的文字包含大量英文字符,用UTF-8編碼就能節省空間;

2)ASCII 編碼實際上可以被看成是UTF-8編碼的一部分,所以,大量只支援ASCII#編碼的歷史遺留軟體可以在UTF-8編碼下繼續運作。

電腦系統通用的字元編碼運作方式:

記憶體:統一unicode編碼

#硬碟、傳輸:轉換成utf-8

瀏覽網頁的時候,伺服器會把動態產生的Unicode內容轉換成UTF-8再傳送到瀏覽器。

Python的字串

#相關函數

  • ord()函數取得字符的整數表示(單一字元)參數為要操作的單一字符,並傳回一個整數。

  • chr()函數#將編碼轉換成對應的字元(單一字元)

  • encode()函數,將str##字串以指定的編碼方式(參數)變成bytes

'str'.encode

ascii/utf-8)傳回bytes字串

#中文以ascii編碼會報錯

  • decode()函數把從網路或磁碟上讀取的bytes以指定的編碼方式(參數)變成str

'bytes'.decode(ascii/utf-8)回傳str字串

bytes無法解碼會報錯,

如果bytes中只有一小部分無效的字節,可以傳入errors='ignore'忽略錯誤的位元組

> >> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore') '中'

  • len( )函數,計算字串包含字元個數

#>>> len(b'ABC') 3 >>> len(b'\xe4\xb8\xad\xe6\x96\x87') 6 >>> len('中文'.encode('utf-8')) 6

在最新的Python 3版本中,字串是以Unicode#的,也就是說,Python的字串支援多語言

Python

的字串類型是str,如果要在網路上傳輸,或儲存到磁碟上,就需要把str變成bytes

>>為了避免亂碼問題,應當始終堅持使用UTF-8編碼對str bytes進行轉換

str和bytes的差異

  • 1)str一個字元對應若干個位元組bytes的每個字元都只佔用一個位元組。 (將多位元組的字元分解為單字節的多字元)

#>>> 'ABC'.encode('ascii') b'ABC ' >>> '中文'.encode('utf-8') b'\xe4\xb8\xad\xe6\x96\x87'

#在bytes中,無法顯示為ASCII字元的字節,以\x##顯示。

  • 2)bytes字元帶前綴,帶引號

.py檔案中含中文要用utf-8編碼

#!/usr/bin/env python3 # -*- coding: utf-8 -*-

第一行註解是為了告訴 Linux/OS X系統,這是一個Python可執行程序,##Windows系統會忽略這個註解;

第二行註解是為了告訴Python解釋器,依照UTF-8編碼讀取原始程式碼,否則,你在原始碼中寫的中文輸出可能會有亂碼。

>>編輯器用UTF-8 without BOM

#字串格式化問題

>>> 'Hello, %s' % 'world' 'Hello, world' >> ;> 'Hi, %s, you have $%d.' % ('Michael', 1000000) 'Hi, Michael, you have $1000000.'

%運算子

  • 就是用來格式化字串的。在字串內部有幾個%?佔位符,後面就跟幾個變數或值,順序要對應好。如果只有一個%?,括號可以省略。

  • 轉義,用%%來表示一個%

> ;>> 'growth rate: %d %%' % 7 'growth rate: 7 %'

##佔位符%d#%f#%s%x
取代內容
整數
字串
1十六進位整數

#format()另一種格式化字串的方法是使用字串的format()方法,它會用傳入的參數依序取代字串內的佔位符

{0}

{1}…###,不過這種方式寫起來比#####%##### ##要麻煩得多:#########>>> 'Hello, {0}, 成績提升了{1:.1f}%'.format('小明', 17.125) ' Hello, 小明, 成績提升了17.1%'###

以上是淺談python學習之字元編碼與字串的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:博客园。如有侵權,請聯絡admin@php.cn刪除
2小時的Python計劃:一種現實的方法2小時的Python計劃:一種現實的方法Apr 11, 2025 am 12:04 AM

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

Python:探索其主要應用程序Python:探索其主要應用程序Apr 10, 2025 am 09:41 AM

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

您可以在2小時內學到多少python?您可以在2小時內學到多少python?Apr 09, 2025 pm 04:33 PM

兩小時內可以學到Python的基礎知識。 1.學習變量和數據類型,2.掌握控制結構如if語句和循環,3.了解函數的定義和使用。這些將幫助你開始編寫簡單的Python程序。

如何在10小時內通過項目和問題驅動的方式教計算機小白編程基礎?如何在10小時內通過項目和問題驅動的方式教計算機小白編程基礎?Apr 02, 2025 am 07:18 AM

如何在10小時內教計算機小白編程基礎?如果你只有10個小時來教計算機小白一些編程知識,你會選擇教些什麼�...

如何在使用 Fiddler Everywhere 進行中間人讀取時避免被瀏覽器檢測到?如何在使用 Fiddler Everywhere 進行中間人讀取時避免被瀏覽器檢測到?Apr 02, 2025 am 07:15 AM

使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

Python 3.6加載Pickle文件報錯"__builtin__"模塊未找到怎麼辦?Python 3.6加載Pickle文件報錯"__builtin__"模塊未找到怎麼辦?Apr 02, 2025 am 07:12 AM

Python3.6環境下加載Pickle文件報錯:ModuleNotFoundError:Nomodulenamed...

如何提高jieba分詞在景區評論分析中的準確性?如何提高jieba分詞在景區評論分析中的準確性?Apr 02, 2025 am 07:09 AM

如何解決jieba分詞在景區評論分析中的問題?當我們在進行景區評論分析時,往往會使用jieba分詞工具來處理文�...

如何使用正則表達式匹配到第一個閉合標籤就停止?如何使用正則表達式匹配到第一個閉合標籤就停止?Apr 02, 2025 am 07:06 AM

如何使用正則表達式匹配到第一個閉合標籤就停止?在處理HTML或其他標記語言時,常常需要使用正則表達式來�...

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器