本章節為大家更新一下「Python語法規範與資料類型」相關內容,主要是為了讓大家了解Python有什麼類型的程式模式,掌握Python的基本語法,清楚怎麼輸出及命令列參數的基本應用,對Python的資料類型了解後,以便做更多的相關操作。
①Python互動式指令程式設計。
②Python腳本程式設計。
③中文編碼處理。
互動式命令程式設計模式就是一個典型逐行讀取執行模式。
當程式只有一行或較少的時候,這種程式模式是比較典型的應用方式。
下圖使用PythonIDLE編輯器進行編程,而此編輯器的編程模式就是典型的互動式命令編符號。
>>>就是輸入互動指令的提示符,每次輸入完畢後回車,該指令就會被Python解析器執行。
當我們需要編寫較為複雜或大段的程式碼的時候,命令式程式設計就顯得不夠方便。
因此,Python提供了腳本程式模式。可以建立一個後綴名為*.py的腳本文件,將大量的程式碼編寫到該文件中,這樣便於程式碼的維護和更新,之後再使用交互命令執行或IDE 工具運行即可。
字串是一種資料類型。但是,字串還有一個比較特殊的編碼問題。
因為計算機只能處理數字,如果要處理文本,就必須先把文本轉換為數字才能處理。
最早的電腦在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進制11111111=十進制255),如果要表示更大的整數,就必須用更多的位元組。例如兩個位元組可以表示的最大整數是65535,4 個位元組可以表示的最大整數是4294967295。
由於電腦是美國人發明的,因此,最早只有127個字元被編碼到電腦裡,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII編碼,例如大寫字母A的編碼是65,小寫字母z的編碼是122。
Python3之所以能夠很好地解決中文亂碼問題,在於其將所有的字串都是用unicode進行字符編碼。
● Unicode把所有的語言統一到一套編碼裡,這樣就不會亂碼了。
● Unicode也在不斷的發展,但最常用的是用兩個位元組表示一個字符(如果遇到非常生僻的字符,就需要4位元組)。現在我們見到的大多數作業系統和大多數程式語言都支援unicode。
ASCII編碼是1個位元組,而Unicode編碼通常是2個位元組。
新的問題又出現了:如果統一成Unicode編碼,亂碼問題就從此消失了。但是,如果你寫的文字基本上全部是英文的話,用Unicode編碼比ASCII編碼需要多一倍的儲存空間,在儲存和傳輸上就十分不划算。
解決方法的誕生:又出現了把Unicode編碼轉換成「可變長編碼」的UTF-8編碼。
● UTF-8編碼把一個Unicode字元根據不同的數字大小編碼成1-6個字節,常用的英文字母被編碼成1個字節,漢字通常是3個字節,只有很生僻的字元才會被編碼成4-6個位元組。
● 如果你要傳輸的文字包含大量英文字符,用UTF-8編碼就能節省空間。
● UTF-8編碼有一個額外的好處,就是ASCII編碼實際上可以被看成是UTF-8編碼的一部分,所以,大量只支援ASCII編碼的歷史遺留軟體可以在UTF-8編碼下繼續工作。
特別注意:電腦記憶體中,統一使用Unicode編碼。
在Python3版本中,字串都是以Unicode編碼的,也就是說,Python字串支援多語言。
單一字元的編碼,Python提供了ord()函數取得單一字元的十進位整數表示,chr()函數把編碼轉換成對應的字元。
>>> ord(‘A’) 65 >>> ord(‘中’) 20013 >>> chr(66) ‘B’ >>> chr(25991) ‘文’
Python原始碼也是一個文字檔 ,所以,當你的原始碼中包含中文的時候,在儲存原始碼時,就需要務必指定儲存為UTF-8編碼。當Python解釋器讀取原始碼時,為了讓它按UTF-8編碼讀取,我們通常在檔案開頭寫上這行。
#-*- coding:utf-8 *-
註解是為了告訴Python解釋器,按照UTF-8編碼讀取原始碼,否則,你在原始碼中寫的中文輸出可能會有亂碼。
以上是自動化測試:Python常見的幾種程式模式的詳細內容。更多資訊請關注PHP中文網其他相關文章!