字符串還有一個編碼問題。
因為電腦只能處理數字,如果要處理文本,就必須先把文字轉換成數字才能處理。最早的電腦在設計時採用8位元(bit)作為一個位元組(byte#) ,所以,一個位元組能表示的最大的整數就是255(二進位11111111=十進位255 ),0 - 255被用來表示大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII 編碼,例如大寫字母A 的編碼是65,小寫字母z 的編碼是122#。
#如果要表示中文,顯然一個位元組是不夠的,至少需要兩個位元組,而且還不能和ASCII編碼衝突,所以,中國制定了GB2312編碼,用來把中文編進去。
#類似的,其他語言如日文和韓文也有這個問題。為了統一所有文字的編碼,Unicode應運而生。 Unicode把所有語言都統一到一套編碼裡,這樣就不會再有亂碼問題了。
Unicode通常用兩個位元組表示一個字符,原有的英文編碼從單字節變成雙字節,只要把高字節全部填為0就可以。
#因為Python的誕生比Unicode標準發布的時間還要早,所以最早的Python只支援ASCII編碼,普通的字串'ABC'在Python內部都是ASCII##編碼的。
#
Python在後來加入了對Unicode的支持,以Unicode表示的字串用u'...'表示,例如:
print u'中文'
Unicode#字串除了多了一個u 之外,與普通字串沒啥區別,轉義字元和多行表示法仍然有效:
print u'中文\n日文\n韩文'
#多行:
##u'''第一行 第二行'''
多行:ur'''Python的Unicode字符串支持"中文",
"日文",
"韩文"等多种语言'''
# 如果中文字串在 Python環境下遇到UnicodeDecodeError,這是因為.py檔案儲存的格式有問題。可以在第一行加入註解
# -*- coding: utf-8 -*-
#目的是告訴Python解釋器,用
... 並選擇UTF-8
格式保存。
二、Python中整數和浮點數
Python支援對整數和浮點數直接進行四則混合運算,運算規則和數學上的四則運算規則完全一致。
基本的運算:
1 + 2 + 3 # ==> 6 4 * 5 - 6 # ==> 14 7.5 / 8 + 2.1 # ==> 3.0375######
(1 + 2) * 3 # ==> 9 (2.2 + 3.3) / (1.5 * (9 - 0.3)) # ==> 0.42145593869731807## ################使用括號可以提升優先級,這和數學運算完全一致,注意只能使用小括號,但是括號可以嵌套很多層:##### ##########和數學運算不同的地方是,###Python###的整數運算結果仍然是整數,浮點數運算結果仍然是浮點數:######### ####
1 + 2 # ==> 整数 3 1.0 + 2.0 # ==> 浮点#########但整數和浮點數混合運算的結果就變成浮點數了:#########
1 + 2.0 # ==> 浮点数 3.0####
为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如 0.1 换成二进制表示就是无限循环小数。
那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?
11 / 4 # ==> 2
令很多初学者惊讶的是,Python的整数除法,即使除不尽,结果仍然是整数,余数直接被扔掉。不过,Python提供了一个求余的运算 % 可以计算余数:
11 % 4 # ==> 3
如果我们要计算 11 / 4 的精确结果,按照“整数和浮点数混合运算的结果是浮点数”的法则,把两个数中的一个变成浮点数再运算就没问题了:
11.0 / 4 # ==> 2.75
#与运算 True and True # ==> True True and False # ==> False False and True # ==> False False and False # ==> False #或运算 True or True # ==> True True or False # ==> True False or True # ==> True False or False # ==> False #非运算 not True # ==> False not False # ==> True a = True print a and 'a=T' or 'a=F' #计算结果不是布尔类型,而是字符串 'a=T',这是为什么呢? #因为Python把0、空字符串''和None看成 False,其他数值和非空字符串都看成 True,所以: True and 'a=T' #计算结果是 'a=T' #继续计算 'a=T' or 'a=F' 计算结果还是 'a=T'
要解释上述结果,又涉及到 and 和 or 运算的一条重要法则:短路计算。
1. 在计算 a and b 时,如果 a 是 False,则根据与运算法则,整个结果必定为 False,因此返回 a;如果 a 是 True,则整个计算结果必定取决与 b,因此返回 b。
2. 在计算 a or b 时,如果 a 是 True,则根据或运算法则,整个计算结果必定为 True,因此返回 a;如果 a 是 False,则整个计算结果必定取决于 b,因此返回 b。
所以Python解释器在做布尔运算时,只要能提前确定计算结果,它就不会往后算了,直接返回结果。
Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。
比如,列出班里所有同学的名字,就可以用一个list表示:
>>> ['Michael', 'Bob', 'Tracy'] ['Michael', 'Bob', 'Tracy']
list是数学意义上的有序集合,也就是说,list中的元素是按照顺序排列的。
构造list非常简单,按照上面的代码,直接用 [ ] 把list的所有元素都括起来,就是一个list对象。通常,我们会把list赋值给一个变量,这样,就可以通过变量来引用list:
classmates = ['Michael', 'Bob', 'Tracy'] classmates # 打印classmates变量的内容 >>>['Michael', 'Bob', 'Tracy']
由于Python是动态语言,所以list中包含的元素并不要求都必须是同一种数据类型,我们完全可以在list中包含各种数据:
L = ['Michael', 100, True]
一个元素也没有的list,就是空list:
empty_list = []
#打印成绩表 L = ['adam', 95.5,'lisa', 85,'bart', 59] print L
由于list是一个有序集合,所以,我们可以用一个list按分数从高到低表示出班里的3个同学:
L = ['Adam', 'Lisa', 'Bart']
那我们如何从list中获取指定第 N 名的同学呢?方法是通过索引来获取list中的指定元素。
需要特别注意的是,索引从 0 开始,也就是说,第一个元素的索引是0,第二个元素的索引是1,以此类推。
因此,要打印第一名同学的名字,用 L[0]:
但使用索引时,千万注意不要越界,所以没有L[3]。
L = ['Adam', 'Lisa', 'Bart'] print L[-1] >>>Bart
L = ['Adam', 'Lisa', 'Bart']
把新同学Paul添加到现有的 list 中
第一个办法是用 list 的 append() 方法,把新同学追加到 list 的末尾:
L = ['Adam', 'Lisa', 'Bart'] L.append('Paul') print L >>> ['Adam', 'Lisa', 'Bart', 'Paul']
append()总是把新的元素添加到 list 的尾部。
用list的 insert()方法,它接受两个参数,第一个参数是索引号,第二个参数是待添加的新元素:
L = ['Adam', 'Lisa', 'Bart'] L.insert(0, 'Paul') print L >>>['Paul', 'Adam', 'Lisa', 'Bart']
L.insert(0, 'Paul') 的意思是,'Paul'将被添加到索引为 0 的位置上(也就是第一个),而原来索引为 0 的Adam同学,以及后面的所有同学,都自动向后移动一位。
L = ['Adam', 'Lisa', 'Bart', 'Paul'] L.pop() >>>'Paul' print L >>>['Adam', 'Lisa', 'Bart']
pop()默认删除最后一个,当让也可以指定
L = ['Adam', 'Lisa', 'Paul', 'Bart'] L.pop(2) >>>'Paul' print L >>> ['Adam', 'Lisa', 'Bart']
L = ['Adam', 'Lisa', 'Paul', 'Bart'] L[2] = 'Paul' #或者 L[-1] = 'Paul' print L >>> L = ['Adam', 'Lisa', 'Paul']
tuple是另一种有序的列表,中文翻译为“ 元组 ”。tuple 和 list 非常类似,但是,tuple一旦创建完毕,就不能修改了。
同样是表示班里同学的名称,用tuple表示如下:
t = ('Adam', 'Lisa', 'Bart')
创建tuple和创建list唯一不同之处是用( )替代了[ ]。
现在,这个 t 就不能改变了,tuple没有 append()方法,也没有insert()和pop()方法。所以,新同学没法直接往 tuple 中添加,老同学想退出 tuple 也不行。
获取 tuple 元素的方式和 list 是一模一样的,我们可以正常使用 t[0],t[-1]等索引方式访问元素,但是不能赋值成别的元素
tuple和list一样,可以包含 0 个、1个和任意多个元素。
包含多个元素的 tuple,前面我们已经创建过了。
包含 0 个元素的 tuple,也就是空tuple,直接用 ()表示:
t = () print t >>>()
t = (1) print t >>> 1 #???这是为什么,因为()既可以表示tuple,又可以作为括号表示运算时的优先级,结果 (1) 被Python解释器计算出结果 1,导致我们得到的不是tuple,而是整数 1。
正是因为用()定义单元素的tuple有歧义,所以 Python 规定,单元素 tuple 要多加一个逗号“,”,这样就避免了歧义:
t = (1,) print t >>>(1,)
Python在打印单元素tuple时,也自动添加了一个“,”,为了更明确地告诉你这是一个tuple。
多元素 tuple 加不加这个额外的“,”效果是一样的。
t = ('a', 'b', ['A', 'B']) #t = ('a', 'b', ('A', 'B'))的话就是不可变的
注意到 t 有 3 个元素:'a','b'和一个list:['A', 'B']。list作为一个整体是tuple的第3个元素。list对象可以通过 t[2] 拿到:
L = t[2] L[0] = 'X' L[1] = 'Y' print t >>>('a', 'b', ['X', 'Y'])
以上是PYTHON部落格記錄的詳細內容。更多資訊請關注PHP中文網其他相關文章!