python獲取字母在字母表對應位置的幾種方法及性能對比較
某些情況下要求我們查出字母在字母表中的順序,A = 1,B = 2 , C = 3, 以此類推,例如這題目 https://projecteuler.net/problem=42 其中一步解題步驟就是需要把字母換算成字母表中對應的順序。
取得字母在字母表對應位置的方法,最容易想到的實現的是:
使用str.index 或str.find方法:
In [137]: "ABC".index('B') Out[137]: 1In [138]: "ABC".index('B')+1Out[138]: 2#或者在前面填充一个字符,这样index就直接得到字母序号: In [139]: "_ABC".index("B") Out[139]: 2
我還想到把字母表轉成list或者tuple再index,性能或會有提高? 或是把字母:數字 組成鍵值存到字典是個好辦法?
前兩天我還自己頓悟到了一個方法:
In [140]: ord('B')-64 Out[140]: 2
ord 和chr 都是python中的內置函數,ord可以把ASCII字符轉成對應在ASCII表中的序號,chr則是可以把序號轉成字串。
大寫字母中在表中是從65開始,減掉64剛好是大寫字母在表中的位置。 小寫字母是從97開始,減於96就是對應的字母表位置。
哪種方法可能在性能上更好?我寫了程式碼來測試一下:
az = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"_az = "_ABCDEFGHIJKLMNOPQRSTUVWXYZ"azlist = list(az) azdict = dict(zip(az,range(1,27))) text = az*1000000 #这个是测试数据#str.find和str.index的是一样的。这里就没必要写了。def azindexstr(text): for r in text: az.index(r)+1 passdef _azindexstr(text): for r in text: _az.index(r) passdef azindexlist(text): for r in text: azlist.index(r) passdef azindexdict(text): for r in text: azdict.get(r) passdef azindexdict2(text): for r in text: azdict[r] passdef azord(text): for r in text: ord(r)-64 passdef azand64(text): for r in text: ord(r)%64 pass
把上面的程式碼複製貼上到ipython ,然後用魔法函數%timeit測試各個方法的效能。 ipython 是一個python互動解釋器,附帶各種很實用的功能,例如文字主要到的%timeit 功能。 請輸入pip install ipython安裝.
以下是我測試的結果資料:
In [147]: %timeit azindexstr(text) 1 loop, best of 3: 9.09 s per loop In [148]: %timeit _azindexstr(text) 1 loop, best of 3: 8.1 s per loop In [149]: %timeit azindexlist(text) 1 loop, best of 3: 17.1 s per loop In [150]: %timeit azindexdict(text) 1 loop, best of 3: 4.54 s per loop In [151]: %timeit azindexdict2(text) 1 loop, best of 3: 1.99 s per loop In [152]: %timeit azord(text) 1 loop, best of 3: 2.94 s per loop In [153]: %timeit azand64(text) 1 loop, best of 3: 4.56 s per loop
從結果中可見到list.index速度最慢,我很驚訝。另外如果list中數據很多,index會慢得很嚴重。 dict[r]的速度比dict.get(r)的速度快,但是如果是一個不存在的鍵dict[r]會報錯,而dict.get方法不會報錯,容錯性更好。
ord(r)-64的方法速度不錯,使用起來應該也是最方便,不用建構資料。