Python コード最適化のヒント

高洛峰
高洛峰オリジナル
2016-11-21 16:47:181281ブラウズ

コード最適化パート 1

最近見たコード最適化に関するヒントをいくつか共有します。

if判定の短絡特性

andでは、条件を満たす条件が最も少ない条件を先に配置する必要があり、多数の判定が行われた場合、最も少ない条件を満たす条件がそのまま後続の式を引き起こす計算されないため、時間を節約できます (False と True または False のため)

import timeit

s1 = """
a = range(2000)
[i for i in a if i % 2 ==0 and i > 1900]
"""

s2 = """
a = range(2000)
[i for i in a if  i > 1900 and i % 2 ==0]
"""

print timeit.timeit(stmt=s1, number=1000)
print timeit.timeit(stmt=s2, number=1000)

演算結果は次のとおりです:

➜  python test6.py
0.248532056808
0.195827960968

# 可以看到s2 表达式计算更快, 因为大部分情况都不满足 i>1900, 所以这些情况下, i % 2 == 0 也没有计算,从而节约了时间

or も同様に、最も多くの条件を満たすものを最初に置きます。

import timeit

s1 = """
a = range(2000)
[i for i in a if 10 < i <20 or 1000 < i < 2000]
"""

s2 = """
a = range(2000)
[i for i in a if 1000 < i < 2000 or 10 < i <20]
"""

print timeit.timeit(stmt=s1, number=1000)
print timeit.timeit(stmt=s2, number=1000)

実行結果:

0.253124952316
0.202992200851

マージ文字列を結合

ループしてマージするよりも速くマージ文字列を結合します。

import timeit

s1 = """
a = [str(x) for x in range(2000)]
s = &#39;&#39;
for i in a:
    s += i
"""

s2 = """
a = [str(x) for x in range(2000)]
s = &#39;&#39;.join(a)
"""

print timeit.timeit(stmt=s1, number=1000)
print timeit.timeit(stmt=s2, number=1000)

実行結果は次のとおりです:

python test6.py

0.558945894241
0.422435998917

while 1 および while True

python2.x では、True と False は予約されたキーワードではなく、グローバル変数です。つまり、これを行うことができます

>>> True = 0
>>> True
0
>>> if not True:
...   print &#39;1&#39;
...
1

したがって、次のようになりますこの場合:

import timeit

s1 = """
n = 1000000
while 1:
    n -= 1
    if n <= 0: break
"""

s2 = """
n = 1000000
while True:
    n -= 1
    if n <= 0: break
"""

print timeit.timeit(stmt=s1, number=100)
print timeit.timeit(stmt=s2, number=100)

演算結果は次のようになります:

➜  python test6.py
5.18007302284
6.84624099731

True を判定するたびに、最初に True の値を見つける必要があるためです。

python3.xではTrueがキーワード引数になるので上記2つの状況は同じです。

cProfile、cStringIO、cPickle

C バージョンを使用して作成された拡張機能は、ネイティブのものよりも高速です。 cPickle と pickle は次のとおりです:

import timeit

s1 = """
import cPickle
import pickle
n = range(10000)
cPickle.dumps(n)
"""

s2 = """
import cPickle
import pickle
n = range(10000)
pickle.dumps(n)
"""

print timeit.timeit(stmt=s1, number=100)
print timeit.timeit(stmt=s2, number=100)

実行結果は次のとおりです:

➜ python test6.py
0.182178974152
1.70917797089

ジェネレーターを適切に使用する

違い

() を使用してジェネレーター オブジェクトを取得する場合、必要なメモリ スペースはオブジェクトのサイズとは関係ありません。リストなので効率が高くなります。

import timeit

s1 = """
[i for i in range (100000)]
"""

s2 = """
(i for i in range(100000))
"""

print timeit.timeit(stmt=s1, number=1000)
print timeit.timeit(stmt=s2, number=1000)

結果:

➜  python test6.py
5.44327497482
0.923446893692

ただし、ループトラバーサルが必要な状況の場合:次のように反復子の使用は効率的ではありません:

import timeit

s1 = """
ls = range(1000000)
def yield_func(ls):
    for i in ls:
        yield i+1
for x in yield_func(ls):
    pass
"""

s2 = """
ls = range(1000000)
def not_yield_func(ls):
    return [i+1 for i in ls]
for x in not_yield_func(ls):
    pass
"""

print timeit.timeit(stmt=s1, number=10)
print timeit.timeit(stmt=s2, number=10)

結果は次のようになります:

➜  python test6.py
1.03186702728
1.01472687721

したがって、ジェネレーターの使用はメモリのトレードオフになります。結果を考慮してください。

xrange

在python2.x里xrange 是纯C实现的生成器,相对于range来说,它不会一次性计算出所有值在内存中。但它的限制是只能和整型一起工作:你不能使用long或者float。

import 语句的开销

import语句有时候为了限制它们的作用范围或者节省初始化时间,被卸载函数内部,虽然python的解释器不会重复import同一个模块不会出错,但重复导入会影响部分性能。有时候为了实现懒加载(即使用的时候再加载一个开销很大的模块),可以这么做:

email = None

def parse_email():
    global email
    if email is None:
        import email
    ...

# 这样一来email模块仅会被引入一次,在parse_email()被第一次调用的时候。


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。