Python은 표현력이 매우 뛰어난 언어입니다. 이는 작업을 신속하게 완료하는 데 도움이 되는 거대한 표준 라이브러리와 많은 내장 모듈을 제공합니다. 그러나 많은 사람들이 Python이 제공하는 기능에 빠져 있고, 표준 라이브러리를 최대한 활용하지 못하고, 한 줄 스크립트를 너무 강조하고, Python의 기본 구조를 오해할 수 있습니다. 이 문서는 새로운 Python 개발자가 빠질 수 있는 몇 가지 함정에 대한 대략적인 목록입니다.
1. Python 버전을 모릅니다
StackOverflow에서 반복되는 질문입니다. 많은 사람들이 한 버전에서 완벽하게 작동하는 코드를 작성할 수 있지만 시스템에 다른 버전의 Python이 설치되어 있습니다. 사용 중인 Python 버전이 무엇인지 확인하세요.
다음 코드를 통해 Python 버전을 확인할 수 있습니다.
[pythontab@testServer]$ python --version Python 2.7.10 [pythontab@testServer]$ python --V Python 2.7.10
위 두 가지 방법 모두 가능합니다.
2. 버전 관리자
pyenv는 다양한 Python 버전을 관리하는 데 탁월한 도구이지만 안타깝게도 *nix 시스템에서만 작동합니다. Mac 시스템에서는 Brew install pyenv를 통해 간단히 설치할 수 있으며, Linux에서는 자동 설치 프로그램도 있습니다.
3. 단선 프로그램 중독
많은 사람들이 단선 프로그램의 즐거움에 열광하고 있습니다. 단선 솔루션이 다중 라인 솔루션보다 효율성이 떨어지더라도 이를 자랑할 것입니다.
Python에서 한 줄로 작성한다는 것은 기본적으로 여러 표현식이 포함된 복잡한 파생을 의미합니다. 예:
l = [m for a, b in zip(this, that) if b.method(a) != b for m in b if not m.method(a, b) and reduce(lambda x, y: a + y.method(), (m, a, b))]
솔직히 위의 예는 제가 만들어낸 것입니다. 하지만 비슷한 코드를 작성하는 사람들이 많이 보입니다. 이러한 코드는 일주일이 지나면 이해할 수 없게 됩니다. 단순히 목록에 요소를 추가하거나 조건에 따라 설정하는 등 약간 더 복잡한 작업을 수행하려는 경우 실수를 범할 가능성이 높습니다.
한 줄의 코드는 성과가 아닙니다. 예, 유연해 보일 수 있지만 성과는 아닙니다. 집을 청소하고 모든 것을 옷장에 넣는 것과 같다고 상상해 보세요. 좋은 코드는 깔끔하고 읽기 쉽고 효율적이어야 합니다.
4. 컬렉션을 잘못된 방식으로 초기화
이것은 방심할 수 있는 좀 더 미묘한 문제입니다. 집합 이해는 목록 이해와 매우 유사합니다.
>>> { n for n in range(10) if n % 2 == 0 } {0, 8, 2, 4, 6} >>> type({ n for n in range(10) if n % 2 == 0 })
위는 집합 도출의 예입니다. 컬렉션은 목록 및 컨테이너와 같습니다. 차이점은 세트에 중복된 값이 있을 수 없으며 순서가 지정되지 않는다는 것입니다. 집합 파생을 보는 사람들은 종종 {}가 빈 집합을 초기화한다고 잘못 생각합니다. 하지만 그렇지 않습니다. 빈 사전을 초기화합니다.
>>> {} {} >>> type({})
빈 컬렉션을 초기화하려면 간단히 set() 메서드를 호출하면 됩니다.
>>> set() set() >>> type(set())
빈 집합은 set()으로 표시되지만 일부 요소가 포함된 집합은 해당 요소를 중괄호로 표시해야 합니다.
>>> s = set() >>> s set() >>> s.add(1) >>> s {1} >>> s.add(2) >>> s {1, 2}
이는 set([1, 2])와 유사한 것을 기대하기 때문에 직관에 어긋납니다.
5. GIL에 대한 오해
GIL(전역 인터프리터 잠금)은 Python 프로그램에서 언제든지 하나의 스레드만 실행할 수 있음을 의미합니다. 이는 우리가 스레드를 생성하고 병렬로 실행하기를 원할 때 그렇게 하지 않는다는 것을 의미합니다. Python 인터프리터의 실제 작업은 실행 중인 여러 스레드 사이를 빠르게 전환하는 것입니다. 그러나 이것은 실제로 일어나는 일에 대한 매우 간단한 설명일 뿐이며 훨씬 더 복잡합니다. 예를 들어 본질적으로 C 확장인 다양한 라이브러리를 사용하는 등 병렬로 실행하는 예가 많이 있습니다. 그러나 Python 코드를 실행할 때 대부분의 경우 병렬로 실행되지 않습니다. 즉, Python의 스레드는 Java나 C++의 스레드와 다릅니다.
많은 사람들은 이것이 실제 스레드라고 말하며 Python을 옹호하려고 할 것입니다. 이는 확실히 사실이지만, Python이 예상한 것과 다르게 스레드를 처리한다는 사실은 바뀌지 않습니다. Ruby 언어에도 동일한 상황이 존재합니다(Ruby에는 인터프리터 잠금 기능도 있습니다).
지정된 솔루션은 다중 처리 모듈을 사용하는 것입니다. 다중 처리 모듈은 포크에 적합한 오버레이인 Process 클래스를 제공합니다. 하지만 포크 프로세스는 스레드보다 훨씬 비용이 많이 들고, 서로 조정하기 위해 서로 다른 프로세스 간에 많은 작업을 수행해야 하기 때문에 매번 성능 향상을 볼 수 없을 수도 있습니다.
그러나 이 문제가 Python의 모든 구현에 존재하는 것은 아닙니다. 예를 들어 Python의 한 구현인 PyPy-stm은 GIL을 제거하려고 시도합니다(여전히 불안정합니다). JVM(Jython) 또는 CLR(IronPython)과 같은 다른 플랫폼에 구축된 Python 구현에도 GIL 문제가 없습니다.
요컨대, Thread 클래스를 사용할 때는 주의하세요. 원하는 결과가 나오지 않을 수도 있습니다.
6. 기존 클래스 사용
在Python 2中,有两种类型的类,分别为“旧式”类和“新式”类。如果你使用Python 3,那么你默认使用“新式”类。为了确保在Python2中使用“新式”类,你需要让你新创建的每一个类都继承object类,且类不能已继承了内置类型,例如int或list。换句话说,你的基类、类如果不继承其他类,就总是需要继承object类。
class MyNewObject(object): # stuff here
这些“新式”类解决一些老式类的根本缺陷,想要详细了解新式类和旧式类请参见《python新式类和旧式类区别》《python2中的__new__与__init__,新式类和经典类》。
7.按错误的方式迭代
对于这门语言的新手来说,下边的代码是非常常见的:
for name_index in range(len(names)): print(names[name_index])
在上边的例子中,没有必须调用len函数,因为列表迭代实际上要简单得多:
for name in names: print(name)
此外,还有一大堆其他的工具帮助你简化迭代。例如,可以使用zip同时遍历两个列表:
for cat, dog in zip(cats, dogs): print(cat, dog)
如果你想同时考虑列表变量的索引和值,可以使用enumerate:
for index, cat in enumerate(cats): print(cat, index)
在itertools中也有很多有用的函数供你选择。然而请注意,使用itertools函数并不总是正确的选择。如果itertools中的一个函数为你试图解决的问题提供了一个非常方便的解决办法,例如铺平一个列表或根据给定的列表创建一个其内容的排列,那就用它吧。但是不要仅仅因为你想要它而去适应你代码的一部分。
滥用itertools引发的问题出现的过于频繁,以至于在StackOverflow上一个德高望重的Python贡献者已经贡献他们资料的重要组成部分来解决这些问题。
8.使用可变的默认参数
我多次见到过如下的代码:
def foo(a, b, c=[]): # append to c # do some more stuff
永远不要使用可变的默认参数,可以使用如下的代码代替:
def foo(a, b, c=None): if c is None: c = [] # append to c # do some more stuff
与其解释这个问题是什么,不如展示下使用可变默认参数的影响:
>>> def foo(a, b, c=[]): ... c.append(a) ... c.append(b) ... print(c) ... >>> foo(1, 1) [1, 1] >>> foo(1, 1) [1, 1, 1, 1] >>> foo(1, 1) [1, 1, 1, 1, 1, 1]
同一个变量c在函数调用的每一次都被反复引用。这可能有一些意想不到的后果。
总结
这些只是相对来说刚接触Python的人可能会遇到的一些问题。然而请注意,可能会遇到的问题远非就这么些。然而另一些缺陷是人们像使用Java或C++一样使用Python,并且试图按他们熟悉的方式使用Python。