首頁  >  文章  >  後端開發  >  給Python初學者的一些程式設計建議

給Python初學者的一些程式設計建議

高洛峰
高洛峰原創
2016-10-17 13:23:231202瀏覽

Python是一種非常富有表現力的語言。它為我們提供了一個龐大的標準庫和許多內建模組,幫助我們快速完成工作。然而,許多人可能會迷失在它提供的功能中,無法充分利用標準函式庫,過度重視單行腳本,以及誤解Python基本結構等。本文是一個關於Python新手可能會陷入的一些陷阱的不完全清單。

1.不知道Python版本

這是一個在StackOverflow上反覆出現的問題。許多人能寫出在某個版本上完美工作的程式碼,但在他們在自己的系統上安裝有不同版本的Python。要確保你知道你正在使用的Python版本。

你可以透過下邊的程式碼來檢視Python版本:

[pythontab@testServer]$ python --version
Python 2.7.10
[pythontab@testServer]$ python --V
Python 2.7.10

上面兩種方法都是可以的

2.不使用版本管理器

pyenv是一個極好的管理不同工具,但Python版本的工具很不幸,它只工作在*nix系統上。在Mac系統上,你可以簡單地透過brew install pyenv安裝它,在Linux上,也有一個自動安裝程式。

3.沉迷於一行程式

許多人熱衷於一行程式帶來的興奮感。即使他們的一行解決方案比一個多行解決方案低效,他們也會吹噓。

Python中的一行程式在本質上意味著具有多個表達式的複雜推導。例如:

l = [m for a, b in zip(this, that) if b.method(a) != b for m in b if not m.method(a, b) and reduce(lambda x, y: a + y.method(), (m, a, b))]

   

老實講,我編造了上面的範例。但我看到很多人都寫類似的程式碼。這樣的程式碼在一個星期後就會變得難以理解。如果你想做一些稍微複雜的事情,例如根據條件簡單地在一個清單或集合中加入一個元素,你可能就會犯錯。

單行程式碼並不是什麼成就,是的,他們可能看起來很靈活,但不是什麼成就。想像一下,這就像是你在打掃房間時把所有的東西都塞進你的衣櫥。好的程式碼應該是乾淨的,易於閱讀的和有效率的。

4.利用錯誤的方式初始化一個集合

這是一個更微妙的問題,可能讓你措手不及。集合推導很像列表推導。

 
>>> { n for n in range(10) if n % 2 == 0 }
{0, 8, 2, 4, 6}
>>> type({ n for n in range(10) if n % 2 == 0 })

   

上面就是集合推導的一個例子。集合就像列表,也是容器。不同的是,一個集合中不能有任何重複的值,而且是無序的。看到集合推導人們常常錯誤地認為{}能初始化一個空集合。但其實不然,它初始化一個空字典。

>>> {}
{}
>>> type({})

如果你想初始化一個空集合,可以簡單地呼叫set()方法。

>>> set()
set()
>>> type(set())

   

注意一個空集合用set()表示,但是一個包含一些元素的集合就就要用花括號包圍元素來表示。

>>> s = set()
>>> s
set()
>>> s.add(1)
>>> s
{1}
>>> s.add(2)
>>> s
{1, 2}

   

這和直覺是相反的,因為你預期類似set([1, 2])的某些東西。

5.誤解GIL

GIL(全域解釋器鎖定)意味著在Python程式中,任一個時間點只能有一個執行緒在運作。這意味著當我們創建一個線程並希望它並行運行時,它並不會那樣。 Python解釋器實際的工作是在不同的運行線程之間快速進行切換。但這只是對實際發生事情的一個非常簡單的解釋,實際情況要複雜的多。有許多種並行運行的實例,例如使用本質為C擴展的各種庫。但運行Python程式碼時,大部分時間裡它不會並行執行。換句話說,Python中的執行緒並不像Java或C++中的執行緒。

許多人會嘗試為Python辯解,說這些都是真正的線程。這確實是真的,但並不能改變這樣一個事實:Python處理線程的方式和你期望的方式是不同的。 Ruby語言也有相同的情況(Ruby也有解釋器鎖)。

指定的解決方案是使用multiprocessing模組。 multiprocessing模組提供Process類,它是一個對fork的很好的覆蓋。然而,fork過程比一個線程的代價高得多,所以你可能不會每次都能看到效能上的提升,因為不同的process之間需要做大量的工作來進行相互協調。

然而,這個問題並不存在於每一個Python的實作版本中。例如,Python的一個實作PyPy-stm就試圖擺脫GIL(仍未穩定)。建立在其他平台,如JVM(Jython)或CLR(IronPython),上的Python實現,也沒有GIL的問題。

總之,使用Thread類別時要多加小心,你得到的可能不是你想要的。

6.使用舊式類別

在Python 2中,有两种类型的类,分别为“旧式”类和“新式”类。如果你使用Python 3,那么你默认使用“新式”类。为了确保在Python2中使用“新式”类,你需要让你新创建的每一个类都继承object类,且类不能已继承了内置类型,例如int或list。换句话说,你的基类、类如果不继承其他类,就总是需要继承object类。

class MyNewObject(object):
# stuff here

   

这些“新式”类解决一些老式类的根本缺陷,想要详细了解新式类和旧式类请参见《python新式类和旧式类区别》《python2中的__new__与__init__,新式类和经典类》。

7.按错误的方式迭代

对于这门语言的新手来说,下边的代码是非常常见的:

for name_index in range(len(names)):
print(names[name_index])

   

在上边的例子中,没有必须调用len函数,因为列表迭代实际上要简单得多:

for name in names:
print(name)

   

此外,还有一大堆其他的工具帮助你简化迭代。例如,可以使用zip同时遍历两个列表:

for cat, dog in zip(cats, dogs):
print(cat, dog)

如果你想同时考虑列表变量的索引和值,可以使用enumerate:

   
for index, cat in enumerate(cats):
print(cat, index)

在itertools中也有很多有用的函数供你选择。然而请注意,使用itertools函数并不总是正确的选择。如果itertools中的一个函数为你试图解决的问题提供了一个非常方便的解决办法,例如铺平一个列表或根据给定的列表创建一个其内容的排列,那就用它吧。但是不要仅仅因为你想要它而去适应你代码的一部分。

滥用itertools引发的问题出现的过于频繁,以至于在StackOverflow上一个德高望重的Python贡献者已经贡献他们资料的重要组成部分来解决这些问题。

8.使用可变的默认参数

我多次见到过如下的代码:

def foo(a, b, c=[]):
# append to c
# do some more stuff

永远不要使用可变的默认参数,可以使用如下的代码代替:

def foo(a, b, c=None):
if c is None:
c = []
# append to c
# do some more stuff

   

与其解释这个问题是什么,不如展示下使用可变默认参数的影响:

>>> def foo(a, b, c=[]):
... c.append(a)
... c.append(b)
... print(c)
...
>>> foo(1, 1)
[1, 1]
>>> foo(1, 1)
[1, 1, 1, 1]
>>> foo(1, 1)
[1, 1, 1, 1, 1, 1]

同一个变量c在函数调用的每一次都被反复引用。这可能有一些意想不到的后果。

总结

这些只是相对来说刚接触Python的人可能会遇到的一些问题。然而请注意,可能会遇到的问题远非就这么些。然而另一些缺陷是人们像使用Java或C++一样使用Python,并且试图按他们熟悉的方式使用Python。


陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn