首頁  >  文章  >  資料庫  >  range()是什麼?為什麼不生產迭代器?

range()是什麼?為什麼不生產迭代器?

不言
不言轉載
2019-01-07 10:30:513950瀏覽

這篇文章帶給大家的內容是關於range()是什麼?為什麼不生產迭代器?有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。

迭代器是 23 種設計模式中最常用的一種(之一),在 Python 中隨處可見它的身影,我們經常用到它,但是卻不一定意識到它的存在。在關於迭代器的系列文章中(連結請參閱文末),我至少提到了 23 種產生迭代器的方法。有些方法是專門用來產生迭代器的,有些方法則是為了解決別的問題而「暗中」使用到迭代器。

在系統學習迭代器之前,我一直以為 range() 方法也是用來產生迭代器的,現在卻突然發現,它產生的只是可迭代對象,而不是迭代器! (PS:Python2 中 range() 產生的是列表,本文基於Python3,生成的是可迭代物件)

於是,我有了這樣的疑問:為什麼 range() 不產生迭代器呢?在尋找答案的過程中,我發現自己對 range 類型的認知有些誤解。因此,本文將會和大家全面地認識 range ,期待與你共同學習進步。

1、range() 是什麼?

它的語法:range(start, stop [,step]) ;start 指的是計數起始值,預設為0;stop 指的是計數結束值,但不包括stop ; step 是步長,預設為1,不可以為0 。 range() 方法產生一段左閉右開的整數範圍。

>>> a = range(5)  # 即 range(0,5)
>>> a
range(0, 5)
>>> len(a)
5
>>> for x in a:
>>>     print(x,end=" ")
0 1 2 3 4

對於range() 函數,有幾個注意點:(1)它表示的是左閉右開區間;(2)它接收的參數必須是整數,可以是負數,但不能是浮點數等其它類型;(3)它是不可變的序列類型,可以進行判斷元素、查找元素、切片等操作,但不能修改元素;(4)它是可迭代對象,卻不是迭代器。

# (1)左闭右开
>>> for i in range(3, 6):
>>>     print(i,end=" ")
3 4 5

# (2)参数类型
>>> for i in range(-8, -2, 2):
>>>     print(i,end=" ")
-8 -6 -4
>>> range(2.2)
----------------------------
TypeError    Traceback (most recent call last)
...
TypeError: 'float' object cannot be interpreted as an integer

# (3)序列操作
>>> b = range(1,10)
>>> b[0]
1
>>> b[:-3]
range(1, 7)
>>> b[0] = 2
TypeError  Traceback (most recent call last)
...
TypeError: 'range' object does not support item assignment

# (4)不是迭代器
>>> hasattr(range(3),'__iter__')
True
>>> hasattr(range(3),'__next__')
False
>>> hasattr(iter(range(3)),'__next__')
True

2、 為什麼range()不生產迭代器?

可以取得迭代器的內建方法很多,例如zip() 、enumerate()、map()、filter() 和reversed() 等等,但像range() 這樣只是得到的是可迭代物件的方法就絕無僅有了(若有反例,歡迎告知)。這就是我存在知識迷思的地方。

在 for-迴圈 遍歷時,可迭代物件與迭代器的效能是一樣的,即它們都是惰性求值的,在空間複雜度與時間複雜度上並無差異。我曾概括過兩者的差異是「一同兩不同」:相同的是都可惰性迭代,不同的是可迭代物件不支援自遍歷(即next()方法),而迭代器本身不支援切片(即__getitem__() 方法)。

雖然有這些差別,但很難下結論說它們哪個比較優。現在微妙之處就在於,為什麼給 5 種內建方法都設計了迭代器,偏偏給 range() 方法設計的就是可迭代物件呢?把它們都統一起來,不是更好麼?

事實上,Pyhton 為了規範性就做過不少這種事,例如,Python2 中有range() 和xrange() 兩種方法,而Python3 就乾掉了其中一種,還用了「李代桃僵」法。為什麼不更規範點,令 range() 產生的是迭代器呢?

關於這個問題,我沒找到官方解釋,以下純屬個人觀點

zip() 等方法都需要接收確定的可迭代物件的參數,是對它們的一種再加工的過程,因此也希望馬上產出確定的結果來,所以Python 開發者就設計了這個結果是迭代器。這樣還有一個好處,當作為參數的可迭代物件發生變化的時候,作為結果的迭代器因為是消耗型的,不會被錯誤地使用。

而range() 方法就不同了,它接收的參數不是可迭代對象,本身是一種初次加工的過程,所以設計它為可迭代對象,既可以直接使用,也可以用於其它再加工用途。例如,zip() 等方法就完全可以接收 range 類型的參數。

>>> for i in zip(range(1,6,2), range(2,7,2)):
>>>    print(i, end="")
(1, 2)(3, 4)(5, 6)

也就是說,range() 方法作為一種初級生產者,它生產的原料本身就有很大用途,早早把它變為迭代器的話,無疑是一種畫蛇添足的行為。

對於這種解讀,你是否覺得有道理呢?歡迎就這個話題與我探討。

3、range 類型是什麼?

以上是我對「為什麼range()不產生迭代器」的一種解答。順著這個思路,我研究了一下它所產生的 range 對象,一研究就發現,這個 range 對像也不簡單。

首先奇怪的一點就是,它竟然是不可變序列!我從未註意過這一點。雖然說,我從未想過要修改 range() 的數值,但這不可修改的特性還是令我驚訝。

翻閱文檔,官方是這樣明確劃分的-有三種基本的序列類型:列表、元組和範圍(range)物件。 (There are three basic sequence types: lists, tuples, and range objects.)  

这我倒一直没注意,原来 range 类型居然跟列表和元组是一样地位的基础序列!我一直记挂着字符串是不可变的序列类型,不曾想,这里还有一位不可变的序列类型呢。

那 range 序列跟其它序列类型有什么差异呢?

普通序列都支持的操作有 12 种,在《你真的知道Python的字符串是什么吗?》这篇文章里提到过。range 序列只支持其中的 10 种,不支持进行加法拼接与乘法重复。

>>> range(2) + range(3)
-----------------------------------------
TypeError  Traceback (most recent call last)
...
TypeError: unsupported operand type(s) for +: 'range' and 'range'

>>> range(2)*2
-----------------------------------------
TypeError  Traceback (most recent call last)
...
TypeError: unsupported operand type(s) for *: 'range' and 'int'

那么问题来了:同样是不可变序列,为什么字符串和元组就支持上述两种操作,而偏偏 range 序列不支持呢?虽然不能直接修改不可变序列,但我们可以将它们拷贝到新的序列上进行操作啊,为何 range 对象连这都不支持呢?

且看官方文档的解释:

...due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.

原因是 range 对象仅仅表示一个遵循着严格模式的序列,而重复与拼接通常会破坏这种模式...

问题的关键就在于 range 序列的 pattern,仔细想想,其实它表示的就是一个等差数列啊(喵,高中数学知识没忘...),拼接两个等差数列,或者重复拼接一个等差数列,想想确实不妥,这就是为啥 range 类型不支持这两个操作的原因了。由此推论,其它修改动作也会破坏等差数列结构,所以统统不给修改就是了。

4、小结

回顾全文,我得到了两个偏冷门的结论:range 是可迭代对象而不是迭代器;range 对象是不可变的等差序列。

若单纯看结论的话,你也许没有感触,或许还会说这没啥了不得啊。但如果我追问,为什么 range 不是迭代器呢,为什么 range 是不可变序列呢?对这俩问题,你是否还能答出个自圆其说的设计思想呢?(PS:我决定了,若有机会面试别人,我必要问这两个问题的嘿~)

由于 range 对象这细微而有意思的特性,我觉得这篇文章写得值了。本文是作为迭代器系列文章的一篇来写的,所以对于迭代器的基础知识介绍不多,欢迎查看之前的文章。另外,还有一种特殊的迭代器也值得单独成文,那就是生成器了,敬请期待后续推文哦~

以上是range()是什麼?為什麼不生產迭代器?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:segmentfault.com。如有侵權,請聯絡admin@php.cn刪除