首頁  >  文章  >  後端開發  >  你應該知道的python列表去重方法

你應該知道的python列表去重方法

高洛峰
高洛峰原創
2017-02-21 10:50:182237瀏覽

前言

列表去重是寫Python腳本時常遇問題,因為不管來源資料來自哪裡,當我們轉換成列表的方式時,有可能預期的結果不是我們最終的結果,最常見的就是清單中元素有重複,這時候第一件事我們就要做去重處理。

我們先來個最簡單的方式,用python內建的資料型別set來實現。

假設我們的清單資料是這樣的:

level_names = [
 u'Second Level',
 u'Second Level',
 u'Second Level',
 u'First Level',
 u'First Level'
]

因為集合的元素是不能重複的,所以將列表轉換成集合時,會自動去掉重複的元素,這就是基本原理,程式碼如下:

>>> the_list = set(level_names)
>>> print(the_list)
set([u'Second Level', u'First Level'])

這種方式缺點是再轉換成列表時無法保存之前的列表順序,如果沒這個要求,這種方式是最簡答的, 也許有的小伙伴覺得好簡單呀,這沒什麼技術含量嗎,沒錯,所以一般面試題裡讓你列表去重一般會這麼寫:

請寫出列表去重的方法(不能用set)

人家寫明不能用set了,那呢,這招有時候還不能用,那當然也難不倒我們,我們還有其他方法。

我們都知道列表可以遍歷,能遍歷問題也就簡單了,我們再定義空列表,然後遍歷有數據的列表,再遍歷時加一個判斷,如果在空列表裡沒有,就加進去,如果有了就丟掉,程式碼如下:

the_list = []
for level in level_names:
 if level not in the_list:
  the_list.append(level)
print(the_list)

大家覺得這種方式是不是還可以,但這種方式對付一般的小列表是沒問題的,但如果遇到一個超級大列表,也會力不從心,因為在the_list列表變的非常大,在判斷時候會影響效率,因為列表是按索引順序去查找的,當數據量很大時會變慢。

也許你要問了,那我遇到大的列表咋辦? 有更牛隻的方法嗎?當然有,讓我們繼續,既然在判斷時用列表會影響效率,那我們就轉換一個思路,我們用集合,那你可能要問了,那集合就快了?沒錯,因為set使用的hash函數查找值,雖然set無序,但位置是固定的,只需一次就可以查到特定元素是否存在,網上有人做了列表和set的元素查找對比,相同的數據條件下,用list耗時16分鐘,用set耗時52秒,這對比看出效果了吧,別的不多說了,貼代碼:

the_list = []
the_set = set()
for level in level_names:
 if level not in the_set:
  the_set.add(level)
  the_list.append(level)
print(the_list)

更多你應該知道的python列表去重方法相關文章請關注PHP中文網!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn