三種方法刪除列表中重複的元素及效率分析

來源:互聯網
上載者:User
方法一:

使用列表對象的sort()方法對列表進行排序,從最後一個元素開始迴圈迭代列表,判斷相鄰的兩元素是否是否相等!

def methodOne(list):    list.sort()    lenList = len(list)    lastItem = list[lenList-1]    for i in range(lenList-2,-1,-1):        if list[i] == lastItem:            list.remove(list[i])        else:            lastItem = list[i]    return list

方法二:

定義一個臨時列表,迴圈迭代出的元素如果不在暫存資料表中,則加入,最後返回臨時列表!

def methodTwo(list):    tempList = []    for i in list:        if not i in tempList:            tempList.append(i)    return tempList

方法三:

lists=[20,12,34,12,24,34,55,27]print list(set(lists))

1、方法一相對方法二來說,有更多的額外操作如:排序、賦值。因為在Python中,變數是不可變的,每迭代出一個元素比較不相等後的操作是都是建立立一個局部變數並賦值而丟棄原變數,這需要消耗更多的記憶體!同時因為排序操作,破壞了相對位置。

2、方法二建立一個臨時列表進行操作,而列表是可變的,每次追加元素都只是在原列表上增加一個索引及值,因而相對方法一來說效率會更高!

3、第三個方法無疑是這三種方法中效率最好的(無論是代碼的簡潔還是運行效率):set()是內建的資料類型“集合類型”,它是無序的且值是唯一項的!所以set() 執行的結果就是轉為集合且直接去除了重複的元素,再list()則將集合又轉回清單類型。

但是,set()是會破壞了排列順序,如果要保留排序,list(set(lists)) 可改為 sorted(set(lists),key=lists.index)

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.