python 中 set 和 dict 的實現原理

阿新 • • 發佈：2019-01-11

1. dict 和 list 查詢效能的比較

from random import randint


def load_list_data(total_nums, target_nums):
    """
    從檔案中讀取資料，以list的方式返回
    :param total_nums: 讀取的數量
    :param target_nums: 需要查詢的資料的數量
    """
    all_data = []
    target_data = []
    file_name = "G:/慕課網課程/AdvancePython/fbobject_idnew.txt"
    with open(file_name, encoding="utf8", mode="r") as f_open:
        for count, line in enumerate(f_open):
            if count < total_nums:
                all_data.append(line)
            else:
                break

    for x in range(target_nums):
        random_index = randint(0, total_nums)
        if all_data[random_index] not in target_data:
            target_data.append(all_data[random_index])
            if len(target_data) == target_nums:
                break

    return all_data, target_data

def load_dict_data(total_nums, target_nums):
    """
    從檔案中讀取資料，以dict的方式返回
    :param total_nums: 讀取的數量
    :param target_nums: 需要查詢的資料的數量
    """
    all_data = {}
    target_data = []
    file_name = "G:/慕課網課程/AdvancePython/fbobject_idnew.txt"
    with open(file_name, encoding="utf8", mode="r") as f_open:
        for count, line in enumerate(f_open):
            if count < total_nums:
                all_data[line] = 0
            else:
                break
    all_data_list = list(all_data)
    for x in range(target_nums):
        random_index = randint(0, total_nums-1)
        if all_data_list[random_index] not in target_data:
            target_data.append(all_data_list[random_index])
            if len(target_data) == target_nums:
                break

    return all_data, target_data


def find_test(all_data, target_data):
    #測試執行時間
    test_times = 100
    total_times = 0
    import time
    for i in range(test_times):
        find = 0
        start_time = time.time()
        for data in target_data:
            if data in all_data:
                find += 1
        last_time = time.time() - start_time
        total_times += last_time
    return total_times/test_times


if __name__ == "__main__":
    all_data, target_data = load_list_data(10000, 1000)
    # all_data, target_data = load_list_data(100000, 1000)
    # all_data, target_data = load_list_data(1000000, 1000)


    # all_data, target_data = load_dict_data(10000, 1000)
    # all_data, target_data = load_dict_data(100000, 1000)
    # all_data, target_data = load_dict_data(1000000, 1000)
    last_time = find_test(all_data, target_data)
    print(last_time)

由上可以得出結論：

（1）dict的查詢效能遠遠大於list

(2) 在list中，隨著list資料亮的增大，查詢的時間也會增大; 在 dict中，查詢元素的時間不會隨著資料量的增大而增大，其時間複雜度為O(1)

2. 為什麼 dict的查詢效能會遠遠的大於 list呢？

是因為dict 中的 key 和set 中的元素值都是可hash的。

以dict為例，原理如下所示：

dict中建立的hash表如下：

圖1

hash表的查詢：

圖2

故：

（1） dict的key 或者 set的值都必須是可hash的

不可變物件，都是可hash的，str，fronzenset, tuple, 自己實現的類（帶有__hash__魔法函式）

(2) dict的記憶體花銷大（hash簡單的來說即對映，如圖1所示，對映之後，不可能是連續的存在記憶體空間中的，總有一些記憶體時空的，當發現記憶體空間中的“空”只有1/3時，便會觸發擴容操作，以免引起hash衝突），但是查詢速度快。自定義的物件，或者python內部的物件都是dict包裝的。

(3)dict的儲存順序和元素的新增順序有關

（4）新增的資料有可能改變已有的資料順序（擴容時，需要將原來的dict，複製移動到新的記憶體空間，此時將“擠出”已有的“空”，所以每個key的偏移可能改變）

python 中 set 和 dict 的實現原理

1. dict 和 list 查詢效能的比較 from random import randint def load_list_data(total_nums, target_nums): """ 從檔案中讀取資料，以list的方式返回 :param total_nu

基於接口回調詳解JUC中Callable和FutureTask實現原理

cnblogs blog 異步編程但是迷糊對象 extend href 增加 Callable接口和FutureTask實現類，是JUC(Java Util Concurrent)包中很重要的兩個技術實現，它們使獲取多線程運行結果成為可能。它們底層的實現，就是基於接口

python中tuple * 和 dict **

偶然見到以下用法 *tuple 和 **dict作為引數, 經過查詢,才知道這是一種簡要寫法, 見下面的例子 *tuple def foo(x, y): print(x, y) >>t = (1, 2) >>foo(*t) 1 2 *

python中defaultdict和dict的區別與使用

預設值可以很方便眾所周知，在Python中如果訪問字典中不存在的鍵，會引發KeyError異常（JavaScript中如果物件中不存在某個屬性，則返回undefined）。但是有時候，字典中的每個鍵都存在預設值是非常方便的。例如下面的例子： strings =

基於介面回撥詳解JUC中Callable和FutureTask實現原理

Callable介面和FutureTask實現類，是JUC(Java Util Concurrent)包中很重要的兩個技術實現，它們使獲取多執行緒執行結果成為可能。它們底層的實現，就是基於介面回撥技術。介面回撥，許多程式設計師都耳熟能詳，這種技術被廣泛應用於非同步模組的開發中。它的實現原理並不複雜，但是對初學

python中set和frozenset方法和區別

先簡單說一下set t.add('x') # 新增一項 s.update([10,37,42]) # 在s中新增多項 t.remove('H') # 刪除一項 len(s) # set 的長度 x in s # 測試 x 是否是 s

gj6 深入python的set和dict

key display 存在 aps 哈希沖突 gif per 文件 clas 6.1 collections中的abc from collections.abc import Mapping, MutableMapping #dict屬於mapping類型

PythonI/O進階學習筆記_5.python的set和dict

前言：我一直覺得對我來說學習知識很忌諱不繫統。本篇內容與上一篇自定義序列類是有聯絡的。上一篇比較通範的瞭解了序列類的一些協議和特性，並且有些list的內容。這篇更加具體到set和dict這兩個序列類。以此來了解python序列類的具體應用。（這篇比較簡單）（感覺具體比抽象都更容易理解，但是也要學會思考

Python中xml和dict格式轉換

在做介面自動化的時候，請求資料之前都是JSON格式的，Python有自帶的包來解決。最近在做APP的介面，遇到XML格式的請求資料，費了很大勁來解決，解決方式是：介面文件拿到的是XML，線上轉化為json格式（目的是拿到xml資料的模板），存放到json檔案中，根據介面名去提取。 github原文介紹：

Python中list,tuple,dict,set的區別和用法

Python語言簡潔明，可以用較少的程式碼實現同樣的功能。其中Python的四個內建資料型別功不可沒，即是list, tuple, dict, set。List在Python中List中的元素用中括號[]來表示，可以這樣定義一個List:L = [12, 'China

python中list/tuple/dict/set的區別

代碼方法 num super 三維 .get 浮點數計算 keyword 序列是Python中最基本的數據結構。序列中的每個元素都分配一個數字 - 它的位置，或索引，第一個索引是0，第二個索引是1，依此類推。Python有6個序列的內置類型，但最常見的是列表list和元

python入門之Python中list,tuple,dict,set辨析

1.list用法 list，顧名思義，是一個集合，用L=[a,b,c]表示。集合中可以包含任意型別的元素，且是有序的，可以通過下標來訪問。支援倒序訪問， List通過內建的append()方法來新增到尾部，L.append(‘sth’) 通過insert()方法新增到指定位置

python中list，dict，set的總結

list 基本特性有序可變,元素可以是任何已知的資料結構初始化 a = [] a = [1,3,54] a = [1, '34', (2,4)] 增刪改

Java網絡編程和NIO詳解7：淺談 Linux 中NIO Selector 的實現原理

fdt 重要文件描述 block tor create size 註冊 comm Java網絡編程和NIO詳解7：淺談 Linux 中NIO Selector 的實現原理轉自：https://www.jianshu.com/p/2b71ea919d49 本系列文章首發於

Python中copy和deepcopy的區別，以及程式設計實現deepcopy的功能

在python中，有淺複製copy()和深度複製deepcopy()，這兩個的區別我用以下的例子來說明，例如：numlist=[[1,2,[3,4,5]],34,"haha",{"name":{"fistname":"孫","lastName":"悟空"}}]設 numl

python中list ,tuple,dict,set的關係以及不可變物件解釋（圖文詳解）

list 1.list可以放進tuple (易知） 2.list可以放入dict作為value，但不可以作為key >>> key = [1, 2, 3] >>> d[key] = 'a list' Traceback (most

python中的集合dict&set

dict型別我們已經知道，list 和 tuple 可以用來表示順序集合，例如，班裡同學的名字以及他們對應的分數： ['mike','aki','jack']#姓名 [98,86,78]#對應的分數但是如果要想通過名字找到對應的分數，使用lis

Python中sort()和sorted()的區別

-s 可變對象傳遞內置函數 ict pan 16px nbsp lin 1、sort()是可變對象（字典）的方法，無參數，無返回值， sort（）會改變可變對象，因此無需返回值。例如： list: 1 >>> a = [4,3,7,8] 2 >

Python中range和xrange的異同之處

基本上 xrange class 依據對象 lis tar 都是 post range 函數說明：range([start,] stop[, step])。依據start與stop指定的範圍以及step設定的步長，生成一個序列。 range演示樣例: &

Python中Swithch Case語法實現

some case 其他 -s clas rec tro imp recipe 摘自網絡 python本身沒有switch語句，解決方法有以下3種: A.使用dictionaryvalues = { value1: do_some_stuff1,

python 中 set 和 dict 的實現原理

相關推薦