【算法】散列表

阿新 • • 發佈：2018-08-24

存儲 print rom 包含不錯最大 true 檢查處的

散列表

散列函數

定義

散列函數“將輸入映射到數字”。即無論你給它什麽數據，它都還你一個數字。

散列函數必須滿足一些要求

l 它必須是一致的。例如，假設你輸入apple時得到的是4，那麽每次輸入apple時，得到的都必須為4。

l 它應將不同的輸入映射到不同的數字。例如，如果一個散列函數不管輸入是什麽都返回1，它就不是好的散列函數。最理想的情況是，將不同的輸入映射到不同的數字。

散列函數準確地指出了存儲位置，具體原因如下：

l 散列函數總是將同樣的輸入映射到相同的索引。

l 散列函數將不同的輸入映射到不同的索引。

l 散列函數知道數組有多大，只返回有效的索引。

散列表

l 使用散列函數和數組創建了一種被稱為散列表（hashtable）的數據結構。

l 散列表是一種包含額外邏輯的數據結構。數組和鏈表都被直接映射到內存，但散列表更復雜，它使用散列函數來確定元素的存儲位置。

l 散列表也使用數組來存儲數據，因此其獲取元素的速度與數組一樣快

python使用字典來實現散列表功能，可使用函數dict創建散列表

應用

將散列表用於查找

示例：

l 創建映射。

l 查找。

>>> phonebook={}
>>> phonebook[‘li‘]=123456
>>> phonebook[‘p‘]=987654
>>> print(phonebook[‘p‘])
987654

防止重復

示例：檢查是否存在某個元素

voted={}
def check_voter(name):
    if voted.get(name):              #使用函數get來返回是否存在。不存在返回None
        print(‘kick them out!‘)
    else:
        voted[name]=True
        print(‘let them vote‘)
 
check_voter(‘tom‘)

check_voter(‘jerry‘)

check_voter(‘jerry‘)

將散列表用作緩存

緩存的工作原理

：網站將數據記住，而不再重新計算。

緩存優點

l 用戶能夠更快地看到網頁

l 需要做的工作更少。

緩存是一種常用的加速方式，所有大型網站都使用緩存，而緩存的數據則存儲在散列表中！

訪問過程

cache={}
def get_page(url):
    if cache.get(url):                  　　　　　 #檢查緩存中是否存儲了該頁面
        return cache[url]                  　　　　#存儲了，即返回它
    else:
        data=get_data_from_server(url)            #沒存儲，從服務器調用
        cache[url]=data                           #將其存儲到緩存中
        return data                               #返回該頁面

小結

散列表適合用於：

l 模擬映射關系；

l 防止重復；

l 緩存/記住數據，以免服務器再通過處理來生成它們

沖突（collision）

定義

給兩個鍵分配的位置相同。

處理沖突的方式

如果兩個鍵映射到了同一個位置，就在這個位置存儲一個鏈表。

經驗

l 散列函數很重要。避免散列函數將所有的鍵都映射到一個位置，而最理想的情況是，散列函數將鍵均勻地映射到散列表的不同位置。

l 如果散列表存儲的鏈表很長，散列表的速度將急劇下降。然而，如果使用的散列函數很好，這些鏈表就不會很長！

散列函數很重要，好的散列函數很少導致沖突。

性能

在平均情況下，散列表執行各種操作的時間都為O(1)。 O(1)被稱為常量時間。

散列表的性能

操作	平均情況	最糟情況
查找	O(1)	O(n)
插入	O(1)	O(n)
刪除	O(1)	O(n)

散列表同數組和鏈表比較

操作	平均情況	最糟情況	數組	鏈表
查找	O(1)	O(n)	O(1)	O(n)
插入	O(1)	O(n)	O(n)	O(1)
刪除	O(1)	O(n)	O(n)	O(1)

在平均情況下，散列表的查找（獲取給定索引處的值）速度與數組一樣快，而插入和刪除速度與鏈表一樣快，因此它兼具兩者的優點！

但在最糟情況下，散列表的各種操作的速度都很慢。

在使用散列表時，避開最糟情況至關重要。需要有：

l 較低的填裝因子

l 良好的散列函數。

填裝因子

計算公式

散列表的填裝因子=散列表包含的元素數/位置總數

調整長度（resizing）

填裝因子大於1意味著元素數量超過了數組的位置數。

一旦填裝因子開始增大，就需要在散列表中添加位置，這被稱為調整長度（resizing）

經驗

填裝因子越低，發生沖突的可能性越小，散列表的性能越高。

一個不錯的經驗規則是：一旦填裝因子大於0.7，就調整散列表的長度。

良好的散列函數

良好的散列函數讓數組中的值呈均勻分布。

糟糕的散列函數讓值紮堆，導致大量的沖突。

小結

l 可以結合散列函數和數組來創建散列表。

l 沖突很糟糕，應使用可以最大限度減少沖突的散列函數。

l 散列表的查找、插入和刪除速度都非常快。

l 散列表適合用於模擬映射關系。

l 一旦填裝因子超過0.7，就該調整散列表的長度。

l 散列表可用於緩存數據（例如，在Web服務器上）。

l 散列表非常適合用於防止重復。

【算法】散列表

存儲 print rom 包含不錯最大 true 檢查處的散列表散列函數定義散列函數“將輸入映射到數字”。即無論你給它什麽數據，它都還你一個數字。散列函數必須滿足一些要求 l 它必須是一致的。例如，假設你輸入apple時得到的是4，那麽每次輸入appl

【算法】小知識

count 要求字符出現存在方法最終 while 意思　　記錄一些在我看來有意思的小算法知識 ■　　識別有效的括號字符串　　以小括號為例，在帶括號的字符串中，如果只提取出括號作為特征，"()",""（空串）,"(()(()(())))"這些是有效的括號字符

【算法】算法和數據結構緒論

title 避免找到高端分析初學閱讀相關結構算法和算法分析　　先說點無關緊要的。初中的時候，知道有CS這門專門的學科存在的時候最開始的概念中CS就是等同於算法。這有可能是因為當時的前桌是後來一代CS傳奇WJMZBMR。。因為當時看起來十分高端，再加上後來

【算法】map的應用

字符 i++ pre gin air htm ++ 一行問題 map使用參考鏈接http://www.cnblogs.com/KID-XiaoYuan/articles/7297709.html 題目在ACM比賽中，你每解決一道題，你就可以獲得一個氣球，不同顏色的氣球代

【算法】計算幾何

線上理解轉化在線是否多少 ros 實驗數值【斜率】 k=Δy/Δx 斜率為0時，直線平行於x軸（Δy=0）。 ★斜率不存在時，直線平行於y軸（Δx=0）。兩點確定一條直線，所以枚舉斜率時只需要枚舉任意兩點。 eg.枚舉同一直線上的點，利用在同一直線上的點必定

【算法】二分圖的判定

pre 滿足二分 log 判斷 ext 連通圖 size ret 二分圖的判定　　　　　　　　　　　　　　給定一個具有n個頂點的圖。要給圖上每個頂點染色，並且要使相鄰的頂點顏色不同。　　　　　　　　　　　　　　判斷是否能最多用兩種顏色進行染色。題目保證沒有重邊和自環。

【算法】Dijkstra算法（單源最短路徑問題）鄰接矩陣和鄰接表實現

當前 prior 排序發的單源最短路徑 fine emp eat col Dijkstra算法可使用的前提：不存在負圈。負圈：負圈又稱負環,就是說一個全部由負權的邊組成的環,這樣的話不存在最短路,因為每在環中轉一圈路徑總長就會邊小。算法描述：　　1.找到最

【算法】素數專題

rim eve style log back rime logs als class 【素數判定】假設輸入的都是正數，時間復雜度O（sqrt（n）） bool is_prime(int n){ for(int i = 2;i*i <= n; i++){

【算法】一個小白的算法筆記：堆排序 (>д<)

根節點節點和 -- 樹形 new 示例 () 是否 family 參考資料《算法（第4版）》 — — Robert Sedgewick， Kevin Wayne 什麽是二叉堆在了解堆排序之前，

【算法】fhqtreap初探

oid 最好回收 truct iostream 實現 min define hide 　　NOIP回來就一直想著學平衡樹。。。平衡樹寫久了調不出來真的會頭腦發熱.jpg 　　大概只寫了幾道題。。。　　fhqtreap是不需要旋（xun）轉（jun）的平衡樹，僅使用分

【算法】一個小白的算法筆記：歸並排序算法的編碼和優化 (,,? ? ?,,)

oid pub 大小角色 bcd 存在 ffd return 實現參考資料《算法（第4版）》 — — Robert Sedgewick， Kevin Wayne 歸並排序的概念歸並排序的實現我是這樣來描述的：先對

【算法】最大公約數、最小公倍數、數學歸納法

數學題 div 邏輯技術分享同時 9.png 最大常見演繹法最大公約數：如果數a能被數b整除，a就叫做b的倍數，b就叫做a的約數。幾個整數中公有的約數，叫做這幾個數的公約數；其中最大的一個，叫做這幾個數的最大公約數。 12、16的公約數有1、2、4，其中

【算法】後綴自動機SAM

同時一個自動 ... 包含結合不存在相交 bsp 【Right集合】後綴自動機真正優於後綴樹的方面在於：結合了有限狀態自動機，從而實現了O(n)的時空復雜度。 trans(s,str)表示s+str到達的狀態。 ST(str)=trans(init,str)

【算法】如何設計--高效的大數據匹配算法

高效 rain https sin 1-1 tails 處理 topic 大數據大數據匹配-算法 CoPilot大數據匹配_百度搜索在Spark上進行兩個大數據集的匹配 - CSDN博客字符串匹配算法總結 - 大數據算法-煉數成金-Dataguru專業數據分析社區【大數

【算法】紅黑樹-二叉樹-算法

平衡查找樹 .cn art baidu 博客 win 清晰 .com utf-8 紅黑樹-二叉樹-算法紅黑樹查找_百度搜索(5 條消息)AVL樹，紅黑樹，B樹，B+樹，Trie樹都分別應用在哪些現實場景中？ - 知乎查找(二)：徹底理解紅黑樹和平衡查找樹 - @瞪著太陽

【算法】CDQ分治 -- 三維偏序 & 動態逆序對

累加區間 www 得到 pri sort fine max upd 初次接觸CDQ分治，感覺真的挺厲害的。整體思路即分而治之，再用之前處理出來的答案統計之後的答案。大概流程是：對於區間 l ~ r : 1.處理 l ~mid, mid + 1 ~ r 的答案 2.分

【算法】排序（一）選擇排序

如何接下來運行時 images 復雜度分析穩定性 stat ima 在排序算法中，最簡單的莫過於選擇排序了。排序思路：在選擇排序算法中分別有一個外循環和一個內循環，假設需要排序的序列共有n個元素，所以外循環的次數為n次，在n次交換（外循環）中，每次設置序列中的第

【算法】排序（二）冒泡排序

-m and 我們 sta image system ring ole bce 上一篇給大家說了選擇排序的原理，這一次我們來說一說冒泡排序的原理其實冒泡排序和選擇排序一樣都是很簡單的排序方式。本文將介紹以下內容排序原理算法實現（JAVA）測試階段算法分析

【算法】排序（四）歸並排序

logs sta images pri 第一步 dom -o body 升序上次給大家說了說簡單的冒泡排序，這次我們來說一說插入排序插入排序的做法就像是我們日常生活中玩撲克牌一樣，每次抽一張牌，將撲克牌按一定順序插入手牌中，一步步完成排序本文將介紹以下內容排序思

【算法】哈希表的誕生（Java）

sys 什麽是 ros http 鍵值 private 問題現象三種參考資料《算法（java）》 — — Robert Sedgewick， Kevin Wayne 《數據結構》

【算法】散列表

散列表

散列函數

定義

散列函數必須滿足一些要求

散列函數準確地指出了存儲位置，具體原因如下：

散列表

應用

將散列表用於查找

防止重復

將散列表用作緩存

小結

沖突（collision）

定義

處理沖突的方式

經驗

性能

散列表的性能

散列表同數組和鏈表比較

填裝因子

計算公式

調整長度（resizing）

經驗

良好的散列函數

小結

相關推薦