1. 程式人生 > >資料結構知識總結

資料結構知識總結

連結串列

  • 連結串列是一種由節點(Node)組成的線性表,每個節點通過指標指向下一個節點。它是一種由節點組成,並能用於表示序列的資料結構。每個節點有數域和指標域。
  • 單鏈表:每個節點僅指向下一個節點,最後一個節點指向空(null)。
  • 雙向連結串列:每個節點有兩個指標p,n。p指向前一個節點,n指向下一個節點;最後一個節點指向空。
  • 迴圈連結串列:每個節點指向下一個節點,最後一個節點指向第一個節點。
  • 時間複雜度:
    • 索引:O(n)
    • 查詢:O(n)
    • 插入:O(1)
    • 刪除:O(1)

  • 棧是一個線性表
    ,支援兩種基本操作:push 操作可以用於將元素壓入棧,pop 操作可以將棧頂元素移除。
  • 遵循後入先出(LIFO)原則,僅在表尾作插入、刪除操作。
  • 時間複雜度
    • 索引:O(n)
    • 查詢:O(n)
    • 插入:O(1)
    • 刪除:O(1)

佇列

  • 佇列是一個元素集合,支援兩種基本操作:enqueue 用於新增一個元素到佇列,dequeue 用於刪除佇列中的一個元素。
  • 先進先出的資料結構(First In First Out, FIFO)。
  • 時間複雜度
    • 索引:O(n)
    • 查詢:O(n)
    • 插入:O(1)
    • 刪除:O(1)

  • 樹是無向、聯通的無環圖。

二叉樹

  • 二叉樹是一個樹形資料結構,每個節點最多可以有兩個子節點,稱為左子節點和右子節點。
  • 滿二叉樹(Full Tree):二叉樹中的每個節點有 0 或者 2 個子節點。
  • 完美二叉樹(Perfect Binary):二叉樹中的每個節點有兩個子節點,並且所有的葉子節點的深度是一樣的。
  • 完全二叉樹:二叉樹中除最後一層外其他各層的節點數均達到最大值,最後一層的節點都連續集中在最左邊。

二叉查詢樹

  • 二叉查詢樹(BST)是一種二叉樹。其任何節點的值都大於等於左子樹中的值,小於等於右子樹中的值。
  • 時間複雜度
    • 索引:O(log(n))
    • 查詢:O(log(n))
    • 插入:O(log(n))
    • 刪除:O(log(n))

字典樹

  • 字典樹,又稱為基數樹或字首樹,是一種用於儲存鍵值為字串的動態集合或關聯陣列的查詢樹。樹中的節點並不直接儲存關聯鍵值,而是該節點在樹中的位置決定了其關聯鍵值。一個節點的所有子節點都有相同的字首,根節點則是空字串。

樹狀陣列

  • 樹狀陣列,又稱為二進位制索引樹(Binary Indexed Tree,BIT),其概念上是樹,但以陣列實現。陣列中的下標代表樹中的節點,每個節點的父節點或子節點的下標可以通過位運算獲得。陣列中的每個元素都包含了預計算的區間值之和,在整個樹更新的過程中,這些計算的值也同樣會被更新。
  • 時間複雜度
    • 區間求和:O(log(n))
    • 更新:O(log(n))

線段樹

  • 線段樹是用於儲存區間和線段的樹形資料結構。它允許查詢一個節點在若干條線段中出現的次數。
  • 時間複雜度
    • 區間查詢:O(log(n))
    • 更新:O(log(n))

  • 堆是一種基於樹的滿足某些特性的資料結構:整個堆中的所有父子節點的鍵值都滿足相同的排序條件。堆分為最大堆和最小堆。在最大堆中,父節點的鍵值永遠大於等於所有子節點的鍵值,根節點的鍵值是最大的。最小堆中,父節點的鍵值永遠小於等於所有子節點的鍵值,根節點的鍵值是最小的。
  • 時間複雜度
    • 索引:O(log(n))
    • 查詢:O(log(n))
    • 插入:O(log(n))
    • 刪除:O(log(n))
    • 刪除最大值/最小值:O(1)

雜湊

  • 雜湊用於將任意長度的資料對映到固定長度的資料。雜湊函式的返回值被稱為雜湊值、雜湊碼或者雜湊。如果不同的主鍵得到相同的雜湊值,則發生了衝突。
  • Hash Maphash map 是一個儲存鍵值間關係的資料結構。HashMap 通過雜湊函式將鍵轉化為桶或者槽中的下標,從而便於指定值的查詢。
  • 衝突解決
    • 鏈地址法(Separate Chaining:在鏈地址法中,每個桶(bucket)是相互獨立的,每一個索引對應一個元素列表。處理HashMap 的時間就是查詢桶的時間(常量)與遍歷列表元素的時間之和。
    • 開放地址法(Open Addressing:在開放地址方法中,當插入新值時,會判斷該值對應的雜湊桶是否存在,如果存在則根據某種演算法依次選擇下一個可能的位置,直到找到一個未被佔用的地址。開放地址即某個元素的位置並不永遠由其雜湊值決定。

 

  • 圖是G =(V,E)的有序對,其包括頂點或節點的集合 V 以及邊或弧的集合E,其中E包括了兩個來自V的元素(即邊與兩個頂點相關聯 ,並且該關聯為這兩個頂點的無序對)。
  • 無向圖:圖的鄰接矩陣是對稱的,因此如果存在節點 u 到節點 v 的邊,那節點 v 到節點 u 的邊也一定存在。
  • 有向圖:圖的鄰接矩陣不是對稱的。因此如果存在節點 u 到節點 v 的邊並不意味著一定存在節點 v 到節點 u 的邊。

演算法

排序

快速排序

  • 穩定:否
  • 時間複雜度
    • 最優:O(nlog(n))
    • 最差:O(n^2)
    • 平均:O(nlog(n))

合併排序

  • 合併排序是一種分治演算法。這個演算法不斷地將一個數組分為兩部分,分別對左子陣列和右子陣列排序,然後將兩個數組合併為新的有序陣列。
  • 穩定:是
  • 時間複雜度:
    • 最優:O(nlog(n))
    • 最差:O(nlog(n))
    • 平均:O(nlog(n))

桶排序

  • 桶排序是一種將元素分到一定數量的桶中的排序演算法。每個桶內部採用其他演算法排序,或遞迴呼叫桶排序。
  • 時間複雜度
    • 最優:Ω(n + k)
    • 最差: O(n^2)
    • 平均:Θ(n + k)

基數排序

  • 基數排序類似於桶排序,將元素分發到一定數目的桶中。不同的是,基數排序在分割元素之後沒有讓每個桶單獨進行排序,而是直接做了合併操作。
  • 時間複雜度
    • 最優:Ω(nk)
    • 最差: O(nk)
    • 平均:Θ(nk)

圖演算法

深度優先搜尋

  • 深度優先搜尋是一種先遍歷子節點而不回溯的圖遍歷演算法。
  • 時間複雜度:O(|V| + |E|)

廣度優先搜尋

  • 廣度優先搜尋是一種先遍歷鄰居節點而不是子節點的圖遍歷演算法。
  • 時間複雜度:O(|V| + |E|)

拓撲排序

  • 拓撲排序是有向圖節點的線性排序。對於任何一條節點 u 到節點 v 的邊,u 的下標先於 v。
  • 時間複雜度:O(|V| + |E|)

Dijkstra演算法

  • Dijkstra 演算法是一種在有向圖中查詢單源最短路徑的演算法。
  • 時間複雜度:O(|V|^2)

Bellman-Ford演算法

  • Bellman-Ford 是一種在帶權圖中查詢單一源點到其他節點最短路徑的演算法。
  • 雖然時間複雜度大於 Dijkstra 演算法,但它可以處理包含了負值邊的圖。
  • 時間複雜度:
    • 最優:O(|E|)
    • 最差:O(|V||E|)

Floyd-Warshall 演算法

  • Floyd-Warshall 演算法是一種在無環帶權圖中尋找任意節點間最短路徑的演算法。
  • 該演算法執行一次即可找到所有節點間的最短路徑(路徑權重和)。
  • 時間複雜度:
    • 最優:O(|V|^3)
    • 最差:O(|V|^3)
    • 平均:O(|V|^3)

最小生成樹演算法

  • 最小生成樹演算法是一種在無向帶權圖中查詢最小生成樹的貪心演算法。換言之,最小生成樹演算法能在一個圖中找到連線所有節點的邊的最小子集。
  • 時間複雜度:O(|V|^2)

Kruskal 演算法

  • Kruskal 演算法也是一個計算最小生成樹的貪心演算法,但在 Kruskal 演算法中,圖不一定是連通的。
  • 時間複雜度:O(|E|log|V|)

貪心演算法

  • 貪心演算法總是做出在當前看來最優的選擇,並希望最後整體也是最優的。
  • 使用貪心演算法可以解決的問題必須具有如下兩種特性:
    • 最優子結構
      • 問題的最優解包含其子問題的最優解。
    • 貪心選擇
      • 每一步的貪心選擇可以得到問題的整體最優解。
  • 例項-硬幣選擇問題
  • 給定期望的硬幣總和為 V 分,以及 n 種硬幣,即型別是 i 的硬幣共有 coinValue[i] 分,i的範圍是 [0…n – 1]。假設每種型別的硬幣都有無限個,求解為使和為 V 分最少需要多少硬幣?
  • 硬幣:便士(1美分),鎳(5美分),一角(10美分),四分之一(25美分)。
  • 假設總和 V 為41,。我們可以使用貪心演算法查詢小於或者等於 V 的面值最大的硬幣,然後從 V 中減掉該硬幣的值,如此重複進行。
    • V = 41 | 使用了0個硬幣
    • V = 16 | 使用了1個硬幣(41 – 25 = 16)
    • V = 6 | 使用了2個硬幣(16 – 10 = 6)
    • V = 1 | 使用了3個硬幣(6 – 5 = 1)
    • V = 0 | 使用了4個硬幣(1 – 1 = 0)

運算

  • 位運算即在位元級別進行操作的技術。使用位運算技術可以帶來更快的執行速度與更小的記憶體使用。
  • 測試第 k 位:s & (1 << k);
  • 設定第k位:s |= (1 << k);
  • 關閉第k位:s &= ~(1 << k);
  • 切換第k位:s ^= (1 << k);
  • 乘以2n:s << n;
  • 除以2n:s >> n;
  • 交集:s & t;
  • 並集:s | t;
  • 減法:s & ~t;
  • 提取最小非0位:s & (-s);
  • 提取最小0位:~s & (s + 1);
  • 交換值:x ^= y; y ^= x; x ^= y;