經典排序演算法優劣比較(總結)
1. 氣泡排序
氣泡排序是最簡單的排序之一了,其大體思想就是通過與相鄰元素的比較和交換來把小的數交換到最前面。這個過程類似於水泡向上升一樣,因此而得名。舉個栗子,對5,3,8,6,4這個無序序列進行氣泡排序。首先從後向前冒泡,4和6比較,把4交換到前面,序列變成5,3,8,4,6。同理4和8交換,變成5,3,4,8,6,3和4無需交換。5和3交換,變成3,5,4,8,6,3.這樣一次冒泡就完了,把最小的數3排到最前面了。對剩下的序列依次冒泡就會得到一個有序序列。氣泡排序的時間複雜度為O(n^2)。
2. 選擇排序
選擇排序的思想其實和氣泡排序有點類似,都是在一次排序後把最小的元素放到最前面。但是過程不同,氣泡排序是通過相鄰的比較和交換。而選擇排序是通過對整體的選擇。舉個栗子,對5,3,8,6,4這個無序序列進行簡單選擇排序,首先要選擇5以外的最小數來和5交換,也就是選擇3和5交換,一次排序後就變成了3,5,8,6,4.對剩下的序列一次進行選擇和交換,最終就會得到一個有序序列。其實選擇排序可以看成氣泡排序的優化,因為其目的相同,只是選擇排序只有在確定了最小數的前提下才進行交換,大大減少了交換的次數。選擇排序的時間複雜度為O(n^2)。
3. 插入排序
插入排序不是通過交換位置而是通過比較找到合適的位置插入元素來達到排序的目的的。相信大家都有過打撲克牌的經歷,特別是牌數較大的。在分牌時可能要整理自己的牌,牌多的時候怎麼整理呢?就是拿到一張牌,找到一個合適的位置插入。這個原理其實和插入排序是一樣的。舉個栗子,對5,3,8,6,4這個無序序列進行簡單插入排序,首先假設第一個數的位置時正確的,想一下在拿到第一張牌的時候,沒必要整理。然後3要插到5前面,把5後移一位,變成3,5,8,6,4.想一下整理牌的時候應該也是這樣吧。然後8不用動,6插在8前面,8後移一位,4插在5前面,從5開始都向後移一位。注意在插入一個數的時候要保證這個數前面的數已經有序。簡單插入排序的時間複雜度也是O(n^2)。
4. 快速排序
快速排序一聽名字就覺得很高階,在實際應用當中快速排序確實也是表現最好的排序演算法。快速排序雖然高階,但其實其思想是來自氣泡排序,氣泡排序是通過相鄰元素的比較和交換把最小的冒泡到最頂端,而快速排序是比較和交換小數和大數,這樣一來不僅把小數冒泡到上面同時也把大數沉到下面。
舉個栗子:對5,3,8,6,4這個無序序列進行快速排序,思路是右指標找比基準數小的,左指標找比基準數大的,交換之。
5,3,8,6,4 用5作為比較的基準,最終會把5小的移動到5的左邊,比5大的移動到5的右邊。
5,3,8,6,4 首先設定i,j兩個指標分別指向兩端,j指標先掃描(思考一下為什麼?)4比5小停止。然後i掃描,8比5大停止。交換i,j位置。
5,3,4,6,8 然後j指標再掃描,這時j掃描4時兩指標相遇。停止。然後交換4和基準數。
4,3,5,6,8 一次劃分後達到了左邊比5小,右邊比5大的目的。之後對左右子序列遞迴排序,最終得到有序序列。
上面留下來了一個問題為什麼一定要j指標先動呢?首先這也不是絕對的,這取決於基準數的位置,因為在最後兩個指標相遇的時候,要交換基準數到相遇的位置。一般選取第一個數作為基準數,那麼就是在左邊,所以最後相遇的數要和基準數交換,那麼相遇的數一定要比基準數小。所以j指標先移動才能先找到比基準數小的數。
快速排序是不穩定的,其時間平均時間複雜度是O(nlgn)。
總結快速排序的思想:冒泡+二分+遞迴分治,慢慢體會。。。
5. 堆排序
堆排序是藉助堆來實現的選擇排序,思想同簡單的選擇排序,以下以大頂堆為例。注意:如果想升序排序就使用大頂堆,反之使用小頂堆。原因是堆頂元素需要交換到序列尾部。
首先,實現堆排序需要解決兩個問題:
如何由一個無序序列鍵成一個堆?
如何在輸出堆頂元素之後,調整剩餘元素成為一個新的堆? 第一個問題,可以直接使用線性陣列來表示一個堆,由初始的無序序列建成一個堆就需要自底向上從第一個非葉元素開始挨個調整成一個堆。
第二個問題,怎麼調整成堆?首先是將堆頂元素和最後一個元素交換。然後比較當前堆頂元素的左右孩子節點,因為除了當前的堆頂元素,左右孩子堆均滿足條件,這時需要選擇當前堆頂元素與左右孩子節點的較大者(大頂堆)交換,直至葉子節點。我們稱這個自堆頂自葉子的調整成為篩選。
從一個無序序列建堆的過程就是一個反覆篩選的過程。若將此序列看成是一個完全二叉樹,則最後一個非終端節點是n/2取底個元素,由此篩選即可。舉個栗子:
49,38,65,97,76,13,27,49序列的堆排序建初始堆和調整的過程如下:
6. 希爾排序
希爾排序是插入排序的一種高效率的實現,也叫縮小增量排序。簡單的插入排序中,如果待排序列是正序時,時間複雜度是O(n),如果序列是基本有序的,使用直接插入排序效率就非常高。希爾排序就利用了這個特點。基本思想是:先將整個待排記錄序列分割成為若干子序列分別進行直接插入排序,待整個序列中的記錄基本有序時再對全體記錄進行一次直接插入排序。
從上述排序過程可見,希爾排序的特點是,子序列的構成不是簡單的逐段分割,而是將某個相隔某個增量的記錄組成一個子序列。如上面的例子,第一堂排序時的增量為5,第二趟排序的增量為3。由於前兩趟的插入排序中記錄的關鍵字是和同一子序列中的前一個記錄的關鍵字進行比較,因此關鍵字較小的記錄就不是一步一步地向前挪動,而是跳躍式地往前移,從而使得進行最後一趟排序時,整個序列已經做到基本有序,只要作記錄的少量比較和移動即可。因此希爾排序的效率要比直接插入排序高。
希爾排序的分析是複雜的,時間複雜度是所取增量的函式,這涉及一些數學上的難題。但是在大量實驗的基礎上推出當n在某個範圍內時,時間複雜度可以達到O(n^1.3)。
7. 歸併排序
歸併排序是另一種不同的排序方法,因為歸併排序使用了遞迴分治的思想,所以理解起來比較容易。其基本思想是,先遞迴劃分子問題,然後合併結果。把待排序列看成由兩個有序的子序列,然後合併兩個子序列,然後把子序列看成由兩個有序序列。。。。。倒著來看,其實就是先兩兩合併,然後四四合並。。。最終形成有序序列。空間複雜度為O(n),時間複雜度為O(nlogn)。
8. 計數排序
計數排序
如果在面試中有面試官要求你寫一個O(n)時間複雜度的排序演算法,你千萬不要立刻說:這不可能!雖然前面基於比較的排序的下限是O(nlogn)。但是確實也有線性時間複雜度的排序,只不過有前提條件,就是待排序的數要滿足一定的範圍的整數,而且計數排序需要比較多的輔助空間。其基本思想是,用待排序的數作為計數陣列的下標,統計每個數字的個數。然後依次輸出即可得到有序序列。
總結
在前面的介紹和分析中我們提到了氣泡排序、選擇排序、插入排序三種簡單的排序及其變種快速排序、堆排序、希爾排序三種比較高效的排序。後面我們又分析了基於分治遞迴思想的歸併排序還有計數排序、桶排序、基數排序三種線性排序。我們可以知道排序演算法要麼簡單有效,要麼是利用簡單排序的特點加以改進,要麼是以空間換取時間在特定情況下的高效排序。但是這些排序方法都不是固定不變的,需要結合具體的需求和場景來選擇甚至組合使用。才能達到高效穩定的目的。沒有最好的排序,只有最適合的排序。
下面就總結一下排序演算法的各自的使用場景和適用場合。
-
從平均時間來看,快速排序是效率最高的,但快速排序在最壞情況下的時間效能不如堆排序和歸併排序。而後者相比較的結果是,在n較大時歸併排序使用時間較少,但使用輔助空間較多。
-
上面說的簡單排序包括除希爾排序之外的所有氣泡排序、插入排序、簡單選擇排序。其中直接插入排序最簡單,但序列基本有序或者n較小時,直接插入排序是好的方法,因此常將它和其他的排序方法,如快速排序、歸併排序等結合在一起使用。
-
基數排序的時間複雜度也可以寫成O(d*n)。因此它最使用於n值很大而關鍵字較小的的序列。若關鍵字也很大,而序列中大多數記錄的最高關鍵字均不同,則亦可先按最高關鍵字不同,將序列分成若干小的子序列,而後進行直接插入排序。
-
從方法的穩定性來比較,基數排序是穩定的內排方法,所有時間複雜度為O(n^2)的簡單排序也是穩定的。但是快速排序、堆排序、希爾排序等時間效能較好的排序方法都是不穩定的。穩定性需要根據具體需求選擇。
-
上面的演算法實現大多數是使用線性儲存結構,像插入排序這種演算法用連結串列實現更好,省去了移動元素的時間。具體的儲存結構在具體的實現版本中也是不同的。