1. 程式人生 > >演算法的時間與空間複雜度

演算法的時間與空間複雜度

演算法(Algorithm)是指用來操作資料、解決程式問題的一組方法。對於同一個問題,使用不同的演算法,也許最終得到的結果是一樣的,但在過程中消耗的資源和時間卻會有很大的區別。

那麼我們應該如何去衡量不同演算法之間的優劣呢?

主要還是從演算法所佔用的「時間」和「空間」兩個維度去考量。

  • 時間維度:是指執行當前演算法所消耗的時間,我們通常用「時間複雜度」來描述。

  • 空間維度:是指執行當前演算法需要佔用多少記憶體空間,我們通常用「空間複雜度」來描述。

因此,評價一個演算法的效率主要是看它的時間複雜度和空間複雜度情況。然而,有的時候時間和空間卻又是「魚和熊掌」,不可兼得的,那麼我們就需要從中去取一個平衡點。

下面我來分別介紹一下「時間複雜度」和「空間複雜度」的計算方式。

一、時間複雜度

我們想要知道一個演算法的「時間複雜度」,很多人首先想到的的方法就是把這個演算法程式執行一遍,那麼它所消耗的時間就自然而然知道了。

這種方式可以嗎?當然可以,不過它也有很多弊端。
這種方式非常容易受執行環境的影響,在效能高的機器上跑出來的結果與在效能低的機器上跑的結果相差會很大。而且對測試時使用的資料規模也有很大關係。再者,並我們在寫演算法的時候,還沒有辦法完整的去執行呢。

因此,另一種更為通用的方法就出來了:「 大O符號表示法 」,即 T(n) = O(f(n))

我們先來看個例子:

for(i=1; i<=n; ++i)
{
   j = i;
   j++;
}

通過「 大O符號表示法 」,這段程式碼的時間複雜度為:O(n) ,為什麼呢?

在 大O符號表示法中,時間複雜度的公式是: T(n) = O( f(n) ),其中f(n) 表示每行程式碼執行次數之和,而 O 表示正比例關係,這個公式的全稱是:演算法的漸進時間複雜度 。

我們繼續看上面的例子,假設每行程式碼的執行時間都是一樣的,我們用 1顆粒時間 來表示,那麼這個例子的第一行耗時是1個顆粒時間,第三行的執行時間是 n個顆粒時間,第四行的執行時間也是 n個顆粒時間(第二行和第五行是符號,暫時忽略),那麼總時間就是 1顆粒時間 + n顆粒時間 + n顆粒時間 ,即 (1+2n)個顆粒時間,即: T(n) =  (1+2n)*顆粒時間,從這個結果可以看出,這個演算法的耗時是隨著n的變化而變化,因此,我們可以簡化的將這個演算法的時間複雜度表示為:T(n) =  O(n)

為什麼可以這麼去簡化呢,因為大O符號表示法並不是用於來真實代表演算法的執行時間的,它是用來表示程式碼執行時間的增長變化趨勢的。

所以上面的例子中,如果n無限大的時候,T(n) =  time(1+2n)中的常量1就沒有意義了,倍數2也意義不大。因此直接簡化為T(n) =  O(n) 就可以了。

常見的時間複雜度量級有:

  • 常數階O(1)

  • 對數階O(logN)

  • 線性階O(n)

  • 線性對數階O(nlogN)

  • 平方階O(n²)

  • 立方階O(n³)

  • K次方階O(n^k)

  • 指數階(2^n)

上面從上至下依次的時間複雜度越來越大,執行的效率越來越低。

下面選取一些較為常用的來講解一下(沒有嚴格按照順序):

  1. 常數階O(1)

無論程式碼執行了多少行,只要是沒有迴圈等複雜結構,那這個程式碼的時間複雜度就都是O(1),如:

int i = 1;
int j = 2;
++i;
j++;
int m = i + j;

上述程式碼在執行的時候,它消耗的時候並不隨著某個變數的增長而增長,那麼無論這類程式碼有多長,即使有幾萬幾十萬行,都可以用O(1)來表示它的時間複雜度。

  1. 線性階O(n)

這個在最開始的程式碼示例中就講解過了,如:

for(i=1; i<=n; ++i)
{
   j = i;
   j++;
}

這段程式碼,for迴圈裡面的程式碼會執行n遍,因此它消耗的時間是隨著n的變化而變化的,因此這類程式碼都可以用O(n)來表示它的時間複雜度。

  1. 對數階O(logN)

還是先來看程式碼:

int i = 1;
while(i<n)
{
    i = i * 2;
}

從上面程式碼可以看到,在while迴圈裡面,每次都將 i 乘以 2,乘完之後,i 距離 n 就越來越近了。我們試著求解一下,假設迴圈x次之後,i 就大於 2 了,此時這個迴圈就退出了,也就是說 2 的 x 次方等於 n,那麼 x = log2^n
也就是說當迴圈 log2^n 次以後,這個程式碼就結束了。因此這個程式碼的時間複雜度為:O(logn)

  1. 線性對數階O(nlogN)

線性對數階O(nlogN) 其實非常容易理解,將時間複雜度為O(logn)的程式碼迴圈N遍的話,那麼它的時間複雜度就是 n * O(logN),也就是了O(nlogN)。

就拿上面的程式碼加一點修改來舉例:

for(m=1; m<n; m++)
{
    i = 1;
    while(i<n)
    {
        i = i * 2;
    }
}
  1. 平方階O(n²)

平方階O(n²) 就更容易理解了,如果把 O(n) 的程式碼再巢狀迴圈一遍,它的時間複雜度就是 O(n²) 了。
舉例:

for(x=1; i<=n; x++)
{
   for(i=1; i<=n; i++)
    {
       j = i;
       j++;
    }
}

這段程式碼其實就是嵌套了2層n迴圈,它的時間複雜度就是 O(n*n),即  O(n²) 
如果將其中一層迴圈的n改成m,即:

for(x=1; i<=m; x++)
{
   for(i=1; i<=n; i++)
    {
       j = i;
       j++;
    }
}

那它的時間複雜度就變成了 O(m*n)

  1. 立方階O(n³)K次方階O(n^k)

參考上面的O(n²) 去理解就好了,O(n³)相當於三層n迴圈,其它的類似。

除此之外,其實還有 平均時間複雜度、均攤時間複雜度、最壞時間複雜度、最好時間複雜度 的分析方法,有點複雜,這裡就不展開了。

二、空間複雜度

既然時間複雜度不是用來計算程式具體耗時的,那麼我也應該明白,空間複雜度也不是用來計算程式實際佔用的空間的。

空間複雜度是對一個演算法在執行過程中臨時佔用儲存空間大小的一個量度,同樣反映的是一個趨勢,我們用 S(n) 來定義。

空間複雜度比較常用的有:O(1)、O(n)、O(n²),我們下面來看看:

  1. 空間複雜度 O(1)

如果演算法執行所需要的臨時空間不隨著某個變數n的大小而變化,即此演算法空間複雜度為一個常量,可表示為 O(1)
舉例:

int i = 1;
int j = 2;
++i;
j++;
int m = i + j;

程式碼中的 i、j、m 所分配的空間都不隨著處理資料量變化,因此它的空間複雜度 S(n) = O(1)

  1. 空間複雜度 O(n)

我們先看一個程式碼:

int[] m = new int[n]
for(i=1; i<=n; ++i)
{
   j = i;
   j++;
}

這段程式碼中,第一行new了一個數組出來,這個資料佔用的大小為n,這段程式碼的2-6行,雖然有迴圈,但沒有再分配新的空間,因此,這段程式碼的空間複雜度主要看第一行即可,即 S(n) = O(n)