九、深度優先 && 廣度優先

阿新 • • 發佈：2020-06-27

一、什麼是“搜尋”演演算法？

演演算法是作用於具體資料結構之上的，深度優先搜尋演演算法和廣度優先搜尋演演算法都是基於“圖”這種資料結構的。
因為圖這種資料結構的表達能力很強，大部分涉及搜尋的場景都可以抽象成“圖”。
圖上的搜尋演演算法，最直接的理解就是，在圖中找出從一個頂點出發，到另一個頂點的路徑。
具體方法有很多，兩種最簡單、最“暴力”的方法為深度優先、廣度優先搜尋，還有A、 IDA等啟發式搜尋演演算法。
圖有兩種主要儲存方法，鄰接表和鄰接矩陣。
以無向圖，採用鄰接表儲存為例：

public class Graph {

    // 頂點的個數

    private int v;

    // 每個頂點後面有個連結串列
 

    private LinkedList<Integer>[] adj;

    public Graph(int v) {

        this.v = v;

        adj = new LinkedList[v];

        for (int i = 0; i < v; i++) {

            adj[i] = new LinkedList<>();

        }

    }

    /**

     * 新增邊

     * @param s 頂點

     * @param t 頂點

     */

    public void addEdge(int s,int t){
 

        // 無向圖一條邊存兩次（聯想微信好友）

        adj[s].add(t);

        adj[t].add(s);

    }

}

二、廣度優先搜尋（BFS）

廣度優先搜尋（Breadth-First-Search），簡稱為 BFS。
它是一種“地毯式”層層推進的搜尋策略，即先查詢離起始頂點最近的，然後是次近的，依次往外搜尋。

2.1、實現過程

/**

 * 圖的廣度優先搜尋，搜尋一條從 s 到 t 的路徑。

 * 這樣求得的路徑就是從 s 到 t 的最短路徑。

 *

 * @param s 起始頂點

 * @param t 終止頂點

 */

public void bfs(int s, int t) {
 

    if (s == t) {

        return;

    }

    // visited 記錄已經被訪問的頂點，避免頂點被重複訪問。如果頂點 q 被訪問，那相應的visited[q]會被設定為true。

    boolean[] visited = new boolean[v];

    visited[s] = true;

    // queue 是一個佇列，用來儲存已經被訪問、但相連的頂點還沒有被訪問的頂點。因為廣度優先搜尋是逐層訪問的，只有把第k層的頂點都訪問完成之後，才能訪問第k+1層的頂點。

    // 當訪問到第k層的頂點的時候，需要把第k層的頂點記錄下來，稍後才能通過第k層的頂點來找第k+1層的頂點。

    // 所以，用這個佇列來實現記錄的功能。

    Queue<Integer> queue = new LinkedList<>();

    queue.add(s);

    // prev 用來記錄搜尋路徑。當從頂點s開始，廣度優先搜尋到頂點t後，prev陣列中儲存的就是搜尋的路徑。

    // 不過，這個路徑是反向儲存的。prev[w]儲存的是，頂點w是從哪個前驅頂點遍歷過來的。

    // 比如，通過頂點2的鄰接表訪問到頂點3，那prev[3]就等於2。為了正向打印出路徑，需要遞迴地來列印，就是print()函式的實現方式。

    int[] prev = Arrays.stream(new int[v]).map(f -> -1).toArray();

    while (queue.size() != 0) {

        int w = queue.poll();

        LinkedList<Integer> wLinked = adj[w]; // 表示：鄰接表儲存時頂點為w，所對應的連結串列

        for (int i = 0; i < wLinked.size(); ++i) {

            int q = wLinked.get(i);

            // 判斷頂點 q 是否被訪問

            if (!visited[q]) {

                // 未被訪問

                prev[q] = w;

                if (q == t) {

                    print(prev, s, t);

                    return;

                }

                visited[q] = true;

                queue.add(q);

            }

        }

    }

}

// 遞迴列印s->t的路徑

private void print(int[] prev, int s, int t) {

    if (prev[t] != -1 && t != s) {

        print(prev, s, prev[t]);

    }

    System.out.print(t + " ");

}

原理如下：

2.2、複雜度分析

最壞情況下，終止頂點 t 離起始頂點 s 很遠，需要遍歷完整個圖才能找到。
這個時候，每個頂點都要進出一遍佇列，每個邊也都會被訪問一次，所以，廣度優先搜尋的時間複雜度是 O(V+E)。
其中，V 表示頂點的個數，E 表示邊的個數。
對於一個連通圖來說，也就是說一個圖中的所有頂點都是連通的，E肯定要大於等於 V-1，所以，廣度優先搜尋的時間複雜度也可以簡寫為 O(E)。
廣度優先搜尋的空間消耗主要在幾個輔助變數 visited 陣列、queue 佇列、prev 陣列上。
這三個儲存空間的大小都不會超過頂點的個數，所以空間複雜度是 O(V)。

三、深度優先搜尋（DFS）

深度優先搜尋（Depth-First-Search），簡稱DFS。
最直觀的例子就是“走迷宮，假設站在迷宮的某個岔路口，然後想找到出口。
隨意選擇一個岔路口來走，走著走著發現走不通的時候，就回退到上一個岔路口，重新選擇一條路繼續走，直到最終找到出口。這種走法就是一種深度優先搜尋策略。
如下圖所示，在圖中應用深度優先搜尋，來找某個頂點到另一個頂點的路徑。
搜尋的起始頂點是 s，終止頂點是 t，在圖中尋找一條從頂點 s 到頂點 t 的路徑。
用深度遞迴演演算法，把整個搜尋的路徑標記出來了。實線箭頭表示遍歷，虛線箭頭表示回退。
從圖中可以看出，深度優先搜尋找出來的路徑，並不是頂點 s 到頂點 t 的最短路徑。

3.1、實現過程

// 全域性變數或者類成員變數，標記是否找到終點 t

boolean found = false;

/**

 * 深度優先搜尋

 *

 * @param s 起始頂點

 * @param t 終止頂點

 */

public void dfs(int s, int t) {

    found = false;

    // 標記頂點是否被訪問

    boolean[] visited = new boolean[v];

    // prev 用來記錄搜尋路徑，prev[w] = a 表示 w 頂點的上一級節點為 a

    int[] prev = Arrays.stream(new int[v])

            .map(f -> -1).toArray();

    recurDfs(s, t, visited, prev);

    print(prev, s, t);

}

private void recurDfs(int w, int t, boolean[] visited, int[] prev) {

    if (found == true) {

        return;

    }

    visited[w] = true;

    if (w == t) {

        found = true;

        return;

    }

    LinkedList<Integer> wLinked = adj[w];

    for (int i = 0; i < wLinked.size(); ++i) {

        int q = wLinked.get(i);

        if (!visited[q]) {

            prev[q] = w;

            recurDfs(q, t, visited, prev);

        }

    }

}

3.2、複雜度分析

深度搜索中每條邊最多會被訪問兩次，一次是遍歷，一次是回退。
所以，深度優先搜尋演演算法的時間複雜度是 O(E)， E 表示邊的個數。
深度優先搜尋演演算法的消耗記憶體主要是 visited、 prev 陣列和遞迴呼叫棧。
visited、 prev 陣列的大小跟頂點的個數V成正比，遞迴呼叫棧的最大深度不會超過頂點的個數，所以總的空間複雜度就是 O(V)。

四，兩者對比

廣度優先搜尋和深度優先搜尋是圖上的兩種最常用、最基本的搜尋演演算法，比起其他高階的搜尋演演算法，比如A、 IDA等，要簡單粗暴，沒有什麼優化，所以，也被

叫作暴力搜尋演演算法。
所以，這兩種搜尋演演算法僅適用於狀態空間不大，也就是說圖不大的搜尋。
廣度優先搜尋，通俗的理解就是，地毯式層層推進，從起始頂點開始，依次往外遍歷。
廣度優先搜尋需要藉助佇列來實現，遍歷得到的路徑就是，起始頂點到終止頂點的最短路徑。
深度優先搜尋用的是回溯思想，非常適合用遞迴實現。換種說法，深度優先搜尋是藉助棧來實現的。
在執行效率方面，深度優先和廣度優先搜尋的時間複雜度都是 O(E)，空間複雜度是 O(V)。