1. 程式人生 > 實用技巧 >【IDA*+剪枝】DNA sequence

【IDA*+剪枝】DNA sequence

DNA sequence HDU - 1560

題意:

給定N個DNA序列(僅由ATCG構成),求能使得這N個序列均為其子序列的最短公共序列,輸出這個最小的長度。

思路:

IDA*,估價函式即N個序列中未匹配個數的最大值。(因為最理想情況是,當前所嘗試的字母X加入公共序列之後,能同時與這N個序列匹配)

反思:

先前不知道IDA*,當作普通剪枝做了,發現T了之後又嘗試按字母貢獻值從大到小來搜尋,但並沒有多大的優化,還是T。

思路太直了,雖然意識到了“該序列未匹配的個數”的重要性,但還是大費周章地試圖給每個序列每個字母的匹配情況做標記,也導致我在如何做標記、擦標記的問題上花了不少時間……

以後想問題還是得有意識地抓住最關鍵的變數,不能侷限在“好想”和“直觀”上。

int n;
int mshort = -1;
string alpha = "ATCG";

struct node {
    string ch;
    int len;
    int filled;
}DNA[10];

int guess() {
    int tmp = 0;
    for (int i = 1; i <= n; i++) {
        tmp = max(tmp, DNA[i].len - DNA[i].filled);
    }
    return tmp;
}

int dfs(int len,string s) {
    //估價函式,估計還要填幾個字母,依據是所有序列中單個序列未做標記的個數的最大值
    if (len + guess() > mshort) return 0;
    //如果不行,限制逐漸放寬
    if (!guess()) return 1;

    int flag = 0, tem[10];
    for (int i = 0; i < 4; i++) {
        //遍歷四個字母
        flag = 0;
        for (int j = 1; j <= n; j++)
            tem[j] = DNA[j].filled;
        //匹配之前臨時存一下已匹配個數,便於後續還原
        for (int j = 1; j <= n; j++) {
            if (DNA[j].filled<DNA[j].len && DNA[j].ch[DNA[j].filled] == alpha[i]) {
                DNA[j].filled++;
                flag = 1;
                //標記 這個字母有貢獻
            }
        }
        if (flag) {
            if (dfs(len + 1,s+alpha[i])) return 1;
            for (int k = 1; k <= n; k++) DNA[k].filled = tem[k];
            //還原
        }
    }
    return 0;
}

int main()
{
    ios::sync_with_stdio(false);
    int t; cin >> t; while (t--) {
        cin >> n;
        mshort = -1;
        for (int i = 1; i <= n; i++) {
            cin >> DNA[i].ch;
            DNA[i].len = DNA[i].ch.length();
            DNA[i].filled = 0;
            mshort = max(mshort, DNA[i].len);
        }
        //迭代加深
        while (!dfs(0,"")) {
            mshort++;
        }
        cout << mshort << endl;
    }
    return 0;
}