1. 程式人生 > 其它 >力扣 leetcode 839. 相似字串組 (python)

力扣 leetcode 839. 相似字串組 (python)

技術標籤:pythonleetcode字串列表pythonleetcode演算法

Topic

如果交換字串 X 中的兩個不同位置的字母,使得它和字串 Y 相等,那麼稱 X 和 Y 兩個字串相似。如果這兩個字串本身是相等的,那它們也是相似的。
例如,“tars” 和 “rats” 是相似的 (交換 0 與 2 的位置); “rats” 和 “arts” 也是相似的,但是 “star” 不與 “tars”,“rats”,或 “arts” 相似。
總之,它們通過相似性形成了兩個關聯組:{“tars”, “rats”, “arts”} 和 {“star”}。注意,“tars” 和 “arts” 是在同一組中,即使它們並不相似。形式上,對每個組而言,要確定一個單詞在組中,只需要這個詞和該組中至少一個單詞相似。

給你一個字串列表 strs。列表中的每個字串都是 strs 中其它所有字串的一個字母異位詞。請問 strs 中有多少個相似字串組?

Example_1

輸入:strs = [“tars”,“rats”,“arts”,“star”]
輸出:2

Example_2

輸入:strs = [“omv”,“ovm”]
輸出:1

Tips

1 <= strs.length <= 100
1 <= strs[i].length <= 1000
sum(strs[i].length) <= 2 * 104
strs[i] 只包含小寫字母。
strs 中的所有單詞都具有相同的長度,且是彼此的字母異位詞。

Solution

字典實現並查集和用列表實現並查集均可
但用列表實現並查集可以減少一個迴圈的使用,更推薦列表法

首先既然要判斷相似字串組的個數
那麼如何判斷字串是否相似就是難點

判斷字串是否相似

設計一個is_similar函式判斷兩個字串是否相等
由於題目中說明了strs 中的所有單詞都具有相同的長度,且是彼此的字母異位詞。
所以可以採用如下方法:

同時遍歷兩個字串
如果其中不相等的字元恰好是兩個
那麼就說明他們只有兩位字母發生了互換
他們滿足相似字元的條件
輸出True
反之則不滿足返回False

在這裡可以通過交換字串數大於2break迴圈判斷
增加執行效率

利用並查集判斷組的個數

先初始化一個並查集加入所有節點

之後運用兩層for迴圈
第二層為第一層中字串往後的所有字串

只要滿足字串相等或者滿足相似字串條件
將兩個字串的對應節點合併

利用並查集輸出連通分量數即為結果

可以通過先判斷節點是否連線增加執行效率
對於已經連線的無需連線
對於未連線的進行連線

Code

class UnionFind:
    def __init__(self, n):
        self.father = list(range(n))
        self.size = [1] * n
        # 當前連通分量數目
        self.setCount = n
    
    def find(self, x):
        if self.father[x] == x:
            return x
        self.father[x] = self.find(self.father[x])		
        return self.father[x]

    
    def merge(self, x, y):
        x, y = self.find(x), self.find(y)
        if x == y:
            return False
        if self.size[x] < self.size[y]:
            x, y = y, x
        self.father[y] = x
        self.size[x] += self.size[y]
        self.setCount -= 1
        return True
    
    def is_connected(self, x, y):
        return self.find(x) == self.find(y)


class Solution:
    def numSimilarGroups(self, strs: List[str]) -> int:
        def is_similar(A, B):
            n = len(A)
            diff = 0

            for i in range(n):
                if A[i] != B[i]: 
                    diff += 1
                if diff > 2:
                    break
            return diff == 2

        m = len(strs)
        uf = UnionFind(m)

        for j in range(m):
            for z in range(j + 1, m):
                if not uf.is_connected(j, z):
                    if strs[j] == strs[z] or is_similar(list(strs[j]), list(strs[z])):
                        uf.merge(j, z)
        
        return uf.setCount

Result

在這裡插入圖片描述