力扣 leetcode 839. 相似字串組 (python)
技術標籤:pythonleetcode字串列表pythonleetcode演算法
Topic
如果交換字串 X 中的兩個不同位置的字母,使得它和字串 Y 相等,那麼稱 X 和 Y 兩個字串相似。如果這兩個字串本身是相等的,那它們也是相似的。
例如,“tars” 和 “rats” 是相似的 (交換 0 與 2 的位置); “rats” 和 “arts” 也是相似的,但是 “star” 不與 “tars”,“rats”,或 “arts” 相似。
總之,它們通過相似性形成了兩個關聯組:{“tars”, “rats”, “arts”} 和 {“star”}。注意,“tars” 和 “arts” 是在同一組中,即使它們並不相似。形式上,對每個組而言,要確定一個單詞在組中,只需要這個詞和該組中至少一個單詞相似。給你一個字串列表 strs。列表中的每個字串都是 strs 中其它所有字串的一個字母異位詞。請問 strs 中有多少個相似字串組?
Example_1
輸入:strs = [“tars”,“rats”,“arts”,“star”]
輸出:2
Example_2
輸入:strs = [“omv”,“ovm”]
輸出:1
Tips
1 <= strs.length <= 100
1 <= strs[i].length <= 1000
sum(strs[i].length) <= 2 * 104
strs[i] 只包含小寫字母。
strs 中的所有單詞都具有相同的長度,且是彼此的字母異位詞。
Solution
用字典實現並查集和用列表實現並查集均可
但用列表實現並查集可以減少一個迴圈的使用,更推薦列表法
首先既然要判斷相似字串組的個數
那麼如何判斷字串是否相似就是難點
判斷字串是否相似
設計一個is_similar函式判斷兩個字串是否相等
由於題目中說明了strs 中的所有單詞都具有相同的長度,且是彼此的字母異位詞。
所以可以採用如下方法:
同時遍歷兩個字串
如果其中不相等的字元恰好是兩個
那麼就說明他們只有兩位字母發生了互換
他們滿足相似字元的條件
輸出True
反之則不滿足返回False
在這裡可以通過交換字串數大於2break迴圈判斷
增加執行效率
利用並查集判斷組的個數
先初始化一個並查集加入所有節點
之後運用兩層for迴圈
第二層為第一層中字串往後的所有字串
只要滿足字串相等或者滿足相似字串條件
將兩個字串的對應節點合併
利用並查集輸出連通分量數即為結果
可以通過先判斷節點是否連線增加執行效率
對於已經連線的無需連線
對於未連線的進行連線
Code
class UnionFind:
def __init__(self, n):
self.father = list(range(n))
self.size = [1] * n
# 當前連通分量數目
self.setCount = n
def find(self, x):
if self.father[x] == x:
return x
self.father[x] = self.find(self.father[x])
return self.father[x]
def merge(self, x, y):
x, y = self.find(x), self.find(y)
if x == y:
return False
if self.size[x] < self.size[y]:
x, y = y, x
self.father[y] = x
self.size[x] += self.size[y]
self.setCount -= 1
return True
def is_connected(self, x, y):
return self.find(x) == self.find(y)
class Solution:
def numSimilarGroups(self, strs: List[str]) -> int:
def is_similar(A, B):
n = len(A)
diff = 0
for i in range(n):
if A[i] != B[i]:
diff += 1
if diff > 2:
break
return diff == 2
m = len(strs)
uf = UnionFind(m)
for j in range(m):
for z in range(j + 1, m):
if not uf.is_connected(j, z):
if strs[j] == strs[z] or is_similar(list(strs[j]), list(strs[z])):
uf.merge(j, z)
return uf.setCount