1. 程式人生 > >python利用交集計算詞類標籤的分類

python利用交集計算詞類標籤的分類

在詞分類中經常有以下標籤:
'ab','ba','','13','1','3','bc3','ab24'
那麼,如何將這些標籤歸入各標籤的子類中呢?

mystr=['ab','ba','','13','1','3','bc3','ab24']
myl=dict()
for k1 in mystr:
    for k2 in mystr:
        if len(set(k1).intersection(k2))==len(set(k1)) :
            myl.setdefault(k1,[]) 
            myl[k1].append(k2)
print(myl)

{'ab': ['ab', 'ba', 'ab24'], 'ba': ['ab', 'ba', 'ab24'], '': ['ab', 'ba', '', '13', '1', '3', 'bc3', 'ab24'], '13': ['13'], '1': ['13', '1'], '3': ['13', '3', 'bc3'], 'bc3': ['bc3'], 'ab24': ['ab24']}