1. 程式人生 > >shell/bash 交集、並集、差集

shell/bash 交集、並集、差集

方法一(直接用檔名):取兩個文字檔案的並、交、差集
並:

sort -m <(sort file1 | uniq) <(sort file2 | uniq) | uniq


交:

sort -m <(sort file1 | uniq) <(sort file2 | uniq) | uniq -d


 file1 - file2:


sort -m <(sort file1 | uniq) <(sort file2 | uniq) <(sort file2 | uniq) | uniq -u

方法二(用變數引數):取兩個文字檔案的並

、交、差集

file1=XXXX

file2=YYYY


並:

sort -m <(sort $file1 | uniq) <(sort $file2 | uniq) | uniq


交:

sort -m <(sort $file1 | uniq) <(sort $file2 | uniq) | uniq -d


 file1 - file2:


sort -m <(sort $file1 | uniq) <(sort $file2 | uniq) <(sort $file2 | uniq) | uniq -u

方法三:

file1=XXXX

file2=YYYY

並:

cat $file1 $file2 | sort | uniq

交:

cat $file1 $file2 | sort | uniq -d

備註:

uniq -d 會輸出重複行

uniq -u 只顯示唯一的行

grep命令

grep命令是常用來搜尋文字內容的,根據輸入的pattern,輸出命中的內容。可以利用它的檔案輸入pattern特性,來求兩個檔案的交集。

$ 
c
d
e

那差集可以利用-v這個引數,例如:

$ grep -F -v -f a.file b.file
f
g

$ grep -F -v -f b.file a.file
a
b

其中第一個命令求B-A,第二個命令求A-B

注意:

1)grep求交集不要求輸入檔案是排序的,但最好是唯一的

2)差集時注意輸入檔案的順序