使用uniq命令求並集交集差集

阿新 • • 發佈：2022-03-26

原創：打碼日記（微信公眾號ID：codelogs），歡迎分享，轉載請保留出處。

uniq

uniq是linux上非常有用的一個命令，從字面意思上就能看出來，它可以用來去重。
但使用uniq的前提是檔案是排好序的，所以我們經常會搭配sort排序命令來一起使用uniq，如下：

$ cat test.txt
c 
a 
a
b 

$ sort test.txt | uniq
a
b
c

# sort -u 也能去重
$ sort -u test.txt
a
b
c

如上所示，由於sort -u也能達到去重的效果，導致uniq的原本功能就顯得不那麼有用了。
其實經常會發現這樣的linux命令，衍生功能比原始功能更有用，比如wc

命令，全名是word count，即單詞計數，但我們最常用的卻是wc -l獲取行數。
與wc一樣，uniq的衍生功能也比原始去重功能要有用得多，如下：

分組計數uniq -c

$ sort test.txt | uniq -c
      2 a
      1 b
      1 c

-c選項可以統計每個值的個數，超級有用，還有下面這個按狀態統計TCP連線數的。

$ netstat -nat|awk '/tcp/{print $NF}'|sort|uniq -c
      4 CLOSE_WAIT
      6 ESTABLISHED
      2 LAST_ACK
      2 LISTEN

求並集

$ cat test1.txt
c 
a 
b 

$ cat test2.txt
c
b
d

$ cat test1.txt test2.txt |sort |uniq 
a
b
c
d

很顯然，兩個檔案合併後，再去重，就是並集了。

求交集

$ cat test1.txt test2.txt | sort | uniq -d
b
c

-d選項的作用是隻輸出有重複的項，顯然，兩個檔案合併，重複項就是交集。

求差集

$ cat test1.txt test2.txt test2.txt| sort | uniq -u 
a

-u選項的作用是隻輸出唯一的項，顯然，如果test2.txt

中的項在text1.txt中也存在，這一項就不會輸出，另外，為了讓test2.txt的內容不輸出，故意讓其cat了兩次。

comm

comm命令可以更直觀的求並集，交集與差集，同樣，交給comm處理的資料，也要事先排好序，如下：

$ comm <(sort -u test1.txt) <(sort -u test2.txt)
a
                b
                c
        d

<()是bash下的命令替換語法，它類似於生成一個臨時虛擬檔案，且檔案內容就是命令的輸出內容。
如上，第一列是test1.txt減test2.txt的差集，第二列是test2.txt減test1.txt的差集，第三列就是交集。
如果只想要交集，可使用comm -1 -2或comm -12，-1 -2表示不顯示第一列與第二列，同理-3就是不顯示第三列。
啥，你說它沒有並集？看下面，用tr把空白刪掉就好了嘛！

$ comm <(sort -u test1.txt) <(sort -u test2.txt)|tr -d '\t'
a
b
c
d

往期內容

mysql的timestamp會存在時區問題？
hex,base64,urlencode編碼方案對比
 字元編碼解惑
 真正理解可重複讀事務隔離級別
 Linux文字命令技巧(下)
Linux文字命令技巧(上)

使用uniq命令求並集交集差集

原創：打碼日記（微信公眾號ID：codelogs），歡迎分享，轉載請保留出處。 uniq

基於python求兩個列表的並集.交集.差集

這篇文章主要介紹了基於python求兩個列表的並集.交集.差集,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

【Set】Set集合求並集,交集,差集

/** * @author: Sam.yang * @date: 2020/11/16 11:14 * @desc: Set集合操作工具類 */ public class SetOptUtils {

PHP陣列並集交集差集

並集 array_merge 字串鍵名相同，後面覆蓋前面，數字鍵名會在後面追加，不覆蓋，參考程式碼如下

JAVA——兩個List集合求交集、並集和差集（去重）模板

關注微信公眾號：CodingTechWork，一起學習進步。引言經常遇到一些集合類之間的過濾資料、求合集之類的問題，在此以List為例，畢竟在資料庫中取資料後，我們使用比較多的是List集合進行操作。

Scala中求List集合的交集，並集，差集

技術標籤：其他scala object liu { def main(args: Array[String]): Unit = { val a1=List(5,6,4,7) val a2=List(1,2,3,5)

java求兩個集合的交集,並集和差集

1 //求兩個集合的交集,並集和差集 2 package classwork9; 3 4 import java.util.ArrayList; 5 import java.util.Collection;

python 求兩個列表的交集，並集，差集

技術標籤：pythonpython列表 a = [1, 5, 8, 9, 6] b = [2, 1, 8, 6, 9, 3, 7] print(\'求兩個列表的交集intersection:\', list(set(a).intersection(set(b))))# 求兩個列表的交集

第五章_Spark核心程式設計_Rdd運算元_2value_求交集&並集&差集&拉鍊_intersection&union&subtract&zip

1. 求交集-intersection object intersectionTest extends App { /* * 1. 定義 *def intersection(other: RDD[T]): RDD[T]

JS 求交集，並集，差集，子集 forEach和es6兩種方法

1.並集:[A B C R U ] let set111 = new Set([\"A\", \"B\", \"C\"]) let set222 = new Set([\"A\", \"R\", \"U\"])

C# Linq 交集、並集、差集、去重

其實只要明白 LINQ查詢操作符的 Distinct、Union、Concat、Intersect、Except、Skip、Take、SkipWhile、TakeWhile、Single、SingleOrDefault、Reverse、SelectMany,Aggregate()(這個挺偏的，具體意思有空再寫，可以

【python--集合】增刪改交集差集並集反交集子集和超集

# dic = {} print(type(dic)) se = {} print(type(se)) se = set() print(type(se)) # # # 建立空集合 se = set()

CollectionUtils取交集,並集和差集

import org.apache.commons.collections.CollectionUtils; <dependency> <groupId>commons-collections</groupId>

java 8兩個List集合取交集、並集、差集、去重並集

public class ListTest { public static void main(String[] args) { ArrayList<String> listA = CollectionUtil.toList(\"a\", \"b\", \"c\", \"d\", \"e\");

兩個List集合取交集、並集、差集

兩個List集合取交集、並集、差集業務場景：根據使用者查詢許可權，入參：UserCode，lastQueryTime（上次查詢時間），出參：許可權變化的列表。 oldList（上次查詢到的許可權列表），currList（當前查詢到的許可權列

map集合取並集，差集，交集

map集合取並集，差集，交集前段時間需要用到取兩個集合的並集，差集，交集，在這貼下程式碼記錄一下

常見陣列list處理方法（交集，並集，差集，去重）

let list = [ { id: \"1\", content: \"A\" }, { id: \"2\", content: \"B\" }, { id: \"3\", content: \"C\" }, { id: \"4\",

sql server 交集,差集的用法詳解

概述為什麼使用集合運算：　　在集合運算中比聯接查詢和EXISTS/NOT EXISTS更方便。

使用 java stream 獲取兩個集合之間的交集.差集

原始物件 List<HrProbationMainPO> hrProbationMainList =newArrayList<HrProbationMainPO>();

集合取交集差集

//1.利用java8特性 public static void main(String[] args) { List list1 = new ArrayList(); list1.add(\"1\");

使用uniq命令求並集交集差集

uniq

分組計數uniq -c

求並集

求交集

求差集

comm

往期內容

相關推薦