實驗樓 簡單的文本處理
阿新 • • 發佈:2017-08-16
大小寫 去除 重復 sudo 指定 兩個文件 strong 符號 信息
文本處理命令
tr 命令
tr 命令可以用來刪除一段文本信息中的某些文字。或者將其進行轉換
選項 | 說明 |
---|---|
-d |
刪除和set1匹配的字符,註意不是全詞匹配也不是按字符順序匹配 |
-s |
去除set1指定的在輸入文本中連續並重復的字符 |
# 刪除 "hello shiyanlou" 中所有的‘o‘,‘l‘,‘h‘
$ echo ‘hello shiyanlou‘ | tr -d ‘olh‘
# 將"hello" 中的ll,去重為一個l
$ echo ‘hello‘ | tr -s ‘l‘
# 將輸入文本,全部轉換為大寫或小寫輸出
$ cat /etc/passwd | tr ‘[:lower:]‘ ‘[:upper:]‘
# 上面的‘[:lower:]‘ ‘[:upper:]‘你也可以簡單的寫作‘[a-z]‘ ‘[A-Z]‘,當然反過來將大寫變小寫也是可以的
col 命令
col 命令可以將Tab
換成對等數量的空格鍵,或反轉這個操作。
選項 | 說明 |
---|---|
-x |
將Tab 轉換為空格 |
-h |
將空格轉換為Tab (默認選項) |
# 查看 /etc/protocols 中的不可見字符,可以看到很多 ^I ,這其實就是 Tab 轉義成可見字符的符號
$ cat -A /etc/protocols
# 使用 col -x 將 /etc/protocols 中的 Tab 轉換為空格,然後再使用 cat 查看,你發現 ^I 不見了
$ cat /etc/protocols | col -x | cat -A
join命令
用於將兩個文件中包含相同內容的那一行合並在一起。
選項 | 說明 |
---|---|
-t |
指定分隔符,默認為空格 |
-i |
忽略大小寫的差異 |
-1 |
指明第一個文件要用哪個字段來對比,,默認對比第一個字段 |
-2 |
指明第二個文件要用哪個字段來對比,,默認對比第一個字段 |
# 創建兩個文件
$ echo ‘1 hello‘ > file1
$ echo ‘1 shiyanlou‘ > file2
$ join file1 file2
# 將/etc/passwd與/etc/shadow兩個文件合並,指定以‘:‘作為分隔符
$ sudo join -t‘:‘ /etc/passwd /etc/shadow
# 將/etc/passwd與/etc/group兩個文件合並,指定以‘:‘作為分隔符, 分別比對第4和第3個字段
$ sudo join -t‘:‘ -1 4 /etc/passwd -2 3 /etc/group
paste命令
paste
這個命令與join
命令類似,它是在不對比數據的情況下,簡單地將多個文件合並一起,以Tab
隔開。
選項 | 說明 |
---|---|
-d |
指定合並的分隔符,默認為Tab |
-s |
不合並到一行,每個文件為一行 |
$ echo hello > file1
$ echo shiyanlou > file2
$ echo www.shiyanlou.com > file3
$ paste -d ‘:‘ file1 file2 file3
$ paste -s file1 file2 file3
輕松一下
ninvaders
作業
手動完成 dos 文本格式到 UNIX 文本格式的轉換
cat file1 | tr ‘\r\n:^M$‘ ‘\n:$‘ | > file2
實驗樓 簡單的文本處理