1. 程式人生 > >通過命令查詢檔案中出現頻率最高的前K個詞

通過命令查詢檔案中出現頻率最高的前K個詞

 使用linux命令或者shell實現:檔案words存放英文單詞,格式為每行一個英文單詞(單詞可以重複),統計這個檔案中出現次數最多的前10個單詞。

cat words.txt | sort | uniq -c | sort -k1,1nr | head -10

  主要考察對sort、uniq命令的使用,相關解釋如下,命令及引數的詳細說明請自行通過man檢視,簡單介紹下以上指令各部分的功能:

sort:  對單詞進行排序

uniq -c:  顯示唯一的行,並在每行行首加上本行在檔案中出現的次數

sort -k1,1nr:  按照第一個欄位,數值排序,且為逆序

head -10:

  取前10行資料


grep 查詢然後查詢awk寫到一個檔案裡邊追加

</article>