linux 的grep操作以及Linux自帶wc命令
使用spark進行wordcount後可以通過Linux自帶的wc命令進行驗證
比如 spark命令是求出某個文件中spark的數量 使用wc驗證 grep spark README.md | wc 求出README.md中spark的數量
下面介紹一下用到的grep 和 wc命令
grep (global search regular expression(RE) and print out the line,全面搜尋正則表示式並把行打印出來)
[[email protected]~]# grep [-acinv] [--color=auto] '搜尋字串' filename 選項與引數: -a :將 binary 檔案以 text 檔案的方式搜尋資料 -c :計算找到 '搜尋字串' 的次數 -i :忽略大小寫的不同,所以大小寫視為相同 -n :順便輸出行號 -v :反向選擇,亦即顯示出沒有 '搜尋字串' 內容的那一行! --color=auto :可以將找到的關鍵詞部分加上顏色的顯示喔
Linux系統中的wc(Word Count)命令的功能為統計指定檔案中的位元組數(-c)、字數(-w)、行數(-l),並將統計結果顯示輸出。
預設分別輸出 檔案的行數、單詞數、位元組數
相關推薦
linux 的grep操作以及Linux自帶wc命令
使用spark進行wordcount後可以通過Linux自帶的wc命令進行驗證 比如 spark命令是求出某個文件中spark的數量 使用wc驗證 grep spark README.md | wc 求出README.md
1.linux使用自帶的命令執行spoon寫好的job命令以及效能調優策略
1. [[email protected] data_integration]# nohup ./kitchen.sh /file file/desktopstatistics.kjb &[1] 16537 [[email protected] data_integrat
LINUX RedHat6.4卸載自帶JDK及安裝新的JDK
卸載 oot home local version pro tools.jar java版本 clas 1、查看系統當前Java版本: [root@localhost /]$ java -version 2、查看當前java編譯器及卸載: [root@localhost /
Linux CentOS 6.5 使用自帶jdk修改環境變量
all version x86_64 IE 安裝 ins art too 解壓 首先聲明,默認jdk指我們安裝完CentOS後系統自帶jdk,自己下載安裝的jdk只需要下載,解壓即可,之後步驟與此文一致 1.查看我們默認jdk的位置 指令: [html] view
Linux下對MySQL/MariaDB數據庫的基本操作以及linux mysql添加用戶,刪除用戶,以及用戶權限的授予
信息 查看 let quit mar 普通用戶 表名 mys xxxx 文章引用地址:https://www.cnblogs.com/Glory-D/p/7518541.html、https://www.cnblogs.com/zhchoutai/p/6929103.htm
linux下oracle常用操作以及linux基本操作
linux下檢視oracle中有多少個例項已經啟動了: ps -ef|grep smon echo命令可以檢視變數 echo $ORACLE_HOME看看目錄在哪 沒啟動的,只能去$ORACLE_HOME/dbs下面去數你有多少init檔案了。 oracle11g可以檢視
linux下怎麼解除安裝自帶的JDK和安裝想要的JDK
解除安裝 1、解除安裝用 bin檔案安裝的JDK方法: 刪除/usr/java目錄下的所有東西 2、解除安裝系統自帶的jdk版本方法: 檢視自帶的jdk: #rpm -qa | grep gcj 看到如下資訊: libgcj-4.1.2-44.el5 java
linux/windows下利用JDK自帶的工具獲取thread dump檔案和heap dump檔案
在上一篇部落格http://blog.csdn.net/aitangyong/article/details/24009283中介紹了dump的一些基本概念,這一篇部落格介紹如何在windows/li
(一)Linux基本操作-(1)Linux命令行基本操作
src 個數 .net 管理員 通過 虛擬 重復 以及 linux 聲明:本筆記內容為筆者自己整理. 數年之前在”Linuxcast”學習Linux,當時記錄了一份紙質版筆記,現在有意將其整理成電子版,供自己日後查閱以及分享. 感謝Linuxcast,感謝蘇勇(nash
flink安裝以及執行自帶wordcount示例(單機版,無hadoop環境)
1、下載安裝包到/opt目錄 2、解壓安裝包 tar zxf flink-1.6.1-bin-hadoop26-scala_2.11.tgz 3、啟動flink cd /opt/flink-1
HttpClient的使用以及jdk自帶URLConnection的使用
使用HttpClient連線服務端的步驟: 1.建立HttpClient客戶端物件 HttpClient client = new DefaultHttpClient(); 2.建立請求物件 1.1 GET請求 HttpUriRequest request = new Ht
linux基礎指令以及Linux環境下的重要目錄
學習Linux就像學習英語一樣,熟練掌握Linux指令,就像學習英語單詞一樣。只有學習好英語單詞,才有可能會寫出英語文章,會做英語翻譯。那麼同樣,只有掌握了Linux的基礎指令,才能在Linux環境下進行網路程式設計,才能很好的熟悉新環境Lin
unity自定義巨集定義以及常用自帶的巨集定義
如下是系統有的巨集, //如果你的平臺已經被你switch platform 你的那個平臺過後,對應的輸出列印是彩色的,否則是灰色的 #if UNITY_IPHONE Debug.Log("UNITY_IPHONE"); #elif UNITY_ANDROI
centos7下安裝docker(17docker監控---docker自帶監控命令)
img 數據 spa 查看 監控 pan top 可用 mage Docker自帶的監控子命令 1.docker ps;docker ps -a這是我們常用的查看容器狀態的命令 docker container ls和docker ps的功能一樣 2.docker to
xampp自帶mysql命令深入分析MySQL ERROR 1045 (28000)
erro 內存 輸入 多個 mysql pro div 登錄 組成 在命令行輸入mysql -u root –p,輸入密碼,或通過工具連接數據庫時,經常出現下面的錯誤信息,詳細該錯誤信息很多人在使用MySQL時都遇到過。 ERROR 1045 (28000): Access
Mac 自帶git 命令使用--(總結筆記)
1.先在GitHub上建立repository,取名為AAAAA。 然後通過git pull命令可以下拉到本地,【cd ~/】當前使用者根目錄,,進入一目錄之後,使用git pull url 進行下拉專案。 注意:若已經pull過該專案,且不確認是不是會引起衝突,另當別論。 git pull
JDK自帶的命令列工具
一、jps:JVM Process Status Tool,顯示指定系統內所有的虛擬機器程序。 jps的用法: jps工具主要選項: -q:只輸出JVMID,省略主類的名稱 -m:輸出虛擬機器程序啟動時傳遞給主類main()函式的引數 -l:輸出主類的全名,如果
JDK自帶的命令列工具有哪些?
在JDK的bin目錄下包含了很多功能強大的命令列工具,它們的主要功能程式碼都是在jdk/lib/tools.jar中實現的。下面一一介紹這些命令列工具。 jps jps是JVM Process Status Tool的簡稱,用於顯示指定系統內所有的Hot
Mac 自帶ftp命令
FTP的命令列格式為:ftp -v -d -i -n -g [主機IP或者主機名],其中 -v顯示遠端伺服器的所有響應資訊; -n限制ftp的自動登入,即不使用; .n etrc檔案; -d使用除錯方式; -g取消全域性檔名。 ftp使用的內部命令如下(中括號表
Emacs自帶輸入法命令說明
* C-x RET C-\ 輸入法名 RET (set-input-method)為當前的buffer選擇一個新的輸入法* C-\ (toggle-input-method)開啟/禁用所選擇的輸入法,類似window下的Ctrl-Space* C-h I 輸入法 RET