YARN提交任務作業（以wordcount樣例程式為例）

阿新 • • 發佈：2019-01-11

前提

已經搭建好Hadoop環境。

向YARN提交wordcount任務

1、首先在HDFS建立輸入檔案目錄，並將待處理的wordcount檔案傳入相應的輸入檔案目錄。

# 建立輸入檔案目錄
hadoop fs -mkdir -p /tmp/jbw/wordcount_input_dir

# 將待處理的檔案上傳至對應目錄
hadoop fs -put /mnt/disk1/linken_speech.txt /tmp/jbw/wordcount_input_dir
hadoop fs -ls /tmp/jbw/wordcount_input_dir

這裡寫圖片描述

2、執行Hadoop的woedcount樣例程式（向YARN提交作業）

引數中指定jar執行檔案、輸入資料目錄（需要先建立好，並將待處理文字上傳至其中）、輸出目錄（無需建立，由樣例程式自己生成）。

hadoop jar hadoop/bin/hadoop-mapreduce-examples.jar wordcount /tmp/jbw/wordcount_input_dir /tmp/jbw/wordcount_output_dir

執行過程如下圖，可以看到wordcount執行過程會分map和reduce兩個階段。
這裡寫圖片描述

3、檢視執行結果

在HDFS的輸出檔案目錄下檢視是否有結果檔案，並檢視。

hadoop fs -ls /tmp/jbw/wordcount_output_dir
hadoop fs -cat 
 /tmp/jbw/wordcount_output_dir/part-r-00000

這裡寫圖片描述
結果如下，可以看到每個單詞的出現次數已經被統計出來：

Kill掉YARN上的某個任務

我們可以kill掉提交給YARN上的任何執行中的任務。這裡以大資料基準測試TPC造資料作為向YARN提交的任務。關於TPC，它其實會生成大量不同數量級別的用於測試大資料平臺效能的標準測試資料。這裡選它的原因是它造大量資料的時間比較長，我們有充分的時間可以kill掉它。

解壓tpcds-5.x.tar.gz檔案，進入bin目錄執行./gen-date.sh：

tar -zxvf tpcds-5.x.tar.gz
cd tpcds/bin
# 生成資料 

./gen-date.sh

過程如下：
這裡寫圖片描述

現在我們看一下YARN上有哪些執行的作業，並檢視狀態：

yarn application -list
# 根據任務ID檢視任務狀態
yarn application -status application_1528449227004_0002

這裡寫圖片描述

指定任務ID，kill掉它

yarn application -kill application_1528449227004_0002

這裡寫圖片描述

YARN提交任務作業（以wordcount樣例程式為例）

前提已經搭建好Hadoop環境。向YARN提交wordcount任務 1、首先在HDFS建立輸入檔案目錄，並將待處理的wordcount檔案傳入相應的輸入檔案目錄。 # 建立輸入檔案目錄 hadoop fs -mkdir -p /tmp/jb

Linux系統下的vi編輯器的使用（以VMware下的Ubuntu64為例）

linux系統編輯器一般模式 ubuntu虛擬機 vi編譯器上午花費一些時間學習vi編輯器，下面把學習的一些經驗記錄在這篇博文中。 vi編輯器是Linux系統下的基本編譯器，工作在字符模式，是一個很高效的文本編譯器，它在系統和服務器管理上的功能是普通的圖形編譯器所不能夠

Linux下command not found（以CentOS下沒有telnet為例）

裏的 linu com ins net 文件 bsp netd mman [[email protected]/* */ ~]# telnet bash: telnet: command not found rpm -qa telnet* //查詢是否安裝了

Mac 創建證書（以創建gdb證書為例）

pick 1-1 src for png b- num iat alt open /Applications/Utilities/Keychain\ Access.app/ 打開鑰匙串訪問繼續繼續創建完畢。 Now that we have a ce

MVC初級知識之二——Routing路由（以近乎產品源碼為例）

.cn load lan 下載地址路由 href targe eas bak 演示產品的代碼，開源去近乎官網下載近乎免費源碼版。下載地址：http://www.jinhusns.com/Uploads/Release/bak/jinhu_V5.2.0

Alfred 3 如何設置默認搜索引擎（以百度搜索為例）

今天 alfred width city search left 屏幕由於 -o 今天，由於收到UDACITY的微信新聞，關於使用Alfred 工具的介紹，所以一時興起，決定再把Alfred研究一下，以後再慢慢適應使用Alfred，結果花了近2個小時才總算把Alfred默

Unity的www網路下載類（以替換模型貼圖為例說明）

一、編寫給模型替換貼圖的指令碼 /*** * * Title: * 網路基礎 * * * Description: * 功能： * WWW 下載類的學習 * * Date: 20

雜記——controller的工作原理（以CSDN網站導航條為例）

最近初學springMVC，今天明白了controller和jsp之間聯絡的工作原理，於是記一個小筆記。先看一個程式碼下面是controller中的一個cookieBind方法 @RequestMapping(value="/cookiebind", method = {Reques

基於GDAL庫，讀取.grd文件（以海洋地形數據為例）C++版

的區別網站這一 eight null 配置 drag oat data 技術背景　　海洋地形數據主要是通過美國全球地形起伏數據（GMT）獲得，數據格式為grd（GSBG）二進制數據，打開軟件通過是Surfer軟件，surfer軟件可進行數據的編輯處理，以及進一步的可視

第三方介面呼叫案例（以阿里雲簡訊服務為例）

第三方介面或者服務大部分都是以rest風格的，需要http請求去呼叫，通過網路傳送請求去呼叫，然後等待第三方服務的響應，併發量多的話，會嚴重拖慢業務邏輯的處理速度。為了提高系統的效能，呼叫第三方服務，最好做成非同步的，如果條件允許，最好用單獨的伺服器，或者幾臺伺服器來做呼叫第三方介面，來提高業務邏輯

錯排問題（以航電OJ 2048 為例）

神、上帝以及老天爺 Problem Description HDU 2006’10 ACM contest的頒獎晚會隆重開始了！為了活躍氣氛，組織者舉行了一個別開生面、獎品豐厚的抽獎活動，這個活動的具體要求是這樣的：首先，所有參加晚會的人員都將一張寫有自己名字的字條放入抽獎箱中；

Selenium元素定位初探（以今日頭條首頁為例）

隨著網頁技術的發展，動態網頁的比例越來越高，原來抓取靜態網頁的許多方法變得不再適用；再加上越來越多的網站添加了各種複雜的反爬蟲策略，導致直接通過網路請求的方式去抓取頁面的方式已經有些落伍了。而Selenium可以通過模擬瀏覽器的真實行為來訪問網頁並將頁面原始碼快取下來，從而實現所見

基於GDAL庫，讀取.nc檔案（以海洋表溫資料為例）

　　對於做海洋資料處理的同學，會經常遇到nc格式的檔案，nc檔案的格式全稱是NetCDF，具體的詳細解釋請查詢官網【https://www.unidata.ucar.edu/software/netcdf/docs/index.html】，一般從全球大洋資料庫裡面下載的溫鹽、風場及雲量等資料，基本上是nc檔案

python爬蟲（以國家菸草網新聞為例）

國家菸草專賣局的網址是：http://www.tobacco.gov.cn/html/ 要爬取的內容為各省級局的新聞。大部分的省的新聞頁url都是有規律的，比如貴州省的是 http://www.tobacco.gov.cn/html/36/3617/36

ARM裸板程式的開發和編譯（以點亮LED燈為例）

製作好交叉編譯工具鏈後，怎麼確定是否有效呢，當然是編譯一個程式燒寫到板上跑一下了。這裡我們以點亮LED燈為例描述如何使用我們製作的交叉編譯工具鏈編譯裸板程式。首先，需要了解下Nor flash,Nand flash,片內記憶體，片外記憶體，地址空間這幾個概念。其中，Nor

安裝Windows和Linux雙系統方法（以Windows7和Ubuntu16.04為例）

用UltraISO製作Ubuntu 或 Debian 的U盤啟動盤後，在機器用U盤啟動時有時會報這個錯誤：failed to load ldlinux.c32 這是UltraISO的問題，需要換燒錄軟體，請換燒錄軟體： linux：mkusb windows

Chrome-逆向分析JS-2獲取傳送請求位置（以datatables獲取表格資料為例）

劇透：就是使用了一下Chrome Source的XHR/fetch Breakpoints 功能，在傳送請求時在該行進入斷點除錯。 # 一：不認識一下XHR/fetch Breakpoints 這個功能麼？可以去 https://developers.google.com/web/tools/chrome-

Alfred 3 如何設定預設搜尋引擎（以百度搜索為例）

前提條件： Alfred 3 已經安裝在MAC中首先要有破解的Alfred 3 安裝在MAC PRO中，然後進入到以下欄目：Features-->web Search-->Add Custom Search(根據以下圖來設定) ；注意：如果需要設定指定在百度中搜索內容，需要設

線上生成android應用程式初探（以線上生成EPUB電子書為例）

最近發現國內有的公司提供線上編輯並自動編譯生成android應用程式的產品。覺得有點意思，正好有幾個朋友老說需要epub格式的電子書，看了看android的SDK，自己業餘時間做了個線上生成apk電子書閱讀器和epub電子書的程式。近一週沒有看電視了，有必要把整個實現過程分

分散式架構學習之：013--基於Dubbo的分散式系統架構介紹（以第三方支付系統架構為例）

基於Dubbo的分散式應用架構規劃（以第三方支付系統為例）結合業務場景，對系統的應用型別進行劃分： (1) 服務子系統 ------ 賬戶、交易、對賬、結算、打款、風控…… (2) 內部管理應用

YARN提交任務作業（以wordcount樣例程式為例）

前提

向YARN提交wordcount任務

Kill掉YARN上的某個任務

相關推薦