VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

阿新 • • 發佈：2019-01-27

執行WordCount作業

步驟：

進入hadoop目錄，刪除input目錄和output目錄（如果有）；

啟動hdfs系統，ResourceManager和NodeManager。

$cd /usr/hadoop-2.7.2

$sbin/start-dfs.sh

$sbin/start-yarn.sh

在/usr/hadoop-2.7.2中新建目錄userData，userData記憶體放兩個文字檔案file1.txt和file2.txt。

$cat userData/file1.txt

Hello world.

Bye world.

$ cat userData/file2.txt

Hello Hadoop.

Bye Hadoop.

重建hdfs內的input目錄（如果有）。

$ bin/hadoop fs -ls -R .

如果input目錄為空，則可用rmdir刪除它：

$ bin/hadoop fs -rmdir ./input

如果output目錄不為空，則用rm的遞迴選項刪除它：

$ bin/hadoop fs -rm -R ./output

在hdfs內新建input目錄。

$ bin/hadoop fs -mkdir ./input

將userData內的file1.txt和file2.txt兩個檔案上傳到HDFS

中的input目錄

$ bin/hadoop fs -putuserData/file1.txt ./input

$ bin/hadoop fs -put userData/file2.txt ./input

$ bin/hadoop fs -ls -R .

drwxr-xr-x - hadoopsupergroup 0 2016-05-02 12:07input

-rw-r--r-- 1 hadoopsupergroup 24 2016-05-02 12:06 input/file1.txt

-rw-r--r-- 1 hadoopsupergroup 27 2016-05-02 12:07input/file2.txt

執行hadoop自帶的WordCount程式，統計單詞數

$cd /usr/hadoop-2.7.2/share/hadoop/mapreduce

$/usr/hadoop-2.7.2/bin/hadoop jar hadoop-mapreduce-examples-2.7.2.jarwordcount ./input ./output

輸出資訊：略

$ cd /usr/hadoop-2.7.2

$ bin/hadoop fs -ls -R .

drwxr-xr-x - hadoopsupergroup 0 2016-05-02 12:07input

-rw-r--r-- 1 hadoopsupergroup 24 2016-05-02 12:06input/file1.txt

-rw-r--r-- 1 hadoopsupergroup 27 2016-05-02 12:07 input/file2.txt

drwxr-xr-x - hadoopsupergroup 0 2016-05-02 12:11output

-rw-r--r-- 1 hadoopsupergroup 0 2016-05-02 12:11output/_SUCCESS

-rw-r--r-- 1 hadoopsupergroup 33 2016-05-02 12:11 output/part-r-00000

檢視執行結果：

$ bin/hadoop fs -cat ./output/part-r-00000

Bye 2

Hadoop. 2

Hello 2

world. 2

可見單詞統計正確！

VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

執行WordCount作業步驟：進入hadoop目錄，刪除input目錄和output目錄（如果有）；啟動hdfs系統，ResourceManager和NodeManager。 $cd /usr/hadoop-2.7.2 $sbin/start-dfs.sh $s

Python全棧開發之路【第八篇】：面向對象編程設計與開發（2）

ssi pen 解析執行示例動態類型 put 所有一、繼承與派生什麽是繼承？繼承指的是類與類之間的關系，是一種什麽是什麽的關系，繼承的功能之一就是用來解決代碼重用問題。繼承是一種創建新的類的方式，在python中，新建的類可以繼承一個或多個父類，父類又可以成

Spring Cloud 基於Spring Boot 2.x的服務註冊與發現（Eureka）

一.Spring Cloud 簡介 Spring Cloud為開發人員提供了快速構建分散式系統中一些常見模式的工具（例如配置管理，服務發現，斷路器，智慧路由，微代理，控制匯流排，一次性令牌，全域性鎖定，領導選舉，分散式會話，群集狀態）。分散式系統的協調導致鍋

[CentOS 7系列]壓縮與打包（下）

linux windows 壓縮文件壓縮包除了gzip、bzip2和xz外，linux中還有一款壓縮軟件。它支持壓縮目錄，也可以解壓windows中同類型的文件。它就是我們熟悉的zip。1、zip命令作用zip 1.txt.zip 1.txt壓縮zip -r 123.zip

CentOS7安裝hadoop2.7.2 實現偽分散式測試成功（親測教程）

CentOS7安裝hadoop2.7.2 實現偽分散式測試成功（親測教程） CentOS7安裝hadoop2.7.2 實現偽分散式測試成功（親測教程）經過幾天的嘗試，終於在CentOS7下安裝hadoop，實現偽分散式，並且測試成功現在簡要的回訴一篇，以方便記憶

Hadoop 2.7.0在centos7分散式叢集上的部署與測試

Author: Wingter Wu 1 環境說明 VitualBox 5.0.24 CentOS-7-x86_64-Minimal-1611：http://isoredirect.centos.org/centos/7/isos/x86_64/CentOS-7-x86_6

虛擬機器安裝spark2.2+hadoop2.7.3

安裝VisualBox和作業系統官網下載VisualBox安裝檔案.並安裝。 ubuntu官網下載最新版本得ubuntu安裝檔案。 visualBox新建64位ubuntu,並啟動虛擬機器。跟著提示選擇ubuntu安裝檔案，就可以很順利的裝好系統了。

Sonar6.0基於centos7.2安裝與使用（一）

Sonar是一個用於程式碼質量管理的開源平臺，用於管理原始碼的質量，可以從多個維度檢測程式碼質量，通過外掛形式，可以支援包括java,C#,C/C++,PL/SQL,Cobol,JavaScrip,Groovy等等二十幾種程式語言的程式碼質量管理與檢測。 Son

第7課列表初始化（2）_分析initializer_list<T>的實現

定義找到 code 元素 arr except 等價地址 -a 1. 初始化列表的實現（1）當編譯器看到{t1,t2…tn}時便會生成一個initializer_list<T>對象（其中的T為元素的類型），它關聯到一個array<T,n>。（

安裝Loadrunner 11.0時，彈出缺少2.8 sp1組件--解決方案（win7）

pos OS node 運行分享 mac 進入 sta load 這是因為註冊表缺少FullInstallVer和Version，歸根到底是madc安裝的的問題以下是解決方法： 1.運行regedit，打開註冊表，進入HKEY_LOCAL_MACHINE\SOFTWAR

2018-4-27 18周2次課分發系統-expect講解（下）

expect20.31 expect腳本同步文件·自動同步文件[root@localhost sbin]# chmod a+x 4.expect [root@localhost sbin]# ./4.expect spawn rsync -av [email protected]:/tmp/12.txt

阿裏雲 centos7 64位搭建JAVA環境-----安裝JDK（2）

命令是什麽 vim 文件解壓縮 inf exp ima 發現 mysql安裝好以後，把jdk環境配置一下。首先下載jdk 8，在官網下載。找到鏈接 http://download.oracle.com/otn-pub/java/jdk/8u171-b11/51

Centos7 安裝hadoop2.7.3和jdk1.8

配置 tin source 沒有 https prope font col 配置環境變量下載好hadoop和jdk軟件包，傳到虛擬機上第一步：安裝jdk並配置環境變量解壓 tar -xvf 配置環境變量 vim /etc/profile #set ja

第7章網路層協議（2）_ICMP協議

2. ICMP協議 2.1 ICMP報文（Internet Control Message Protocol）的型別報文型別型別值程式碼描述請求報文 8 0

CentOS7安裝Hadoop2.7.3完整步驟

1.環境，3臺CentOS7，64位，Hadoop2.7需要64位Linux，CentOS7 作業系統二十分鐘就可以安裝完成， Master 192.168.1.32 Slave1 192.168.1.33 Slave2 192.168.1.31 2.(1

Android studio3.0對於百度地圖api開發（2）——百度地圖定位指定地點以及地圖型別的變換

承接上一篇文章寫的，https://blog.csdn.net/qq_41562408/article/details/82794772已經實現了百度地圖的工具準備以及基本的地圖顯示，不過就一個地圖應用來說，只是單純的顯示一種地圖型別以及只是能夠定位到天安門其他地

itext-2.1.7.jar和itextasian-1.5.2.jar 在 maven 專案依賴不上。問題解決。

問題描述：java 匯出 PDF 檔案遇到報錯 Exception in thread "main" com.lowagie.text.DocumentException: Font 'STSong-Light' with 'UniGB-UCS2-H' is not recognized

CentOS 7.2 配置Apache服務（httpd）--上篇

一、Apache簡介 Apache HTTP Server（簡稱Apache）是Apache軟體基金會的一個開放原始碼的網頁伺服器軟體，可以在大多數電腦作業系統中執行，由於其跨平臺和安全性（儘管不斷

CentOS7安裝Hadoop2.7.3完整流程及總結

一、前言配置一臺master伺服器，兩臺（或多臺）slave伺服器; master可以無密碼SSH登入到slave; 解除安裝centos7自帶的openjdk,通過SecureCRT的rz命令上傳jdk-7u79-linux-x64.tar.gz檔案到伺

CentOS7安裝Hadoop2.7完整步驟

我這邊給出我的叢集環境是由一臺主節點master和三臺從節點slave組成： master 192.168.1.2 slave1 192.168.1.3 slave2 192.168.1.4 slave3 192.168.1.5 申明：我搭建的這個叢集不是在普通使

VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

執行WordCount作業

相關推薦