Hadoop安裝配置、執行第一個WordCount示例程式

阿新 • • 發佈：2019-01-01

作業系統ubuntu。本篇目的是在單機模式下執行成功WordCount示例程式。

本篇小結安裝步驟，遇到的問題和解決辦法。

疑惑點及其思考。

Hadoop是為linux而開發的，所以開發hadoop程式，包括spark最好在linux環境下。目錄如下：

一：Hadoop執行環境安裝：

java1.6安裝配置

Hadoop使用者建立

SHH安裝及配置

二：安裝Hadoop 2.x

下載

安裝

配置

三：WordCount示例程式執行測試

建立input

拷貝檔案到input目錄

執行示例程式

檢視輸入目錄output

詳細過程如下：

一：Hadoop執行環境安裝：

java1.6安裝配置：

具體過程分為：下載Oracle JDK, 新建安裝目錄，解壓，配置環境變數，讓環境變數生效，檢驗java安裝結果。

下載：到官網下載linux版本的oracle JDK

新建目錄：命令mkdir

解壓檔案：命令tar -zxvf解壓檔案到新建目錄

配置環境變數：命令vim ~/.bashrc或者gedit　~/.bashrc修改配置檔案。新增安裝路徑JAVA_HOME等。

讓環境變數生效：命令source ~/.bashrc

檢驗安裝結果：命令java -version.能出現安裝java的版本資訊，則表示成功。

注意事項：linux系統預設安裝了openJDK，為了效能，個人還是建議刪除openJDK.到官網下載oracle JDK並安裝。

Hadoop使用者建立

建立Hadoop使用者：命令sudo useradd -m hadoop -s /bin/bash. 建立hadoop使用者，並使用bash作為shell.

設定密碼：命令sudo passwd hadoop.

新增hadoop使用者管理員許可權：命令sudo adduser hadoop su.

網上另一種方法是：命令sudo gedit /etc/sudoers.在開啟的檔案中在root All=(All:All)All下一行新增hadoop All=(All:All)All.

登出當前使用者，並用hadoop使用者登陸。

SSH安裝及配置

用hadoop登陸後，更新apt.命令sudo apt-get update.

安裝SSH:命令sudo apt-get install openssh-server. 預設的openssh-client已經安裝。

啟動服務：命令sudo /etc/init.d/ssh start

檢視服務是否啟動：ps -e | grep ssh

登陸ssh：命令ssh localhost。輸入hadoop使用者密碼即可登陸。這樣每次登陸都必須輸入密碼，比較費勁，所以需要設定免密碼登陸。

生成金鑰並加入授權：命令ssh-keygen

無密碼登陸ssh：命令ssh localhost就能無密碼登陸了。

二：安裝Hadoop 2.x

下載：

到官網下載最新且最穩定（stable）的版本,格式為.tar.gz,為已編譯好版本。src是hadoop原始碼，需要重新編譯才可用。

md5檔案用於校驗下載檔案是否完整。一般不用。

安裝：

解壓：tar -zxvf命令解壓到 /usr/local目錄下

改名：mv命令改名為hadoop

修改檔案許可權：

方法一：sudo chmod 774 /usr/local/hadoop

方法二：sudo chown -R hadoop ./hadoop

配置：

配置~/.bashrc檔案：用gedit開啟，檔案末尾新增如下：

#HADOOP VARIABLES START

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

#HADOOP VARIABLES END

配置檔案/usr/local/hadoop/etc/hadoop/hadoop-env.sh

修改這一行為：export JAVA_HOME=/usr/lib/jvm/java

測試haoop是否安裝成功，見下圖：

三：WordCount示例程式執行測試

建立input

命令mkdir input, 建立input目錄。

拷貝檔案到input目錄

命令cp README.txt input, 拷貝檔案到input目錄，作為輸入。

執行示例程式

bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output。

見下圖：

執行結果如下：

檢視輸入目錄output

命令cat output/*，結果如下：

參考文章：

１．http://www.powerxing.com/install-hadoop/

２．http://www.cnblogs.com/kinglau/p/3794433.html

３．http://wenku.baidu.com/link?url=nlVL80JkbQkGD9T8lZqlrxSqTHCmm2A5z4EYcfvoHYe4CZIyh0VseZxIJ5fpJbGXRruHv7UCB-e-bTh_8NvLGplQSpcVyQ_iMuSowhZm6ty

Hadoop安裝配置、執行第一個WordCount示例程式

作業系統ubuntu。本篇目的是在單機模式下執行成功WordCount示例程式。本篇小結安裝步驟，遇到的問題和解決辦法。疑惑點及其思考。 Hadoop是為linux而開發的，所以開發hadoop程式，包括spark最好在linux環境下。目錄如下：一：Hadoop

PyQt5 IDE安裝並執行第一個hello world程式

由來本人一直採用c++作為個人官方語言，對pyqt早有耳聞，之前也想嘗試下寫個hello word程式試試，苦於一直不知道有什麼比較好的IDE來進行開發一直擱置。今天，終於耐下心來把這一套搞定了，記錄下。開始安裝PyQt5及配置IDE 安裝

ubuntu下編寫並執行第一個c語言程式

對於初入Ubantu系統的小夥伴來說，進入Ubuntu最想做的事莫過於在終端（Terminal）裡執行自己的第一個C/C++程式"hello.c/hello.cpp"了。 Ubuntu預設是不包含編輯器vim和編譯器gcc。如果你是剛安裝好的Ubuntu電腦，下面我們將

Angular CLI 建立你的第一個 Angular 示例程式

第一步：安裝 Angular CLI 你要使用 Angular CLI 來建立專案、建立應用和庫程式碼，並執行多種開發任務，比

RDIFramework.NET ━ .NET快速資訊化系統開發框架-第3章軟體安裝、配置、執行方法

RDIFramework.NET ━ .NET快速資訊化系統開發框架第3章軟體安裝、配置、執行方法第3章軟體安裝、配置、執行方法 3.1 軟體安裝　　一、框架資料庫的安裝。　　1）、開啟SqlServer企業管理器（確保已經安裝了Microsoft SQL Server 2008及

Ganglia的安裝、配置、執行解析詳情

2017年05月24日 09:12:42 繾綣浮生丶閱讀數：5908 標籤： ganglia系統監控大資料更多個人分類： Ganglia 一、安裝ganglia: 網上示例很多，對該部分的翻譯後續再跟進。

HIVE的安裝配置、mysql的安裝、hive建立表、建立分割槽、修改表等內容、hive beeline使用、HIVE的四種資料匯入方式、使用Java程式碼執行hive的sql命令

1.上傳tar包這裡我上傳的是apache-hive-1.2.1-bin.tar.gz 2.解壓 mkdir -p /home/tuzq/software/hive/ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /home/

OpenCV學習筆記 - 安裝及執行第一個OpenCV程式

1、下載及安裝 OpenCV是一套開源免費的圖形庫，主要有C/C++語言編寫，官網： http://opencv.org/ 。在 http://opencv.org/downloads.html 可以找到個版本和各種平臺的程式包。OpenCV的Windows平臺安

flink安裝以及執行自帶wordcount示例（單機版，無hadoop環境）

1、下載安裝包到/opt目錄 2、解壓安裝包 tar zxf flink-1.6.1-bin-hadoop26-scala_2.11.tgz 3、啟動flink cd /opt/flink-1

sbt安裝、配置、執行(scala sbt helloworld)

下載sbt-1.1.6.tgz -------------------------------------------------------------------------------------------------------------------------

Spark 執行第一個Scala程式WordCount

安裝首先去官網下載Spark。注意Spark和Hadoop之間版本對應關係，我自己裝的Hadoop 2.7.5版本，按照下面方式下載即可。下載完成後，解壓安裝包至路徑/usr/local tar -zxf ./spark-2.3.0-bin-had

Hadoop HDFS 配置、格式化、啟動、基本使用Hadoop MapReduce配置、wordcount程式提交

Hadoop的安裝方式單機：所有的服務執行在一個程序裡面，開發階段才會使用分散式：將多個服務（JVM），分別執行在多臺機器上。偽分散式：將多個服務（JVM）執行在一臺機器上 Hadoop偽分散式安裝文件：http://hadoop.a

Docker安裝以及執行第一個HelloWorld

在安裝Docker之前我們先來了解一下什麼是Docker？觀察Docker圖示，其實很形象的解釋了什麼是Docker。在沒有使用集裝箱的情況下，我們需要考慮不同形狀、尺寸的貨物怎麼安放，貨物與貨物之間是否能堆疊，這無疑是很繁瑣的事情。現在有了集裝箱(容器)，我們就能將不同的貨

Lua在Windows下的安裝、配置、執行

#Windows下安裝、執行Lua! 本文提供全流程，中文翻譯。 Chinar 堅持將簡單的生活方式，帶給世人！（擁有更好的閱讀體驗 —— 高解析度使用者請根據需求調整網頁縮放比例） Ch

hadoop學習---執行第一個hadoop例項

hadoop環境搭建好後，執行第wordcount示例 1.首先啟動hadoop：sbin/start-dfs.sh,sbin/start-yarn.sh（必須能夠正常執行） 2.進入到hadoop的安裝目錄下（我的是/usr/hadoop） 3.新建hadoop

JDK的安裝與第一個Java小程式的執行（在win7和win10上檢驗過）

本文總結了部分有關 jdk 安裝時容易出現的問題及解決方法，僅用於學習和交流目的。疏漏之處敬請指出。一、JDK的下載和安裝（在最前面提醒下，初學的寶寶們一定要仔細啊，很多初學者太粗心，導致安裝 jdk 安裝了一週都沒成功的也大有人在）首先下載安裝

在VMware虛擬機器下安裝Android Studio（AS）以及執行第一個HelloWorld程式

1、JDK 1.1下載百度一下“JDK”即可 1.2安裝選擇安裝目錄 C:\java JAVA_HOME→C:\java PATH→C:\java\bin 2、android studio (AS) 2.2安裝遇到的問題： 1.新建

Hadoop架構設計、執行原理具體解釋

下一個發現 job調度 mmap tin 文件復制必須 new 最大 1、Map-Reduce的邏輯過程如果我們須要處理一批有關天氣的數據。其格式例如以下：依照ASCII碼存儲。每行一條記錄每一行字符從0開始計數，第15個到第18個字符為年第25個到第29個字

linux上Elasticsearch 安裝配置、網頁訪問

elasticsearch 安裝配置一、ElasticSearch簡述 ElasticSearch是一個基於Lucene的搜索服務器。它提供了一個分布式多用戶能力的全文搜索引擎，基於RESTful web接口。Elasticsearch是用Java開發的，並作為Apache許可條款下的開放源碼

Maven01——簡介、安裝配置、入門程序、項目構建和依賴管理

setting end open 環境變量配置關系 date execute att imp 1 Maven的簡介 1.1 什麽是maven 是apache下的一個開源項目，是純java開發，並且只是用來管理java項目的　Svn eclipse maven量級

Hadoop安裝配置、執行第一個WordCount示例程式

相關推薦