mapreduce job提交的幾種執行方式

阿新 • • 發佈：2019-02-18

總共整理下來有三大類：

叢集上直接通過jar包來呼叫，輸入和輸出檔案必須都存在hdfs叢集上
linux環境下，在eclipse中叢集或本地呼叫程式，以及輸入和輸出檔案存於叢集或本地
windows環境下，在eclipse中叢集或本地呼叫程式，以及輸入和輸出檔案存於叢集或本地

1、在eclipse中開發好mr程式（windows或linux下都可以），然後打成jar包(wc.jar)，上傳到伺服器
執行命令

hadoop jar wc.jar com.elon.bigdata.hadoop.MainClassRunner

這種方式會將這個job提交到yarn叢集上去執行,程式的輸入和輸出檔案可以存在windows/linux本地或者hdfs叢集上,根據程式中編寫的Path路徑來做選擇。

2、在Linux的eclipse中直接啟動Runner類的main方法，這種方式可以使job執行在本地，也可以執行在yarn叢集

究竟執行在本地還是在叢集，取決於第一個配置引數

conf.set("mapreduce.framework.name", "yarn");   //設定mapreduce的執行是在local(預設)還是yarn上
conf.set("yarn.resourcemanager.hostname", "hadoop");    //若在yarn上執行，則指定yarn主機名

如果確實需要在eclipse中提交到yarn執行，必須做好以下兩個設定
- 將mr工程打成jar包(wc.jar)，放在工程主目錄下
- 在工程的main方法中，加入一個配置引數 conf.set(“mapreduce.job.jar”,”wc.jar”);

3、在windows的eclipse中執行本地模式，步驟為：

a、在windows中找一個地方放一份hadoop的安裝包，並且將其bin目錄配到環境變數中
b、根據windows平臺的版本（32？64？win7？win8？），替換掉hadoop安裝包中的本地庫(bin,lib)
c、mr程式的工程中不要有引數mapreduce.framework.name的設定

4、在windows的eclipse中執行main方法來提交job到叢集執行，比較麻煩

a、類似於方式3中所描述的對本地庫相容性進行改造

b、修改YarnRunner這個類

mapreduce job提交的幾種執行方式

總共整理下來有三大類：叢集上直接通過jar包來呼叫，輸入和輸出檔案必須都存在hdfs叢集上 linux環境下，在eclipse中叢集或本地呼叫程式，以及輸入和輸出檔案存於叢集或本地 windows環境下，在eclipse中叢集或本地呼叫程式，以及輸入和輸出

MapReduce中Job的幾種執行模式

MapReduce中job的幾種執行模式1、在eclipse中開發好mr程式（windows或linux下都可以），然後打成jar包(wc.jar)，上傳到伺服器執行命令 hadoop jar wc.jar cn.itheima.hadoop.MainCla

JavaScript 匿名函式有哪幾種執行方式?

!function(){}() <- ! function Identifier[opt] ( FormalParameterList[opt] ) { FunctionBody } Arguments <- ! FunctionExpression Arguments <- ! Membe

MapReduce 程式的幾種提交執行模式

目錄本地模式執行叢集模式執行本地模型執行 1/在windows的eclipse裡面直接執行main方法，就會將job提交給本地執行器localjobrunner執行 ----輸入輸出資料可以放在本地路徑下（c:/wc/srcdata/）

程序、執行緒間的幾種通訊方式

一、程序通訊幾種程序間的通訊方式（1）管道（pipe）：管道是一種半雙工的通訊方式，資料只能單向流動，而且只能在具有血緣關係的程序間使用。程序的血緣關係通常指父子程序關係。（2）有名管道（named pipe）：有名管道也是半雙工的通訊方式，但是它允許無

jsp的form表單提交幾種方式

1.form表單submit直接提交資料 <%@ page contentType="text/html;charset=UTF-8" language="java" %> <%@ taglib prefix="c" uri="http://java.sun.com/jsp/j

（十六）java併發程式設計--執行緒的死鎖解決方案(生產者和消費者幾種實現方式)

上一篇中,主要了解了什麼時候死鎖，並且提出死鎖的一個解決方案，多個鎖要按照一定的順序來。本片主要是利用生產者消費者模式解決執行緒的死鎖。多執行緒生產者和消費者一個典型的多執行緒程式。一個生產者生產提供消費的東西，但是生產速度和消費速度是不同的。這就需要讓

hive幾種執行sql的方式總結

在命令列介面下，我們來看看hive sql的幾種執行方式： [email protected] hive-0.13.1]$ bin/hive -help usage: hive -d,　--define <key=value> 　　　　　　 Vari

處理提交請求資料的幾種新鮮方式（StringEntity， UrlEncodedFormEntity() ，MultipartEntity）

假設你有一份請求資料，需要做一次HTTP請求，那麼現在我們來談談這份請求資料的處理。。。本文提及三種方式：StringEntity， UrlEncodedFormEntity() ，MultipartEntity UrlEncodeFor

C#執行緒間同步的幾種實現方式

一、使用訊號量 using System; using System.Threading; namespace SemaphoreDemo { class Program { static void Main(string[] args)

oracle 資料庫中幾種連線方式執行過程（nested loop、hash join、sort order join）

簡單介紹了一下oracle 各種連線方式的執行過程，虛擬碼內容來源於pro oracle sql。 nested loop： select empno, ename, dname, loc fro

多執行緒-執行緒同步有幾種實現方式

執行緒同步有幾種實現方式 1. Synchronized 在方法級別 public synchronized …. 在程式碼塊 synchronized(物件){} 1. 當synchronized作用在方法上的時候，鎖住的就是這個物件的例項 synchronized

java中執行緒池的幾種實現方式

1、執行緒池簡介：多執行緒技術主要解決處理器單元內多個執行緒執行的問題，它可以顯著減少處理器單元的閒置時間，增加處理器單元的吞吐能力。假設一個伺服器完成一項任務所需時間為：T1 建立執行緒時間，T2 線上程中執行任務的時間，T3 銷燬執

更新UI的幾種方式？（子執行緒與UI執行緒有哪幾種通訊方式？）

handler sendMessage方式 private Handler handler = new Handler() { public void handleMessage(Message msg) {

Android 幾種非同步方式，解決主執行緒中遇到的卡頓

起因：當我們的UI越來越複雜的時候，或者說某個業務需要大量的計算的時候，我們的主執行緒會消耗大量的資源去計算，這個時候，我們的Activity或者說fragmemt等UI頁面就會出現卡頓，乃至ANR。總結一下，就是我們直接在主執行緒（UI執行緒）中，做耗時操作，就會造成卡

Java多執行緒有哪幾種實現方式? Java中的類如何保證執行緒安全? 請說明ThreadLocal的用法和適用場景（面試題）

Java多執行緒有哪幾種實現方式? Java中的類如何保證執行緒安全? 請說明ThreadLocal的用法和適用場景 Java多執行緒有三種實現方式： (1)繼承Thread類，重寫run函式 (2)實現Runnable介面，重寫run函式開啟執行緒：Thread t

執行緒的幾種建立方式並實現賣票功能

本篇簡單的講下執行緒的幾種建立方式並相應的實現售票功能一、執行緒建立public class ThreadTest { public static void main(String[] args) throws InterruptedException, Executio

C++執行緒的幾種呼叫方式

#include<thread> #include<future> using namespace std; class A { public: void f(int x,

Java中實現執行緒同步的幾種常用方式

首先講一下為什麼要實現執行緒同步： java允許多執行緒併發控制，當多個執行緒同時操作一個可共享的資源變數時（如資料的增刪改查），將會導致資料不準確，相互之間產生衝突，因此加入同步鎖以避免在該執行緒沒有完成操作之前，被其他執行緒的呼叫，從而保證了該變數的唯一性和準

確保某個BeanDefinitionRegistryPostProcessor Bean被最後執行的幾種實現方式

[TOC] ### 一、事出有因最近有一個場景，因同一個專案中不同JAR包依賴同一個元件，但依賴元件的版本不同，導致無論使用哪個版本都報錯（無法同時相容兩個JAR包中所需的方法呼叫），經過分析發現差異的部份是在一個BEAN中的方法出入參不同而矣，故考慮通過動態替換掉這個存在相容性的BEAN，換成我們

mapreduce job提交的幾種執行方式

相關推薦