關於Hadoop MapReduce 執行少包問題解決

阿新 • • 發佈：2018-11-09

這是一個Hadoop中極為常見的丟包少類的問題，希望能幫到大家

問題描述

命令：hadoop jar 執行包主函式引數-1 引數-2

執行產生異常
異常一：
Exit code: 1 Stack trace: ExitCodeException exitCode=1: at org.apache.hadoop.util.Shell.runCommand(Shell.java:604) at org.apache.hadoop.util.Shell.run(Shell.java:507)

異常二：
org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.orc.mapreduce.OrcOutputFormat not found

解決思路
MR程式執行少包有二種： 1.程式運行當前環境少包 2.Yarn執行環境Executor少包

如果剛執行命令，還任務甚至還未提交Yarn產生了異常，可以理解為當前環境少包

通過匯入環境變數即可執行： 注意多個Jar包使用 : 隔開
export HADOOP_CLASSPATH=${HADOOP_CLASSPATH}:lib/orc-mapreduce-1.1.0.jar

如果程式已經提交Yarn了，注意觀察資源管理介面，檢視執行日誌
方法一：
hadoop jar 執行包主函式 -libjars lib/*.jar 引數-1 引數-2
可將依賴包提交Executor執行環境,注意位置不可變,多個lib使用,隔開

但是需要使用Tools工具類執行任務，否則無法識別引數-libjars, 會被識別為Main的引數,具體請看後面補充
方法二
程式中使用分散式快取，快取Jar檔案，具體看補充

補充 : 方法一

//通過實現工具類，Run方法執行Job，-libjars才可被識別
public class MapredOrcFileConvert extends Configured implements Tool {
    static Logger logger = LoggerFactory.getLogger("MapredOrcFileConvert");

    @Override
    public int run(String[] strings) throws Exception {
    	// 重要: 必須要用:父類方法getConf() . 
        Configuration conf = getConf();
        Job job = Job.getInstance(conf, "NAME");
        /*JAR*/
        job.setJarByClass(MapredOrcFileConvert.class);
        /*Format*/
        ...
        /*Map*/
           ...
        /*Reduce*/
           ...
        /*Param*/
           ...
        FileInputFormat.addInputPath(job, new Path(strings[1]));
        FileOutputFormat.setOutputPath(job, new Path(strings[2]));
        return job.waitForCompletion(true) ? 0 : 1;
    }

    public static void main(String args[]) throws Exception {
    	//工具類執行
        int status = ToolRunner.run(new Configuration(), new MapredOrcFileConvert(), args);
        System.exit(status);
    }

補充 : 方法二

	  //分散式快取,依賴包需要上傳HDFS,指定檔案路徑，匯入快取，即可解決依賴
      Configuration conf = new Configuration();
       FileSystem fileSystem = FileSystem.get(conf);
       FileStatus[] status = fileSystem.listStatus("HDFS JAR Lib PATH");
       for (FileStatus statu : status) {
           System.out.println("+" + statu.getPath().toString());
           DistributedCache.addArchiveToClassPath(statu.getPath(), conf);
       }

關於Hadoop MapReduce 執行少包問題解決

這是一個Hadoop中極為常見的丟包少類的問題，希望能幫到大家問題描述命令：hadoop jar 執行包主函式引數-1 引數-2 執行產生異常異常一： Exit code: 1 Stack trace: ExitCodeException exitCo

hadoop叢集執行jar包報錯（eclipse導jar）

報錯日誌： Exception in thread "main" java.lang.UnsupportedClassVersionError: com/hdfs/wordcount/WordcountDriver has been compiled by a more recent v

大資料基礎課之Hadoop MapReduce執行過程詳解

述一下mapreduce的流程（shuffle的sort，partitions，group）首先是 Mapreduce經過SplitInput 輸入分片決定map的個數在用Record記錄 key value。然後分為以下三個流程： Map：輸入 key

Hadoop MapReduce執行過程詳解（帶hadoop例子）

問題導讀1.MapReduce是如何執行任務的？ 2.Mapper任務是怎樣的一個過程？ 3.Reduce是如何執行任務的？ 4.鍵值對是如何編號的？ 5.例項，如何計算沒見最高氣溫？分析MapReduce執行過程 MapReduce執行的時候，會通過Mapper執

直接執行jar包找不到主類和沒有主清單屬性的解決

springboot專案module 通過maven打包編譯後，生成jar包；再通過命令 java -jar eureka-server/target/eureka-server-0.0.1-SNAPSHOT.jar 啟動後提示： jar包找不到主類和沒有主清單屬性。

Hadoop偽分佈安裝詳解+MapReduce執行原理+基於MapReduce的KNN演算法實現

本篇部落格將圍繞Hadoop偽分佈安裝+MapReduce執行原理+基於MapReduce的KNN演算法實現這三個方面進行敘述。（一）Hadoop偽分佈安裝 1、簡述Hadoop的安裝模式中–偽分佈模式與叢集模式的區別與聯絡. Hadoop的安裝方式有三種:本地模式,偽分佈模式

Hadoop-mapreduce 程式在windows上執行需要注意的問題

1.在主程式中需要新增這幾個引數配置 Configuration conf = new Configuration(); // 1、設定job執行時要訪問的預設檔案系統 conf.set("fs.defaultFS", HADOOP_ROOT_PATH);

windows下idea編寫WordCount程式，並打jar包上傳到hadoop叢集執行（傻瓜版）

通常會在IDE中編制程式，然後打成jar包，然後提交到叢集，最常用的是建立一個Maven專案，利用Maven來管理jar包的依賴。一、生成WordCount的jar包 1. 開啟IDEA，File→New→Project→Maven→Next→填寫Groupld和Artifactld→Ne

Mac 出現正在執行安裝包指令碼或等待其他安裝完成的解決辦法

參考資料： https://www.jianshu.com/p/2d75ebf055c5 描述：安裝mysql時出現正在執行安裝包指令碼，等待半小時無果後切出工作管理員，結束安裝器程序，重新開啟安裝包，出現等待其他安裝完成。無法正常安裝。原因：利用工作管理員殺掉了安裝器但安裝程序仍在進

hadoop下提交jar包執行時連線失敗異常或連線被拒絕

提交jar包執行時連線失敗異常或連線被拒絕錯誤提示為: Exception in thread "main" java.net.ConnectException: Call From mini02/192.168.91.4 to mini02:8032 fai

MyEclipse+Maven打可執行war包時遇到的一系列問題及解決方法詳解

以下是我整個打war包過程時遇到的一些問題以及我用到的解決方案，及時分享出來，給遇到同樣問題的小夥伴們予以借鑑，少走彎路。先貼出來pom.xml中打war包需要的依賴 <build>

Hadoop On Yarn Mapreduce執行原理與常用資料壓縮格式

我們通過提交jar包，進行MapReduce處理，那麼整個執行過程分為五個環節： 1、向client端提交MapReduce job. 2、隨後yarn的ResourceManager進行資源的分配. 3、由NodeManager進行載入與監控containers. 4、通

Hadoop 2.6 MapReduce執行原理詳解

　　市面上的hadoop權威指南一類的都是老版本的書籍了，索性學習並翻譯了下最新版的Hadoop:The Definitive Guide, 4th Edition與大家共同學習。　　我們通過提交jar包，進行MapReduce處理，那麼整個執行過程分為五個環節：　　1、向client端提交MapRed

【Hadoop】Windows 10 在Intellij IEDA本地執行Hadoop MapReduce例項

環境：作業系統：Windows 10 Hadoop版本：2.7.3 Java版本: 1.8 前期準備： 1. 配置hadoop環境。 2. 配置maven環境。 1.下載maven部署包apache-maven-3.5.3-

hadoop初識之三：搭建hadoop環境（配置HDFS，Yarn及mapreduce 執行在yarn）上及三種執行模式（本地模式，偽分散式和分散式介）

--===============安裝jdk（解壓版）================== --root 使用者登入 --建立檔案層級目錄 /opt下分別建 modules/softwares/datas/tools 資料夾 --檢視是否安裝jdk rpm -

linux中hadoop 執行jar包

1.執行MR的命令： hadoop jar <jar在linux的路徑> <main方法所在的類的全類名> <引數> 例子： hadoop jar /root/wc1.jar cn.itcast.d3.hadoop

Eclipse新建Servlet出錯，少包的解決辦法

當我建立servlet後，出現了很多錯誤，目測是沒有引進各種包如圖所示：解決辦法是：開啟Properties->java Bulid path->Libraries->Add Libraries->Server Runtime，選擇tomcat

hadoop之HDFS、yarn、MapReduce執行原理分析

1、HDFS分散式儲存 namenode:統一管理檔案的元資料資訊 fsImage:儲存了檔案的基本資訊，如檔案路徑，檔案副本集個數，檔案塊的資訊，檔案所在的主機資訊。 editslog：

將jar包上傳到Hadoop伺服器並執行jar包的方法--引數不對應導致報錯output directory already exists

ERROR security.UserGroupInformation: PriviledgedActionException as:root cause:org.apache.hadoop.mapred.FileAlreadyExistsException:Outpu

Hadoop Jar 執行HBase類的報錯，解決方法

問題如下： [[email protected] ~]# hadoop jar testHBase-1.0-SNAPSHOT.jar com.qf.hbase.hbasewordcount.HBaseWordCountApp /tmp/hbase-root/hba

關於Hadoop MapReduce 執行少包問題解決

相關推薦