IDEA 除錯 Hadoop程式

阿新 • • 發佈：2018-12-25

1、解壓Hadoop到任意目錄

比如：D:\soft\dev\Hadoop-2.7.2

2、設定環境變數

HADOOP_HOME：D:\soft\dev\hadoop-2.7.2

HADOOP_BIN_PATH：%HADOOP_HOME%\bin

HADOOP_PREFIX：%HADOOP_HOME%

在Path後面加上%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin;

3、新建專案

3.1、新建Maven專案

這裡寫圖片描述

3.2、加入依賴

<dependency>
   <groupId>junit</groupId 
>
    <artifactId>junit</artifactId>
    <version>4.12</version>
</dependency>
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-client</artifactId>
    <version>2.7.2</version>
</dependency>
<dependency 
>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-common</artifactId>
    <version>2.7.2</version>
</dependency>
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-hdfs</artifactId>
    <version 
>2.7.2</version>
</dependency>

3.3、編寫WordCount程式

WcMapper.Java

public class WcMapper extends Mapper<LongWritable, Text, Text, IntWritable> {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String[] words = StringUtils.split(value.toString(), ' ');
        for (String w : words) {
            context.write(new Text(w), new IntWritable(1));
        }
    }
}

WcReducer.java

public class WcReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
    @Override
    protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        int sum = 0;
        for (IntWritable i : values) {
            sum = sum + i.get();
        }
        context.write(key, new IntWritable(sum));
    }
}

RunJob.java

public class RunJob {
    public static void main(String[] args) throws Exception {
        Configuration config = new Configuration();
        //設定hdfs的通訊地址
        config.set("fs.defaultFS", "hdfs://node1:8020");
        //設定RN的主機
        config.set("yarn.resourcemanager.hostname", "node1");

        try {
            FileSystem fs = FileSystem.get(config);

            Job job = Job.getInstance(config);
            job.setJarByClass(RunJob.class);

            job.setJobName("wc");

            job.setMapperClass(WcMapper.class);
            job.setReducerClass(WcReducer.class);

            job.setMapOutputKeyClass(Text.class);
            job.setMapOutputValueClass(IntWritable.class);

            FileInputFormat.addInputPath(job, new Path("/usr/input/wc.txt"));

            Path outpath = new Path("/usr/output/wc");
            if (fs.exists(outpath)) {
                fs.delete(outpath, true);
            }
            FileOutputFormat.setOutputPath(job, outpath);

            boolean f = job.waitForCompletion(true);
            if (f) {
                System.out.println("job任務執行成功");
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

注意：（改自己的主機）
//設定hdfs的通訊地址
config.set(“fs.defaultFS”, “hdfs://node1:8020”);
//設定RN的主機
config.set(“yarn.resourcemanager.hostname”, “node1”);

日誌檔案：log4j.properties

log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.Target=System.out
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d{ABSOLUTE} %5p %c{1}:%L - %m%n
log4j.rootLogger=INFO, console

3.4、執行WordCount程式

這裡寫圖片描述

再次執行：

報錯：java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

這裡寫圖片描述

修改org.apache.hadoop.io.nativeio.NativeIO原始碼：

這裡寫圖片描述

為：

這裡寫圖片描述

拷貝到src下如下結構：

這裡寫圖片描述

3.5、再次執行WordCount程式

這裡寫圖片描述

如果提示許可權異常則：
修改hdfs-site.xml

<property> 
   <name>dfs.permissions</name> 
   <value>false</value> 
</property>

重啟hdfs 即可

IDEA 除錯 Hadoop程式

1、解壓Hadoop到任意目錄比如：D:\soft\dev\Hadoop-2.7.2 2、設定環境變數 HADOOP_HOME：D:\soft\dev\hadoop-2.7.2 HADOOP_BIN_PATH：%HADOOP_HOME%\bin HADOOP_

12--配置IDEA遠端除錯Hadoop程式（Hadoop HA下）

public class MyUtils { public static void deleteDir(Configuration conf, String dirPath) throws IOException{ FileSystem fs=FileSystem.get(conf)

大資料IDEA除錯flink程式

Flink在IDEA中開發是一件比較困難的事情，網上沒有參考資料，就算就業說的太過籠統，不知道是會了不說還是不會瞎說，為了解決flink這個問題，本人特別做了一遍開發的簡單說明。主要考慮兩個問題，1、語言環境的搭建。2、flink程式碼編譯通過並執行獲取更多大資料視訊資料請加QQ群：947967114 首

macOS 10.12.1 Idea除錯Go程式遇到could not launch process: could not get thread count

我的Idea版本是2016.3，在macOS 10.12.1除錯Go程式會發現報錯： could not launch process: could not get thread count 解決方案

在Windows 除錯 Hadoop程式

轉：http://blog.csdn.net/uq_jin/article/details/52235121 1、解壓Hadoop到任意目錄比如：D:\soft\dev\Hadoop-2.7.2 2、設定環境變數 HADOOP_HOME：D:\soft\dev\had

windows下idea編寫WordCount程式，並打jar包上傳到hadoop叢集執行（傻瓜版）

通常會在IDE中編制程式，然後打成jar包，然後提交到叢集，最常用的是建立一個Maven專案，利用Maven來管理jar包的依賴。一、生成WordCount的jar包 1. 開啟IDEA，File→New→Project→Maven→Next→填寫Groupld和Artifactld→Ne

通過Idea遠端除錯Hadoop叢集

早期的開發中經常用eclipse遠端除錯Hadoop叢集，近期Idea的市場佔有率逐漸增加，本文介紹如何在通過Idea遠端除錯Hadoop叢集。一、工程截圖二、操作流程 Idea中新建專案將h

IDEA+Maven開發第一個Hadoop程式WordCount

IDEA+Maven開發第一個Hadoop程式WordCount 1. 新建一個maven專案選擇JDK版本。 2.設定GroupId和ArtifactId 3.設定專案名稱 &

IntelliJ IDEA 遠端除錯Hadoop

開發環境 IntelliJ IDEA 2017.1.3 JDK VERSION jdk 1.8 Hadoop 版本 hadoop1.0.0 虛擬機器完全分散式 node1172.16.20.101 master node2172.16.20.102 sl

intellij IDEA下遠端除錯hadoop

test: [exec] deploy jar [exec] deploy run.sh [exec] change authority [exec] start run.sh [exec] add jar to classpath [exec] r

idea Intellij 遠端除錯java程式

網上很多都是遠端除錯tomcat。如果是純java程式有點不一樣。首先是遠端伺服器上java啟動參賽要加上除錯的引數： "-Xdebug -Xrunjdwp:transport=dt_socke

「hadoop」idea gradle hadoop 運行helloworld示例

三臺補充 linux .dll 遇到 dea name 步驟 red 運行一個簡單的hadoop實例。環境：win7跑三臺ubuntu虛擬機，並已成功安裝hadoop2.8.1環境，win7安裝idea工具【步驟】 1、參考 http://blog.csd

通過IDEA及hadoop平臺實現k-means聚類算法

綜合 tle tostring html map apache cnblogs cos textfile 有段時間沒有操作過，發現自己忘記一些步驟了，這篇文章會記錄相關步驟，並隨時進行補充修改。 1 基礎步驟，即相關環境部署及數據準備數據文件類型為.csv文件，excel

Idea+Centos+hadoop-2.7.3源碼環境搭建

tar.gz mar 點擊技術 baidu str mage tar follow Idea+Centos7+hadoop-2.7.3源碼閱讀環境搭建 1.環境準備安裝maven 3.5.4 下載地址: http://mirrors.shu.edu.cn/apache

未載入mfc120ud.i386.pdb：VS2013除錯MFC程式解決方法

剛使用VS2013時，想轉入MFC庫函式發現無法除錯MFC程式碼。VS2013提示如下：網上查了一下才得知，VS2013不像以前的VS版本一樣自帶MFC的pdb檔案。但是微軟提供了Microsoft Symbol Server自動下載pdb檔案，只是預設情況下沒有開啟。開

使用符號表除錯release程式

原文地址：http://blog.csdn.net/jmflovezlf/article/details/16589841 如果要生成單獨的除錯資訊檔案，命令如下： objcopy –

windows上eclipse執行hadoop程式報NullPointerException錯

windows上eclipse執行hadoop程式報NullPointerException錯 log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFact

Spark本地除錯和程式重啟checkpoint恢復碰到的問題

Spark本地除錯和程式重啟checkpoint恢復碰到的問題 1、產生問題的背景　　今天自測Spark程式碰到兩個問題，(1)、啟動流式程式報錯 (2)、重啟Spark程式,同一個物件的部分資料恢復了，一部分沒有恢復　　第一個問題的報錯資訊：　　第二個問題的結果資訊： 2、排查

在Firebug中除錯JS程式 (F10 F11 F8)

在Firebug中除錯程式在Firebug控制檯的的Javascript控制面板中，可以對頁面中的Javascript進行除錯，方法很簡單，只需要在要除錯的行的左邊單擊，就會出現斷點了，之後請記住下面常件的快捷鍵： (1) Shift+F8重新執行； (2)&

DSP C6678除錯SylixOS程式

使用RealEvo-IDE編譯SylixOS DPS工程生成可執行檔案，由CCS5.5進行燒錄 1、開啟CCS 5.5，新建CCS工程 2、新建目標配置檔案選擇對應目標並儲存 3、設定6678開發板撥碼開關到如下位置，上電，接USB線，確認驅動正確安裝 4、測試

IDEA 除錯 Hadoop程式

1、解壓Hadoop到任意目錄

2、設定環境變數

3、新建專案

3.1、新建Maven專案

3.2、加入依賴

3.3、編寫WordCount程式

3.4、執行WordCount程式

3.5、再次執行WordCount程式

相關推薦