1. 程式人生 > >通過IDEA搭建scala開發環境開發spark應用程式

通過IDEA搭建scala開發環境開發spark應用程式

一、idea社群版安裝scala外掛

因為idea預設不支援scala開發環境,所以當需要使用idea搭建scala開發環境時,首先需要安裝scala外掛,具體安裝辦法如下。

1、開啟idea,點選configure下拉選單中的plugins選項:

clip_image002

2、在彈出對話方塊中點選紅框按鈕:

clip_image004

3、在彈出最新對話方塊的搜尋欄輸入scala,在篩選出的內容中選擇紅框部分,點選右側install按鈕開始下載外掛:

clip_image006

本人在測試過程中通過install自動下載外掛失敗,最後選擇手動下載scala外掛,然後通過步驟2中install plugin from disk選項,選擇手動下載zip包的方式安裝外掛成功。

二、建立scala工程

1、下載scala安裝檔案,並解壓到d:\目錄下:

https://downloads.lightbend.com/scala/2.10.6/scala-2.10.6.zip

2、開啟idea開發工具,選擇“create new project”,建立一個新的工程:

clip_image008

3、下圖中選擇jdk版本、選擇scala、以及scala依賴包位置(scala安裝軟體位置),next:

clip_image010

4、輸入工程名稱並且選擇工程位置,點選finash:

clip_image012

5、完成工程建立後如下:

clip_image014

三、配置scala工程

1、file->preject structure:

clip_image016

2、modulesàsrcànew folder方式建立資料夾:

clip_image018

3、完成檔案建立後,點選ok完成配置。

clip_image020

工程結構如下:

clip_image022

四、為工程匯入spark jar包

1、首先解壓縮spark安裝包到d:\目錄下:

D:\spark-1.3.0-bin-2.5.0-cdh5.3.6

2、fileàproject structure:

clip_image024

3、在對話方塊選擇librariesà+àjava:

clip_image026

4、在彈出對話方塊內選擇spark解壓目錄,選中spark lib目錄下所有jar包,點選ok匯入所有jar包:

clip_image028

5、點選ok,完成spark jar包匯入scala工程:

clip_image030

clip_image032

五、編寫wordcount程式進行基準測試

1、在scala工程中建立packet,並且建立測試spark類,並且編寫wordcount程式程式碼,如下:

package Chavin.King.SparkApp
import

org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
object SparkDemo {
def main(args: Array[String]) {
val logFile = "hdfs://chavin.king:9000/user/hadoop/mapreduce/wordcount/input/wc.input"
val conf = new SparkConf().setAppName("Simple Application") //.setMaster("local")
val sc = new SparkContext(conf)
val rdd = sc.textFile(logFile)
val wordcount = rdd.flatMap(_.split(" ")).map((_,1)).reduceByKey(_ + _).map(x => (x._2,x._1)).sortByKey(false).map(x => (x._2,x._1))
wordcount.saveAsTextFile("hdfs://chavin.king:9000/user/hadoop/mapreduce/wordcount/output00000")
sc.stop()
}
}

截圖如下:

clip_image034

2、程式碼完成之後,右鍵à選擇run “SparkApp”,執行程式進行功能測試。

3、打包SparkApp程式:

File—>preject structureàartifactsà+àJARàfrom modules with dependencies:

clip_image036

下圖中選擇要編譯的主類,點選ok:

clip_image038

刪除output layout下的所有依賴jar包,並且指定output directory,點選ok:

clip_image040

回到idea主頁面,點選buildàbuild artifacts:

clip_image042

SaprkApp.jar—>build,進行jar包編譯:

clip_image044

編譯完成後到d:\下可以看到我們編譯的jar包。

4、測試編譯的jar包(SparkApp.jar):

4.1)刪除hdfs輸出目錄:

bin/hdfs dfs -rm -r hdfs://chavin.king:9000/user/hadoop/mapreduce/wordcount/output00000

4.2)spark-submit方式測試jar包:

相關推薦

通過IDEA搭建scala開發環境開發spark應用程式

一、idea社群版安裝scala外掛因為idea預設不支援scala開發環境,所以當需要使用idea搭建scala開發環境時,首先需要安裝scala外掛,具體安裝辦法如下。1、開啟idea,點選configure下拉選單中的plugins選項:2、在彈出對話方塊中點選紅框按鈕:3、在彈出最新對話方塊的搜尋欄輸

IDEA搭建scala開發環境開發spark應用程序

編寫 運行程序 通過 https apach import input inf 搭建 一、idea社區版安裝scala插件 因為idea默認不支持scala開發環境,所以當需要使用idea搭建scala開發環境時,首先需要安裝scala插件,具體安裝辦法如下。 1、

IDEA搭建scala開發環境開發spark應用程式

一、idea社群版安裝scala外掛 因為idea預設不支援scala開發環境,所以當需要使用idea搭建scala開發環境時,首先需要安裝scala外掛,具體安裝辦法如下。 1、開啟idea,點選configure下拉選單中的plugins選項: 2、在彈出對話方塊中點選紅框按鈕: 3、在彈出最新對話

Intellij Idea搭建Scala開發環境

本篇部落格主要是安裝Scala並且配置環境變數以及在Intellij Idea下安裝外掛並新建一個Scala專案。一、操作步驟①安裝Intellij Idea②安裝jdk③配置maven④安裝Scala⑤Intellij Idea下新建一個Scala專案解壓Scala並重命名

Linux環境通過docker搭建PHP的LAMP開發環境

想必作為一個Web開發的程式設計師,近些年對docker一定不會陌生,Docker 是一個開源的應用容器引擎,讓開發者可以打包他們的應用以及依賴包到一個可移植的容器中,然後釋出到任何流行的 Linux 機器上,也可以實現虛擬化。容器是完全使用沙箱機制,相互之間不會有任何介面。使用dock

Windows環境搭建Ionic+cordova環境開發混合移動APP

網上有多篇ionic開發環境搭建的文章,但是針對windows下的說明比較少,所以在這裡再補充一篇windows下的開發環境搭建文章 1.nodejs nodejs官網: https://nodejs.org/en/ 它會自動檢測當前OS型別,並提供下載地址 Windows

(原創)node.js入門之一:express簡單伺服器搭建-Mac環境開發

0:開篇廢話 好久沒來記錄點東西了,以前記錄的都是一些解決小問題的程式碼片段,只能算是當記事本來用的吧。 換了工作,好像沒那麼多程式碼要寫了,那就自己找點事做,於是重新翻出了nodejs,以前是在主程的搭建環境下,寫一些介面給我的iOS前

Spark應用程式開發引數調優深入剖析-Spark商業調優實戰

本套系列部落格從真實商業環境抽取案例進行總結和分享,並給出Spark商業應用實戰指導,請持續關注本套部落格。版權宣告:本套Spark商業應用實戰歸作者(秦凱新)所有,禁止轉載,歡迎學習。 Spark商業應用實戰-Spark資料傾斜案例測試及調優準則深入剖析 Spark商業應用實戰-Spark資源

使用idea搭建Scala 專案

轉自:http://blog.csdn.net/lovehuangjiaju/article/details/47778671 主要內容 Intellij IDEA開發環境簡介Intellij IDEA Scala開發環境搭建Intellij IDEA常見問題及解決方案

用eclipse整合開發環境開發、除錯arm linux程式

安裝交叉編譯器(arm-linux-gcc)以及整合開發環境(eclipse) 1.安裝arm-linux-gcc,不管你是從網上下載的,還是開發板光盤裡面的,都可以,版本也沒什麼限制,我的是arm-linux-gcc-4.3.2。   進入arm-linux-gcc

使用Intellij Idea編寫Spark應用程式Scala+SBT)

對Scala程式碼進行打包編譯時,可以採用Maven,也可以採用SBT,相對而言,業界更多使用SBT。之前有篇部落格我們介紹了使用Intellij Idea編寫Spark應用程式(Scala+Maven),採用的是Maven工具。今天這篇部落格同樣是使用Intellij

idea 搭建ssm+maven 環境

https://blog.csdn.net/qq_25591191/article/details/78745312 https://www.jb51.net/article/117670.htm https://blog.csdn.net/baidu_23086307/article/de

使用IDEA搭建SpringBoot多環境多配置檔案

啟動SpringBoot 開啟SpringBootApplication啟動類,滑鼠右鍵RUN項,或者Ctrl+Shift+F10,生成啟動配置 生成dev環境的配置檔案 /src/main/

配置eclipse ide開發環境 編寫 執行java程式

獲取eclipse並安裝下載安裝檔案解壓即可選擇工作區啟動eclipse新建java專案 選擇file new project 彈出new project想到對話方塊,選擇java project單擊next按鈕在彈出的對話方塊中填寫專案的名稱,並萱蕚相應的jre單擊next

如何在開發環境中建立mapreduce程式

1. 首先建立開發環境(eclipse-hadoop),網上搭建部落格很多,不細說 2. 開發環境建立之後自己建立一個包,這個名字是隨便起的,可以起名為mapreduce。 3.然後建立一個.java檔案,可以是mapreduce檔案:mapreduce.java。 4.把

Docker在PHP專案開發環境中的應用

環境部署是所有團隊都必須面對的問題,隨著系統越來越大,依賴的服務也越來越多,比如我們目前的一個專案就會用到: Web伺服器:NginxWeb程式:PHP + Node資料庫:MySQL搜尋引擎:ElasticSearch佇列服務:Gearman快取服務:Redi

JDK1.8原始碼分析03之idea搭建原始碼閱讀環境

序言:上一節說了閱讀原始碼的順序,有了一個大體的方向,咱們就知道該如何下手。接下來,就要搭建一個方便閱讀原始碼及debug的環境。有助於跟蹤原始碼的呼叫情況。 目前新開發的專案, 大多數都是基於JDK1.8開發,所以我選擇該版本進行原始碼分析。 JDK1.8版本號:jdk1.8.0_151 一. JDK1

通過Blazor使用C#開發SPA單頁面應用程式(3)

  今天我們來看看Blazor開發的一些基本知識。 一、Blazor元件結構  Blazor中元件的基本結構可以分為3個部分,如下所示: //Counter.razor //Directives section 指令部分 @page "/counter" //Ra

通過Blazor使用C#開發SPA單頁面應用程式(4) - Ant Design Button

  前面學習了Blazor的特點、環境搭建及基礎知識,現在我們嘗試的做個實際的元件。   Ant Design是螞蟻金服是基於Ant Design設計體系的 UI 元件庫,主要用於研發企業級中後臺產品。目前官方是基於React和Angular實現的,今年也推出了Vue的實現。其元件涵蓋面

Mac下基於c++和spawn-fcgi開發nginx後臺fastcgi應用程式

1,目的 在做後臺開發的時候一直使用的語言就是go java js python。由於框架不多,很少有人嘗試採用c++進行web後臺開發。基於此,本文嘗試在mac平臺下采用c++開發nginx的fastcgi addon。 2,原理 nginx作為代理伺服器,在nginx.conf配置檔