Spark Idea Maven 開發環境搭建

一、安裝jdk

jdk版本最好是1.7以上，設定好環境變數，安裝過程，略。

二、安裝Maven

我選擇的Maven版本是3.3.3，安裝過程，略。

編輯Maven安裝目錄conf/settings.xml檔案，

1 2	`<!-- 修改Maven 庫存放目錄-->` `<localRepository>D:\maven-repository\repository</localRepository>`

三、安裝Idea

安裝過程，略。

四、建立Spark專案

1、新建一個Spark專案，

2、選擇Maven，從模板建立專案，

3、填寫專案GroupId等，

4、選擇本地安裝的Maven和Maven配置檔案。

5、next

6、建立完畢，檢視新專案結構：

7、自動更新Maven pom檔案

8、編譯專案

如果出現這種錯誤，這個錯誤是由於Junit版本造成的，可以刪掉Test，和pom.xml檔案中Junit的相關依賴，

即刪掉這兩個Scala類：

和pom.xml檔案中的Junit依賴：

1 2 3 4 5

<dependency> <groupId>junit</groupId> <artifactId>junit</artifactId>

<version>4.12</version> </dependency>

　9、重新整理Maven依賴

10、引入Jdk和Scala開發庫

11、在pom.xml加入相關的依賴包，包括Hadoop、Spark等

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48

<dependency> <groupId>commons-logging</groupId>

<artifactId>commons-logging</artifactId> <version>1.1.1</version> <type>jar</type> </dependency> <dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-lang3</artifactId> <version>3.1</version> </dependency> <dependency> <groupId>log4j</groupId> <artifactId>log4j</artifactId> <version>1.2.9</version> </dependency> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.7.1</version> </dependency> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>2.7.1</version> </dependency> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-hdfs</artifactId> <version>2.7.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.10</artifactId> <version>1.5.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.10</artifactId> <version>1.5.1</version> </dependency>

　　然後重新整理maven的依賴，

12、新建一個Scala Object。

測試程式碼為：

1 2 3 4 5 def main(args: Array[String]) { println("Hello World!") val sparkConf =new SparkConf().setMaster("local").setAppName("test") val sparkContext =new SparkContext(sparkConf) }

　　執行，

如果報了以下錯誤，

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 java.lang.SecurityException:class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the samepackage at java.lang.ClassLoader.checkCerts(ClassLoader.java:952) at java.lang.ClassLoader.preDefineClass(ClassLoader.java:666) at java.lang.ClassLoader.defineClass(ClassLoader.java:794) at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142) at java.net.URLClassLoader.defineClass(URLClassLoader.java:449) at java.net.URLClassLoader.access$100(URLClassLoader.java:71) at java.net.URLClassLoader$1.run(URLClassLoader.java:361) at java.net.URLClassLoader$1.run(URLClassLoader.java:355) at java.security.AccessController.doPrivileged(Native Method) at java.net.URLClassLoader.findClass(URLClassLoader.java:354) at java.lang.ClassLoader.loadClass(ClassLoader.java:425) at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308) at java.lang.ClassLoader.loadClass(ClassLoader.java:358) at org.spark-project.jetty.servlet.ServletContextHandler.<init>(ServletContextHandler.java:136) at org.spark-project.jetty.servlet.ServletContextHandler.<init>(ServletContextHandler.java:129) at org.spark-project.jetty.servlet.ServletContextHandler.<init>(ServletContextHandler.java:98) at org.apache.spark.ui.JettyUtils$.createServletHandler(JettyUtils.scala:110) at org.apache.spark.ui.JettyUtils$.createServletHandler(JettyUtils.scala:101) at org.apache.spark.ui.WebUI.attachPage(WebUI.scala:78) at org.apache.spark.ui.WebUI$$anonfun$attachTab$1.apply(WebUI.scala:62) at org.apache.spark.ui.WebUI$$anonfun$attachTab$1.apply(WebUI.scala:62) at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59) at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:47) at org.apache.spark.ui.WebUI.attachTab(WebUI.scala:62) at org.apache.spark.ui.SparkUI.initialize(SparkUI.scala:61) at org.apache.spark.ui.SparkUI.<init>(SparkUI.scala:74) at org.apache.spark.ui.SparkUI$.create(SparkUI.scala:190) at org.apache.spark.ui.SparkUI$.createLiveUI(SparkUI.scala:141) at org.apache.spark.SparkContext.<init>(SparkContext.scala:466) at com.test.Test$.main(Test.scala:13) at com.test.Test.main(Test.scala) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:606) at com.intellij.rt.execution.application.AppMain.main(AppMain.java:144)

　　可以把servlet-api 2.5 jar刪除即可：

最好的辦法是刪除pom.xml中相關的依賴，即

1 2 3 4 5 <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.7.1</version> </dependency>

最後的pom.xml檔案的依賴是

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 <dependencies> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-common</artifactId> <version>2.7.1</version> </dependency> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-hdfs</artifactId> <version>2.7.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.10</artifactId> <version>1.5.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.10</artifactId> <version>1.5.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-hive_2.10</artifactId> <version>1.5.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.10</artifactId> <version>1.5.2</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-mllib_2.10</artifactId> <version>1.5.2</version> </dependency> <dependency> <groupId>com.databricks</groupId> <artifactId>spark-avro_2.10</artifactId> <version>2.0.1</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.10</artifactId> <version>1.5.2</version> </dependency> </dependencies>

　　如果是報了這個錯誤，也沒有什麼問題，程式依舊可以執行，

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 java.io.IOException: Could not locate executablenull\bin\winutils.exe in the Hadoop binaries. at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:356) at org.apache.hadoop.util.Shell.getWinUtilsPath(Shell.java:371) at org.apache.hadoop.util.Shell.<clinit>(Shell.java:364) at org.apache.hadoop.util.StringUtils.<clinit>(StringUtils.java:80) at org.apache.hadoop.security.SecurityUtil.getAuthenticationMethod(SecurityUtil.java:611) at org.apache.hadoop.security.UserGroupInformation.initialize(UserGroupInformation.java:272) at org.apache.hadoop.security.UserGroupInformation.ensureInitialized(UserGroupInformation.java:260) at org.apache.hadoop.security.UserGroupInformation.loginUserFromSubject(UserGroupInformation.java:790) at org.apache.hadoop.security.UserGroupInformation.getLoginUser(UserGroupInformation.java:760) at org.apache.hadoop.security.UserGroupInformation.getCurrentUser(UserGroupInformation.java:633) at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2084) at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2084) at scala.Option.getOrElse(Option.scala:120) at org.apache.spark.util.Utils$.getCurrentUserName(Utils.scala:2084) at org.apache.spark.SparkContext.<init>(SparkContext.scala:311) at com.test.Test$.main(Test.scala:13) at com.test.Test.main(Test.scala) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:606) at com.intellij.rt.execution.application.AppMain.main(AppMain.java:144)

　　最後看到的正常輸出：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65

Hello World! Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties 16/09/19 11:21:29 INFO SparkContext: Running Spark version 1.5.1 16/09/19 11:21:29 ERROR Shell: Failed to locate the winutils binary in the hadoop binary path

java.io.IOException: Could not locate executable

null\bin\winutils.exe in the Hadoop binaries. at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:356) at org.apache.hadoop.util.Shell.getWinUtilsPath(Shell.java:371) at org.apache.hadoop.util.Shell.<clinit>(Shell.java:364) at org.apache.hadoop.util.StringUtils.<clinit>(StringUtils.java:80) at org.apache.hadoop.security.SecurityUtil.getAuthenticationMethod(SecurityUtil.java:611) at org.apache.hadoop.security.UserGroupInformation.initialize(UserGroupInformation.java:272) at org.apache.hadoop.security.UserGroupInformation.ensureInitialized(UserGroupInformation.java:260) at org.apache.hadoop.security.UserGroupInformation.loginUserFromSubject(UserGroupInformation.java:790) at org.apache.hadoop.security.UserGroupInformation.getLoginUser(UserGroupInformation.java:760) at org.apache.hadoop.security.UserGroupInformation.getCurrentUser(UserGroupInformation.java:633) at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2084) at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2084) at scala.Option.getOrElse(Option.scala:120) at org.apache.spark.util.Utils$.getCurrentUserName(Utils.scala:2084) at org.apache.spark.SparkContext.<init>(SparkContext.scala:311) at com.test.Test$.main(Test.scala:13) at com.test.Test.main(Test.scala) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:606) at com.intellij.rt.execution.application.AppMain.main(AppMain.java:144) 16/09/19 11:21:29 WARN NativeCodeLoader: Unable to load native

-hadoop library

for your platform... using builtin-java classes where applicable 16/09/19 11:21:30 INFO SecurityManager: Changing view acls to: pc 16/09/19 11:21:30 INFO SecurityManager: Changing modify acls to: pc 16/09/19 11:21:30

INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(pc); users with modify permissions: Set(pc)

16/09/19 11:21:30 INFO Slf4jLogger: Slf4jLogger started 16/09/19 11:21:31 INFO Remoting: Starting remoting 16/09/19 11:21:31 INFO Remoting: Remoting started; listening on addresses :[akka.tcp://[email protected]:52500] 16/09/19 11:21:31 INFO Utils: Successfully started service 'sparkDriver' on port 52500. 16/09/19 11:21:31 INFO SparkEnv: Registering MapOutputTracker 16/09/19 11:21:31 INFO SparkEnv: Registering BlockManagerMaster 16/09/19 11:21:31

INFO DiskBlockManager: Created local directory at C:\Users\pc\AppData\Local\Temp\blockmgr-f9ea7f8c-68f9-4f9b-a31e-b87ec2e702a4

16/09/19 11:21:31 INFO MemoryStore: MemoryStore started with capacity 966.9 MB 16/09/19 11:21:31 INFO HttpFileServer: HTTP File server directory is C:\Users\pc\AppData\Local\Temp\spark-64cccfb4-46c8-4266-92c1-14cfc6aa2cb3\httpd-5993f955-0d92-4233-b366-c9a94f7122bc 16/09/19 11:21:31 INFO HttpServer: Starting HTTP Server 16/09/19 11:21:31 INFO Utils: Successfully started service 'HTTP file server' on port 52501. 16/09/19 11:21:31 INFO SparkEnv: Registering OutputCommitCoordinator 16/09/19 11:21:31 INFO Utils: Successfully started service 'SparkUI' on port 4040. 16/09/19 11:21:31 INFO SparkUI: Started SparkUI at http://192.168.51.143:4040 16/09/19 11:21:31 WARN MetricsSystem: Using default

   
 
  
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    Spark Idea Maven 開發環境搭建
      
一、安裝jdk
jdk版本最好是1.7以上，設定好環境變數，安裝過程，略。
二、安裝Maven
我選擇的Maven版本是3.3.3，安裝過程，略。
編輯Maven安裝目錄conf/settings.xml檔案，



?

1
2



<!-- 修改Maven 庫存放目錄-->
<loc 

  
 

    

    
    Spark2.2,IDEA,Maven開發環境搭建附測試
      
                

前言：

　　停滯了一段時間，現在要沉下心來學習點東西，出點貨了。

　　本文沒有JavaJDK ScalaSDK和 IDEA的安裝過程，網路上會有很多文章介紹這個內容，因此這裡就不再贅述。

一、在IDEA上安裝Scala外掛

首先開啟IDEA，進入最初的視窗，選擇C 

  
 

    

    
    Maven開發環境搭建
      環境   命令   zip   pre   class   src   保存   found   ack   配置Maven流程：
1.下載Maven,官網:http://maven.apache.org/
 
2.安裝到本地：
　　1 ).解壓apache-maven-x.x.x-bin.zip文件
　　2 

  
 

    

    
    Ubuntu 16.04下Spark安裝與開發環境搭建
       
 
 https://blog.csdn.net/lengconglin/article/details/77847623 
   
   
 一、Spark執行環境  　 　Spark是Scala寫的，執行在JVM上，所以執行環境Java7+，如果使用Python 

  
 

    

    
    spark sql scala 開發環境搭建 以及必要jar包匯入
      
								
								            
							
							
							1. scala 環境安裝及安裝 （官網下載） 
 
2.檢驗 scala 是否安裝成功 
 
3.安裝 scala 整合開發環境 IDEA （官網自行下載安裝） 
4.在 IDEA 上 安裝 scal 

  
 

    

    
    Spark部署與開發環境搭建jjar執行
      
                
http://www.cnblogs.com/datahunter/p/4002331.html


1. 安裝JDK

　　解壓jdk安裝包到/usr/lib目錄：

1 sudo cp jdk-7u67-linux-x64.gz /usr/lib
2 cd /usr/l 

  
 

    

    
    【技術文件】jeecg3.8-maven 開發環境搭建入門
      
                

JEECG 微雲快速開發平臺（3.8）Eclipse-Maven版本手把手入門手冊


	官方標準開發工具：
	1. IDE
	        Eclipse Java EE IDE for Web Developers.
	        Version: Helios 

  
 

    

    
    Mac OS + IntelliJ Idea +Git 開發環境搭建實戰
      
							
							
							



1.Mac OS  10.11.6 [OS X EL Captain]


  Mac OS是一套運行於蘋果Macintosh系列電腦上的作業系統。Mac OS是首個在商用領域成功的圖形使用者介面作業系統。Mac系統是基於Unix核心的圖形化作業系統；一 

  
 

    

    
    Hadoop Intellij IDEA本地開發環境搭建
      
							
							
							首先我們需要新建一個java工程用於開發Mapper與Reducer，同時我們也需要匯入hadoop的依賴包，這些包可以在hadoop的 share/hadoop 目錄下找到，你可以把這些包單獨取出來作為之後專案的備用。

開啟Project Structure 

  
 

    

    
    IDEA Maven JFianl環境搭建
      
							
							
							IDEA Maven JFinal環境搭建

IDEA：2016

JFinal：2.2



一、新建專案

選擇maven建立，並使用模板



Groupid：是公司域名反寫

Artifactid: 專案名



在建立Maven專案時加上 archet 

  
 

    

    
    【MAVEN】 Maven開發環境搭建
      
                
1、準備
1.1 下載maven安裝包
maven的官方下載地址是http://maven.apache.org/download.cgi 根據自己的作業系統選擇相應的版本

1.2 jdk環境變數
因為maven依賴Java環境執行，所以在使用maven之前需要配置Jav 

  
 

    

    
    Spark SQL 本地開發環境搭建和案例分析
      
                


1_Spark APIs 的演變
     Spark SQL，作為Apache Spark大資料框架的一部分，主要用於結構化資料處理和對Spark資料執行類SQL的查詢。通過Spark SQL，可以實現多種大針資料業務，比如對PG/TG級別的資料分析、分析預測並推薦、 

  
 

    

    
    Spark開發環境搭建（IDEA、Maven）
       
  
  
 在搭建開發環境之前，請先安裝好scala開發環境和spark： scala：https://blog.csdn.net/qq_39429714/article/details/84332869 spark：https://blog.csdn.net/qq_39429714/article/d 

  
 

    

    
    spark開發環境搭建(基於idea 和maven)
      
                轉載文章出自：http://blog.csdn.net/u012373815/article/details/53266301使用idea構建maven 管理的spark專案 ，預設已經裝好了idea 和Scala,mac安裝Scala 那麼使用idea 新建maven 管理 

  
 

    

    
    java開發環境搭建--jdk安裝、maven配置、Idea
       
 
   
   
 安裝 JDK 
 下載安裝 
 首先開啟 Oracle 官網 JDK 1.8 下載頁面，根據下圖選擇下載各系統對應的版本，這裡以 Win10 64 位作業系統為例。 
  
 下載完成之後，雙擊滑鼠進行安裝，一直單擊“下一步”按鈕直至安裝完畢。 
 環境 

  
 

    

    
    Spark Scala IntelliJ IDEA開發環境搭建（入門）
      
							
							
							一、下載安裝IntelliJ IDEA



二、安裝Scala外掛 
 
三、建立Maven工程 
 


填寫完GroupId，ArtifactId後填寫工程名稱，一直下一步，直到工程建立完成。

建立完成後目錄結構如下圖



在main目錄下面建立sca 

  
 

    

    
    Spark+ECLIPSE+JAVA+MAVEN windows開發環境搭建及入門例項【附詳細程式碼】
      
                

前言
本文旨在記錄初學Spark時，根據官網快速入門中的一段Java程式碼，在Maven上建立應用程式並實現執行。

首先推薦一個很好的入門文件庫，就是CSDN的Spark知識庫，裡面有很多spark的從入門到精通的形形色色的資料，
1.開發軟體恭喜你，拿到spark駕考 

  
 

    

    
    Scala2.11.8 + Sbt + Maven + IntelliJ Idea + Spark2.0開發環境搭建備忘
      
                
已有hadoop yarn 和 spark 叢集部署、執行在分散式環境中，程式開發編碼在PC上，由於逐漸增多scala編寫spark2.0程式，入鄉隨俗使用sbt和IntelliJ Idea，順便對PC上的Scala + sbt + maven + IntelliJ Ide 

  
 

    

    
    Hadoop實踐（二）---叢集和開發環境搭建（Intellij IDEA & Maven  開發Hadoop）
      
							
							
							1. 開發環境準備

1. Hadoop叢集安裝



2. Maven安裝



3. Intellij IDEA安裝





2. 建立專案

1. 建立Maven專案





2. 輸入GroupId 和 ArtifactId



新建專案後有提示  

  
 

    

    
    利用KNIME建立Spark Machine learning 模型 1：開發環境搭建
      大數據分析   KNIME   Machine Learning   Spark   建模   １、Knime Analytics　安裝從官方網站下載合適的版本　https://www.knime.com/downloads 將下載的安裝包在安裝路徑解壓　https://www.knime.com/insta 

  

            

          
        
      
    
    
  
    搜尋
    
        
      
      
    
  
 
  
  
    基礎教學
     
    Mysql入門  
     Sql入門 
      Android入門 
       Docker入門 
        Go語言入門 
         Ruby程式入門 
          Python入門 
           Python進階 
            Django入門 
             Python爬蟲入門 
             
      
      
  
   
  
    最近訪問
    
  	      
  
      
    
  

 

 


  
    
      
        
          首頁
前端設計
程式設計
免費資源
實用技巧
資料庫
資訊
字典
        
          Copyright © 2002-2020  程式人生 796T.COM All rights reserved.