Win10系統下spark的環境搭建

阿新 • • 發佈：2019-01-05

環境準備

·jdk配置；
·scala安裝與配置；
·spark安裝與配置；
·hadoop安裝與配置；

版本說明

·jdk：1.8
·scala：2.11.8
·spark：2.4.0
·hadoop：2.8.3

jdk配置

首先，進入我的電腦-〉系統屬性-〉高階系統設定->環境變數
配置JAVA_Home

配置Path
驗證配置

scala安裝與配置

scala下載
官方地址：https://www.scala-lang.org/download/2.11.8.html
配置使用者變數下的Path
變數值一欄輸入：E:\scala 也就是scala的安裝目錄
注意：安裝路徑不能有空格和中文，否則報錯，出現報錯需要解除安裝重灌
配置系統變數下的Path變數
在"變數值"一欄的最前面新增如下的路徑： %SCALA_HOME%\bin;%SCALA_HOME%\jre\bin;
注意：後面的分號；不要漏掉。
設定系統變數下的Classpath 變數：
· “變數名”：ClassPath
· “變數值”：
· .;%SCALA_HOME%\bin;%SCALA_HOME%\lib\dt.jar;%SCALA_HOME%\lib\tools.jar.;
驗證配置

spark安裝與配置

spark下載：http://spark.apache.org/downloads.html

選擇3，進入下載頁面，選擇預設下載
下載完畢後解壓到D:
配置Path

如上，可以看到對應的spark、scala、java版本，同時存在異常資訊，異常資訊是由於hadoop導致的，下面來配置hadoop即可解決該異常。

Hadoop安裝與配置

Hadoop官網下載：http://hadoop.apache.org/releases.html
解壓Hadoop
配置Path
驗證配置

基於spark用線性迴歸進行資料預測

分類和聚類演算法很多，但是對資料進行精準預測的演算法不是很多，這裡參照了別人的線性迴歸的例子，使用spark ml進行線性迴歸。
資料格式

標籤,特徵值1 特徵值2 特徵值3...

 1. 1,1.9
 2. 2,3.1
 3. 3,4
 4. 3.5,4.45
 5. 4,5.02
 6. 9,9.97
 7. -2,-0.98

實現程式碼如下

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint

val data_path = "files/C:/Users/84913/Desktop/sfy/linear_regression_data1.txt"
val data = sc.textFile(data_path)
val training = data.map { line =>
  val arr = line.split(',')
  LabeledPoint(arr(0).toDouble, Vectors.dense(arr(1).split(' ').map(_.toDouble)))
}.cache()
training.foreach(println)

結果

(1.0,[1.9])
(2.0,[3.1])
(3.0,[4.0])
(3.5,[4.45])
(4.0,[5.02])
(9.0,[9.97])
(-2.0,[-0.98])

Win10系統下spark的環境搭建

環境準備 ·jdk配置； ·scala安裝與配置； ·spark安裝與配置； ·hadoop安裝與配置；版本說明 ·jdk：1.8 ·scala：2.11.8 ·spark：2.4.0 ·hadoop：2.8.3 jdk配置首先，進入我的電腦-〉系統屬性-

Win10系統下彙編環境的搭建

最近在上彙編，課下上機發現Win10沒有debug的命令，百度後知道Win10沒有彙編的環境，在搜尋學習很多部落格後，自己總結一下。一、debug命令的實現彙編上機最基本的就是會使用debug

php手動搭建wamp環境（一）--之 Windows系統下PHP環境搭建

1、PHP環境搭建的前提是 Apache HTTP Server （Apache 伺服器）已經安裝部署成功，並可以正常訪問到伺服器的主頁面。Apache HTTP Server 的安裝部署已經在上一篇講解的很詳細了，不清楚的可以點選“ Apache HTTP Servcer-Apache伺服器下載與

win10系統下jdk環境變數配置

工具/原料 jdk-8u162-windows-x64 Win10 方法/步驟 1 .安裝JDK 選擇安裝目錄安裝過程中會

Win7下Spark環境搭建

1.spark下載 2.scala下載 3.hadoop下載 4.winutils.exe下載 5.環境變數 SCALA_HOME : C:\Program Files (x86)\sca

Windows系統下Python環境的搭建

系統環境 ava rsquo ... sta chang 自定義默認 python安裝一、下載Python安裝包 Python官網：地址下載在Pthon安裝包，目前Python 2.x最新版本Python 2.7.14，Python 2.x最新版本Python 3.

Windows 64 位系統下 Python 環境的搭建

for libs ref soft strong 註冊表 -- cnblogs %20 Windows 64 位開發環境註意：本教程適用於 Windows 7 64 位操作系統及 Windows 10 64 位操作系統，其他系統尚未經過校驗。安裝 IDE PyCh

Spark學習筆記--Spark在Windows下的環境搭建（轉）

最新版本 https ons console 步驟新版本用戶 ref sudo 一、JDK的安裝 1、1 下載JDK 　　首先需要安裝JDK，並且將環境變量配置好，如果已經安裝了的老司機可以忽略。JDK（全稱是JavaTM Platform Standard Editi

Spark在Windows下的環境搭建

[] 特定 features 千萬安裝目錄 standard har java test load 由於Spark是用Scala來寫的，所以Spark對Scala肯定是原生態支持的，因此這裏以Scala為主來介紹Spark環境的搭建，主要包括四個步驟，分別是：JDK的安裝

Windows系統下Eclipse上搭建Python開發環境

acl ora .com sdn down win ava ecp http 參考網站： https://blog.csdn.net/zhangphil/article/details/78962159 1、先安裝JDK ，參考網站:https://www.cnblog

ionic 3 vscode 在win10下開發環境搭建

最近學習ionic3開發，按照官網介紹的方法做開發環境搭建，發現並不正確(還是2.0的），網上找到的一些資訊也不對，因為Ionic版本從1.0到3.0變化很大。現把安裝過程記錄下來，給各位探索的朋友們節省時間。具體的安裝環節不做詳細介紹，不會的同學可以百度搜索（找不到答案時可以嘗試bi

win10系統下java的環境配置及helloworld的編寫

win10java配置環境變數，編寫Hello world程式配置環境變數：滑鼠右鍵單擊此電腦選擇”屬性“，再選擇“高階系統設定”，於”高階“選項中點開“環境變數” 這裡寫圖片描述（1）新建一個JAVA_HOME變數值為安裝路徑這裡寫圖片

Win10系統下安裝Python及配置Tensorflow（GPU）環境

在Windows 10 系統下安裝Python及配置Tensorflow框架環境，可用使用軟體Anaconda，更加方便一些；一. Win10環境下安裝Anaconda（Python）下載Anaconda：在 https://www.anaconda.

Java在win10系統下32位和64位環境變數設定

今天解決的一個問題終於把困擾我多年的環境變數之類的東西搞懂了。這一切罪惡的根源就是win10的64位系統可以相容32位軟體當我多年前安裝java的時候，我選擇了安裝32位版本的java而並非64位版本。我按照百度經驗的教程https://jingyan.baidu.c

新手小白安裝Ubuntu+Win10雙系統+ROS+Dashgo環境搭建

新手小白安裝Ubuntu+Win10雙系統+ROS+Dashgo環境搭建第一篇部落格，基本是對前人經驗的總結及改進。 *前言：本篇文章是對於近期安裝Win10+Ubuntu系統，並且在Ubuntu系統下安裝ROS，對EAI Dashgo D1底盤進行控制的經驗記錄。因

Ubuntu系統下LAMP環境及WordPress搭建

0. 連線伺服器ssh [email protected]你的ip -p 22 1.準備 LAMP 環境 LAMP 是 Linux、Apache、MySQL 和 PHP 的縮寫，是 Wordpress 系統依賴的基礎執行環境。我們先來準備 LAMP 環境：安裝

在 Win10 系統下安裝 JDK 及配置環境變數的方法

首先，在官網下載 JDK：Oracle 官網如上圖所示，在 Oracle 官網下載 JDK，有一點需要注意，那就是在我們下載合適的 JDK 之前，需要先點選標記 1 所在的按鈕，選擇接受。否則的話，直接點選 JDK 進行下載的時候，將會彈出如下介面：

Win10下OpenCV環境搭建(VS2017+OpenCV3.2.0)

OpenCV：計算機視覺開源庫開發環境搭載：（1） VS2017版本（2） OpenCV 3.2.0版本（3）配置環境變數和在VS2017中引入標頭檔案、庫檔案、連線庫。具體步驟按序如下

win10系統下cmd呼叫cl編譯器編譯c++環境變數配置

環境變數截圖：修改“zzw06的使用者變數”，編輯PATH，新增： C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\bin;C:\Program Files (x86)\Windows Kits\10\Inc

windows系統下Python環境的搭建-（轉）

<div class="postBody"> <div id="cnblogs_post_body"><p><span style="color:black; font-family:微軟雅黑; font

Win10系統下spark的環境搭建

jdk配置

scala安裝與配置

spark安裝與配置

Hadoop安裝與配置

基於spark用線性迴歸進行資料預測

相關推薦