spark1.2.0版本搭建偽分散式環境

阿新 • • 發佈：2019-01-26

2、安裝和配置scala：

第一步：上傳scala安裝包並解壓

第二步配置SCALA_HOME環境變數到bash_profile

第三步 source 使配置環境變數生效：

第四步驗證scala：

4、安裝和配置spark：

第一步解壓spark：

第二步配置SPARK_HOME環境變數：

第三步使用source生效：

進入spark的conf目錄：

第四步修改slaves檔案，首先開啟該檔案：

slaves修改後：

第五步配置spark-env.sh

首先把spark-env.sh.template拷貝到spark-env.sh：

然後開啟“spark-env.sh”檔案：

spark-env.sh檔案修改後：

5、啟動spark偽分散式幫檢視資訊：

第一步先保證hadoop叢集或者偽分散式啟動成功，使用jps看下程序資訊：

如果沒有啟動，進入hadoop的sbin目錄執行 ./start-all.sh

第二步啟動spark：

進入spark的sbin目錄下執行“start-all.sh”：

此刻我們看到有新程序“Master” 和"Worker"

我們訪問“http://master:8080/”，進如spark的web控制檯頁面：

從頁面上可以看到一個Worker節點的資訊。

我們進入spark的bin目錄，使用“spark-shell”控制檯：

通過訪問"http://master:4040"，進入spark-shell web控制檯頁面：

6、測試spark偽分散式：

我們使用之前上傳到hdfs中的/data/test/README.txt檔案進行mapreduce

取得hdfs檔案：

對讀取的檔案進行一下操作：

使用collect命令提交併執行job：

readmeFile.collect

檢視spark-shell web控制檯：

states：

埠整理：

master埠是7077

master webui是8080

spark shell webui埠是4040

spark1.2.0版本搭建偽分散式環境

2、安裝和配置scala：第一步：上傳scala安裝包並解壓第二步配置SCALA_HOME環境變數到bash_profile 第三步 source 使配置環境變數生效：第四步驗證

在 CentOS 7.2 下安裝 Hadoop 2.7.5 並搭建偽分散式環境的方法

資源下載一、建立 Hadoop 使用者建立 hadoop 使用者，並分配以使用者名稱為家目錄/home/hadoop，並將其加入到sudo使用者組，建立好使用者之後，以 hadoop 使用者登入： sudo useradd

搭建偽分散式環境訪問不到NameNode頁面

在操作API文件Standalone Operation的例子時，出現了頁面訪問錯誤的情況。原因如下： NameNode、DataNode等啟動失敗。可以使用jps檢視啟動情況。如圖：可能是虛擬機器的防火牆開啟。虛擬機器安裝時防火牆預設開啟，很多人沒有注意這個問題。將

hadoop2.2.0上spark偽分散式安裝

1. 從官網上下下載合適的版本： http://spark.apache.org/downloads.html 筆者下載的是for hadoop2.2版本的spark0.9.2 2. 解壓，配置環境： sudo gedit /etc/profile 新增SPARK_HOM

阿里雲虛擬機器搭建Hadoop-2.6.0-cdh5.7.1安裝詳解（偽分散式環境）

首先先搭配安全組開啟映象後輸入以下內容：重要： yum -y install lrzsz HOSTNAME=（自己的主機名字） hostname $HOSTNAME echo "$(grep -E '127|::1' /etc/host

Hadoop2.2.0偽分散式環境搭建（附：64位下編譯Hadoop-2.2.0過程）

Hadoop2.2.0偽分散式環境搭建：寫在前面：Hadoop2.2.0預設是支援32位的OS，如果想要在64位OS下執行的話，可以通過在64位OS下面編譯Hadoop2.2.0來實現，編譯的操作步驟在最後面呈現。 1：操作：下載軟體；檔案：Hadoop-2.2.0.

hadoop2.9.0 hdfs環境搭建(偽分散式)

搭建hadoop2.9.0偽分散式步驟使用了centos7,jdk1.8,hadoop2.9.0 版本算是很新的了.沒有使用什麼古老的版本. 1. 檢視自帶的jdk,解除安裝centos中自帶的jdk 檢視: rpm -qa |grep java 解除安

從零開始搭建大資料平臺系列之（2.1）—— Apache Hadoop 2.x 偽分散式環境搭建

JDK 版本：jdk 1.7.0_67 Apache Hadoop 版本：Hadoop 2.5.0 1、安裝目錄準備 ~]$ cd /opt/ opt]$ sudo mkdir /opt/modules opt]$ sudo chown beifeng:b

Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1單機和偽分散式環境

引言一直用的Ubuntu 32位系統（準備下次用Fedora，Ubuntu越來越不適合學習了），今天準備學習一下Hadoop，結果下載Apache官網上釋出的最新的封裝好的2.5.1版，配置完了根本啟動不起來，檢視錯誤日誌發現是native庫的版本和系統不一致，使用fil

搭建Hadoop偽分散式環境（筆記）

軟硬體環境 CentOS 7.2 64 位 OpenJDK- 1.8 Hadoop- 2.7 關於本教程的說明雲實驗室雲主機自動使用 root 賬戶登入系統，因此本教程中所有的操作都是以 root 使用者來執行的。若要在自己的雲主機上進行本教程的實驗，為了系統安全，建議

Hadoop偽分散式環境搭建之Linux作業系統安裝

Hadoop偽分散式環境搭建之Linux作業系統安裝本篇文章是接上一篇《超詳細hadoop虛擬機器安裝教程（附圖文步驟）》，上一篇有人問怎麼沒寫hadoop安裝。在文章開頭就已經說明了，hadoop安裝會在後面寫到，因為整個系列的文章涉及到每一步的截圖，導致文章整體很長。會分別先對虛擬機器

Hadoop2.7.3單機偽分散式環境搭建

Hadoop2.7.3單機偽分散式環境搭建作者：家輝，日期：2018-07-10 CSDN部落格： http://blog.csdn.net/gobitan 說明：Hadoop測試環境經常搭建，這裡也做成一個模板並記錄下來。基礎環境

CDH 偽分散式環境搭建

安裝環境服務部署規劃伺服器IP 192.168.1.100 192.168.1.110 192.168.1.120 HDFS NameNode

Redis5之前版本高可用叢集搭建(偽分散式Ruby版)

一、簡介 Redis5以前安裝需要藉助ruby，Redis5版本以後不需要可參考Redis5.x版本快取搭建高可用叢集二、Redis高可用叢集搭建 redis安裝下載地址：http://redis.io/download 安裝步驟： # 把下載好的redis-3.0.0-rc2.tar.gz放在/u

Storm 偽分散式環境搭建

前提：安裝ZooKeeper tar -zxvf apache-storm-1.0.3.tar.gz -C ~/training/ 設定環境變數：vi ~/.bash_profile

Hive on Spark 偽分散式環境搭建過程記錄

進入hive cli是，會有如下提示： Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. s

hadoop系列之偽分散式環境搭建及測試驗證

Hadoop2.x 偽分散式環境搭建及測試驗證作者：Dennis 日期：2018-08-09 前置條件： Linux 虛擬機器一臺，版本為 CentOS 7.4，假設 IP 地址為 192.168.159.181，並修改如下：修改/etc/hostname 的

Ubuntu16.04搭建hadoop偽分散式環境

參考自：https://blog.csdn.net/hliq5399/article/details/78193113 原材料： 1.Ubuntu16.04作業系統成品（在vmware上安裝成功） 2.jdk-7u67-linux-x64.tar.gzjdk-7u67-

Linux centos7 下使用James3.2.0版本及James2.3.2.1版本郵箱搭建

因公司的業務需要，需要搭建一個自己的郵箱伺服器。選了很多的版本，最後選擇了James，並且分為兩個James的版本。3版本的和2版本的在以下都會介紹安裝配置和使用，以及外網部署的配置。參考別人的部落格以及對於James的官網研究了將近三天，最後將兩個版本的都測

大資料環境搭建之HBase偽分散式環境搭建步驟詳解

文章目錄 HBase簡介環境準備 JDK1.8以上 HBase 1.2.6 安裝模式安裝配置解壓安裝包配置檔案 hbase-env.

spark1.2.0版本搭建偽分散式環境

相關推薦