Spark之偽分散式搭建、偽分散式Hadoop、Hive安裝

阿新 • • 發佈：2019-04-03

怎麼在本地安裝Spark，這裡就不再描述了。

List-1

#在SPARK_HOME/conf下
>cp slaves.template slaves
#之後在slaves裡面寫入hostname，如下
>more slaves
mjduan-host


>cp spark-env.sh.template spark-env.sh
#修改spark-env.sh，寫入如下內容,SPARK_MASTER_IP寫mjduan-host
>more spark-env.sh 
export JAVA_HOME=/opt/software/tool/jdk1.8
export HADOOP_HOME=/opt/software/docker/hadoop/hadoop-2.7.7
export SCALA_HOME=/opt/software/tool/scala2.12
export HADOOP_CONF_DIR=/opt/software/docker/hadoop/hadoop-2.7.7/etc/hadoop
export SPARK_MASTER_IP=mjduan-host
export SPARK_WORKER_MEMORY=2048M

之後進入$SPARK_HOME/sbin下，執行start-all.sh，可以看下是否啟動成功，之後去看localhost:8080，可以看到spark的介面。

jps命令可以看到有個Master和Worker。

注意，啟動Spark是可以啟動的，但是如果往Spark上提交程式，Spark預設會從hdfs讀取資料，而不是本地。所以要安裝好HADOOP，安裝Hadoop的時候，帶上了hdfs、yarn都安裝好了。

給Spark提交任務，master後面的URL，如果不知道，可以從日誌中看到或者Spark UI介面中看到。

List-2

spark-submit  --class com.mjduan.project.SimpleApp  --master spark://mjduan-host:7077  Spark-helloworld.jar

安裝Hadoop-2.7，Hive-2.3，參考: https://blog.csdn.net/u013332124/article/details/85223496 ，左邊安裝Hadoop的教程裡面，沒有設定yarn，要配置yarn，不然在hive命令列中進入insert時會報錯，配置yarn參考: https://blog.csdn.net/linbo_18874208784/article/details/74178236

，在安裝Hive時，報使用者無法訪問hive，要修改hive的配置檔案，參考: https://stackoverflow.com/questions/40603714/hive-is-not-allowed-to-impersonate-hive

Spark偽分散式的安裝，參考: https://blog.csdn.net/zhihaoma/article/details/52296645<

本地搭建hadoop叢集--hive安裝2.3.3

2.3.3和2以下的安裝區別就是如下波浪線需要在執行hive之前進入 bin目錄 schematool -dbType derby -initSchema 這裡可以用mysql 。derby都行。具體支援哪些jdbc 作為元資料底層這個就不曉得了。目前用的最多的是 mysq

Spark之偽分散式搭建、偽分散式Hadoop、Hive安裝

開發十年，就只剩下這套架構體系了！ >>>

Hadoop安裝之偽分散式搭建

本文介紹apache hadoop的第二種搭建模式：偽分散式。關於偽分散式的搭建基於上篇《Hadoop安裝之standAlone單機》文章中standAlone搭建的基礎之上進行擴建。安裝伺服器規劃伺服器IP 192.168.254.1

Spark本地安裝及Linux下偽分散式搭建

title: Spark本地安裝及Linux下偽分散式搭建 date: 2018-12-01 12:34:35 tags: Spark categories: 大資料 toc: true 個人github部落格：Josonlee’s Blog 文章目錄

hadoop初識之三：搭建hadoop環境（配置HDFS，Yarn及mapreduce 執行在yarn）上及三種執行模式（本地模式，偽分散式和分散式介）

--===============安裝jdk（解壓版）================== --root 使用者登入 --建立檔案層級目錄 /opt下分別建 modules/softwares/datas/tools 資料夾 --檢視是否安裝jdk rpm -

05.偽分散式、克隆、完全分散式搭建

Hadoop：資料儲存模組資料計算模組 doug cutting //hadoop之父 //分散式檔案系統GFS，可用於處理海量網頁的儲存 //分散式計算框架MAP REDU

Hadoop簡單入門之偽分散式搭建

前面兩章主要講解了完全分散式的搭建，這章主要講解伺服器單機完成偽分佈的搭建,介紹Hadoop配置，啟動，以及簡單測試。我的機器:阿里雲伺服器，64位，Java64，Hadoop2.4.1（64）所有軟體下載百度雲密碼：uup8 講在

Hadoop偽分散式、完全分散式搭建和測試（詳細版）

安裝 Hadoop 入門學習，快速搭建偽分散式環境。注：需要下載的安裝包在文章底部，請自行獲取。 1. 修改主機名 vim /etc/hostname vim /etc/hosts reboot reboot 重啟主機使修改配置檔案生效，這裡我

Hadoop單機、偽分散式叢集搭建（十分詳細）

原文地址：http://blog.csdn.net/dr_guo/article/details/50886667 下面我就一邊搭建一邊寫怎麼搭建Hadoop偽分佈模式。 1.下載jdk並安裝去官網下就可以了，下完之後把檔案移到/o

Hadoop的偽分散式搭建

已正確安裝jdk環境 JDK測試安裝成功: >java -version 解壓Hadoop，建議解壓目錄:/usr/local下免密登陸設定(如果不加免密操作，每次啟動和關閉會有多次輸入密碼過程)： >ssh-keygen -t dsa -P '

hadoop單機版和偽分散式搭建

單機版：使用的是linux上的檔案系統，用於測試使用過程：解壓到 /usr/local/ 配置/etc/profile下的環境變數 source /etc/profile ,然後修改 /usr/local/etc/hadoop/hadoop-env.sh 中的JAVA_HOME為jd

搭建真正的zookeeper叢集搭建zookeeper偽分散式叢集

搭建zookeeper偽分散式叢集 zookeeper是Hadop Ecosystem中非常重要的元件，它的主要功能是為分散式系統提供一致性協調服務，提供的功能包括配置維護，域名服務，分散式同步和組服務。 zookeeper的目標就是封裝好複雜易出錯的關鍵服務，將簡單易用的介面和效能高

安裝HBase--單節點、偽分散式、完全分散式安裝

1.下載HBase 連結：http://mirrors.cnnic.cn/apache/hbase/ 選擇 stable 目錄，下載 bin 檔案：在Linux上解壓，部落格中解壓在/home/hadoop 目錄下：進入解壓目錄： 2.修改配置修改JD

cdh5.7.0偽分散式叢集之hive安裝

基本環境及軟體：軟體版本軟體包 centos-6.4 JDK-1.8 jdk-8u191-linux-x64.tar.gz hadoo

zookeeper偽分散式搭建

一、描述偽分散式叢集就是在一臺機器部署多個zk應用，部署之前伺服器需要有jdk環境 java -version可以顯示相關java資訊才可以進行zookeeper搭建二、步驟第一步下載好zookeeper-3.4.9.tar.gz 然後解壓tar -zxvf zookeeper-3.4.

偽叢集與簡單完全分散式叢集的搭建

我是在root許可權下搭建的流程比較簡單 1.簡單單機Hadoop叢集（偽分散式）搭建流程下載 JDK 與Hadoop壓縮包，將檔案傳入linux系統中解壓配置環境： ①首先

hadoop-2.6.0-cdh5.7.0偽分散式搭建

1，這個我們是直接在linux中下載hadoop-2.6.0-cdh5.7.0，（當然你也可以在本地下載後再上傳，這步就可以忽略）首先確保你的虛擬機器有網路，可以先ping百度測試有網沒，如下程式碼就是有網路的情況。 [[email protected

大資料(四) --偽分散式搭建

說明搭建之前, 先根據HDFS三種模式一文將叢集的初始環境配置好. 偽分散式搭建將上傳的Hadoop壓縮包解壓這裡我將檔案解壓到/opt/software/hadoop資料夾下. tar -zxf hadoop-2.6.5.tar.gz -C

Hadoop 偽分散式搭建

1.下載解壓，我下的2.8.5 2.編輯etc/hadoop/core-site.xml <configuration> <property> <name>fs.defaultFS</name>

hadoop偽分散式搭建

加粗體為檔案或目錄的路徑，應根據自己的路徑不同而做適度的修改 1.設定IP地址執行命令：service network restart 驗證：ifconfig 2.關閉防火牆執行命令:systemctl stop firewalld.service 3.關閉

Spark之偽分散式搭建、偽分散式Hadoop、Hive安裝

相關推薦