大資料(四) --偽分散式搭建

阿新 • • 發佈：2018-12-15

說明

搭建之前, 先根據HDFS三種模式一文將叢集的初始環境配置好.

偽分散式搭建

將上傳的Hadoop壓縮包解壓這裡我將檔案解壓到/opt/software/hadoop資料夾下. tar -zxf hadoop-2.6.5.tar.gz -C /opt/software/hadoop

進入配置檔案修改目錄 cd /opt/software/hadoop/hadoop-2.6.5/etc/hadoop/
修改hdfs-site.xml配置

vim hdfs-site.xml 編輯檔案, 在configuration標籤對中插入:

<property>
       <name>dfs.replication</name>
       <value>1</value>
</property>

<property>     
		<name>dfs.namenode.secondary.http-address</name>
     	<value>node01:50090</value>
</property>

其中dfs.replication配置的是block塊的副本數, 這裡偽分散式設值為1, 即沒有副本, 只有本身;

dfs.namenode.secondary.http-address配置的是SecondaryNameNode節點的地址和埠, 偽分散式都放在同一臺伺服器上.

修改core-site.xml配置

vim core-site.xml 編輯檔案, 在configuration標籤對中插入

<property>
        <name>fs.defaultFS</name>
        <value>hdfs://node01:9000</value>
</property>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/var/abc/hadoop/cluster</value>
</property>

其中fs.defaultFS配置的是hdfs檔案目錄的字首, 這裡配置好後, 在輸入操作hdfs目錄的命令時, 就可以直接從’ / ’ 處開始輸入路徑.

hadoop.tmp.dir配置的是hdfs生成檔案的存放目錄, 包括元資料資訊以及blockId.

修改slaves配置檔案

vim slaves

編輯slaves, 在檔案中寫入:

node01

slaves中配置的是從節點(DataNode)資訊, 對於偽分散式來說, 只需加入自身即可.

修改hadoop-evn.sh檔案

此步可先跳過, 該檔案可以不修改. 當啟動hdfs出現" JAVA_HOME cannot find or set" 類似的說明java_home沒有配置的提示時, 可再手動配置(前提是執行java -version成功在顯示器列印java版本).

vim hadoop-evn.sh

編輯檔案, 找到export JAVA_HOME=${JAVA_HOME}那一行

將 = 後的內容改為JAVA_HOME的確切路徑, 可使用 echo $JAVA_HOME檢視
export JAVA_HOME=/usr/local/jdk1.8.0_181

將hadoop配置到使用者環境變數中

此處配置好後, 可以在任意位置使用hdfs的指令.

vim ~/.bashrc
在檔案最後插入
export PATH=$PATH:/opt/software/hadoop/hadoop-2.6.5/bin:/opt/software/hadoop/hadoop-2.6.5/sbin

格式化NameNode

hdfs namenode -format

建立core-site中配置的目錄及檔案

啟動HDFS

start-dfs.sh

檢視啟動程序

jps

操作HDFS檔案系統

建立目錄 hdfs dfs -mkdir -p /abc/cba
上傳檔案 hdfs dfs -D dfs.blocksize=1048576 -put  text.txt
...

關閉HDFS

stop-dfs.sh
或
killall java

HDFS的程序都是基於JVM的, 因此殺死所有java程序也會把hdfs的程序給關閉.

大資料(四) --偽分散式搭建

說明搭建之前, 先根據HDFS三種模式一文將叢集的初始環境配置好. 偽分散式搭建將上傳的Hadoop壓縮包解壓這裡我將檔案解壓到/opt/software/hadoop資料夾下. tar -zxf hadoop-2.6.5.tar.gz -C

大資料（hadoop分散式搭建和yarn）

分散式搭建步驟 1：克隆一臺機器完成後，按以下步驟進行修改（作為源克隆主機） 1）修改網

大資料 hadoop2.5.2偽分散式搭建

1.準備Linux環境 1.0點選VMware快捷方式，右鍵開啟檔案所在位置 -> 雙擊vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 設定網段：192.168.8.0 子網掩碼：255.255.255.0 -> apply -&g

大資料偽分散式搭建

hadoop安裝配置在 /opt/ 目錄下建立 software 與 module 空資料夾 cd /opt/ mkdir software module 下載或上傳 Hadoop 安裝包到此目錄下 wget http://

大資料Hadoop叢集環境搭建（四）

安裝JDK 安裝Java JDK 1、檢視是否已經安裝了java JDK。 [[email protected] Desktop]# java –version 注意：Hadoop機器上的JDK，最好是Oracle的Java JDK，不然會有一些問題，比如可能沒

大資料系列之分散式釋出訂閱訊息系統Kafka（四）Kafka與Flume的3種整合

前面我們已經介紹了Flume，現在我們將Kafka與Flume整合先看一下Flume的結構組成：我們可以發現，將Flume與Kafka進行整合無非3種情況，Flume作為生產者——Sink輸出到Kafka，Flume作為消費者——Source接

Hadoop的偽分散式搭建

已正確安裝jdk環境 JDK測試安裝成功: >java -version 解壓Hadoop，建議解壓目錄:/usr/local下免密登陸設定(如果不加免密操作，每次啟動和關閉會有多次輸入密碼過程)： >ssh-keygen -t dsa -P '

hadoop單機版和偽分散式搭建

單機版：使用的是linux上的檔案系統，用於測試使用過程：解壓到 /usr/local/ 配置/etc/profile下的環境變數 source /etc/profile ,然後修改 /usr/local/etc/hadoop/hadoop-env.sh 中的JAVA_HOME為jd

Hadoop安裝之偽分散式搭建

本文介紹apache hadoop的第二種搭建模式：偽分散式。關於偽分散式的搭建基於上篇《Hadoop安裝之standAlone單機》文章中standAlone搭建的基礎之上進行擴建。安裝伺服器規劃伺服器IP 192.168.254.1

大資料平臺hive原生搭建教程

環境準備 centos 7.1系統需要三臺雲主機： master（8）作為 client 客戶端 slave1（9）作為 hive server 伺服器端 slave2（10）安裝 mysql server 安裝包使用的是官網下載的將hive上傳到master ，mys

大資料平臺--Hadoop原生搭建教程

環境準備: 三臺虛擬機器 master（8）、slave1（9）、slave2（10) centos 7.1、jdk-8u171-linux-x64.tar.gz、hadoop-2.7.3.tar.gz 0x1環境準備首先先在三臺虛擬機器中建立hadoop資料夾 mdkir /

1.大資料指CDH叢集搭建詳細步驟（一）

1.使用CDH,其中CDH表示的意思是Cloudera’s Distribution Including Apache Hadoop，簡稱“CDH”）基於web的使用者介面，支援大多數的hadoop元件，包括了HDFS，MapReduce以及HIve和Pig Hbase以及Zookeepe

大資料：spark叢集搭建

建立spark使用者組，組ID1000 groupadd -g 1000 spark 在spark使用者組下建立使用者ID 2000的spark使用者獲取視訊中文件資料及完整視訊的夥伴請加QQ群：947967114useradd -u 2000 -g spark spark 設定密碼 passwd

zookeeper偽分散式搭建

一、描述偽分散式叢集就是在一臺機器部署多個zk應用，部署之前伺服器需要有jdk環境 java -version可以顯示相關java資訊才可以進行zookeeper搭建二、步驟第一步下載好zookeeper-3.4.9.tar.gz 然後解壓tar -zxvf zookeeper-3.4.

Spark本地安裝及Linux下偽分散式搭建

title: Spark本地安裝及Linux下偽分散式搭建 date: 2018-12-01 12:34:35 tags: Spark categories: 大資料 toc: true 個人github部落格：Josonlee’s Blog 文章目錄

hadoop-2.6.0-cdh5.7.0偽分散式搭建

1，這個我們是直接在linux中下載hadoop-2.6.0-cdh5.7.0，（當然你也可以在本地下載後再上傳，這步就可以忽略）首先確保你的虛擬機器有網路，可以先ping百度測試有網沒，如下程式碼就是有網路的情況。 [[email protected

最詳細的大資料之Hadoop分散式系統架構解析！沒有之一！

Hadoop 由許多元素構成。其最底部是 Hadoop Distributed File System（HDFS），它儲存 Hadoop 叢集中所有儲存節點上的檔案。HDFS（對於本文）的上一層是MapReduce引擎，該引擎由 JobTrackers 和 TaskTrack

(一)大資料生態圈叢集搭建之 --Linux環境準備

搭建準備工作本地機環境準備安裝包虛擬機器工具連線工具上傳工具 CentOS虛擬機器環境搭建通用配置靜態IP配置時間同步配置 JDK環境配置

大資料筆記之分散式檔案系統HDFS筆記一

分散式檔案系統就是把檔案分佈儲存到多個計算機節點上，成千上萬的計算機節點構成計算機叢集。這些節點分為兩類。一類叫做“主節點”(Master Node)，也叫做“名稱節點”(Name Node) 另一

大資料hadoop叢集的搭建總結及步驟

CentOS6.5mini版hadoop叢集搭建流程 CentOS 7 系列：關閉防火牆：systemctl stop firewalld 禁止防火牆開機啟動：systemctl disable firewalld 安裝

大資料(四) --偽分散式搭建

說明

偽分散式搭建

相關推薦