mapreduce叢集的搭建及安裝

阿新 • • 發佈：2018-11-27

mapreduce叢集的搭建及安裝

節點分配

NameNode
    node01
        主
    node02
        從
DataNode
    node02
    node03
    node04
zookeeper
    node02
    node03
    node04
zkfc
    node01
    node02
journalnode
    node01
    node02
    node03
resourcemanager
    node03
    node04
nodemanager
    node02
    node03
    node04

環境檢測

安裝jdk
    配置環境變數
配置免祕鑰
    如果本身沒有.ssh檔案需要先生成
        ssh localhost
    如果要和其他節點免祕鑰需要將自己的公鑰發給他，並追加公鑰
        ssh-keygen -t dsa -P '' -f ./id_dsa
        scp -r ./id_dsa.pub [email protected]*:`pwd`/node0*.pub
        cat node0*.pub >> aut……

安裝hadoop

解壓hadoop到指定目錄下
配置配置檔案
    配置三個env.sh，將其中的JAVA_HOME寫死

    修改hdfs-site.xml

        命名叢集名
            <name>dfs.nameservices</name>
              <value>mycluster</value>
        命名叢集下的兩個NN的名稱
            <name>dfs.ha.namenodes.mycluster</name>
              <value>nn1,nn2</value>
        分別對兩個NN指定其物理路徑：ip加 埠號
             <name>dfs.namenode.rpc-address.mycluster.nn1</name>
              <value>node01:8020</value>
            <name>dfs.namenode.rpc-address.mycluster.nn2</name>
              <value>node02:8020</value>
        指定兩個NN的瀏覽器訪問路徑：ip加埠號
            <name>dfs.namenode.http-address.mycluster.nn1</name>
              <value>node01:50070</value>
            <name>dfs.namenode.http-address.mycluster.nn2</name>
              <value>node02:50070</value>
        指定edits的路徑，在journalnode伺服器上，因為journalnode伺服器是公用的，所以需要指定叢集名以示區分
            <name>dfs.namenode.shared.edits.dir</name>
              <value>qjournal://node01:8485;node02:8485;node03:8485/mycluster</value>
        在本機上給一個路徑表示edits的地址
             <name>dfs.journalnode.edits.dir</name>
              <value>/var/sxt/hadoop/ha/jn</value>
        給一個類
            <name>dfs.client.failover.proxy.provider.mycluster</name>
              <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        還有兩個不知道
            <name>dfs.ha.fencing.methods</name>
              <value>sshfence</value>
              <name>dfs.ha.fencing.ssh.private-key-files</name>
              <value>/root/.ssh/id_dsa</value>
        開啟主從NN的切換
             <name>dfs.ha.automatic-failover.enabled</name>
               <value>true</value>

    修改core-site.xml
        預設檔案系統路徑
             <name>fs.defaultFS</name>
              <value>hdfs://mycluster</value>
        hadoop臨時檔案存放路徑
            /var/sxt/hadoop-2.6/ha
        zookeeper叢集節點資訊
             <name>ha.zookeeper.quorum</name>
               <value>node02:2181,node03:2181,node04:2181</value>

安裝zookeeper

將zookeeper解壓到指定目錄下
配置配置檔案
    將conf/zoo重新命名為zoo.cfg
    在裡面將資料存放目錄改掉
        dataDir=/var/sxt/zk
    新增伺服器節點資訊
        server.1=node02:2888:3888
        server.2=node03:2888:3888
        server.3=node04:2888:3888
    在各個節點的/var/sxt/zk下建立一個myid檔案，並將值加入其中
        echo 1 > myid

啟動hadoopHA叢集

啟動zookeeper
    zkServer.sh start
    檢查zookeeper狀態
        zkServer.sh status
啟動journalnode
    hadoop-daemon.sh start journalnode
在主NN上
    格式化namenode
        hdfs namenode –format
    啟動NameNode
        hadoop-daemon.sh start namenode
在另一臺NN上
    hdfs namenode  -bootstrapStandby
格式化zkfc
    hdfs zkfc -formatZK
啟動dfs
    start-dfs.sh
檢查叢集
    jps
    通過瀏覽器訪問

hadoop+yarn的搭建

目標：用yarn來管理hadoop叢集的資源排程
配置mapred-site.xml
    指定mapreduce框架名yarn
        <name>mapreduce.framework.name</name>
                <value>yarn</value>
配置yarn-site.xml
    指定shuffle
        <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
    開啟ResourceManager
        <name>yarn.resourcemanager.ha.enabled</name>
           <value>true</value>
    指定叢集id
        <name>yarn.resourcemanager.cluster-id</name>
           <value>cluster1</value>
    指定ResourceManager的虛擬節點
           <name>yarn.resourcemanager.ha.rm-ids</name>
           <value>rm1,rm2</value>
    指定ResourceManager真實物理
        <name>yarn.resourcemanager.hostname.rm1</name>
           <value>node03</value>
        <name>yarn.resourcemanager.hostname.rm2</name>
           <value>node04</value>
    指定zookeeper節點，利用zookeeper實現高可用
        <name>yarn.resourcemanager.zk-address</name>
           <value>node02:2181,node03:2181,node04:2181</value>
啟動hadoop+yarn
    前面的hadoopHA已經啟動
    在node01上啟動yarn
        start-yarn.sh
        在node03和node04上分別啟動ResourceManager
            yarn-daemon.sh start resourcemanager

mapreduce叢集的搭建及安裝

mapreduce叢集的搭建及安裝節點分配 NameNode node01 主 node02 從 DataNode node02 node03 node04 zookeeper node02

Redis叢集安裝--叢集搭建及密碼配置遇到的一些問題

網上關於Redis叢集安裝配置的文章很多,也比較全面，但每個人的需求不一樣，本文搭建一個配置密碼的Redis叢集過程其中遇到的一些問題其中我見到的以這篇文章最詳細https://www.cnblogs.com/hello-daocaoren/p/843190

redis叢集搭建及問題的決方法（一）

一、叢集搭建主要配置如下： P61 bind 127.0.0.1//預設ip為127.0.0.1改為其他節點機器可訪問的ip 註釋掉bind;可以監聽連線當前服務的所有-h 後的ip;例如;綁定了 127.0.0.1,但是登入時使用-h 10.9.17.153

redis叢集搭建及問題的決方法（二）

一、準備好有三個主節點的叢集 127.0.0.1:8000> cluster nodes 8ce851252f32fcab268e77d3b3ed976d57d2f498 10.211.55.5:8000 myself,master - 0 0 1 con

[Kafka] Apache Kafka 簡介、叢集搭建及配置詳解

前言 kafka是一種高吞吐量的分散式釋出訂閱訊息系統，它可以處理消費者規模的網站中的所有動作流資料。這種動作（網頁瀏覽，搜尋和其他使用者的行動）是在現代網路上的許多社會功能的一個關鍵因素。這些資料通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。 Kafk

Es叢集搭建及日誌指令碼

1.場景還原近日，筆者專案中需要做系統化的日誌採集，筆者靈機一動，elk最好不過；今天筆者就es叢集搭建作此分享 2.實現方案 ①筆者整合的是elasticsearch-2.4.6，下載對應的tar包 ②叢集配置節點1配置： cluster.name:

8分鐘學會Consul叢集搭建及微服務概念

Consul介紹： Consul 是由 HashiCorp 公司推出的開源軟體，用於實現分散式系統的服務發現與配置。與其他分散式服務註冊與發現的方案，Consul 的方案更“一站式”，內建了服務註冊與發現框架、分佈一致性協議實現、健康檢查、Key/Value 儲存、多資料中心方

redis-cluser叢集搭建及使用

近段時間一直在研究redis-cluser叢集模式，準備將原有的sentinel模式替換掉。但是遲遲沒能落實，一來是現有叢集模式尚能滿足現有應用，怕變更後不穩定固不願輕易改動；二是對redis-cluster的研究還不是很深入，還需要時間。redis-cluster

Redis-Cluster叢集搭建及配置

前言在上一篇文章中隊redis進行了簡單的介紹和安裝,在這一篇文章中進行一個redis-Cluster的叢集搭建。 Redis-Cluster介紹 redis-cluster架構設計架構細節: (1)所有的redis節點彼此互聯(PIN

Elasticsearch基於docker叢集搭建以及安裝ik分詞器

由於機器沒這麼多，所以用docker模擬真正的叢集搭建。 1、準備工作 1-1、準備docker環境：使用yum安裝docker: yum install -y docker-io 安裝完成後，開啟docker: systemctl start docker; 檢視d

RabbitMQ 高可用叢集搭建及電商平臺使用經驗總結

面向EDA（事件驅動架構）的方式來設計你的訊息 AMQP routing key的設計 RabbitMQ cluster搭建 Mirror queue policy設定兩個不錯的RabbitMQ plugin 大型應用外掛(Sharding、Rederation) Queue映象失敗手動同步

Hadoop虛擬機器叢集搭建及配置詳解

配置步驟 1.新建Linux虛擬機器 2.安裝jdk，獲得root許可權 3.安裝成功後複製兩個虛擬機器，分別分別命名master、slave1、slave2 4.將三個虛擬機器相互連通，配置SSH無金鑰登入 5.在master中配置Hadoop環境，配置

hadoop偽分散式叢集搭建及配置記錄

如果已經走到了需要搭建hadoop偽分散式的環境了，那說明你至少做好了以下三點建立好了自己的虛擬機器，ip、本機名對映、防火牆、安全子系統都已經配置好了下載jdk1.7及以上版本，並配置好了java環境下載hadoop2.7.0及以上版本，並解壓到、opt/modules（自

超詳細Hadoop HA高可用叢集搭建及常見問題處理

最近研究了下公司的hadoop叢集並模仿搭建了一個在本地測試使用的hadoop叢集。本文介紹下詳細的搭建過程以及各種常見問題的處理解決。 1 , 前期準備 1.0 , 準備Linux環境。安裝vmware linux虛擬機

Elasticsearch叢集搭建及Python互動

本文記錄Elasticsearch物理叢集的安裝步驟，在3臺機器上部署一個叢集。行文順序為整個安裝過程從頭到尾，期間發現不少問題。因此，本文不適合一步步跟著做，建議您看完整篇文章，然後再開始搭建叢集。 1 . 環境機器： 3臺物理機器，分別為130，

Docker-swarm叢集搭建及visualize監控的相關配置

初識Swarm Swarm 是 Docker 公司在 2014 年 12 月初發布的一套較為簡單的工具,用來管理 Docker 集群,它將一群 Docker 宿主機變成一個單一的,虛擬的主機。Swarm 使用標準的 Docker API 介

Storm和Zookeeper叢集搭建及在java專案中的使用

上一篇：介紹了分散式Zookeeper叢集的搭建和Kafka叢集的搭建，接下來學習一下Storm叢集的搭建。實驗環境 Cent OS 6.9 apache-storm-1.1.0 三臺伺服器虛擬機器：192.168.1.129、192.1

Mongodb Windows 叢集搭建及測試

我在一臺Windows機器下搭建了一個 Replica Sets + Sharding 測試叢集環境，以此作為我後續對於Mongodb更進一步學習的實驗平臺。只有一臺windows機器，配置方案： 1、3個分片sharding 2、每一個分片由3個節點構成1主2備的Replica Sets 3、3個配置節

Angular4.0 安裝環境搭建及安裝失敗解決辦法

1.安裝nodejs首先要安裝nodejs，可以直接到node官網下載安裝。安裝完成後，開啟cmd ，輸入node -v 檢視是否安裝。 npm工具也會隨node一起自動安裝，使用npm -v 檢視

ElasticSearch叢集搭建及啟動異常的問題

ElasticSearch叢集搭建本文采用ElasticSearch5.6.9版本，採用3臺機器安裝，分別為server01，server02，server03。機器的系統是CentOS6.9版本 ElasticSearch叢集是採用leader選舉機制來

mapreduce叢集的搭建及安裝

mapreduce叢集的搭建及安裝

相關推薦