大資料平臺叢集外客戶端部署

阿新 • • 發佈：2019-01-18

轉載請註明出處：http://www.cnblogs.com/xiaodf/

本文件主要用於說明，如何在叢集外節點上,部署大資料平臺的客戶端，此大資料平臺已經開啟了Kerberos身份驗證。通過客戶端使用者在叢集外就可以使用叢集內的服務了，如查詢叢集內的hdfs資料，提交spark任務到叢集內執行等操作。
具體部署步驟如下所示：

1、拷貝叢集內hadoop相關元件包到客戶端

本地建立目錄/opt/cloudera/parcels

mkdir –R /opt/cloudera/parcels

拷貝元件包CDH-5.7.2-1.cdh5.7.2.p0.18到目錄/opt/cloudera/parcels
進入目錄建立軟連線

cd /opt/cloudrea/parcels
ln –s CDH-5.7.2-1.cdh5.7.2.p0.18 CDH

2、拷貝叢集內hadoop相關配置檔案到客戶端

建立目錄/etc/hadoop,將/etc/hadoop/conf資料夾放入該目錄,node1為叢集內節點

mkdir /etc/hadoop
scp -r node1:/etc/hadoop/conf /etc/hadoop

建立目錄/etc/hive,將/etc/hive/conf資料夾放入該目錄

mkdir /etc/hive
scp -r node1:/etc/hive/conf /etc/hive

建立目錄/etc/spark,將/etc/spark/conf資料夾放入該目錄

mkdir /etc/spark
scp -r node1:/etc/spark/conf /etc/spark

3、拷貝叢集內身份驗證相關配置檔案krb5.conf到客戶端

scp node1:/etc/krb5.conf  /etc

4、執行客戶端指令碼client.sh,檔案內容如下：

export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop
export HADOOP_CONF=/etc/hadoop/conf
export HADOOP_CONF_DIR=/etc/hadoop/conf
export YARN_CONF_DIR=/etc/hadoop/conf
export SPARK_CONF_DIR=/etc/spark/conf
#export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark
CDH_HOME="/opt/cloudera/parcels/CDH"
export PATH=$CDH_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin/:$PATH
##beeline 連線hive進行sql查詢
cd /opt/cloudera/parcels/CDH/bin
./beeline -u "jdbc:hive2://node7:10000/;principal=hive/ 
[email protected]" --config /etc/hive/conf
##執行hdfs命令
#./hdfs --config /etc/hadoop/conf dfs -ls /
##提交spark命令
#cd /opt/cloudera/parcels/CDH/lib/spark/bin
#./spark-shell

注意：
1、客戶端要與叢集時間同步，否則身份認證會失敗；
2、客戶端host要新增叢集hosts，叢集hosts可連線叢集某一點獲取；
3、叢集已開啟kerberos身份驗證，執行shell命令前，需要kinit進行身份驗證，示例如下：

#kinit認證命令
[[email protected] client]# kinit -kt /home/user01.keytab user01
#檢視當前使用者
[[email protected] client]# klist
Ticket cache: FILE:/tmp/krb5cc_0
Default principal: [email protected]

Valid starting       Expires              Service principal
12/01/2016 20:48:50  12/02/2016 20:48:50  krbtgt/[email protected]
    renew until 12/08/2016 20:48:50

4、spark jdbc程式設計，同樣需要呼叫kerberos身份驗證，示例如下,完整工程看【spark jdbc 示例】目錄下Security

package kerberos.spark;


import org.apache.hadoop.security.UserGroupInformation;

import java.io.IOException;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;
import java.util.Timer;
import java.util.TimerTask;

/*
 * 開啟許可權驗證時，可以傳入使用者principal 和 keytab 進行身份驗證
 */
public class sparkjdbc {
   public static void main(String args[]) {
      final String principal = args[0];//使用者對應principal，如user01
      final String keytab = args[1];//使用者對應keytab，如/home/user01/user01.keytab
      String sql = args[2];//業務sql操作語句
      try {
         //1、身份驗證：間隔12小時驗證一次
         long interval=1;
         long now = System.currentTimeMillis();
         long start = interval - now % interval;
         Timer timer = new Timer();
         timer.schedule(new TimerTask(){
            public void run() {
               org.apache.hadoop.conf.Configuration conf = new org.apache.hadoop.conf.Configuration();
               conf.set("hadoop.security.authentication", "Kerberos");
               UserGroupInformation.setConfiguration(conf);
               try {
                  UserGroupInformation.loginUserFromKeytab(principal,keytab);
                  System.out.println("getting connection");
                  System.out.println("current user: "+UserGroupInformation.getCurrentUser());
                  System.out.println("login user: "+UserGroupInformation.getLoginUser());
               } catch (IOException e) {
                  e.printStackTrace();
               }
               System.out.println("execute task!"+ this.scheduledExecutionTime());
            }
         },start,12*60*60*1000);//定時任務

         //正常業務，spark jdbc連線hive進行sql操作
         Class.forName("org.apache.hive.jdbc.HiveDriver");
         Connection con = DriverManager
               .getConnection("jdbc:hive2://node7:10000/;principal=hive/[email protected]");
         System.out.println("got connection");
         Statement stmt = con.createStatement();
         ResultSet rs = stmt.executeQuery(sql);// executeQuery會返回結果的集合，否則返回空值
            System.out.println("列印輸出結果：");
            while (rs.next()) {
                System.out.println(rs.getString(1));// 入如果返回的是int型別可以用getInt()
            }
         
         con.close();
      } catch (Exception e) {
         e.printStackTrace();
      }
   }
}

大資料平臺叢集外客戶端部署

1、拷貝叢集內hadoop相關元件包到客戶端

2、拷貝叢集內hadoop相關配置檔案到客戶端

3、拷貝叢集內身份驗證相關配置檔案krb5.conf到客戶端

4、執行客戶端指令碼client.sh,檔案內容如下：

4、spark jdbc程式設計，同樣需要呼叫kerberos身份驗證，示例如下,完整工程看【spark jdbc 示例】目錄下Security

大資料平臺叢集外客戶端部署

CentOS7部署CDH6.0.1大資料平臺

VWMare如何讓自己的多臺大資料cdh叢集虛擬機器連線外網

大資料平臺Hadoop的分散式叢集環境搭建，官網推薦

用Ambari一鍵部署大資料平臺

大資料平臺CDH叢集離線搭建

大資料平臺搭建------CDH單機部署

Kafka 叢集在馬蜂窩大資料平臺的優化與應用擴充套件

Hadoop大資料平臺之Kafka部署

最新版大資料平臺安裝部署指南，HDP-2.6.5.0，ambari-2.6.2.0

微軟企業級加解密解決方案MBAM客戶端部署

一堆命令部署rsync以及客戶端部署

openLDAP客戶端部署(centos6.5)

zabbix服務端客戶端部署

MDT2013客戶端部署報錯

ganglia 客戶端部署

redis叢集與分片（1）-redis伺服器叢集、客戶端分片 redis叢集與分片（1）-redis伺服器叢集、客戶端分片

zookeeper叢集的客戶端與伺服器端

資料脫敏介紹(大資料平臺 )

資料來源/大資料平臺

大資料平臺叢集外客戶端部署

1、拷貝叢集內hadoop相關元件包到客戶端

2、拷貝叢集內hadoop相關配置檔案到客戶端

3、拷貝叢集內身份驗證相關配置檔案krb5.conf到客戶端

4、執行客戶端指令碼client.sh,檔案內容如下：

4、spark jdbc程式設計，同樣需要呼叫kerberos身份驗證，示例如下,完整工程看【spark jdbc 示例】目錄下Security

相關推薦