0027-如何在CDH叢集啟用Kerberos

阿新 • • 發佈：2018-11-20

溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。

1.文件編寫目的

本文件講述如何在CDH叢集啟用及配置Kerberos，您將學習到以下知識：

1.如何安裝及配置KDC服務

2.如何通過CDH啟用Kerberos

3.如何登入Kerberos並訪問Hadoop相關服務

文件主要分為以下幾步：

1.安裝及配置KDC服務

2.CDH叢集啟用Kerberos

3.Kerberos使用

這篇文件將重點介紹如何在CDH叢集啟用及配置Kerberos，並基於以下假設：

1.CDH叢集執行正常

2.叢集未啟用Kerberos

3.MySQL 5.1.73

以下是本次測試環境，但不是本操作手冊的必需環境：

1.作業系統：CentOS 6.5

2.CDH和CM版本為5.12.0

3.採用root使用者進行操作

2.KDC服務安裝及配置

本文件中將KDC服務安裝在Cloudera Manager Server所在伺服器上（KDC服務可根據自己需要安裝在其他伺服器）

1.在Cloudera Manager伺服器上安裝KDC服務

[[email protected]~]# yum -y install krb5-serverkrb5-libs krb5-auth-dialog krb5-workstation

0027-如何在CDH叢集啟用Kerberos

2.修改/etc/krb5.conf配置

[[email protected] fayson_r]# vim /etc/krb5.conf 
[logging]
 default = FILE:/var/log/krb5libs.log
 kdc = FILE:/var/log/krb5kdc.log
 admin_server = FILE:/var/log/kadmind.log

[libdefaults]
 default_realm = FAYSON.COM
 dns_lookup_realm = false
 dns_lookup_kdc = false
 ticket_lifetime = 24h
 renew_lifetime = 7d
 forwardable = true

[realms]
 FAYSON.COM = {
  kdc = ip-172-31-6-148.fayson.com
  admin_server = ip-172-31-6-148.fayson.com
 }

[domain_realm]
 .ip-172-31-6-148.fayson.com = FAYSON.COM
 ip-172-31-6-148.fayson.com = FAYSON.COM

標紅部分為需要修改的資訊。

0027-如何在CDH叢集啟用Kerberos

3.修改/var/kerberos/krb5kdc/kadm5.acl配置

[[email protected]~]# vim /var/kerberos/krb5kdc/kadm5.acl 
*/[email protected]    *

0027-如何在CDH叢集啟用Kerberos

4.修改/var/kerberos/krb5kdc/kdc.conf配置

[[email protected] ~]# vim /var/kerberos/krb5kdc/kdc.conf 
[kdcdefaults]
 kdc_ports = 88
 kdc_tcp_ports = 88

[realms]
 FAYSON.COM= {
  #master_key_type = aes256-cts
  max_renewable_life= 7d 0h 0m 0s
  acl_file = /var/kerberos/krb5kdc/kadm5.acl
  dict_file = /usr/share/dict/words
  admin_keytab = /var/kerberos/krb5kdc/kadm5.keytab
  supported_enctypes = aes256-cts:normal aes128-cts:normal des3-hmac-sha1:normal arcfour-hmac:normal des-hmac-sha1:n
ormal des-cbc-md5:normal des-cbc-crc:normal
 }

標紅部分為需要修改的配置。

0027-如何在CDH叢集啟用Kerberos

5.建立Kerberos資料庫

[[email protected] ~]# kdb5_util create –r FAYSON.COM -s
Loading random data
Initializing database '/var/kerberos/krb5kdc/principal' for realm 'FAYSON.COM',
master key name 'K/[email protected]'
You will be prompted for the database Master Password.
It is important that you NOT FORGET this password.
Enter KDC database master key: 
Re-enter KDC database master key to verify:

0027-如何在CDH叢集啟用Kerberos

此處需要輸入Kerberos資料庫的密碼。

6.建立Kerberos的管理賬號

[[email protected] ~]# kadmin.local
Authenticating as principal fayson/[email protected] with password.
kadmin.local:  addprinc admin/[email protected]
WARNING: no policy specified for admin/[email protected]; defaulting to no policy
Enter password for principal "admin/[email protected]": 
Re-enter password for principal "admin/[email protected]": 
Principal "admin/[email protected]" created.
kadmin.local:  exit
[[email protected] ~]#

0027-如何在CDH叢集啟用Kerberos

標紅部分為Kerberos管理員賬號，需要輸入管理員密碼。

7.將Kerberos服務新增到自啟動服務，並啟動krb5kdc和kadmin服務

[[email protected]~]# chkconfig krb5kdc on
[[email protected] ~]# chkconfig kadmin on
[[email protected] ~]# service krb5kdc start
Starting Kerberos 5 KDC:                                   [  OK  ]
[[email protected] ~]# service kadmin start
Starting Kerberos 5 Admin Server:                          [  OK  ]
[[email protected] ~]#

0027-如何在CDH叢集啟用Kerberos

8.測試Kerberos的管理員賬號

[[email protected] ~]# kinit admin/[email protected]
Password for admin/[email protected]: 
[[email protected] ~]# klist
Ticket cache: FILE:/tmp/krb5cc_0
Default principal: admin/[email protected]

Valid starting     Expires            Service principal
09/05/17 16:39:17  09/06/17 16:39:17  krbtgt/[email protected]
        renew until 09/12/17 16:39:17
[[email protected] ~]#

0027-如何在CDH叢集啟用Kerberos

9.為叢集安裝所有Kerberos客戶端，包括Cloudera Manager

[[email protected] cdh-shell-master]# yum -y install krb5-libs krb5-workstation

0027-如何在CDH叢集啟用Kerberos

10.在Cloudera Manager Server伺服器上安裝額外的包

[[email protected]]# yum -y install openldap-clients

0027-如何在CDH叢集啟用Kerberos

11.將KDC Server上的krb5.conf檔案拷貝到所有Kerberos客戶端

[[email protected]]# scp -r /etc/krb5.conf [email protected]:/etc/

此處使用指令碼進行拷貝

[[email protected]]# sh b.sh node.list /etc/krb5.conf  /etc/
krb5.conf                                                                         100% 451     0.4KB/s   00:00   
krb5.conf                                                                         100% 451     0.4KB/s   00:00   
krb5.conf                                                                         100% 451     0.4KB/s   00:00   
krb5.conf                                                                          100%  451     0.4KB/s  00:00    
[[email protected] cdh-shell-master]#

0027-如何在CDH叢集啟用Kerberos

3.CDH叢集啟用Kerberos

1.在KDC中給Cloudera Manager新增管理員賬號

[[email protected] cdh-shell-bak]# kadmin.local
Authenticating as principal admin/[email protected] with password.
kadmin.local:  addprinc cloudera-scm/[email protected]
WARNING: no policy specified for cloudera-scm/[email protected]; defaulting to no policy
Enter password for principal "cloudera-scm/[email protected]": 
Re-enter password for principal "cloudera-scm/[email protected]": 
Principal "cloudera-scm/[email protected]" created.
kadmin.local:  exit
[[email protected] cdh-shell-bak]#

0027-如何在CDH叢集啟用Kerberos

2.進入Cloudera Manager的“管理”-> “安全”介面

0027-如何在CDH叢集啟用Kerberos

3.選擇“啟用Kerberos”，進入如下介面

確保如下列出的所有檢查項都已完成

0027-如何在CDH叢集啟用Kerberos

4.點選“繼續”，配置相關的KDC資訊，包括型別、KDC伺服器、KDC Realm、加密型別以及待建立的Service Principal（hdfs，yarn,，hbase，hive等）的更新生命期等

0027-如何在CDH叢集啟用Kerberos

5.點選“繼續”

0027-如何在CDH叢集啟用Kerberos

6.不建議讓Cloudera Manager來管理krb5.conf, 點選“繼續”

0027-如何在CDH叢集啟用Kerberos

7.輸入Cloudera Manager的Kerbers管理員賬號，必須和之前建立的賬號一致，點選“繼續”

0027-如何在CDH叢集啟用Kerberos

8.等待啟用Kerberos完成，點選“繼續”

0027-如何在CDH叢集啟用Kerberos

9.點選“繼續”

0027-如何在CDH叢集啟用Kerberos

10.勾選重啟叢集，點選“繼續”

0027-如何在CDH叢集啟用Kerberos

11.等待叢集重啟成功，點選“繼續”

0027-如何在CDH叢集啟用Kerberos

至此已成功啟用Kerberos。

4.Kerberos使用

使用fayson使用者執行MapReduce任務及操作Hive，需要在叢集所有節點建立fayson使用者。

1.使用kadmin建立一個fayson的principal

[[email protected] cdh-shell-bak]# kadmin.local
Authenticating as principal admin/[email protected] with password.
kadmin.local:  addprinc [email protected]
WARNING: no policy specified for [email protected]; defaulting to no policy
Enter password for principal "[email protected]":
Re-enter password for principal "[email protected]":
Principal "[email protected]" created.
kadmin.local:  exit
[[email protected] cdh-shell-bak]#

0027-如何在CDH叢集啟用Kerberos

2.使用fayson使用者登入Kerberos

[[email protected] cdh-shell-bak]# kdestroy
[[email protected] cdh-shell-bak]# kinit fayson
Password for [email protected]: 
[[email protected] cdh-shell-bak]# klist
Ticket cache: FILE:/tmp/krb5cc_0
Default principal: [email protected]

Valid starting     Expires            Service principal
09/05/17 17:19:08  09/06/17 17:19:08  krbtgt/[email protected]
        renew until 09/12/17 17:19:08
[[email protected] cdh-shell-bak]#

0027-如何在CDH叢集啟用Kerberos

3.執行MapReduce作業

[[email protected]~]# hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-0.20-mapreduce/hadoop-examples.jar pi 10 1
...
Starting Job
17/09/02 20:10:43 INFO mapreduce.Job: Running job: job_1504383005209_0001
17/09/02 20:10:56 INFO mapreduce.Job: Job job_1504383005209_0001 running in ubermode : false
17/09/02 20:10:56 INFO mapreduce.Job:  map0% reduce 0%
17/09/02 20:11:09 INFO mapreduce.Job:  map20% reduce 0%
17/09/02 20:11:12 INFO mapreduce.Job:  map40% reduce 0%
17/09/02 20:11:13 INFO mapreduce.Job:  map50% reduce 0%
17/09/02 20:11:15 INFO mapreduce.Job:  map60% reduce 0%
17/09/02 20:11:16 INFO mapreduce.Job:  map70% reduce 0%
17/09/02 20:11:19 INFO mapreduce.Job:  map80% reduce 0%
17/09/02 20:11:21 INFO mapreduce.Job:  map100% reduce 0%
17/09/02 20:11:26 INFO mapreduce.Job:  map100% reduce 100%
17/09/02 20:11:26 INFO mapreduce.Job: Job job_1504383005209_0001 completedsuccessfully

0027-如何在CDH叢集啟用Kerberos

4.使用beeline連線hive進行測試

[[email protected] cdh-shell-bak]# beeline 
Beeline version 1.1.0-cdh5.12.1 by Apache Hive
beeline> !connect jdbc:hive2://localhost:10000/;principal=hive/[email protected]
...
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://localhost:10000/> show tables;
...
INFO  : OK
+-------------+--+
|  tab_name   |
+-------------+--+
| test_table  |
+-------------+--+
1 row selected (0.194 seconds)
0: jdbc:hive2://localhost:10000/> select * from test_table;
...
INFO  : OK
+----------------+----------------+--+
| test_table.s1  | test_table.s2  |
+----------------+----------------+--+
| 4              | lisi           |
| 1              | test           |
| 2              | fayson         |
| 3              | zhangsan       |
+----------------+----------------+--+
4 rows selected (0.144 seconds)
0: jdbc:hive2://localhost:10000/>

0027-如何在CDH叢集啟用Kerberos

執行Hive MapReduce作業

0: jdbc:hive2://localhost:10000/> select count(*) from test_table;
...
INFO  : OK
+------+--+
| _c0  |
+------+--+
| 4    |
+------+--+
1 row selected (35.779 seconds)
0: jdbc:hive2://localhost:10000/>

0027-如何在CDH叢集啟用Kerberos

5.常見問題

1.使用Kerberos使用者身份執行MapReduce作業報錯

main : run as user is fayson
main : requested yarn user is fayson
Requested user fayson is not whitelisted and has id 501,whichis below the minimum allowed 1000

Failing this attempt. Failing the application.
17/09/02 20:05:04 INFO mapreduce.Job: Counters: 0
Job Finished in 6.184 seconds
java.io.FileNotFoundException: File does not exist:hdfs://ip-172-31-6-148:8020/user/fayson/QuasiMonteCarlo_1504382696029_1308422444/out/reduce-out
 at org.apache.hadoop.hdfs.DistributedFileSystem$20.doCall(DistributedFileSystem.java:1266)
 at org.apache.hadoop.hdfs.DistributedFileSystem$20.doCall(DistributedFileSystem.java:1258)
 at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
 at org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus(DistributedFileSystem.java:1258)
 at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1820)
 at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1844)
 at org.apache.hadoop.examples.QuasiMonteCarlo.estimatePi(QuasiMonteCarlo.java:314)
 at org.apache.hadoop.examples.QuasiMonteCarlo.run(QuasiMonteCarlo.java:354)
 at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
 at org.apache.hadoop.examples.QuasiMonteCarlo.main(QuasiMonteCarlo.java:363)
 at sun.reflect.NativeMethodAccessorImpl.invoke0(NativeMethod)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
 at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
 at java.lang.reflect.Method.invoke(Method.java:606)
 at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:71)
 at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:144)
 at org.apache.hadoop.examples.ExampleDriver.main(ExampleDriver.java:74)
 at sun.reflect.NativeMethodAccessorImpl.invoke0(NativeMethod)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
 at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
 at java.lang.reflect.Method.invoke(Method.java:606)
 atorg.apache.hadoop.util.RunJar.run(RunJar.java:221)
 at org.apache.hadoop.util.RunJar.main(RunJar.java:136)

0027-如何在CDH叢集啟用Kerberos

問題原因：是由於Yarn限制了使用者id小於10000的使用者提交作業；

解決方法：修改Yarn的min.user.id來解決

0027-如何在CDH叢集啟用Kerberos

醉酒鞭名馬，少年多浮誇！嶺南浣溪沙，嘔吐酒肆下！摯友不肯放，資料玩的花！
溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。

推薦關注Hadoop實操，第一時間，分享更多Hadoop乾貨，歡迎轉發和分享。

0027-如何在CDH叢集啟用Kerberos

原創文章，歡迎轉載，轉載請註明：轉載自微信公眾號Hadoop實操

0027-如何在CDH叢集啟用Kerberos

溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。 1.文件編寫目的本文件講述如何在CDH叢集啟用及配置Kerberos，您將學習到以下知識： 1.如何安裝及配置KDC服務 2.如何通過CDH啟用Kerberos 3.如何登入Kerberos並訪問Hadoop相關服務

0027-如何在CDH集群啟用Kerberos

link support http hdf 方法 seq 限制數據 alt 溫馨提示：要看高清無碼套圖，請使用手機打開並單擊圖片放大查看。 1.文檔編寫目的本文檔講述如何在CDH集群啟用及配置Kerberos，您將學習到以下知識： 1.如何安裝及配置KDC服務 2.

windows 配置kerberos訪問啟用spnego的CDH 叢集web UI頁面

一問題描述　　CDH叢集啟用 HTTP Web 控制檯的 Kerberos 身份驗證後，FireFox下HTTP訪問HDFS、Yarn、Hive、HBase等Hadoop服務的Web UI(如Namenode的50070，Yarn的8088)等出現錯誤： GSSException: Defective

0013-如何在Kerberos與非Kerberos的CDH叢集BDR不可用時複製資料

溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。 1.概述本文件描述了在Kerberos與非Kerberos的CDH叢集之間BDR不可用的情況下實現資料互導。文件主要講述 1.測試叢集環境描述 2.CDH的BDR功能驗證 3.叢集之間資料複製要求和限制 4.叢集之間資料複

0031-如何在CDH啟用Kerberos的情況下安裝及使用Sentry(一)

iso 3.2 welcom odi mina entry ren pil ini 溫馨提示：要看高清無碼套圖，請使用手機打開並單擊圖片放大查看。 1.文檔編寫目的本文檔主要講述如何在啟用Kerberos的CDH集群中安裝配置及使用Sentry。內容概述 1.如

0032-如何在CDH啟用Kerberos的情況下安裝及使用Sentry(二)

expire ket prot rec 備註 ali lin 導致 local 溫馨提示：要看高清無碼套圖，請使用手機打開並單擊圖片放大查看。 5.Sentry列權限管理 1.在集群所有節點添加fayson_r用戶 [root@ip-172-31-6-148 cdh-s

0110-如何給Kerberos環境下的CDH叢集新增Gateway節點

Fayson的github： https://github.com/fayson/cdhproject 1.文件編寫目的 Gateway節點又稱為客戶端節點，通常用作訪問Hadoop叢集的介面機。它主要會部署一些客戶端的配置，指令碼命令，比如HDFS的core-site.xml，hdfs-site.xml

Java/Scala 訪問啟用kerberos驗證的Hadoop叢集

通過keytab的方式訪問HDFSConfiguration config = new Configuration(); FileSystem hdfs = null;

kafka叢集安全化之啟用kerberos與acl

一、背景在我們部署完kafka之後，雖然我們已經可以“肆意”的用kafka了，但是在一個大公司的實際生產環境中，kafka叢集往往十分龐大，每個使用者都應該只關心自己所負責的Topic，並且對其他人所使用的Topic沒有許可權。這樣一來可以將資源隔離開來，二來可以防止誤操作。

基於CM搭建的CDH叢集之hive元件升級過程（hive0.13.1升級到hive-1.2.1且確保納入CM管理）

1、在hive0.13.1版本下建立lib121目錄 cd /opt/cloudera/parcels/CDH/lib/hive;mkdir lib121 2、下載hive1.2.1版本,並將該版本lib下所有檔案拷貝到lib121中 3、修改/opt/cloudera/par

cdh叢集中新增新主機

1、新加機器環境配置首先得在新的主機環境中安裝JDK，關閉防火牆、修改selinux、NTP時鐘與主機同步、修改hosts、與主機配置ssh免密碼登入、保證安裝好了perl和python。 2、上傳cloudera-manager檔案到/opt目錄，修改agent配置檔案： vi /o

基於centos7.2最小化環境, cdh manager 及 cdh 叢集的部署過程常見問題整理

注：此篇文章主要面向對hadoop有一定了解的開發和運維人員，若是初次接觸hadoop叢集，具體安裝過程請更多參考Ambari的安裝部署教程：http://blog.csdn.net/balabalayi/article/details/64920537 CDH Manager的部署與安裝與Am

0028-如何在CDH未啟用認證的情況下安裝及使用Sentry

溫馨提示：要看高清無碼套圖，請使用手機開啟並單擊圖片放大檢視。 1.文件編寫目的 CDH平臺中的安全，認證（Kerberos/LDAP）是第一步，授權（Sentry）是第二步。如果要啟用授權，必須先啟用認證。但在CDH平臺中給出了一種測試模式，即不啟用認證而只啟用Sentry授權。但強烈不建

CDH叢集裡資料庫

mysql> select * from SENTRY_GROUP; +----------+------------+---------------+ | GROUP_ID | GROUP_NAME | CREATE_TIME | +---

1.大資料指CDH叢集搭建詳細步驟（一）

1.使用CDH,其中CDH表示的意思是Cloudera’s Distribution Including Apache Hadoop，簡稱“CDH”）基於web的使用者介面，支援大多數的hadoop元件，包括了HDFS，MapReduce以及HIve和Pig Hbase以及Zookeepe

Spark-在cdh叢集中執行報錯

Run on a YARN cluster spark-submit \ --class com.hnb.data.UserKeyOpLog \ --master yarn \ --deploy-mode cluster \ --executor-memory 128M \ -

大資料學習之---CDH叢集版本部署

1、軟體環境和IP規劃 RHEL6 角色 jdk-8u45apache-maven-3.3.9 hive-1.1.0-cdh5.7.1-src.tar.gz hadoop-2.8.1.tar.gz mysql-connector-java-6.0.6.tar.gz

CDH叢集配置資源佇列

背景：叢集有若干任務在線上執行其中的一個任務資源佔用量大執行時間長，導致無法正常在生產環境進行hive的活動，影響問題排查等工作，可以通過資源隔離來解決這個問題。配置思路：將日常任務與隨機需求隔離，日常任務有hive指令碼，mr任務產看job資訊得到用到的使用者有三個

CDH叢集安裝Phoenix服務

背景：之前我們都是通過原生的 hbase-java api根據業務需求來查詢hbase，每有一個查詢需求都需要定製化開發相關的查詢程式碼，較為麻煩，而且在效能優化等方面優化也是需要著重注意；目前業界使用 Phoenix操作HBase比較普遍，該方案無論是開發效率還是效能提升都能得到不錯的保證

VWMare如何讓自己的多臺大資料cdh叢集虛擬機器連線外網

問題描述：VWMare如何讓自己的redhat虛擬機器連線外網，同時自己的pc電腦可以訪問自己的叢集虛擬機器！ vmware版本號：11.0 linux系統：redhat 6.5 由於圖形介面比較直觀，開啟圖形介面：執行命令：init 5 cdh叢集主機名和ip地址：hosts cdh1&

0027-如何在CDH叢集啟用Kerberos

相關推薦