離線安裝ocp3.11需要注意的事情
檢查階段
執行部署前檢查的時候
# ansible-playbook -vv playbooks/prerequisites.yml
需要看看play recap是否全過,如果不過需要定位原因,反覆執行
之前在檢查階段,因為node1,node2經常連線不上master(設定為yum源)的repo/base,也就是RHEL7.6的包,暫時解決辦法是在repo中分別掛在自己本地的源繞開錯誤。
部署階段
# ansible-playbook -vv /usr/share/ansible/openshift-ansible/playbooks/deploy_cluster.yml
安裝完成後的提示,如果有不成功,解決問題以後反覆執行。
檢查安裝
[[email protected] yum.repos.d]# oc login -u system:admin Logged into "https://master.example.com:8443" as "system:admin" using existing credentials. You have access to the following projects and can switch between them with 'oc project <projectname>': * default kube-public kube-system management-infra openshift openshift-console openshift-infra openshift-logging openshift-metrics-server openshift-monitoring openshift-node openshift-sdn openshift-web-console Using project "default". [[email protected] yum.repos.d]# oc get nodes NAME STATUS ROLES AGE VERSION master.example.com Ready master 23m v1.11.0+d4cacc0 node1.example.com Ready infra 18m v1.11.0+d4cacc0 node2.example.com Ready compute 18m v1.11.0+d4cacc0
[[email protected] yum.repos.d]# oc get pods --all-namespaces NAMESPACE NAME READY STATUS RESTARTS AGE default docker-registry-1-9q962 1/1 Running 0 17m default registry-console-1-4mb7d 1/1 Running 0 17m default router-1-74pr6 1/1 Running 0 17m kube-system master-api-master.example.com 1/1 Running 0 22m kube-system master-controllers-master.example.com 1/1 Running 1 22m kube-system master-etcd-master.example.com 1/1 Running 0 22m openshift-console console-5896bbb547-df6p2 1/1 Running 0 15m openshift-infra hawkular-cassandra-1-k5bg2 1/1 Running 0 12m openshift-infra hawkular-metrics-6ldrw 0/1 Pending 0 6m openshift-infra hawkular-metrics-858mh 0/1 Preempting 0 12m openshift-infra hawkular-metrics-schema-sd7c5 0/1 Completed 0 13m openshift-infra heapster-tvn6t 1/1 Running 0 12m openshift-logging logging-es-data-master-4g5tbuou-1-bcnsx 0/2 Pending 0 5m openshift-logging logging-es-data-master-4g5tbuou-1-deploy 1/1 Running 0 5m openshift-logging logging-fluentd-m5rbg 1/1 Running 0 6m openshift-logging logging-fluentd-m64sn 1/1 Running 0 6m openshift-logging logging-fluentd-nqpz4 1/1 Running 0 6m openshift-logging logging-kibana-1-wpf2t 2/2 Running 0 7m openshift-metrics-server metrics-server-845b478887-vcbkd 0/1 ErrImagePull 0 11m openshift-monitoring alertmanager-main-0 3/3 Running 0 14m openshift-monitoring alertmanager-main-1 3/3 Running 0 14m openshift-monitoring alertmanager-main-2 3/3 Running 0 14m openshift-monitoring cluster-monitoring-operator-674969789d-65rxn 1/1 Running 0 16m openshift-monitoring grafana-7594d8dd75-cwr6p 2/2 Running 0 15m openshift-monitoring kube-state-metrics-787f69cf4d-xjh76 3/3 Running 0 14m openshift-monitoring node-exporter-bwvpv 2/2 Running 0 14m openshift-monitoring node-exporter-hzbb8 2/2 Running 0 14m openshift-monitoring node-exporter-rdzlp 2/2 Running 0 14m openshift-monitoring prometheus-k8s-0 4/4 Running 1 15m openshift-monitoring prometheus-k8s-1 4/4 Running 1 15m openshift-monitoring prometheus-operator-8544897d54-z7249 1/1 Running 0 16m openshift-node sync-6xthq 1/1 Running 0 20m openshift-node sync-rsgz9 1/1 Running 0 19m openshift-node sync-vsbws 1/1 Running 0 19m openshift-sdn ovs-5d2dl 1/1 Running 0 20m openshift-sdn ovs-gd4gw 1/1 Running 0 19m openshift-sdn ovs-ktpt6 1/1 Running 0 19m openshift-sdn sdn-dz8kv 1/1 Running 0 19m openshift-sdn sdn-mhbkg 1/1 Running 0 19m openshift-sdn sdn-x7tq9 1/1 Running 0 20m openshift-web-console webconsole-5db89b6cd4-5sm9d 1/1 Running 2 16m
metrics還出不來
在master節點執行建立admin使用者
# htpasswd /etc/origin/master/htpasswd admin
同時賦予admin使用者許可權
# oc adm policy add-cluster-role-to-user cluster-admin admin
在hosts檔案中加入
192.168.0.103 master.example.com
192.168.0.104 console.apps.example.com
192.168.0.104 prometheus-k8s-openshift-monitoring.apps.example.com
192.168.0.104 grafana-openshift-monitoring.apps.example.com
192.168.0.104 hawkular-metrics.apps.example.com
訪問https://master.example.com:8443,轉到cluster console下,可以訪問到叢集相關的監控資訊
修改錯誤
- Metrics
經過定位,metrics啟動不了的原因主要是兩點:
1.ose-metrics-server的映象缺失,這個重新匯入後解決
2.openshift-monitoring下的node2下的node-exporter-sbddr一直啟動出錯,經過定位發現是安裝了一個gitlab軟體造成的埠衝突問題,把gitlab停掉後啟動成功
[[email protected] ~]# oc get pods -n openshift-monitoring -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE alertmanager-main-0 3/3 Running 23 21h 10.129.0.69 node1.example.com <none> alertmanager-main-1 3/3 Running 20 21h 10.129.0.66 node1.example.com <none> alertmanager-main-2 3/3 Running 20 21h 10.129.0.68 node1.example.com <none> cluster-monitoring-operator-674969789d-65rxn 1/1 Running 10 21h 10.129.0.65 node1.example.com <none> grafana-7594d8dd75-cwr6p 2/2 Running 18 21h 10.129.0.64 node1.example.com <none> kube-state-metrics-787f69cf4d-xjh76 3/3 Running 20 21h 10.129.0.71 node1.example.com <none> node-exporter-bwvpv 2/2 Running 8 21h 192.168.0.104 node1.example.com <none> node-exporter-hzbb8 2/2 Running 14 21h 192.168.0.103 master.example.com <none> node-exporter-sbddr 2/2 Running 0 13m 192.168.0.105 node2.example.com <none> prometheus-k8s-0 4/4 Running 22 21h 10.129.0.70 node1.example.com <none> prometheus-k8s-1 4/4 Running 22 21h 10.129.0.67 node1.example.com <none> prometheus-operator-8544897d54-z7249 1/1 Running 8 21h 10.129.0.63 node1.example.com <none>
3.openshift-infra下面的hawkular-metrics-9r5nc pod一直在pending狀態,describe一下發現需要1.5G的記憶體,修改rc hawkular-metrics request為500m,後啟動成功
[[email protected] ~]# oc get pods -n openshift-infra -o wide NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE hawkular-cassandra-1-k5bg2 1/1 Running 4 21h 10.130.0.42 node2.example.com <none> hawkular-metrics-9r5nc 1/1 Running 0 11m 10.129.0.75 node1.example.com <none> hawkular-metrics-schema-sd7c5 0/1 Completed 0 21h 10.130.0.3 node2.example.com <none> heapster-tvn6t 1/1 Running 39 21h 10.128.0.53 master.example.com <none>
終於也能截圖展示一下了。
- EFK
經過定位主要是記憶體不夠問題導致,所以現有的16G機器無法折騰了,看了pod啟動命令,一個啟動起來居然就要8G.令人髮指啊!
相關推薦
離線安裝ocp3.11需要注意的事情
檢查階段 執行部署前檢查的時候 # ansible-playbook -vv playbooks/prerequisites.yml 需要看看play recap是否全過,如果不過需要定位原因,反覆執行 之前在檢查階段,因為node1,node2經常連線不上master(設定為yum源)的repo/ba
PyQt v5.11 需要注意的事情
TLS支援 對傳輸層安全性(TLS)的支援變得越來越重要,特別是在移動平臺上,其中應用程式通常是基於雲的伺服器的前端。由於Python和Qt都實現了支援TLS的不同API,因此PyQt應用程式可以選擇使用哪種API。這在部署應用程式時尤其重要,因為支援可能必須包含在應用
安裝CentOS6.10需要注意的問題
伺服器:聯想疊雲伺服器 作業系統:CentOS6.10 實戰任務:U盤安裝CentOS6.10 一、準備工作: 1.阿里巴巴開源映象站下載:https://opsx.alibaba.com/mirror 提供最近時期的兩個版本:CentOS6.10、CentOS7 2.UltraIS
apache編譯安裝php後需要注意以下配置
安裝後, 編輯apache配置檔案 vi /usr/local/apache2/conf/httpd.conf 可以看到 LoadModule php7_module modules/libphp7.so php自動成為apache的模組 將以下內容加入到配置檔案中, apache將.ph
python學習 ( 一 ) :安裝基礎和安裝環境時需要注意的地方
常用:使用workon 時要在envs下使用 1. pip使用報錯 ‘pip’ 不是內部或外部命令,也不是可執行的程式或批處理檔案。 解決方法: 將python的環境新增到pathon中例如:Python27\Scripts 2.使用豆瓣原來安裝dj
離線安裝IE 11
itl 英文版 body 電腦 exe 根據 英文 以管理員身份運行 gpo 轉自:http://blog.sina.com.cn/s/blog_711ab1b10102wzq1.html 1、在D盤下,新建文件夾,取名為“ie”。 2、將官網下載的IE11離線包放到此
關於安裝ubuntu16.04,安裝好後需要注意的點
一般安裝好Ubuntu系統後,需要注意的地方有: 1.Linux配置SSH服務以便實現遠端連線 在遠端連線之前可能沒有設定root使用者的密碼(那麼需要): 開啟終端執行 sudo passwd 命令。 輸入設定的密碼,回車。 再次輸入密碼,回車。 登陸linu
Ubuntu安裝完之後需要做的事情
ase 支持中文 遠程 auth subst unit huang const ng2 字體推薦思源 lantern可以設置全局代理 安裝好了ubuntu之後,安裝gnome主題 安裝Gnome之前,升級系統: $ sudo apt update $ sudo apt up
PHP面試技巧——簽約和違約需要注意哪些事情?
本文摘自《PHP程式設計師面試筆試寶典》。 PHP面試技巧分享,PHP面試題,PHP寶典盡在“琉憶程式設計庫”。 經過了緊張激烈的筆試面試後,最後過五關斬六將,終於得到了用人單位的認可,拿到了用人單位的offer,接著要做的事情就是與用人單位進行簽約,以保住“勝利的果實”。
關於Mysql利用CMD安裝需要注意的幾個易錯點
安裝教程請自行百度 1.注意CMD命令列需指引到Mysql bin資料夾下,並且使用管理員模式啟動,如圖 2.初始安裝檔案中並沒有my.ini檔案,這個檔案需要自己手動建立,內容填寫 [mysql] basedir=C:\Users\Administ
敏捷開發中需要注意的事情
1.團隊中各個隊員的直接面對面相互溝通勝過任何的工具溝通; 2.可以工作的軟體勝過詳細的文件,程式碼才是最好的文件; 3.良好的客戶關係比死板的合同更具有意義; 4.及時的響應變化勝過時刻遵循計劃; 5.儘早的持續的交付有價值的軟體使客戶滿意; 6.任何時候都積極的擁
centos7 開啟wifi介面卡(wifiadapter)和安裝centos7 需要注意的
剛剛安裝好centos7.6和windows10雙系統,但是在開啟centos10 之後 顯示- no wifi-adaper found ,折騰了很久,終於在 https://unix.stackexchange.com/questions/450874/centos-7-no-wifi-ad
樹莓派安裝使用過程中特別需要注意的點!!
今天再對樹莓派相關的知識做一些整理,非常重要。因為我在這上面,出了一些莫名其妙的bug,後來才反應過來是什麼問題。 許可權相關的 樹莓派安裝的時候,正常情況下我們會拿到一個映象的壓縮檔案。這個時候應該怎麼做?千萬在影象化介面裡面點選提取到當前資料夾,正確的做法應該是在root許可權下
CM5(5.11.0)和CDH5(5.11.0)離線安裝
概述 檔案下載 系統環境搭建 日誌檢視 Q&A 參考 概述 CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop眾多分支中的一種,由Cloudera維護,基於穩定
CDH5.11 離線安裝或者升級spark2.x詳細步驟
簡介: 在我的CDH5.11叢集中,預設安裝的spark是1.6版本,這裡需要將其升級為spark2.x版本。經查閱官方文件,發現spark1.6和2.x是可以並行安裝的,也就是說可以不用刪除預設的1.6版本,可以直接安裝2.x版本,它們各自用的埠也是不一樣的。我嘗試了安裝
ubuntu16.04 安裝完系統需要做的事情
ubuntu16.04系統安裝完畢後,需要對系統自帶的程式做一些調整。 1. 安裝rar程式 由於ubuntu系統預設並不支援解壓縮rar格式,因此需要手動安裝解壓縮rar程式。命令如下: sudo apt-get install unrar 使用如下命令解壓縮rar檔案
安裝vs2013提示需要先安裝IE 11的問題
關了VS的安裝程式。建立一個命名為1.bat的批處理檔案,儲存。雙擊執行1.bat,彈出命令列視窗自動執行。成功後,自動關閉。然後重新執行VS2013的安裝程式,搞定。 1.bat內容如下: @ECHO OFF :IE10HACK REG ADD "HKLM\SOFTW
Windows 安裝 Anaconda3+PyCharm以及需要注意的地方
由於本人使用的是windows 10 作業系統,所以介紹在 windows 10 系統中安裝 Anaconda3 的過程。 下載 Anaconda 官網下載地址:https://www.anaconda.com/download/ 點選進入。Anaconda 是跨平臺
使用臨界區物件(CriticalSection)需要注意的一些事情
使用臨界區物件(CriticalSection)需要注意的一些事情 2013年10月28日 ⁄ 綜合 ⁄ 共 2591字 ⁄ 字號 小 中 大 ⁄ 評論關閉 1. 臨界區物件不是核心物件,因此不能繼承,不能跨程序,也不能用waitfor什麼的函式來限定時間等待。這個很好理解,你想想WaitF
cloudera manager5.11.0離線安裝詳細步驟
第一步: (下載安裝包) 第二步: (使用本地CentOS映象源) [[email protected] ~]# cd /etc/yum.repos.d/ [[em