Greenplum啟動失敗Error occurred: non-zero rc: 1的修復

阿新 • • 發佈：2018-12-05

tde files mov fatal startup build ipv figure sharp

某日開發反饋測試環境的集群啟動失敗

報錯內容如下：

[gpadmin@hadoop-test2:/root]
$ gpstart
20181205:16:42:23:005451 gpstart:hadoop-test2:gpadmin-[INFO]:-Starting gpstart with args: 
20181205:16:42:23:005451 gpstart:hadoop-test2:gpadmin-[INFO]:-Gathering information and validating the environment...
20181205:16:42:23:005451 gpstart:hadoop-test2:gpadmin-[INFO]:-Greenplum Binary Version: ‘ 
postgres (Greenplum Database) 5.0.0 build dev‘
20181205:16:42:23:005451 gpstart:hadoop-test2:gpadmin-[INFO]:-Greenplum Catalog Version: ‘301705051‘
20181205:16:42:24:005451 gpstart:hadoop-test2:gpadmin-[INFO]:-Starting Master instance in admin mode
20181205:16:52:24:005451 gpstart:hadoop-test2:gpadmin-[CRITICAL]:-Failed to start Master instance in 
 admin mode
20181205:16:52:24:005451 gpstart:hadoop-test2:gpadmin-[CRITICAL]:-Error occurred: non-zero rc: 1
 Command was: ‘env GPSESSID=0000000000 GPERA=None $GPHOME/bin/pg_ctl -D /home/gpadmin/gpdata/gpmaster/gpseg-1 -l /home/gpadmin/gpdata/gpmaster/gpseg-1/pg_log/startup.log 
-w -t 600 -o " -p 2346 --gp_dbid=1 --gp_num_contents_in_cluster=0 --silent-mode=true -i -M master --gp_contentid=-1 -x 0 -c gp_role=utility " start 
‘
rc=1, stdout=‘waiting for server to start...................................................................................................................................
...........................................................................................................................................................................
...........................................................................................................................................................................
.................................................................................................................................. stopped waiting
‘, stderr=‘could not change directory to "/root"
pg_ctl: could not start server
Examine the log output.

查看啟動日誌發現：

vim /home/gpadmin/gpdata/gpmaster/gpseg-1/pg_log/startup.log

2018-12-05 08:42:24.067241 GMT,,,p5464,th-829482944,,,,0,,,seg-1,,,,,"WARNING","01000","""work_mem"": setting is deprecated, and may be removed in a future release.",,,,,,,,"set_config_option","guc.c",4666,
2018-12-05 08:42:24.067612 GMT,,,p5464,th-829482944,,,,0,,,seg-1,,,,,"WARNING","01000","""work_mem"": setting is deprecated, and may be removed in a future release.",,,,,,,,"set_config_option","guc.c",4666,
2018-12-05 08:42:24.083813 GMT,,,p5465,th-829482944,,,,0,,,seg-1,,,,,"LOG","00000","removing all temporary files",,,,,,,,"RemovePgTempFiles","fd.c",2046,
2018-12-05 08:42:24.098673 GMT,,,p5465,th-829482944,,,,0,,,seg-1,,,,,"FATAL","XX000","could not create shared memory segment: Invalid argument (pg_shmem.c:183)","Failed system call was shmget(key=2346001, size=177586016, 03600).","This error usually means that PostgreSQL‘s request for a shared memory segment exceeded your kernel‘s SHMMAX parameter.  You can either reduce the request size or reconfigure the kernel with larger SHMMAX.  To reduce the request size (currently 177586016 bytes), reduce PostgreSQL‘s shared_buffers parameter (currently 4000) and/or its max_connections parameter (currently 253).
If the request size is already small, it‘s possible that it is less than your kernel‘s SHMMIN parameter, in which case raising the request size or reconfiguring SHMMIN is called for.
The PostgreSQL documentation contains more information about shared memory configuration.",,,,,,"InternalIpcMemoryCreate","pg_shmem.c",183,1

內容大概是說/etc/sysctl.conf設置的內核參數shmmax過小，導致啟動失敗

查看/etc/sysctl.conf下的配置發現：

kernel.shmmax = 20000000
kernel.shmmni = 4096
kernel.shmall = 40000000
kernel.sem = 250 512000 100 2048
kernel.sysrq = 1
kernel.core_uses_pid = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.msgmni = 2048
net.ipv4.tcp_syncookies = 1
net.ipv4.ip_forward = 0
net.ipv4.conf.default.accept_source_route = 0
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_max_syn_backlog = 4096
net.ipv4.conf.all.arp_filter = 1
net.ipv4.ip_local_port_range = 1025 65535
net.core.netdev_max_backlog = 10000
net.core.rmem_max = 2097152
net.core.wmem_max = 2097152
vm.overcommit_memory = 2

對比官網建議的設置和參數定義以及集群已有的數據量，發現確實過小。於是改成官網建議的設置後啟動。

20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-----------------------------------------------------
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-   Successful segment starts                                            = 8
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-   Failed segment starts                                                = 0
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-   Skipped segment starts (segments are marked down in configuration)   = 0
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-----------------------------------------------------
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-Successfully started 8 of 8 segment instances 
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-----------------------------------------------------
20181205:17:54:28:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-Starting Master instance hadoop-test2 directory /home/gpadmin/gpdata/gpmaster/gpseg-1 
20181205:17:54:29:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-Command pg_ctl reports Master hadoop-test2 instance active
20181205:17:54:29:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-No standby master configured.  skipping...
20181205:17:54:29:009711 gpstart:hadoop-test2:gpadmin-[INFO]:-Database successfully started

啟動成功。

總結：pg啟動相關的內核參數配置與實際情況不匹配時，會導致啟動失敗。可通過查看日誌詳細信息查找根源解決問題。

參考文檔：

1、官網建議設置 http://gpdb.docs.pivotal.io/4380/prep_os-system-params.html#topic3

2、內核參數含義http://www.oicqzone.com/pc/2012091612901.html

Greenplum啟動失敗Error occurred: non-zero rc: 1的修復

tde files mov fatal startup build ipv figure sharp 某日開發反饋測試環境的集群啟動失敗報錯內容如下： [gpadmin@hadoop-test2:/root]$ gpstart 20181205:16:42:23:005

zookeeper啟動失敗 Error contacting service. It is probably not running.

查詢狀態顯示： Using config: /usr/local/solrcloud/zookeeper2/bin/../conf/zoo.cfg Error contacting service. It is probably not running. 1.myid沒有建立（dataDir

Ubuntu 16.04.1 LTS zookeeper-3.4.11安裝啟動失敗Error contacting service. It is probably not running.

騰訊雲伺服器Ubuntu 16.04.1 LTS zookeeper-3.4.11安裝啟動失敗 zookeeper安裝後啟動報許可權不足： [email protected]:/opt/zookeeper-3.4.8/bin$ ./zkServer.sh start ZooKeep

Spring MVC 啟動失敗 Error starting ApplicationContext.

Error starting ApplicationContext. To display the auto-configuration report re-run your application with 'debug' enabled. 百度翻譯啟動應用程式

eclipse不能啟動，An internal error occurred during: "reload maven project".

pre net 目錄 ror ctrl element java space log An internal error occurred during: "reload maven project". 這個錯誤是因為項目已經關閉，導致導致此問題的原因是Springba

linux下啟動mysql提示：Timeout error occurred trying to start MySQL Daemon

任務自帶 lean linu 使用 custom 方式 files 一個啟動 mysqld 時經過很長時間顯示 Timeout error occurred trying to start MySQL Daemon. 終端進入 mysql 時顯示 ERROR 2002

Eclipse啟動報錯:An internal error occurred during: "Updating indexes".org/eclipse/core/runtime/internal/adaptor/BasicLocation解決方法

update download 4.0 oca and load 異常 for ror Eclipse一直用的好好的，突然這兩天每次啟動都會出現如下的錯誤：An internal error occurred during: "Updating indexes".org/e

eclipse啟動錯誤An internal error occurred

凱哥Java在導出其他maven項目時候，maven下載jar還沒下載完成，就關閉eclipse。重啟後，一直提示：An internal error occurred during: "reload maven project". 如下圖：解決方案：找到需要啟動項目所在工作空間：在Ecl

linux啟動jmeter報An error occurred

jmeter linux linux啟動jmeter報錯：An error occurred: /root/java/jdk1.8.0_51/jre/lib/amd64/libawt_xawt.so: libXext.so.6: cannot open shared object file: No s

Eclipse啟動發生的錯誤：An internal error occurred during: "Initializing Java Tooling".

window ali lin initial init 解決方案 eset 錯誤重置 1.啟動Eclipse時，初始化異常：An internal error occurred during: "Initializing Java Tooling". 　　解決方案：win

eclipse啟動錯誤:An internal error occurred during: "Initializing Java Tooling". java.lang.NullPointerException

exc str exceptio 技術分享 png 分享 error inf tool eclipse啟動錯誤:An internal error occurred during: "Initializing Java Tooling". java.lang.NullP

gatling壓力測試工具啟動gatling.bat命令行窗口報Error occurred during initialization of VM Could not reserve enough space for 1048576KB object heap錯誤解決方法

大於 spa ava color default class -xms 查看系統測試原因是：Java虛擬機（JVM）分配的內存大於系統可用內存數，所以沒有足夠的空間分配給JVM來創建Object 解決方法：編輯gatling.bat文件，查看系統剩余內存大小，修改分配的

Greenplum啟動失敗Error occurred: non-zero rc: 1的修復

Greenplum啟動失敗Error occurred: non-zero rc: 1的修復

zookeeper啟動失敗 Error contacting service. It is probably not running.

Ubuntu 16.04.1 LTS zookeeper-3.4.11安裝啟動失敗Error contacting service. It is probably not running.

Spring MVC 啟動失敗 Error starting ApplicationContext.

eclipse不能啟動，An internal error occurred during: "reload maven project".

linux下啟動mysql提示：Timeout error occurred trying to start MySQL Daemon

Eclipse啟動報錯:An internal error occurred during: "Updating indexes".org/eclipse/core/runtime/internal/adaptor/BasicLocation解決方法

eclipse啟動錯誤An internal error occurred

linux啟動jmeter報An error occurred

Eclipse啟動發生的錯誤：An internal error occurred during: "Initializing Java Tooling".

eclipse啟動錯誤:An internal error occurred during: "Initializing Java Tooling". java.lang.NullPointerException

gatling壓力測試工具啟動gatling.bat命令行窗口報Error occurred during initialization of VM Could not reserve enough space for 1048576KB object heap錯誤解決方法

centos7下docker啟動失敗--ob for docker.service failed because the control process exited with error code.

Myeclipse2017啟動報An internal error occurred during: "Initializing Java Tooling". org/eclipse/m2e/jdt/

Android問題集錦（十六）- adb啟動命令失敗Error while Launching activity 解決方案

linux 系統中系統關機後，mysql啟動失敗報錯：ERROR 2002 (HY000): Can't connect to local MySQL server through socket '

cluster_state:fail error clusterdown hash slot not served redis叢集啟動失敗解決辦法

zookeeper zkServer.sh satrt啟動失敗,檢視狀態報錯Error contacting service. It is probably not running.

Error scanning entry module-info.class from jar file,Jetty啟動失敗

.net core 釋出後的站點啟動報錯 An error occurred while starting the application.

Greenplum啟動失敗Error occurred: non-zero rc: 1的修復

相關推薦