kubernetes中網絡報錯問題

阿新 • • 發佈：2018-05-28

kubernetes中網絡報錯問題 cni kubernetes pod

kubernetes中網絡報錯問題

系統環境

#系統版本
cat /etc/redhat-release
CentOS Linux release 7.4.1708 (Core)

#kubelet版本
kubelet --version
Kubernetes v1.10.0

#selinux狀態
getenforce
Disabled

#系統防火墻狀態
systemctl status firewalld
● firewalld.service - firewalld - dynamic firewall daemon
Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
Active: inactive (dead)
 Docs: man:firewalld(1)

Pod 異常問題

#dns的Pod 一直處於 Waiting 或 ContainerCreating 狀態
kubectl get po -n kube-system
NAME                                    READY     STATUS             RESTARTS   AGE
kube-dns-86f4d74b45-ffwjf        0/3       ContainerCreating   0          6m

#查看Pod詳細情況
kubectl  describe pod kube-dns-86f4d74b45-ffwjf  -n kube-system
##我們看到如下信息：
Error syncing pod
Pod sandbox changed, it will be killed and re-created.
##可以發現，該 Pod 的 Sandbox 容器無法正常啟動，具體原因需要查看 Kubelet 日誌。

#查看Pod的log
journalctl -u kubelet
##看到如下報錯內容：
RunPodSandbox from runtime service failed: rpc error: code = 2 desc = NetworkPlugin cni failed to set up pod "kube-dns-86f4d74b45-ffwjf" network: failed to set bridge addr: "cni0" already has an IP address different from 10.244.4.1/24

##說明
這裏的一個Pod中啟動了多個容器，所以，我們使用kubectl logs 命令查看日誌很有局限性，關於kubectl logs的使用，請參考kubernetes中的Pod簡述與實踐和kubernetes中文文檔。

處理步驟

#在master節點之外的節點進行操作
kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
##重啟kubelet
systemctl restart kubelet
##重啟docker
systemctl restart docker

#說明
##如果上面操作之後還是報相同的錯誤或是如下錯誤：
"CreatePodSandbox for pod \" kube-dns-86f4d74b45-ffwjf _default(78e796f5-e
b7c-11e7-b903-b827ebd42d30)\" failed: rpc error: code = Unknown desc = N
etworkPlugin cni failed to set up pod \" kube-dns-86f4d74b45-ffwjf _default\"
network: failed to allocate for range 0: no IP addresses available in range set:
10.244.1.1-10.244.1.254"

#執行如下操作步驟：
##在master主機上
kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
##重啟kubelet
systemctl restart kubelet
##重啟docker
systemctl restart docker

##初始化
kubeadm init --kubernetes-version=v1.10.1 --pod-network-cidr=10.244.0.0/16
--apiserver-advertise-address=10.0.0.39
##說明：
最後給出了將節點加入集群的命令：
kubeadm join 10.0.0.39:6443 --token 4g0p8w.w5p29ukwvitim2ti 
--discovery-token-ca-cert-hash sha256:21d0adbfcb409dca97e65564
1573b2ee51c
77a212f194e20a307cb459e5f77c8
這條命令一定保存好，因為後期沒法重現的！！

##建立.kube
rm -rf /root/.kube/
mkdir -p /root/.kube/
cp -i /etc/kubernetes/admin.conf /root/.kube/config
chown root:root /root/.kube/config

#在node（非master）節點上
kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
##重啟kubelet
systemctl restart kubelet
##重啟docker
systemctl restart docker

## kubeadm join
kubeadm join 10.0.0.39:6443 --token 4g0p8w.w5p29ukwvitim2ti 
--discovery-token-ca-cert-hash sha256:21d0adbfcb409dca97e65564
1573b2ee51c
77a212f194e20a307cb459e5f77c8

總結
除了以上錯誤，其他可能的原因還有：
鏡像拉取失敗，比如：
（1）配置了錯誤的鏡像
（2）Kubelet 無法訪問鏡像（國內環境訪問 gcr.io 需要特殊處理
（3）私有鏡像的密鑰配置錯誤
（4）鏡像太大，拉取超時（可以適當調整 kubelet 的 --image-pull-progress-deadline 和 --runtime-request-timeout 選項）
CNI 網絡錯誤，一般需要檢查 CNI 網絡插件的配置，比如：
（1）無法配置 Pod 網絡
（2）無法分配 IP 地址
容器無法啟動，需要檢查是否打包了正確的鏡像或者是否配置了正確的容器參數等。
參考文章
https://github.com/kubernetes/kubernetes/issues/57280

kubernetes中網絡報錯問題

kubernetes中網絡報錯問題 cni kubernetes pod kubernetes中網絡報錯問題系統環境 #系統版本 cat /etc/redhat-release CentOS Linux release 7.4.1708 (Core) #kubelet版本 kubelet

采用WebService客戶端調用WSDL/SOAP網絡報錯的解決辦法

客戶運行重置情況系統 net 發生瀏覽器中錯誤 WebService接口是網絡傳輸控制的重要途徑，在Windows系統下運行客戶端時，平時一直能正確運行，但某天可能突然會發生調用wsdl soap郵件標頭無法識別等莫名其妙的錯誤提示，出現這種情況一

CentOS 7.2重啟網絡報錯 Failed to start LSB: Bring up/down

script 3.5 dhcp ifcfg ron centos str sys 日誌 CentOS 7.2重啟網絡報錯 Failed to start LSB: Bring up/down 我的虛擬機原本有兩塊網卡，一塊叫eno16777736，另一塊叫eno5033

網絡報錯之Http狀態碼分析

nav ... post 網絡報錯範圍它的這一 location 這也消息：這一類型的狀態碼，代表請求已被接受，需要繼續處理。這類響應是臨時響應，只包含狀態行和某些可選的響應頭信息，並以空行結束。由於 HTTP/1.0 協議中沒有定義任何 1xx 狀態碼，所以除非

JS 調試中常見的報錯的解決辦法

是否 asp success ted json字符串 clas 使用 crud 識別報錯：Uncaught SyntaxError: Unexpected token o in JSON at position 1 at JSON.parse (<anonymou

VMware12 中CENTOS系統中網絡(橋接模式）靜態ip設置

start 3.1 打開設備一段引導打開文件虛擬網絡 -- 1.菜單欄：--》編輯 –》虛擬網絡編輯 2.虛擬機設置 3.啟動虛擬機　　3.1打開文件ifcfg-eth0 命令如下： vi

Windows系統中網絡故障

百度百科 network windows 網絡服務電腦網絡前些時候，處理電腦的時候發現開機後電腦網絡符號直接是紅色感嘆號.分析：一般連接線問題，網絡服務關閉會出現紅色感嘆。網卡是好的，連接燈也是閃爍無問題；於是操作系統，發現打不開網絡中心，進入服務（services.msc）,有幾個服

Linux網絡排錯

linux 網絡排錯無法連接網絡網絡排錯對於運維人員十分重要，因此知道網絡排錯的詳細流程以及每一步的原理就顯得非常重要，當網絡出現問題時，我們就可以迅速排查出網絡問題所在，從而快速解決網絡問題。例如網絡無法連接，原因一般分為硬件問題和軟件問題，以下是總結的原因和排查流程：常用網絡命令：測試

Linux內核中網絡數據包的接收-第二部分 select/poll/epoll

() 帶來 back 都是 tips ole sni 得到一次和前面文章的第一部分一樣，這些文字是為了幫別人或者自己理清思路的。而不是所謂的源代碼分析。想分析源代碼的，還是直接debug源代碼最好，看不論什麽文檔以及書都是下策。因此這類幫人理清思路的文章盡可能的記成

Linux內核中網絡數據包的接收-第一部分概念和框架

csdn 請求版本號 post sched nec alloc nts 多核cpu 與網絡數據包的發送不同，網絡收包是異步的的。由於你不確定誰會在什麽時候突然發一個網絡包給你。因此這個網絡收包邏輯事實上包括兩件事：1.數據包到來後的通知2.收到通知並從數據包中獲取數據

CentOS Linux解決網卡報錯Bringing up interface eth0.....

alt let con pac 記錄 tle drive back system 問題描述：在VMware裏克隆出來的CentOS Linux，開機執行命令：ifconfig...沒有看到eth0網卡。然後重啟網卡又報以下錯誤：Bringing up interface e

傳參時Url中有中文報錯

head 無效解釋 content uri 就會 invalid ins character url中如果傳了中文，瀏覽器會報錯：The header content contains invalid characters。原因：瀏覽器自動把這個url進行decodeU

使用虛擬機克隆CentOS 6.9系統重啟網卡報錯問題的解決

才有讀懂它成功使用虛擬機克隆CentOS6.9系統重啟網卡報錯問題的解決1.錯誤信息Bringing up interface eth0: Device eth0 does not seem to be present,delaying initialization.

壓測過程中網絡帶寬瓶頸案例分析

strong edi mon 單位內存占用 err 一個網絡傳輸 src 近期在做一個項目的性能測試時，在打壓時發現壓力達到100hps後就一直打不上去，同時還會報讀redis服務器超時的錯誤。查看了下打壓服務器的cpu和內存占用，沒有發現什麽異常。通過nmon監控

centos7 重啟網卡報錯

報錯 lin emctl nag workman exists 沖突 manage 建議 systemctl restart network 時候報錯： rtnetlink answers file exists 是network和NetworkManager沖突了一般建

項目中訪問controller報錯：HTTP Status 500 - Servlet.init() for servlet spring threw exception

apr ssl .get beans index p s 配置 cnblogs lis 直接訪問controller路徑http://localhost:8080/index報錯： HTTP Status 500 - Servlet.init() for servlet

linux中網絡的bridge、bonding、team

bond team 網橋Bridge:使真機和虛擬機的網卡可以直接交換數據,速度快NAT:虛擬機把數據先轉發給真機，真機再通過網卡傳輸，速度較慢在真機中的 /etc/sysconfig/network-scripts/目錄下查看文件（註意：ifcfg-br0是網橋設置文件，ifcfg-enp0

Windows 10-01 網絡排錯

windows 10一、檢查網絡1.1 檢查電腦網線是否插好如果網線沒插好會顯示未連接到internet1.2 查看IP地址、子網掩碼、ping網關1、查看IP地址、子網掩碼例子：如果獲取的ip地址是以169開頭的無效地址，是無法上網的2、ping網關如果ping網關不通，是無法正常上網的ping 192.1

Python中網絡編程對socket accept函數的理解

可以關閉分享圖片 pos pytho clas blog 服務 ket src 在服務器端，socket()返回的套接字用於監聽（listen）和接受（accept），這個套接字不能用於與客戶端之間發送和接收數據。 accept()接受一個客戶端的連接請求，並返回一

Python中網絡編程對 listen 函數的理解

listen 無法 blog 線程參數 com 產生火車站 pos listen函數的第一個參數時SOCKET類型的，該函數的作用是在這個SOCKET句柄上建立監聽，至於有沒有客戶端連接進來，就需要accept函數去進行檢查了，accept函數的第一個參數也是SOCKE

kubernetes中網絡報錯問題

相關推薦