微信公众号“SRE成长记”可查看原文

最近在做一些k8s的东西,因为还不太熟悉,踩了很多的入门级坑,k8s的坑,或许就是从这里开始的

问题1

1、在master节点使用kubectl命令时,报错:The connection to the server localhost:8080 was refused - did you specify the right host or port?

原因和解决:

执行以下命令配置kubectl,作为普通用户管理集群并在集群上工作:

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

另外,kubectl命令需要使用kubernetes-admin来运行,所以如果是在非master节点也要使用kubectl命令,就需要将主节点中的/etc/kubernetes/admin.conf文件拷贝到从节点相同目录下,然后配置环境变量,并source生效:

echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash_profile
source ~/.bash_profile

问题2

2、在k8s集群添加node节点时,报错:[ERROR FileContent--proc-sys-net-bridge-bridge-nf-call-iptables]: /proc/sys/net/bridge/bridge-nf-call-iptables contents are not set to 1

原因和解决: 这个报错,在很多博客都有提到,应该把/proc/sys/net/bridge/bridge-nf-call-iptables文件改成1:

问题3

3、k8s集群添加node,卡着半天不动:

原因和解决: 检查了命令、token,最后发现是api端口问题。 就是添加节点的命令中,master节点的端口用错了,一般是用6443端口,但是如果有自定义改动,要注意端口的变化。

问题4

4、k8s集群节点不够用,想要把pod分发到master节点,死活分发不上去

问题和解决: 用kubeadm 安装的k8s集群默认情况 master节点是不参与pod负载的,就是说pod并不会被调度到master节点上运行,只会调度到work 节点上运行。但是如果资源紧张,需要临时让master接受pod调度,可以去掉master身上的标签:

kubectl taint node k8s-master node-role.kubernetes.io/master-   
#k8s-master是在master节点运行kubectl get node命令,看到的master节点的name

如下图:

让 master节点恢复不参与POD负载的命令为

kubectl taint node <node-name> node-role.kubernetes.io/master=:NoSchedule`

让 master节点恢复不参与POD负载,并将Node上已经存在的Pod驱逐出去的命令为:

kubectl taint nodes <node-name> node-role.kubernetes.io/master=:NoExecute

问题5

5、kubectl describe pod查看pod详情,提示pod not found,如“Error from server (NotFound): pods "prometheus-0" not found”

原因和解决: 看上图,熟悉了k8s命令之后,一眼就看出来问题了,就是命令中没有指定namespace名字。K8S默认是在default的namespace下,如果不指定namespace,就会去default下面找这个pod,如果找不到,就会报错。 所以,要记得指定namespace:

k8s常用命令 可参考链接:https://www.jianshu.com/p/2ded3a8cc788

SRE成长记.png