引言
Kubernetes的Worker节点的部署要比Master简单不少,核心的是一条join命令,步骤如下。
操作系统是CentOS7,假设使用的用户是root(如果不是root的话,请自行添加”sudo”)
如果你用的是Ubuntu系统,大多数操作也都类似,在结尾附录二中我还给出了Ubuntu安装过程中与CentOS7不同的地方,希望能对你有所帮助。
步骤一 调节Docker版本
Kubernetes和Docker的版本兼容性一直是令人头疼的问题,之前我的服务器上装的docker是1.13.1版本,安装时会报很多莫名其妙的错误,让人困惑很久,经过测试Docker的1.13.0版本是能够和Kubernetes的v1.13.4版本完美配合的。
1.查看docker版本
docker -v
如果发现版本刚好是1.13.0的话就可以直接跳到步骤二了
2.如果发现版本不是1.13.0的话,建议将Docker卸载并且重新安装合适的版本
# 删除已有的docker
yum erase -y docker*
# 删除已有的docker镜像(防止不同版本的docker无法兼容各自的镜像而产生服务无法启动的错误)
mv -f /var/lib/docker /var/lib/docker.old
# 添加可以下载老版本docker的yum源
cat>> /etc/yum.repos.d/docker-main.repo <<EOF
[docker-main]
name=docker-main
baseurl=http://mirrors.aliyun.com/docker-engine/yum/repo/main/centos/7/
gpgcheck=1
enabled=1
gpgkey=http://mirrors.aliyun.com/docker-engine/yum/gpg
EOF
# 清除缓存
yum clean all
# 安装docker 1.13.0
yum -y install docker-engine-1.13.0
上面的安装命令在有的情况下可能还是会安装上新版本的docker,此时可以考虑下载rpm包自己手动进行安装:下载地址
下载docker-engine-selinux-17.05.0.ce-1.el7.centos.noarch.rpm和docker-engine-1.13.0-1.el7.centos.x86_64.rpm这两个,然后上传到linux服务器上,使用如下命令装:
先cd到你上传这两个rpm包所在的目录
# 如果最近在update过,不运行这个也可以
yum update -y
# 先安装docker-engine-selinux
rpm -ivh docker-engine-selinux-17.05.0.ce-1.el7.centos.noarch.rpm
# 再安装docker-engine
rpm -ivh docker-engine-1.13.0-1.el7.centos.x86_64.rpm
之后查看docker版本:
docker -v
确认此时docker的版本已经是1.13.0:
3. 开启docker服务
systemctl enable docker
systemctl start docker
步骤二 安装kubeadm
kubeadm是一个可以方便我们部署kubernetes节点的工具。
# 添加安装kubeadm的yum源
cat>> /etc/yum.repos.d/kubernetes.repo <<EOF
[kubernetes]
name=kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
gpgcheck=0
enable=1
EOF
# 安装kubeadm
yum install -y kubeadm
在安装kubeadm的同时,系统还自动帮你安装了kubectl,kubelet和kubernetes-cni
设置kubelet开机自启
systemctl enable kubelet.service
注意此时不要尝试通过systemctl start
来启动kubelet
,即使尝试了也不会成功,kubelet
最终必须由kubeadm来负责启动。
步骤三 拉取kubernetes的系统镜像
kubernetes在Worker节点上的基础系统,除了kubelet以外,其他都是通过容器部署的。本来这些镜像都可以在Worker启动时自动拉取的,但是因为国内墙的原因,我们事先在本地准备好(通过大佬在github上建立的镜像)。
在shell中执行如下代码:
images=(kube-proxy:v1.13.4 pause:3.1)
for imageName in ${images[@]} ; do
docker pull gcr.azk8s.cn/google-containers/$imageName
docker tag gcr.azk8s.cn/google-containers/$imageName k8s.gcr.io/$imageName
docker rmi gcr.azk8s.cn/google-containers/$imageName
done
步骤四 禁用swap分区
swapoff -a
步骤五 修改主机名
集群内的主机名最好能有比较统一的格式,我没有在集群中配置DNS,所以采用的方案就是使用统一的/etc/hosts
,集群中的主机ip是10.10.108.xx
,于是就约定其主机名是hxx
,我生成了一份这样的hosts
文件,并且用脚本拷贝到了每一台机器上,同时使用下面的命令更改主机名:
(假设ip是10.10.10.108.73
)
hostnamectl set-hostname "h73"
步骤六 加入集群
如果Master节点启动时产生的join
命令还保存着的话,直接使用那条命令就可以了。
否则,可以通过kubeadm token list
命令查看token。
其中有一列EXPIRES
代表token过期的时间,找到一个还没过期的token然后执行以下命令:
kubeadm join Master节点的IP:6443 --token 找到的token --discovery-token-ca-cert-hash sha256:主节点启动时生成的sha256值
如果所有token都过期了,可以使用如下命令创建一个:
kubeadm token create --print-join-command
默认的token有效期是23h,也可以通过如下命令创建永久有效的token:
kubeadm token create --ttl 0 --print-join-command
这时就会生成一个永不过期的token
执行完join命令如果没有报错就成功加入集群了,可以在主节点上通过kubectl get nodes
查看是否有该主机。
附录1:如何排错
有时候join
命令打印出的信息并不详尽,可以使用如下的命令查看更加详尽的报错:
journalctl -xe
对于某个pod的错误可以通过下面的命令具体查看:
kubectl describe pod pod的名称 -n pod所在命名空间
通过kubectl get pods --all-namespaces
可以查看到你想要的pod名称与命名空间,填入上面的命令即可。
附录2:Ubuntu系统需要注意的地方
如果部署的机器是Ubuntu系统,大部分步骤都差不多,区别比较大的地方只有两处:
安装指定版本的Docker
# 删除版本不对的docker
apt-get remove docker docker-engine docker-ce docker.io
# 添加含有老版本docker的源
curl -fsSL https://apt.dockerproject.org/gpg | sudo apt-key add -
apt-add-repository "deb https://apt.dockerproject.org/repo ubuntu-$(lsb_release -cs) main"
apt-get update
# 安装1.13.0版本Docker
apt-get install docker-engine=1.13.0-0~ubuntu-xenial
安装kubeadm
# 添加含有kubeadm的源
git clone https://gitee.com/DQYuan_admin/kubernetes_gpg.git
cd kubernetes_gpg
cat apt-key.gpg | apt-key add -
cat <<EOF > /etc/apt/sources.list.d/kubernetes.list
deb http://mirrors.ustc.edu.cn/kubernetes/apt kubernetes-xenial main
EOF
# 安装kubeadm
apt-get update
apt-get install kubeadm
附录3:部署脚本
脚本默认使用root用户执行。只适用于CentOS7
需要根据自身集群的情况修改脚本部分内容
#!/bin/bash
# 指定需要的docker版本
docker_version=1.13.0
# 如果k8s在该台机器上已启动
kube_line_num=`ps -ef | grep kubelet | wc -l`
if [[ $kube_line_num>1 ]]; then
echo "该台机器已经启动过k8s了,不必重复启动,脚本退出"
exit
fi
function docker_install() {
cat>> /etc/yum.repos.d/docker-main.repo <<EOF
[docker-main]
name=docker-main
baseurl=http://mirrors.aliyun.com/docker-engine/yum/repo/main/centos/7/
gpgcheck=1
enabled=1
gpgkey=http://mirrors.aliyun.com/docker-engine/yum/gpg
EOF
yum erase -y docker*
rm -rf /var/lib/docker.old
rm -f /etc/yum.repos.d/docker.repo
mv -f /var/lib/docker /var/lib/docker.old
yum -y install docker-engine-1.13.0
}
# check if docker install
function check_and_install()
{
echo "检查Docker......"
docker -v
if [ $? -eq 0 ]; then
echo "检查到Docker已安装!"
else
echo "安装docker环境..."
docker_install
echo "安装docker环境...安装完成!"
fi
match=`docker -v | grep $docker_version`
if [[ -z $match ]];
then
echo "docker版本不对,需要的版本是 $docker_version ,正在重新安装"
docker_install
fi
}
check_and_install
echo "关闭swap"
swapoff -a
cat>> /etc/sysctl.d/k8s.conf <<EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
vm.swappiness=0
EOF
sysctl --system
echo "准备安装kubeadm"
cat>> /etc/yum.repos.d/kubernetes.repo <<EOF
[kubernetes]
name=kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
gpgcheck=0
enable=1
EOF
yum install -y kubeadm
systemctl enable docker
systemctl enable kubelet.service
systemctl start docker
echo "拉取镜像"
images=(kube-proxy:v1.13.4 pause:3.1)
for imageName in ${images[@]} ; do
docker pull gcr.azk8s.cn/google-containers/$imageName
docker tag gcr.azk8s.cn/google-containers/$imageName k8s.gcr.io/$imageName
docker rmi gcr.azk8s.cn/google-containers/$imageName
done
echo "处理主机名和hosts"
\cp -f ./unihosts /etc/hosts
# 获得ip的最后一段
ip_seg=`ip a | grep -P "10.10.108.\d+" -o | awk -F '.' '{print $4}'`
hostnamectl set-hostname "h$ip_seg"
echo "加入集群"
kubeadm join 10.10.108.73:6443 --token gdvgh1.bnlcjnlcet9l78zo \
--discovery-token-ca-cert-hash sha256:c6516103a534da7d660895080e90f8a77a5f8d74a417a685c0bcdcd748f82365
需要根据集群情况修改的地方有:
1.提供一份集群统一的hosts
配置
echo "处理主机名和hosts"
\cp -f ./unihosts /etc/hosts
这里的./unihosts
修改成你准备的统一的集群的主机名配置
2.集群ip特征
# 获得ip的最后一段
ip_seg=`ip a | grep -P "10.10.108.\d+" -o | awk -F '.' '{print $4}'`
这里的 10.10.108.\d+
要换成集群自己的ip模式
3.join命令
kubeadm join 10.10.108.73:6443 --token gdvgh1.bnlcjnlcet9l78zo \
--discovery-token-ca-cert-hash sha256:c6516103a534da7d660895080e90f8a77a5f8d74a417a685c0bcdcd748f82365
最后一行的join
要替换成自己集群的join
命令