引言


Kubernetes的Worker节点的部署要比Master简单不少,核心的是一条join命令,步骤如下。

操作系统是CentOS7,假设使用的用户是root(如果不是root的话,请自行添加”sudo”)

如果你用的是Ubuntu系统,大多数操作也都类似,在结尾附录二中我还给出了Ubuntu安装过程中与CentOS7不同的地方,希望能对你有所帮助。

步骤一 调节Docker版本


Kubernetes和Docker的版本兼容性一直是令人头疼的问题,之前我的服务器上装的docker是1.13.1版本,安装时会报很多莫名其妙的错误,让人困惑很久,经过测试Docker的1.13.0版本是能够和Kubernetes的v1.13.4版本完美配合的。

1.查看docker版本

docker -v

如果发现版本刚好是1.13.0的话就可以直接跳到步骤二了

2.如果发现版本不是1.13.0的话,建议将Docker卸载并且重新安装合适的版本

# 删除已有的docker
yum erase -y docker*
# 删除已有的docker镜像(防止不同版本的docker无法兼容各自的镜像而产生服务无法启动的错误)
mv -f /var/lib/docker /var/lib/docker.old
# 添加可以下载老版本docker的yum源
cat>> /etc/yum.repos.d/docker-main.repo <<EOF
[docker-main]
name=docker-main
baseurl=http://mirrors.aliyun.com/docker-engine/yum/repo/main/centos/7/
gpgcheck=1
enabled=1
gpgkey=http://mirrors.aliyun.com/docker-engine/yum/gpg
EOF

# 清除缓存
yum clean all
# 安装docker 1.13.0
yum -y install docker-engine-1.13.0

上面的安装命令在有的情况下可能还是会安装上新版本的docker,此时可以考虑下载rpm包自己手动进行安装:下载地址

下载docker-engine-selinux-17.05.0.ce-1.el7.centos.noarch.rpm和docker-engine-1.13.0-1.el7.centos.x86_64.rpm这两个,然后上传到linux服务器上,使用如下命令装:

先cd到你上传这两个rpm包所在的目录

# 如果最近在update过,不运行这个也可以
yum update -y
# 先安装docker-engine-selinux
rpm -ivh docker-engine-selinux-17.05.0.ce-1.el7.centos.noarch.rpm
# 再安装docker-engine
rpm -ivh docker-engine-1.13.0-1.el7.centos.x86_64.rpm

之后查看docker版本:

docker -v

确认此时docker的版本已经是1.13.0:

确认docker版本

3. 开启docker服务

systemctl enable docker
systemctl start docker

步骤二 安装kubeadm


kubeadm是一个可以方便我们部署kubernetes节点的工具。

# 添加安装kubeadm的yum源
cat>> /etc/yum.repos.d/kubernetes.repo <<EOF
[kubernetes]
name=kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
gpgcheck=0
enable=1
EOF
# 安装kubeadm
yum install -y kubeadm

在安装kubeadm的同时,系统还自动帮你安装了kubectl,kubelet和kubernetes-cni

设置kubelet开机自启

systemctl enable kubelet.service

注意此时不要尝试通过systemctl start来启动kubelet,即使尝试了也不会成功,kubelet最终必须由kubeadm来负责启动。

步骤三 拉取kubernetes的系统镜像


kubernetes在Worker节点上的基础系统,除了kubelet以外,其他都是通过容器部署的。本来这些镜像都可以在Worker启动时自动拉取的,但是因为国内墙的原因,我们事先在本地准备好(通过大佬在github上建立的镜像)。

在shell中执行如下代码:

images=(kube-proxy:v1.13.4 pause:3.1)
for imageName in ${images[@]} ; do
docker pull gcr.azk8s.cn/google-containers/$imageName
docker tag gcr.azk8s.cn/google-containers/$imageName k8s.gcr.io/$imageName
docker rmi gcr.azk8s.cn/google-containers/$imageName
done

步骤四 禁用swap分区


swapoff -a

步骤五 修改主机名


集群内的主机名最好能有比较统一的格式,我没有在集群中配置DNS,所以采用的方案就是使用统一的/etc/hosts,集群中的主机ip是10.10.108.xx,于是就约定其主机名是hxx,我生成了一份这样的hosts文件,并且用脚本拷贝到了每一台机器上,同时使用下面的命令更改主机名:

(假设ip是10.10.10.108.73)

hostnamectl set-hostname "h73"

步骤六 加入集群


如果Master节点启动时产生的join命令还保存着的话,直接使用那条命令就可以了。

否则,可以通过kubeadm token list命令查看token。

tokenlist

其中有一列EXPIRES代表token过期的时间,找到一个还没过期的token然后执行以下命令:

kubeadm join Master节点的IP:6443 --token 找到的token --discovery-token-ca-cert-hash sha256:主节点启动时生成的sha256

如果所有token都过期了,可以使用如下命令创建一个:

kubeadm token create --print-join-command

默认的token有效期是23h,也可以通过如下命令创建永久有效的token:

kubeadm token create --ttl 0 --print-join-command

这时就会生成一个永不过期的token

执行完join命令如果没有报错就成功加入集群了,可以在主节点上通过kubectl get nodes查看是否有该主机。

附录1:如何排错


有时候join命令打印出的信息并不详尽,可以使用如下的命令查看更加详尽的报错:

journalctl -xe

对于某个pod的错误可以通过下面的命令具体查看:

kubectl describe pod pod的名称 -n pod所在命名空间

通过kubectl get pods --all-namespaces可以查看到你想要的pod名称与命名空间,填入上面的命令即可。

附录2:Ubuntu系统需要注意的地方


如果部署的机器是Ubuntu系统,大部分步骤都差不多,区别比较大的地方只有两处:

安装指定版本的Docker

# 删除版本不对的docker
apt-get remove docker docker-engine docker-ce docker.io
# 添加含有老版本docker的源
curl -fsSL https://apt.dockerproject.org/gpg | sudo apt-key add -
apt-add-repository "deb https://apt.dockerproject.org/repo ubuntu-$(lsb_release -cs) main"
apt-get update
# 安装1.13.0版本Docker
apt-get install docker-engine=1.13.0-0~ubuntu-xenial

安装kubeadm

# 添加含有kubeadm的源
git clone  https://gitee.com/DQYuan_admin/kubernetes_gpg.git
cd kubernetes_gpg
cat apt-key.gpg | apt-key add -

cat <<EOF > /etc/apt/sources.list.d/kubernetes.list
deb http://mirrors.ustc.edu.cn/kubernetes/apt kubernetes-xenial main
EOF

# 安装kubeadm
apt-get update
apt-get install kubeadm

附录3:部署脚本


脚本默认使用root用户执行。只适用于CentOS7

需要根据自身集群的情况修改脚本部分内容

#!/bin/bash

# 指定需要的docker版本
docker_version=1.13.0

# 如果k8s在该台机器上已启动
kube_line_num=`ps -ef | grep kubelet | wc -l`

if [[ $kube_line_num>1 ]]; then
    echo "该台机器已经启动过k8s了,不必重复启动,脚本退出"
    exit
fi


function docker_install() {
    cat>> /etc/yum.repos.d/docker-main.repo <<EOF
[docker-main]
name=docker-main
baseurl=http://mirrors.aliyun.com/docker-engine/yum/repo/main/centos/7/
gpgcheck=1
enabled=1
gpgkey=http://mirrors.aliyun.com/docker-engine/yum/gpg
EOF
    yum erase -y docker*
    rm -rf /var/lib/docker.old
    rm -f /etc/yum.repos.d/docker.repo
    mv -f /var/lib/docker /var/lib/docker.old
    yum -y install docker-engine-1.13.0
}

# check if docker install
function check_and_install()
{
    echo "检查Docker......"
    docker -v
    if [ $? -eq  0 ]; then
        echo "检查到Docker已安装!"
    else
        echo "安装docker环境..."
        docker_install
        echo "安装docker环境...安装完成!"
    fi

    match=`docker -v | grep $docker_version`

    if [[ -z $match ]];
    then
        echo "docker版本不对,需要的版本是 $docker_version ,正在重新安装"
        docker_install
    fi
}

check_and_install

echo "关闭swap"
swapoff -a

cat>> /etc/sysctl.d/k8s.conf <<EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
vm.swappiness=0
EOF

sysctl --system

echo "准备安装kubeadm"
cat>> /etc/yum.repos.d/kubernetes.repo <<EOF
[kubernetes]
name=kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
gpgcheck=0
enable=1
EOF

yum install -y kubeadm

systemctl enable docker
systemctl enable kubelet.service
systemctl start docker

echo "拉取镜像"
images=(kube-proxy:v1.13.4 pause:3.1)
for imageName in ${images[@]} ; do
docker pull gcr.azk8s.cn/google-containers/$imageName
docker tag gcr.azk8s.cn/google-containers/$imageName k8s.gcr.io/$imageName
docker rmi gcr.azk8s.cn/google-containers/$imageName
done

echo "处理主机名和hosts"
\cp -f ./unihosts /etc/hosts
# 获得ip的最后一段
ip_seg=`ip a | grep -P "10.10.108.\d+" -o | awk -F '.' '{print $4}'`
hostnamectl set-hostname "h$ip_seg"

echo "加入集群"
kubeadm join 10.10.108.73:6443 --token gdvgh1.bnlcjnlcet9l78zo \
--discovery-token-ca-cert-hash sha256:c6516103a534da7d660895080e90f8a77a5f8d74a417a685c0bcdcd748f82365

需要根据集群情况修改的地方有:

1.提供一份集群统一的hosts配置

echo "处理主机名和hosts"
\cp -f ./unihosts /etc/hosts

这里的./unihosts修改成你准备的统一的集群的主机名配置

2.集群ip特征

# 获得ip的最后一段
ip_seg=`ip a | grep -P "10.10.108.\d+" -o | awk -F '.' '{print $4}'`

这里的 10.10.108.\d+要换成集群自己的ip模式

3.join命令

kubeadm join 10.10.108.73:6443 --token gdvgh1.bnlcjnlcet9l78zo \
--discovery-token-ca-cert-hash sha256:c6516103a534da7d660895080e90f8a77a5f8d74a417a685c0bcdcd748f82365

最后一行的join要替换成自己集群的join命令