关于k8s:k8s高可用集群部署二进制版本v11818下

Kubernetes 作为容器集群零碎，通过健康检查 + 重启策略实现了 Pod 故障自我修复能力，通过调度算法实现将 Pod 分布式部署，并放弃预期正本数，依据 Node 生效状态主动在其余 Node 拉起 Pod，实现了应用层的高可用性。

针对 Kubernetes 集群，高可用性还应蕴含以下两个层面的思考：Etcd 数据库的高可用性和 Kubernetes Master 组件的高可用性。而 Etcd 咱们曾经采纳 3 个节点组建集群实现高可用，本节将对 Master 节点高可用进行阐明和施行。

Master 节点扮演着总控核心的角色，通过一直与工作节点上的 Kubelet 和 kube-proxy 进行通信来保护整个集群的衰弱工作状态。如果 Master 节点故障，将无奈应用 kubectl 工具或者 API 做任何集群治理。

Master 节点次要有三个服务 kube-apiserver、kube-controller-manager 和 kube-scheduler，其中 kube-controller-manager 和 kube-scheduler 组件本身通过抉择机制曾经实现了高可用，所以 Master 高可用次要针对 kube-apiserver 组件，而该组件是以 HTTP API 提供服务，因而对他高可用与 Web 服务器相似，减少负载均衡器对其负载平衡即可，并且可程度扩容。

多 Master 架构图：

Master2 与已部署的 Master1 所有操作统一。所以咱们只需将 Master1 所有 K8s 文件拷贝过去，再批改下服务器 IP 和主机名启动即可。

在 Master2 创立 etcd 证书目录：
mkdir -p /opt/etcd/ssl

拷贝 Master1 上所有 K8s 文件和 etcd 证书到 Master2：

scp -r /opt/kubernetes root@192.168.219.165:/opt
scp -r /opt/cni/ root@192.168.219.165:/opt
scp -r /opt/etcd/ssl root@192.168.219.165:/opt/etcd
scp /usr/lib/systemd/system/kube* root@192.168.219.165:/usr/lib/systemd/system
scp /usr/bin/kubectl  root@192.168.219.165:/usr/bin

批改 apiserver、kubelet 和 kube-proxy 配置文件为本地 IP：

vi /opt/kubernetes/cfg/kube-apiserver.conf 
...
--bind-address=192.168.219.165 \
--advertise-address=192.168.219.165 \
...
 
vi /opt/kubernetes/cfg/kubelet.conf
--hostname-override=k8s-master2
 
vi /opt/kubernetes/cfg/kube-proxy-config.yml
hostnameOverride: k8s-master2

systemctl daemon-reload
systemctl start kube-apiserver
systemctl start kube-controller-manager
systemctl start kube-scheduler
systemctl start kubelet
systemctl start kube-proxy
systemctl enable kube-apiserver
systemctl enable kube-controller-manager
systemctl enable kube-scheduler
systemctl enable kubelet
systemctl enable kube-proxy

kubectl get cs
NAME                 STATUS    MESSAGE             ERROR
scheduler            Healthy   ok                  
controller-manager   Healthy   ok                  
etcd-1               Healthy   {"health":"true"}   
etcd-2               Healthy   {"health":"true"}   
etcd-0               Healthy   {"health":"true"}

kubectl get csr
NAME                                                   AGE   SIGNERNAME                                    REQUESTOR           CONDITION
node-csr-JYNknakEa_YpHz797oKaN-ZTk43nD51Zc9CJkBLcASU   85m   kubernetes.io/kube-apiserver-client-kubelet   kubelet-bootstrap   Pending
 
kubectl certificate approve node-csr-JYNknakEa_YpHz797oKaN-ZTk43nD51Zc9CJkBLcASU
 
kubectl get node
NAME           STATUS   ROLES    AGE   VERSION
k8s-master1    Ready    <none>   34h   v1.18.18
k8s-master2    Ready    <none>   83m   v1.18.18
k8s-node1      Ready    <none>   33h   v1.18.18
k8s-node2      Ready    <none>   33h   v1.18.18

Nginx 是一个支流 Web 服务和反向代理服务器，这里用四层实现对 apiserver 实现负载平衡。

Keepalived 是一个支流高可用软件，基于 VIP 绑定实现服务器双机热备，在上述拓扑中，Keepalived 次要依据 Nginx 运行状态判断是否须要故障转移（偏移 VIP），例如当 Nginx 主节点挂掉，VIP 会主动绑定在 Nginx 备节点，从而保障 VIP 始终可用，实现 Nginx 高可用。

kube-apiserver 高可用架构图：

yum install epel-release -y
yum install nginx keepalived -y

cat > /etc/nginx/nginx.conf << "EOF"
user nginx;
worker_processes auto;
error_log /var/log/nginx/error.log;
pid /run/nginx.pid;

include /usr/share/nginx/modules/*.conf;

events {worker_connections 1024;}

# 四层负载平衡，为两台 Master apiserver 组件提供负载平衡
stream {log_format  main  '$remote_addr $upstream_addr - [$time_local] $status $upstream_bytes_sent';

    access_log  /var/log/nginx/k8s-access.log  main;

    upstream k8s-apiserver {
       server 192.168.219.161:6443;   # Master1 APISERVER IP:PORT
       server 192.168.219.164:6443;   # Master2 APISERVER IP:PORT
    }
    
    server {
       listen 6443;
       proxy_pass k8s-apiserver;
    }
}

http {log_format  main  '$remote_addr - $remote_user [$time_local]"$request"''$status $body_bytes_sent "$http_referer" ''"$http_user_agent""$http_x_forwarded_for"';

    access_log  /var/log/nginx/access.log  main;

    sendfile            on;
    tcp_nopush          on;
    tcp_nodelay         on;
    keepalive_timeout   65;
    types_hash_max_size 2048;

    include             /etc/nginx/mime.types;
    default_type        application/octet-stream;

    server {
        listen       80 default_server;
        server_name  _;

        location / {}}
}
EOF

cat > /etc/keepalived/keepalived.conf << EOF
global_defs { 
   notification_email { 
     acassen@firewall.loc 
     failover@firewall.loc 
     sysadmin@firewall.loc 
   } 
   notification_email_from Alexandre.Cassen@firewall.loc  
   smtp_server 127.0.0.1 
   smtp_connect_timeout 30 
   router_id NGINX_MASTER
} 

vrrp_script check_nginx {script "/etc/keepalived/check_nginx.sh"}

vrrp_instance VI_1 { 
    state MASTER 
    interface ens33  # 批改为理论网卡名
    virtual_router_id 51 # VRRP 路由 ID 实例，每个实例是惟一的 
    priority 100    # 优先级，备服务器设置 90 
    advert_int 1    # 指定 VRRP 心跳包通告间隔时间，默认 1 秒 
    authentication { 
        auth_type PASS      
        auth_pass 1111 
    }  
    # 虚构 IP
    virtual_ipaddress {192.168.219.188/24} 
    track_script {check_nginx} 
}
EOF

vrrp_script：指定查看 nginx 工作状态脚本（依据 nginx 状态判断是否故障转移）
virtual_ipaddress：虚构 IP（VIP）

查看 nginx 状态脚本：

cat > /etc/keepalived/check_nginx.sh  << "EOF"
#!/bin/bash
count=$(ps -ef |grep nginx |egrep -cv "grep|$$")

if ["$count" -eq 0];then
    exit 1
else
    exit 0
fi
EOF
chmod +x /etc/keepalived/check_nginx.sh

cat > /etc/keepalived/keepalived.conf << EOF
global_defs { 
   notification_email { 
     acassen@firewall.loc 
     failover@firewall.loc 
     sysadmin@firewall.loc 
   } 
   notification_email_from Alexandre.Cassen@firewall.loc  
   smtp_server 127.0.0.1 
   smtp_connect_timeout 30 
   router_id NGINX_BACKUP
} 

vrrp_script check_nginx {script "/etc/keepalived/check_nginx.sh"}

vrrp_instance VI_1 { 
    state BACKUP 
    interface ens33
    virtual_router_id 51 # VRRP 路由 ID 实例，每个实例是惟一的 
    priority 90
    advert_int 1
    authentication { 
        auth_type PASS      
        auth_pass 1111 
    }  
    virtual_ipaddress {192.168.219.188/24} 
    track_script {check_nginx} 
}
EOF

上述配置文件中查看 nginx 运行状态脚本：

cat > /etc/keepalived/check_nginx.sh  << "EOF"
#!/bin/bash
count=$(ps -ef |grep nginx |egrep -cv "grep|$$")

if ["$count" -eq 0];then
    exit 1
else
    exit 0
fi
EOF
chmod +x /etc/keepalived/check_nginx.sh

注：keepalived 依据脚本返回状态码（0 为工作失常，非 0 不失常）判断是否故障转移。

systemctl daemon-reload
systemctl start nginx
systemctl start keepalived
systemctl enable nginx
systemctl enable keepalived

ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 00:0c:29:04:f7:2c brd ff:ff:ff:ff:ff:ff
    inet 192.168.31.80/24 brd 192.168.31.255 scope global noprefixroute ens33
       valid_lft forever preferred_lft forever
    inet 192.168.31.88/24 scope global secondary ens33
       valid_lft forever preferred_lft forever
    inet6 fe80::20c:29ff:fe04:f72c/64 scope link 
       valid_lft forever preferred_lft forever

能够看到，在 ens33 网卡绑定了 192.168.31.88 虚构 IP，阐明工作失常。

敞开主节点 Nginx，测试 VIP 是否漂移到备节点服务器。
在 Nginx Master 执行 pkill nginx
在 Nginx Backup，ip addr 命令查看已胜利绑定 VIP。

curl -k https://192.168.219.188:6443/version
{
  "major": "1",
  "minor": "18",
  "gitVersion": "v1.18.3",
  "gitCommit": "2e7996e3e2712684bc73f0dec0200d64eec7fe40",
  "gitTreeState": "clean",
  "buildDate": "2020-05-20T12:43:34Z",
  "goVersion": "go1.13.9",
  "compiler": "gc",
  "platform": "linux/amd64"
}

能够正确获取到 K8s 版本信息，阐明负载均衡器搭建失常。该申请数据流程：curl -> vip(nginx) -> apiserver

tail /var/log/nginx/k8s-access.log -f
192.168.219.181 192.168.219.161:6443 - [30/May/2020:11:15:10 +0800] 200 422
192.168.219.181 192.168.219.164:6443 - [30/May/2020:11:15:26 +0800] 200 422

到此还没完结，还有上面最要害的一步。

试想下，尽管咱们减少了 Master2 和负载均衡器，然而咱们是从单 Master 架构扩容的，也就是说目前所有的 Node 组件连贯都还是 Master1，如果不改为连贯 VIP 走负载均衡器，那么 Master 还是单点故障。

主机名	ip
k8s-master1	192.168.219.161
k8s-node1	192.168.219.162
k8s-node2	192.168.219.163
k8s-master2	192.168.219.164

也就是通过 kubectl get node 命令查看到的节点。

sed -i 's#192.168.219.161:6443#192.168.219.188:6443#' /opt/kubernetes/cfg/*
systemctl restart kubelet
systemctl restart kube-proxy

kubectl get node
NAME             STATUS   ROLES    AGE      VERSION
k8s-master1    Ready    <none>   34h      v1.18.18
k8s-master2    Ready    <none>   101m   v1.18.18
k8s-node1      Ready    <none>   33h      v1.18.18
k8s-node2      Ready    <none>   33h      v1.18.18

至此，一套残缺的 Kubernetes 高可用集群就部署实现了！

PS：如果你是在私有云上，个别都不反对 keepalived，那么你能够间接用它们的负载均衡器产品（内网就行，还收费~），架构与下面一样，间接负载平衡多台 Master kube-apiserver 即可！

关于k8s:k8s高可用集群部署二进制版本v11818下

10、高可用架构（扩容多 Master 架构）

10.1、装置 Docker

10.2、配置主机环境

10.3、部署 Master2 Node（192.168.219.164）

10.3.1、创立 etcd 证书目录

10.3.2、拷贝文件（Master1 操作）

10.3.3、批改配置文件 IP 和主机名

10.3.4、启动设置开机启动

10.3.5、查看集群状态

10.3.6、批准 kubelet 证书申请

11、部署 Nginx 负载均衡器

11.1、装置软件包（主 / 备）

11.2、Nginx 配置文件（主 / 备一样）

11.3、keepalived 配置文件（Nginx Master）

11.4、keepalived 配置文件（Nginx Backup）

11.5、启动并设置开机启动

11.6、查看 keepalived 工作状态

11.7、Nginx+Keepalived 高可用测试

11.8、拜访负载均衡器测试

11.8.1、找 K8s 集群中任意一个节点，应用 curl 查看 K8s 版本测试，应用 VIP 拜访：

11.8.2、通过查看 Nginx 日志也能够看到转发 apiserver IP：

12、批改所有 Worker Node 连贯 LB VIP

12.1、因而接下来就是要改所有 Node 组件配置文件，由原来 192.168.219.161 批改为 192.168.219.188（VIP）

12.2、在上述所有 Worker Node 执行

12.3、查看节点状态