关于kubernetes:Kubernetes小技巧关于节点pod-ip-node数量规划

最近就想体验各种多集群互联（基于 wireguard），而后就深感网络划分的重要性，开始网络设计的杂七乱八的。想互联了都各种问题了，网络重叠了怎么办？集群扩容 IP 资源不够了杂整？还有就是默认的每个 node 节点的 subset 都默认是 24？我一台机器下面也跑不了那么多 Pod 阿 ……
恩默认的 SUBNET 都是 24，举个例子：
我的 kubernetes 集群初始化配置文件 networking 局部如下：

节约 ip 资源阿我一台服务器跑不了那么多 200 多个 pod……..，而且这样算下来除去 service 的地址，集群只能包容 12 个工作节点（包含 master 节点）

正好看到腾讯云 tke 创立集群的时候能够看到能够限度但节点的 pod 数量上线和 service 的数量：

他们怎么搞的呢？参照：k8s-flannel 网络 Node 下限冲破 255

apiVersion: kubeadm.k8s.io/v1beta2
kind: ClusterConfiguration
etcd:
  local:
    dataDir: "/var/lib/etcd"
networking:
  serviceSubnet: "10.96.0.0/16"
  podSubnet: "10.244.0.0/16"
  dnsDomain: "cluster.local"
kubernetesVersion: "v1.18.0"
controlPlaneEndpoint: "11.167.124.4:6443"
controllerManager:
  extraArgs:
    allocate-node-cidrs: 'true'
    node-cidr-mask-size: '28'
apiServer:
  extraArgs:
    authorization-mode: "Node,RBAC"
  certSANs:
  - "11.167.124.4"
  timeoutForControlPlane: 4m0s
imageRepository: "registry.aliyuncs.com/google_containers"

    allocate-node-cidrs: 'true'
    node-cidr-mask-size: '28'

参照：https://kubernetes.io/docs/reference/config-api/kubeadm-config.v1beta3/#kubeadm-k8s-io-v1beta3-Networking

我的 kubernets 初始化配置文件是这样的：

apiVersion: kubeadm.k8s.io/v1beta3
bootstrapTokens:
- groups:
  - system:bootstrappers:kubeadm:default-node-token
  token: abcdef.0123456789abcdef
  ttl: 24h0m0s
  usages:
  - signing
  - authentication
kind: InitConfiguration
localAPIEndpoint:
  advertiseAddress: 10.0.2.28
  bindPort: 6443
nodeRegistration:
  criSocket: unix:///var/run/containerd/containerd.sock
  imagePullPolicy: IfNotPresent
  name: sh-master-01
  taints:
  - effect: NoSchedule
    key: node-role.kubernetes.io/master
---
apiServer:
  timeoutForControlPlane: 4m0s
apiVersion: kubeadm.k8s.io/v1beta3
certificatesDir: /etc/kubernetes/pki
clusterName: kubernetes
controllerManager:
  extraArgs:
    allocate-node-cidrs: 'true'
    node-cidr-mask-size: '26'
dns: {}
etcd:
  local:
    dataDir: /var/lib/etcd
imageRepository: registry.aliyuncs.com/google_containers
kind: ClusterConfiguration
kubernetesVersion: 1.25.0
networking:
  dnsDomain: cluster.local
  serviceSubnet: 172.21.12.0/22
  podSubnet: 172.21.0.0/20
scheduler: {}

注：环境基于 kubeadm 搭建！
node-cidr-mask-size: ’26’ 能够承载多少个地址呢？2^(32-26)-1=2^6-1=63 个地址满够用了 (其实还应该去除一个 flannel.1 网卡占用的地址，还有子网地址 cni0 地址？应该是 61 个？）

首先：serviceSubnet: 172.21.12.0/22 也就是我的集群能够有 2^(32-22)-1=2^10-1=1023 个地址
172.21.0.0/20 子网数量是 64 减去 server 网段目测应该是 48 台节点的集群（当然了也包含 master 节点）

kube-flannel.yaml 同样的也要批改 net-conf.json 局部

  net-conf.json: |
    {
      "Network": "172.21.0.0/20",
      "SubnetLen": 26,
      "Backend": {"Type": "vxlan"}
    }

kubeadm init --config=config.yaml
kubectl apply -f kube-flannel.yml

work 节点退出集群疏忽 , 查看 /run/flannel/subnet.env, 发现 FLANNEL_SUBNET 的掩码变成了 26

ifconfig cni0 flannel.1 所属 Ip 地址：

我在初始化集群的时候搞成了上面这样 …. 没错 pod 网络跟 service 网络写反了 …..

kubeadm init --kubernetes-version=1.25.0 --image-repository=registry.aliyuncs.com/google_containers --service-cidr=171.21.0.0/20 --pod-network-cidr=172.21.12.0/22 --apiserver-advertise-address=10.0.2.28

而后的后果就是四台节点能够，增加第五台就是出问题，而后还流氓了一下 patch 设置了最初一台的 podcidr……

kubectl patch node sh-work-05 -p '{"spec":{"podCIDR":"172.21.7.0/24"}}'

然而管制立体组件就开始异样了！这里只是揭示一下有 patch 的办法能够用，心愿大家不要跟我一样，写反了配置！因为是新的集群，我是 reset 集群从新初始化了！

关于kubernetes:Kubernetes小技巧关于节点pod-ip-node数量规划

背景：

对于节点 pod ip 布局与集群包容更多节点

腾讯云 tke 的例子

对于 controllerManager extraArgs 配置：

再扩大一下：我的集群能够有多少台 node 呢？

依然以 flannel 为例：

初始化集群并验证网络配置

其余碰到的：