关于云计算:TKE-注册节点IDC-轻量云原生上云的最佳路径

7次阅读

共计 3080 个字符,预计需要花费 8 分钟才能阅读完成。

林顺利,腾讯云原生产品经理,负责分布式云产品迭代和注册节点客户扩大,专一于云原生混合云新形态的推广实际。

背景

企业在继续业务运维过程中,感触到腾讯云 TKE 带来的便捷性和极致的应用体验,将新业务的公布以及老业务都迁徙到云上 TKE 来实现。但很多企业数据中心建设较为晚期,选型上采取了自建 IDC 机房的计划,长久以来的 IDC 经营保护和企业上云的诉求产生了抵触和矛盾

1、资源难利旧 / 利用率低

  • 业务大部分在云上运行,存量的 IDC 主机难以利旧;
  • 云下资源业务利用率低(次要是 CPU 资源),均匀不超过 20%,资源节约重大;
  • 对于 GPU 只能实现整卡利用,少数业务运行达不到单卡门槛时产生了 gpu 资源节约;

2、运维老本高

  • 自建 Kubernetes 带来了运维的部署交付和保护老本;
  • Kubernetes 的降级保护、组件(如 kubelet)的降级保护带来了运维的继续经营老本;
  • 自建集群呈现问题时,尤其是零碎组件问题场景下,故障定位难,修复老本高;
  • 基于自建集群,实现运维的监控需要,要求运维进一步自建监控零碎、日志零碎,减少了运维复杂度;

3、难以对立调度

  • 云上曾经应用容器服务,云下有物理机,难以买通云上云下资源,实现对立调度和治理;
  • 云上和云下资源散布在不同的地区,难以将不同地区的资源放在一个集群中对立治理;

云上和云下的对立纳管

如何解决企业 IDC 和上云的抵触问题?这仿佛在过来曾经有了答案 – 混合云部署。然而当下,咱们面临的是云原生的新场景而非单纯的上云,因而,咱们基于传统混合云的解决方案进一步深刻思考,独创出 IDC 轻量级云原生解决方案 – 注册节点 :IDC 节点和 TKE 买通,云上作为管控面来提供治理、调度、监控能力,云下 IDC 作为撑持面来理论承载业务运行。在满足企业 资源利旧、托管运维、混合部署 / 调度 等云化场景的同时,将云上对于 降本增效 的外围个性下沉到 IDC 节点实现无缝集成,进一步促成了 IDC 节点资源的无效、高效利用。

TKE 注册节点的外围个性

  • 老本洞察:可视化监控各种类型工作负载下各项维度指标的应用状况,帮忙用户发现资源节约;
  • Crane:负载资源配额的智能举荐和节点上业务的专有调度,进步资源利用率;
  • qGPU:强隔离的 GPU 虚拟化技术,业务调配 GPU 不是按整卡而是可按 1 /10 卡做细粒度的分派,缩小 GPU 资源节约;

注册节点曾经反对腾讯上万台 IDC 节点,CPU 累计超过 500w 核,成为 IDC 节点轻量上云新范式。在上云同时,平台侧借助云原生资产大盘的资源监控和 crane 的专有调度能力,晋升了 IDC 节点的资源利用率,节点资源均匀水位值由 15% 迁越至 50%。

注册节点,IDC 轻量级云原生最佳门路

TKE 注册节点是针对混合云部署场景,全新降级的节点产品状态,解决了企业在 IDC 运维过程中面临的各类问题:

  1. 资源利旧和利用率晋升

    充分利用 IDC 资源,并通过 Request 举荐、动静调度、节点超卖等能力进一步晋升 IDC 资源的利用率。同时针对于 GPU 资源应用,提供厘核级算力隔离与多优先级混部。

  2. 节点托管运维

    免去在本地搭建、运维 k8s 集群的老本,无缝集成腾讯云云原生相干服务,涵盖日志、监控、审计、存储、容器平安等能力,用户仅须要运维本地服务器即可,并提供节点申明式运维的能力,反对节点疾速降级及回滚。

  3. 云上云下对立调度

    反对在单集群内同时调度本地节点与云上 CVM 节点,便于将云下业务拓展至云上,同时无需引入多集群治理。

注册节点产品能力

云上能力赋能云下

  • 可视化资源监控:通过 CPU/ 内存利用率、节点装箱率等指标直观展现老本耗费和资源节约现状;
  • 业务配额智能举荐:依据业务 Pod 的历史水位,帮忙用户举荐、配置正当的 request;
  • GPU 共享无效利用:提供了 qGPU 能力,qGPU 是内核级别 GPU 虚拟化技术,实现 GPU 共享和强 QoS 隔离,性能简直零损耗;
  • 动静调度、重调度:提供指标利用率配置能力,基于实在利用率调度,放弃节点在平安水位;

IDC 资源利旧和托管免运维

IDC 注册节点托管至云上,作为 TKE 的 worker 节点承载业务,人造实现了资源利旧;管制面在云上 TKE,集群组件的运维、降级、继续经营都由 TKE 自动化实现。

晋升 IDC 节点利用率

基于 Crane 的专有调度器提供了节点超卖的能力,用户能够自主配置节点的放大系数,业务动静调度至放大节点上,晋升了节点的装箱率并进一步晋升了节点的利用率。

对立纳管云上和云下节点

云上节点和注册节点通过不同的节点池来进行治理,业务资源调度时可指定节点池和节点类型,能够实现云上云下互相弹性。

注册节点应用场景

企业 IDC 资源利旧

企业 IDC 中存在各类急需无效利旧的服务器节点,包含 闲置节点、老旧节点、退保节点等,这些节点面临诸多问题:

  • 机器是异构的,难以对立满足业务的诉求;
  • 老旧机器的运维简单,难度高;
  • IDC 节点资源利用率低,节约重大;
  • 本地公有容器化建设和保护老本高;

通过注册节点的计划,企业在极短时间内就可能实现 IDC 节点接入 TKE 的动作(单节点 10min 内接入),应用 TKE 服务。并且,进一步

  • 复用 TKE 云上能力,包含监控,日志,平安等;
  • 晋升了资源利用率:复用云上节点利用率晋升计划,最高可晋升 5 倍;
  • 不便降级运维:云上集群主动降级,节点可设置降级窗口降级;

GPU 细粒度调配

当用户业务 pod 须要应用 GPU 资源且使用量较低甚至不满 1 卡时,如果采纳 Kubernetes 原生的 GPU 配额机制会造成资源节约。

注册节点无缝集成了腾讯云 qGPU 技术,反对在多个容器间共享 GPU 卡并提供容器间显存与算力强隔离的能力,从而在更小粒度应用 GPU 卡的根底上,保障业务平安,达到进步 GPU 使用率、升高用户老本的目标。依赖底层弱小的 qGPU 隔离技术,可做到 GPU 显存和算力的强隔离,共享应用 GPU 的同时,保障业务性能与资源不受烦扰。

多地区对立治理

用户在不同地区中都有存量的 IDC 机房场景下,想要实现对立的资源管理难度十分大,每个地区新建治理立体和业务公布流程减少了运维日常工作复杂度。

注册节点计划能够帮忙用户将不同地区的 IDC 注册到同一个 TKE 集群中进行对立的治理运维,对立了管控入口,升高了运维的复杂度。

云上云下容灾调度

负载 + 高可用的多集群、多套计划的运维老本高,而私有云和 IDC 资源的隔离性,人造适宜用来企业落地业务的容灾场景,用户急需探寻如何通过云上云下实现容灾调度的需要。

注册节点计划中,业务能够自定义调度模式,用户能够自主抉择将服务调度至云上还是云下,云上云下互相弹性,满足单集群容灾场景。

如何创立注册节点

应用注册节点性能的前提条件:

  • IDC 节点操作系统:tencent os 2.4、3.1;
  • TKE 规范集群:版本 v1.18 及以上;网络插件类型为 cillium overlay;
  • 网络买通:IDC 和 TKE 专线买通;

节点注册步骤:

TKE 规范集群,进入集群详情页 > 抉择左侧菜单栏中的节点治理 > 节点池 > 点击新建节点池,抉择注册节点池并填写对应参数提交。

节点池创立实现后进入节点池 > 点击新增节点,复制命令并到 IDC 主机上执行即可。

总结

腾讯云 TKE 中提供了 3 种节点运维的新范式:

  • 申明式节点运维 - 原生节点;
  • 有节点的 serverless – 超级节点;
  • IDC 轻量上云–注册节点;

3 种节点类型别离面向客户不同的业务场景,TKE 实现了一个集群中同时纳管这 3 种节点新范式和 TKE 一般节点的对立治理、调度计划。这也是腾讯云原生一贯的科技与人文观点,用交融的状态帮忙客户解决各类业务撑持的问题、继续关注升高用户的运维老本。

咱们心愿通过企业渐进式上云最佳计划注册节点,最低老本的实现 IDC 业务原地云原生,用户能够便捷的、分钟级的取得云上云原生的能力,实现降本增效。

正文完
 0