关于devops:阿里云杨红军应用管理云上资源DevOps最佳实践

20次阅读

共计 2654 个字符,预计需要花费 7 分钟才能阅读完成。

摘要:2022 年 7 月 25 日,云上自动化运维 CloudOps 系列沙龙_第二弹正式开启!阿里云弹性计算技术专家杨红军带来了首个分享《利用治理:云上资源 DevOps 最佳实际》,以下是他的演讲内容整顿,本篇内容次要分为三个局部:

  1.    云上资源管理和运维的工具
  2.    利用分组维度资源的治理
  3.    利用分组维度资源的运维和监控

01 云上资源管理和运维的工具

目前,围绕 ECS 的管控和运维呈现了五大问题。

第一,随着业务的倒退,企业云上资源数量和品种一直减少,对治理带来了挑战。
第二,资源的应用方、财务方对依据治理视角分账,以及老本优化的诉求显著。
第三,随着越来越多的业务方应用、如何平安的应用云账号和资源,对资源管理者带来了挑战。
第四,随着资源规模的减少,如何高效的治理运维晋升效率,为运维人员带来挑战。
第五,云资源管理、运维的入口过多,无奈找到最佳实际。

为了解决云上资源管控和运维的痛点,必须实现标准化、自动化、数据化、流程化。要实现分组分权治理,买通账号权限,放慢实现审批流程化。

在自动化方面,要进一步晋升效率,缩小人肉操作,保障定时告警运维,时刻留神资源的应用状况。

02 利用分组维度资源的治理

利用分组次要波及三个概念。

第一,利用分组的配置。在每个利用下,创立一些不同的分组们能够依据不同的环境或地区,创立不同的利用分组。从而实现多部署环境、多架构的分组。

第二,资源管理。反对在分组资源里,导入须要的资源,导入利用分组场景化、反对弹性扩缩容。

第三,资源运维。当在资源分组时,呈现破绽或平安危险,通过平安和风险管理,触发监控和事件机制。除此之外,还反对 CICD 代码的编译部署能力。

为了解决云资源数量多,品种多,治理难度大,管控入口不好找等问题。阿里云反对三十多种云资源的导入,对云资源进行对立治理。

为了解决泛滥产品割裂的问题,阿里云通过分组治理,把最佳实际放在一起,不便大家疾速应用这些能力。

为了解决资源分权、分账问题,阿里云通过标签能力,把所有的资源关联到一起。用户能够在账号的费用核心,查看你以后资源的费用散布状况,每月账单等。

以钉钉场景为例,把一部分 ECS 挂载到负载平衡上。通过利用分组,抉择钉钉利用,间接创立利用。在创立过程中,所有关联关系以资源站的模式,主动创立。而后,这些资源会主动导入到利用分组,不便用户后续的管控。

接下来,讲一讲 弹性扩缩容。利用治理把弹性伸缩进行集成。每个利用分组能够间接关联一个弹性伸缩组。用户能够依据业务,制订弹性伸缩的规定。零碎会依照伸缩规定,进行扩缩容。

除此之外,弹性伸缩反对主动退出 RDS,主动关联 SLB/ALB,伸缩配置、生命周期挂钩。

03 利用分组维度资源的运维和监控

自动化运维反对分组级别的资源运维,可能关联资源事件和告警,用户能够任意编排运维工作,灵便可扩大。

在实例治理方面,罕用的运维工作有发送近程命令、上传文件、磁盘清理、启动实例、进行实例等。在镜像治理方面,次要反对更新镜像、删除镜像、创立镜像。

在 OOS 运维编排的自定义模板中,自动化运维反对定时开关机、带宽长期降级、定时执行任意模板。自动化运维反对 120 多种云产品阈值告警,40 多种云产品零碎事件告警。

接下来,讲一讲监控和事件。如果把某些资源,导入到利用分组,能够查看所有的监控,比方某分组下 CPU 的利用率,负载平衡指标等等。印象特深,用户还能够装备告警相干的能力,云监控能力等。

除此之外,事件运维集成了五个零碎事件。包含打算内运维事件、非预期运维事件、实例费用事件、实例安全事件,以及实例因底层降级需迁徙事件。

在平安风险管理中,次要包含破绽扫描,基线和云平台的配置检测。其中,破绽扫描会定期主动扫描 Linux 软件破绽,windows 软件破绽,利用破绽,以及应急破绽。

如上图所示,用户在代码构建时,须要绑定云效企业,新建流水线,受权公布 ECS,而后关联流水线,进行代码扫描、构建、部署、测试。最初,公布到 Kubornetes 集群,阿里云容器服务,阿里云 ECS 或自有主机。

本节课帮忙大家,从一个新的角度思考与了解运维及管控。让大家从资源维度,转化到利用分组视角,重新认识运维及管控。

利用分组能够导入所有资源,并对这些资源进行管控和运维。除此之外,利用分组反对弹性伸缩,自动化运维,监控告警,资源管控等能力。

Q&A 环节,用户问答

Q1 有哪些因素会促使一个组织或企业思考引入 DevOps?

答:如果企业资源管控的数量较大, 业务较简单,运维老本较高。能够应用 DevOps 的自动化工具,实现降本增效。

Q2 在 DevOps 中会遇到哪些平安相干的问题?

答:如果跟用户权限相干,能够让不同的权限的用户去执行自动化相干的工作。能够通过标签,赋予不同的权限。

Q3 自动化性能的 API 是否凋谢?

答:是的。包含资源导入,云监控,弹性扩缩容等能力,都是 Open API 的能力。能够间接通过阿里云或者 SDK 调用。

Q4 在业务增长的过程中,可能遇到哪些难以解决的问题?

答:随着业务成长,用户分权分账,能够通过分组或不同的标签,关联不同的角色。随着资源的增长,能够在利用分组或者用户编排控制台,设置一些自动化的工作。通过可视化,监控告警,弹性扩缩容等能力,进步资源的利用率,节约老本。

近期流动预报

高效能 才经济 | 云上自动化运维 CloudOps 系列沙龙_第三弹!行将开启!

资源效力与研发效力是企业经营过程中必须关注的话题,高效能甚至能成为一家企业的外围竞争力。充分利用云的弹性和自服务工具,企业将能大幅度地优化老本、晋升资源与研发效力。因而,阿里云弹性计算云上自动化运维 CloudOps 系列沙龙,将以“效力晋升与老本优化”作为第三弹的主题,分享相干思考与实际。

本次系列沙龙第三弹由三位阿里云弹性计算技术专家们带来,别离是:
🔲  8 月 16 日 19:00     阿里云弹性计算技术专家  高庆瑞 |《如何疾速搭建低成本高弹性的云上利用》

🔲  8 月 17 日 19:00     阿里云弹性计算技术专家  林小平 |《如何实现资源高效运维与云上老本剖析》

🔲  8 月 18 日 19:00     阿里云弹性计算技术专家  樊毅伟 |《云上老本优化实际》

当初扫描文章底部海报中的二维码或点击链接即可进入“CloudOps 系列沙龙”交换群,获取最陈腐的沙龙资讯,还能够第一工夫取得讲师的“干货材料”哦!

沙龙小 Tips:观看直播期间发问,被讲师抽中并答复问题的同学和填写问卷并被抽中的同学,均可取得精美礼品哦!收费邮寄到你手中!

最陈腐的讲师材料,超多的精美礼品等你获取!立即扫码 / 点击链接进群报名吧!

点击这里,理解沙龙流动更多详情。

正文完
 0