云的可扩展性对企业的经营和倒退而言具备两面性,堪称福祸相依。
适度配置和云蔓延是实在存在的。其造成的老本节约甚至会使科技巨头财务管理者都感到诧异。
以 Pinterest 为例,在一个假期期间,因为使用量减少,该公司的云账单远远超出了最后的预计,Pinterest 不得不在价值 1.7 亿美元的预留资源之外向 AWS 领取 2000 万美元。
解决云的长期老本影响的惟一办法是施行云老本优化。而且,如果企业不心愿老本优化成为工程团队的连累,那么实现自动化是惟一能让企业实现目标的动作。
1、理解优化云老本的劣势
优化云老本值得企业花工夫吗?通信、娱乐、SaaS 和电子商务畛域的公司报告的优化收益就是最好的例证:
1)在 2021 年第一季度,Zoom 报告称其毛利率从上一季度的 69.4% 扩充至 73.9%,这次要是因为优化公共云资源的工作产生了良好效果。
2)Spotify 构建了一个名为 Cost Insights 的定制工具来跟踪云费用并激励工程师把握云收入的所有权,从而将其每年的云收入缩小数百万美元。
3)通过对基础设施决策进行一些理智的增量优化,只管流量减少了 25%,但在三个月内,Segment 的毛利率减少了 20%,基础设施老本升高了 30%。
4)电子商务初创公司 La Fourche 理解到其云计算费用急剧回升,便运行了 CAST AI 节俭报告以寻找优化机会。通过启用主动优化,该公司在不减少工程师工作量的状况下将每月的云账单缩小了 69.9%。
通过以上例证可知云优化工作是值得的,那么企业团队抉择了哪些办法来避免其云老本失控?
2、具体理解本人的云账单
大部分企业对于本人的云账单并不非常理解。
账单简短、简单且难以合成,因为每项服务都有一个已定义的计费指标。因而企业难以具体理解本身的应用状况并做出决断。
老本调配能够揭示谁在应用哪些资源,然而在 Kubernetes 上运行的动静基础架构中,老本调配尤其具备挑战性。
依据本人的云账单检查和调配老本而失去的数据,能够帮忙企业更好地预测本身的需要并确保适当数量的资源(并防止适度配置)。
但预计企业将来的资源需要并非易事。
这是能够遵循的示例序列:
1)取得可见性并剖析本人的应用报告,以确定所有的收入模式。
2)借助定期剖析和解决历史应用数据来检测峰值资源应用场景。
3)将季节性客户需要模式思考在内,并查看它们是否与本身的资源应用顶峰相干。如果能理解到这一点,提前辨认它们可能会更容易。
4)确保定期监控资源应用报告,并设置警报以管制云老本。
5)通过掂量特定于应用程序或工作负载的老本来创立应用程序级成本计划。这也将为计算云基础设施的总领有老本提供无力反对。
6)接下来,查看企业的云提供商的定价模型,并随着工夫的推移布局容量需要。将所有数据放在一个中央能够更轻松地理解老本。
下面列出的工作并非一次性实现的工作。企业须要定期执行此操作以取得良好效果。
3、为应用程序抉择最佳计算资源
如果企业的应用程序依赖于计算,那么抉择正确的虚拟机可能会改善老本问题。但 AWS 有近 400 个不同的实例。相似的实例类型在云提供商之间提供不同的性能——即便在同一个云中,更低廉的实例并不等于更高的性能。
1)定义最低要求
确保在所有计算维度上执行此操作,包含 CPU(架构、数量、处理器抉择)、内存、SSD 和网络连接。
2)抉择正确的实例类型
企业能够从各种 CPU、内存、存储和网络容量组合中进行抉择,将其封装在实例类型中,并为这样的性能进行优化。
3)设置实例的大小
实例应该有足够的容量来满足企业本身的工作负载要求,并在必要时包含诸如突发之类的选项。
4)查看不同的定价模型
三大云提供商提供不同的费率:按需(按需付费)、预留容量、Spot 实例和专用主机。这些选项中都有其长处和毛病。
4、应用 Spot 实例节俭更多老本
从 AWS 和其余大型云提供商处购买闲置容量是明智之举,因为 Spot 实例比按需实例便宜 90%。然而,有一个问题:供应商保留随时发出这些资源的权力。企业须要确保其应用程序已为此做好筹备。
以下是应用 Spot 实例的办法:
1)查看工作负载,理解其是否已筹备好用于 Spot 实例
是否接受中断?实现这项工作须要多长时间?这是工作要害型工作负载吗?这些问题有助于确定 Spot 实例的工作负载。
2)查看云提供商的服务
查看不太风行的实例是个不错的抉择,因为它们不太可能被中断并且能够运行更长的工夫。在确定实例之前查看实例的中断频率。
3)出价机会
设置筹备为所选 Spot 实例领取的最高金额。请留神,它只会在市场价格满足您的报价(或更低)时运行。在按需定价程度上设置最高价格是咱们的教训。
4)分组治理 spot 实例
这样,企业将可能一次申请多种实例类型,从而减少取得 Spot 实例的机会。
为了使上述所有工作顺利进行,须要筹备好在配置、设置和保护工作上破费大量工夫(除非决定将其自动化)。
5、不要被储蓄打算的承诺所吸引
以更便宜的价格提前一到三年预留容量仿佛是一个正当的抉择。当企业必然会应用该服务时,为什么不提前购买容量呢?
咱们曾经理解到预测云老本很艰难。即便是领有整个团队致力于云老本优化的公司也难以做到这一点。
当企业不理解其团队在一到三年内须要多少容量时,企业如何提前打算容量?这是预留实例和储蓄打算等产品的次要问题。
对于预留容量,企业应该理解以下几点:
- 保留实例的工作形式是“应用它或失去它”——它闲暇的每一个小时对企业的团队而言都是一个小时的损失(包含可能取得的任何经济利益)。
- 当您承诺特定资源或消费水平时,假如需要在整个合同期限内不会扭转。但即便是一年的承诺在云中也是永恒的。一旦需要超过预期,企业将不得不付出代价。
- 当遇到新问题时,企业团队将会被迫投入更多资源。或者,您会发现自己曾经领取了未充分利用的容量。在这两种状况下,企业都是失败者。
- 通过与云服务提供商签订此类合同,还可能会面临供应商锁定的危险——即在将来一到三年内依赖该提供商并介绍他们提出的任何变动。
- 为预留抉择最佳资源很简单。
6、为工作抉择适合的工具
为了管制云老本,企业采纳了多种老本治理、优化策略和解决方案:
1)老本可见性和调配——应用各种老本调配、监控和报告工具,企业能够找出费用的起源。实时老本监控用途很大,因为它会在超过设定的阈值时做出揭示。例如在 Azure 上运行的计算操作导致 Adobe 的一个团队意外收取超过 50 万美元的云费用。然而一个警报就能够避免这种状况产生。
2)老本估算和预测——如果企业解决了足够的历史数据并对将来的需要有一个清晰的意识,那么就能够预计其团队须要多少资源并打算估算。
3)遗留老本优化解决方案——企业能够在此处联合前两点中取得的所有信息,以创立云收入的残缺图景并发现潜在的改良对象。市场上的许多解决方案都能够提供帮忙,例如 Cloudability 或 VMware 的 CloudHeath。但大多数时候,他们给出的只是工程师手动施行的动态倡议。
4)自动化的云原生老本优化——这是升高企业云老本的最弱小的解决方案。这种类型的优化不须要团队进行任何额定的工作,并且能够全天候节俭 50% 甚至更多,即便企业曾经在手动优化方面做得很好。一个齐全自主和自动化的解决方案,能够疾速地对资源需要或定价的变动作出反应,这是最佳办法。
7、云自动化为最大水平的节俭提供帮忙
从以上几点能够看出,人工成本优化是一个简单且耗时的过程。
而且无论工程师的技能程度如何,许多老本优化工作都不适宜人工实现。
调配、了解、剖析和预测云费用是十分困难的。企业须要进行基础架构调整、考察定价打算、启动更多实例并执行各种其余工作以创立具备老本效益的基础架构。
自动化能够使企业免去以下许多工作:
除了解脱上述所有工作之外,自动化解决方案还减少了更多价值,因为它:
- 抉择最具老本效益的实例类型和大小以满足应用程序的需要。
- 主动向上和向下扩大云资源,以应答需要的顶峰和降落。
- 删除未应用的资源以打消节约。
- 利用现场实例并优雅地治理中断。
- 自动化存储和备份、安全性和合规性治理以及配置和设置更改,以帮忙企业在其余畛域节俭资金。
最重要的是,自动化平台实时施行所有这些批改,把握云老本优化的工夫点个性。
咱们联合应用 AWS On-Demand 和 Spot 实例来运行在 8 个 CPU 和 16 GB RAM 上运行的应用程序。
而后咱们决定通过 CAST AI 运行它来查看咱们的配置是否优化。该平台倡议挪动到 Spot 实例 INF1。然而,这不是一个低廉的、ML 专用的 GPU 实例吗?
事实证明,过后那个实例实际上比咱们应用的通用计算实例便宜。如果没有自动化,咱们就会失去这个暗藏的宝藏。
通过本文的 Zoom、Spotify 或 La Fourche 等示例能够理解到,升高云老本会对企业的利润产生重大影响。
云老本优化是企业唾手可得的成绩。然而诸如费用监控和报告之类的规范策略只会让企业以微小的工程师工夫老本实现一半的成果。