关于阿里云:热门实践丨如何结合实际业务进行-ECS-规格选型与容量验证

25次阅读

共计 6007 个字符,预计需要花费 16 分钟才能阅读完成。

作者:赵佳佳

随着云原生技术的蓬勃发展以及云产品价格愈发低廉,越来越多 Geek 开发者、技术爱好者抉择 OSS 对象存储、ECS 云服务器等根底产品构建本人的网站、网盘等利用。但对于企业而言,面对品种与规格的丰盛的 ECS 云服务器,如何理解实例规格的要害特点,在库存有余、产品下线、应用抢占式实例等场景中,保障业务的稳固运行成为要害。

那么接下来,咱们一起理解 ECS 云服务器如何选型并通过 PTS 进行容量布局,接下来咱们将介绍三种不同的 ECS 选型形式。

01 联合实例规格参数进行选型

启动 ECS 实例前,咱们会联合性能、价格、工作负载等因素进行配置抉择。依据不同配置参数,ECS 提供蕴含多种不同实例规格的实例规格族。在理论应用过程中,咱们可通过以下两种形式找到参数最合适的实例规格。

  • 实例规格族 [ 1]:查阅文档理解实例规格族的产品详情。
  • DescribeInstanceTypes [ 2]:调用 ECS API 接口,获取最新的性能规格参数。

针对这种形式,咱们须要理解实例规格的命名形式,以便咱们可能疾速理解并找到所需的实例规格。实例规格族名称格局为 ecs.< 规格族 >,实例规格名称为 ecs.< 规格族 >.large。具体命名规定阐明如下所示:

  • ecs:云服务器 ECS 产品代号。
  • < 规格族 >:由规格族主体 + 规格族后缀组成。
  • x86 计算规格族和 ARM 计算规格族
  • 异构计算规格族、弹性裸金属服务器、超级计算集群(SCC)实例规格族 异构计算规格族、弹性裸金属服务器和超级计算集群(SCC)实例规格族个别采纳自主命名形式,由小写字母和数字混合组成。
  • large large 示意 vCPU 核数,中的 n 越大,示意 vCPU 核数越多。其中,xlarge 代表 4 核,2xlarge 代表 8 核,3xlarge 代表 12 核等等,以此类推。

02 依据自建服务与利用进行选型

当企业抉择服务上云的过程中,在采买各种云产品的同时,也会进行各种服务或利用自建,以便满足理论的业务需要。为了不便选型,咱们总结列举了常见自建服务与利用对应的 ECS 实例规格,能够依据企业所应用的利用,并参考选型准则,抉择对应的实例规格族。

03 依据利用场景进行选型

除了依据间接参数以及自建利用与服务两种形式之外。在理论生产过程中,咱们会发现很多业务场景不只是单一个服务或者利用就能满足的。同时,相干业务场景的附加要求也会绝对简单。

通用利用、游戏服务、视频直播场景

在通用场景中,性能需求体现为 CPU 计算密集型,须要绝对平衡的处理器与内存资源配比,通常选用 CPU 与内存配比 1 : 2、系统盘选用高效云盘、数据盘选用 SSD 云盘或者 ESSD 云盘。如果业务须要更强的网络性能,如视频弹幕等,可选用同系列中更高规格的实例规格,进步网络收发包能力(PPS)。

Hadoop、Spark、Kafka 大数据场景

在 Hadoop、Spark、Kafka 大数据等场景中,因为波及不同节点,性能需求体现较为简单,须要平衡各个节点的性能体现,包含计算、存储吞吐、网络性能等。其中,治理节点、计算节点可当作通用场景解决。依据集群规模不同,须要抉择不同实例规格。如 100 个节点以下可选用 ecs.g6e.4xlage,100 个节点以上可选用 ecs.g6e.8xlage。同时,数据节点须要高存储吞吐、高网络吞吐、平衡的处理器与内存配比,可应用大数据型 d 系列规格族。如 MapReduce/Hive 可抉择 ecs.d2s.5xlarge,Spark/Mlib 可抉择 ecs.d2s.10xlarge。

数据库、缓存、搜寻场景

在该类场景中,实例规格的处理器与内存配比个别要求高于 1 : 4,局部软件对存储 I/O 读写能力及时延性能较为敏感,可选用单位内存性价比较高的规格族。

以数据库为例,在传统形式中业务零碎间接对接 OLTP 数据库,数据冗余大多通过 RAID 磁盘阵列实现。抉择云服务器 ECS,轻载、重载数据库都能实现灵便部署。

  • 轻载数据库:采纳企业级实例规格搭配云盘应用,性价比更高。
  • 重载数据库:须要高存储 IOPS 和低读写延时,举荐应用本地 SSD 型 i 系列实例规格族(搭配了高 I/O 型本地 NVMeSSD 本地盘),满足大型重载数据库要求。

深度学习、图像处理场景

在深度学习、图像处理等场景中,利用须要高性能 GPU 加速器,在 GPU 和 CPU 配比方面有如下倡议。

  • 深度学习训练:GPU 与 CPU 比例举荐为 1 : 8 到 1 : 12 之间。
  • 通用深度学习:GPU 与 CP U 比例举荐为 1 : 4 到 1 : 48 之间。
  • 图像识别推理:GPU 与 CPU 比例举荐为 1 : 4 到 1 : 12 之间。
  • 语音辨认与合成推理:GPU 与 CPU 比例举荐为 1 : 16 到 1 : 48 之间。

在以上场景之外,咱们针对异构计算、通用计算总结了常见场景以及对应的规格实例,以便大家抉择。

04 规格验证与容量布局

当实现选型并开始应用 ECS 云服务器实例后,对于理论业务而言这仅仅是开始。在理论业务中,在资源未成为瓶颈时,并发量、TPS、CPU 趋势呈线性关系,当资源利用饱和时,随业务并发量增长,TPS 趋势放弃安稳状态,CPU 开始飙升。当资源利用饱和且并发量冲破极限容量点时,TPS 趋势及 CPU 都呈现稳定,甚至容量开始雪崩,此时服务开始呈现不可用景象。

因而,在抉择适合的规格之后,服务稳定性、资源利用率、业务吞吐量成为新的考量与关注重点。不同团队角色关注重点不尽相同:

  • 业务团队应关注:重要业务流动期间,容量是否能够安稳撑持业务量;
  • 研发团队应关注:手动扩容、主动扩容、公布 / 回滚不被资源限度;
  • 运维团队应关注:资源使用率、部门资源水位、资源用量及老本。

但传统基于人工教训的资源规格配置模式存在局限性,为了保障线上业务的稳定性,通常会预留相当数量的资源与量来应答负载稳定,造成大量资源节约。

因而,须要借助压测工具性能测试 PTS [ 3] 验证 ECS 云服务器的规格抉择是否正确,依据理论业务需要,通过容量剖析、全链路追踪等形式探测云上零碎的最佳平安容量点、极限容量点和毁坏容量点并进行限流降级爱护,达到零碎容量和云上资源老本的最佳平衡点。

常见业务场景压测策略

在模仿类生产环境或引流生产环境运行的业务压力和利用场景组合的过程中,咱们会抉择如渐变、并发、负载、稳定性、极限等不同的压测策略,去评估零碎各项指标是否满足业务量、可用性、稳定性等要求。这里,咱们总结了常见的业务场景、与之对应的压测策略以及策略长处。

最佳实际:基于性能测试 PTS 创立一个压测工作

在演示最佳实际的同时,咱们提供了基于阿里云收费试用的 ECS + PTS 的场景体验,咱们在浏览的同时进行体验。

URL:https://developer.aliyun.com/adc/scenario/f37fb4d355684e189b7…

(一)试验开始前筹备

  • 如果您的阿里云主账号合乎开明收费试用的资格,建议您开明收费试用性能测试 PTS、ECS 云服务器,性能测试 PTS 提供首月 5000VUM 收费压测资源,超出局部将按后付费专家版计费,具体计费详情,请参见性能测试 PTS 计费规定 [ 4]
  • 如果您的阿里云账号只能支付局部收费试用产品,请您支付合乎收费试用资格的产品,而后进入试验,不满足收费试用资格的产品将会应用个人账户资源进行创立,并会产生肯定的费用,请您及时关注账户扣费。为了防止资源节约并造成账号扣费的状况,请严格依照本文提供的参数进行配置。在试验实现之后,请您及时删除或禁用压测工作。
  1. 在试验开始前,请您抉择 开明收费试用
  1. 开明性能测试 PTS 收费试用:在实验室页面下方,抉择 性能测试 PTS,单击 立刻试用 。在 性能测试 PTS 面板 ,选中 服务协定 ,而后单击 立刻试用。此时零碎会跳转至提交胜利页面,示意试用申请胜利,即可收费试用性能测试 PTS 服务。

阐明:性能测试 PTS 专家版开明过程不会产生任何费用,在理论过程中性能测试(按量付费)提供 5000VUM+ 收费压测额度,超出局部将按后付费专家版计费,具体计费详情,请参见性能测试 PTS 计费规定。

  1. 开明云服务器 ECS 收费试用:在实验室页面下方,抉择 云服务器 ECS,单击 立刻试用 。在 云服务器 ECS 面板,依据如下阐明实现参数配置,选中 协定 ,单击 立刻试用,如弹出新的页面,您可先疏忽。本试用教程以下列的配置信息为例,实际操作时,倡议依据您的理论业务体量和需要抉择。
  1. 返回 ECS 控制台 [ 5],在左侧导航栏,抉择 实例与镜像 > 实例 。在顶部菜单栏左上角处,抉择和试用实例雷同的地区(本教程示例华东 1(杭州))。设置该实例登录明码。找到您创立的试用实例,在其右侧 操作 列单击 > 实例属性 > 重置实例明码 ,依照界面提醒设置 ECS 实例的登录明码。单击试用实例的 ID,抉择 平安组 页签,单击平安组 操作 列的 配置规定,在入方向增加须要放行的端口。本教程中,在平安组入方向放行 80、443、22、3389、8080 端口。

阐明:实例创立实现大概 3~5 分钟后,才反对重置实例明码,如不可重置请急躁期待后重试。

(二)一键配置并部署 ECS 利用

筹备好资源后,能够通过一键配置疾速实现资源配置或利用搭建。一键配置基于阿里云资源编排服务 ROS 实现,旨在帮忙开发者通过 IaC 形式体验资源的自动化配置。模板实现的内容包含:

  • 为 ECS 实例创立平安组。
  • 部署 LAMP 环境。
  • 基于 LAMP 环境应用 PbootCMS 源码搭建网站。
  1. 关上一键配置模板链接 [ 6] 返回 ROS 控制台,零碎主动关上应用新资源创立资源栈的面板,并在模板内容区域展现 YAML 文件的详细信息。
  2. 抉择模板 页面,ROS 控制台默认处于您上一次拜访控制台时的地区,在本试验中地区应该处于华北 2(北京),放弃页面所有选项不变,单击 下一步 进入 配置模板参数 页面。
  1. 配置模板参数 页面,批改资源栈名称,抉择您申请收费试用时创立的 ECS 实例,并通过设置 MySQL 数据库明码来批改数据库 root 用户的默认明码。填写完所有必选信息并确认后单击 创立 开始一键配置。

阐明:

  • 装置 Apache、MySQL 和 PHP 须要通过互联网下载利用,配置工夫可能因为网络稳定性等起因而不同。期待期间,您能够通过刷新资源栈信息页面来查看配置是否实现或通过单击事件页签查看配置具体停顿。
  • 如果在同一台 ECS 实例上反复执行本教程的一键配置模板,请确保 MySQL 数据库明码和第一次执行模板时设置的明码完全一致。否则一键配置后果不可用。
  1. 资源栈信息 页面,请您急躁期待大略 8~10 分钟,状态显示为 创立胜利 时示意一键配置实现。
  1. 资源栈信息 页面,单击 输入
  1. 在输入页签,单击的 WebUrl 的值(http:///admin.php).
  1. 呈现 PbootCMS 登录页面示意一键配置胜利。您能够在 PbootCMS 中依据公司的需要自定义网站的内容,包含全局配置、根底内容、文章内容、扩大内容、会员中心等。本步骤的后续控制台操作为可选操作,可跳过。

(三)开明性能测试 PTS 并创立场景进行压测及查看报告

  1. 返回性能测试 PTS 控制台 [ 7]
  2. 在左侧导航栏中,抉择 性能测试 > 创立场景
  1. 创立场景 页面,单击 PTS 压测
  1. 创立 PTS 场景 页面,设置 场景名 ,而后在 场景配置 页签,输出 压测 API 名称 ,例如 demo,单击右侧图标。在 压测 URL区域中输出 http://:80。

阐明:ECS 公网 IP 地址可在云服务器治理控制台 [ 8] 的实例页面查看。

  1. 施压配置 页签,配置相干压测参数,递增模式 抉择 主动递增 最大并发 输出 50,递增百分比 输出 10,单量级继续时长 输出 1,压测总时长 输出 5。确认参数后,单击 保留去压测

阐明:请严格依照指引配置参数进行配置,防止因超出收费试用额度而造成意外出费。

  1. 舒适提醒对话框 中,确认工作预估的预估耗费,未超过收费额度。确认后单击 确定 启动压测
  1. 请您急躁期待大概 3 分钟,您即可在压测中页面查看以后利用实时的压测数据。在 压测中 页面,您能够看到成功率、RT 和 TPS 等概览数据。

  1. 在压测实现之后,会主动跳转到 编辑场景 页面,而后单击 压测报告
  1. 压测报告 页签,找到您的压测报告,单击右侧 操作 列下的 查看。在压测报告理解具体的压测报告内容。

容量布局与性能瓶颈剖析

在拿到测试后果数据之后须要对系统中存在的瓶颈点进行剖析为调优做筹备,零碎的性能瓶颈点次要散布在平安防护、负载平衡、后端利用、中间件、数据库、操作系统、硬件规格等方面,具体瓶颈点和调优细节,敬请期待《容量布局与调优》系列文章。

相干链接:

[1] 实例规格族

https://help.aliyun.com/document_detail/25378.htm#concept-sx4…

[2] DescribeInstanceTypes

https://help.aliyun.com/document_detail/25620.htm#doc-api-Ecs…

[3] 性能测试 PTS

https://www.aliyun.com/product/pts

[4] 性能测试 PTS 计费规定

https://help.aliyun.com/document_detail/433167.html?spm=a2c4g…

[5] ECS 控制台

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fecs.console.aliyun.com%2F

[6] 一键配置模板链接

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fros.console.aliyun.com%2Fregion%2Fstacks%2Fcreate%3Fspm%3Da2c4g.611918.0.0.3aec628amGQK9n%26templateUrl%3Dhttps%3A%2F%2Fstatic-aliyun-doc.oss-cn-hangzhou.aliyuncs.com%2Ffile-manage-files%2Fzh-CN%2F20230320%2Fonyv%2F%25E5%25BF%25AB%25E9%2580%259F%25E6%2590%25AD%25E5%25BB%25BA%25E7%25BD%2591%25E7%25AB%2599.yml&lang=zh

[7] 性能测试 PTS 控制台

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fpts.console.aliyun.com%2F&lang=zh

[8] 云服务器治理控制台

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fecs.console.aliyun.com%2Fserver%2Fregion%2Fcn-beijing

点击此处,立刻进行 ECS 规格选型与容量验证

正文完
 0