关于云平台:效率提升物理机管理使用场景和实践

49次阅读

共计 4952 个字符,预计需要花费 13 分钟才能阅读完成。

本文将分享物理机治理应用场景和实际,别离是物理机相干背景、平台物理机治理架构的介绍,并结合实际场景,进行装机实际,演示物理机性能。

背景介绍

能够把物理机设想成机房的服务器,物理机都有较好的硬件配置,例如内存会达到上百 G,还会应用英特尔至强系列等性能较好的 CPU,另外在磁盘方面,物理机上都有独自的 RAID 控制器。

RAID 控制器上能够挂多块 HDD 机械硬盘或者 SSD 固态硬盘。

服务器上个别会有多块万兆网卡,能够把它们组成逻辑 Bonding,可能实现网络的高可用。

比拟要害的一点是,咱们对物理机的要求是物理机要具备带外控制系统。

带外控制系统个别是指服务器主板上会有独自的 BMC 控制器,BMC 控制器上能够反对 IPMI 和 Redfish API 等近程控制协议。

这种协定的益处是如果物理机上装的操作系统解体,然而依然能够通过 BMC 控制器近程管制机器的开关机。

通过 BMC 能够近程管制物理机的疏导,例如从磁盘启动或网络启动,也能够近程管制开关机,甚至能够近程挂载 ISO 并进行装机。

所以说 BMC 对于物理机而言是十分重要的带外控制系统。

传统形式下物理机治理的痛点

当物理机的规模变大时,就会存在交付效率变低的问题,企业洽购物理机数量较多,若有几十台物理机,须要将其放到机房中,把机器上架,同时记录每台物理机的硬件信息。并且人工装置操作系统,在操作系统上部署业务并交付。

这些反复操作如果手工去做,不仅工夫会线性增长,而且其过程非常干燥,效率低下,这个过程是能够自动化的。

另外,给物理机装置操作系统时,配置也比拟繁琐,一般来说,物理机须要去管理网络调配,在装置操作系统之前还要给磁盘做 RAID 分区,相对而言比较复杂。

每个物理机都有不同型号,例如戴尔和惠普的服务器的控制器都不同,这也须要大家区别对待,如果进行人工操作做完并交付给业务部门,当业务部门不再应用物理机,还要进行回收,又要波及到物理机上的零碎打消,前期又要重装系统再行交付,这些机械化劳动会导致企业效率低下。

云平台提供的治理性能

云联壹云平台能够提供多种物理机治理性能,首先,平台能够自动记录物理机的硬件信息,物理机注册到平台之后,平台会主动探测物理机的内存、cpu 型号、硬盘、网卡等信息。

另外,平台可能主动给物理机装置操作系统。其中包含配置网络,调配 IP,给网卡配置 Bonding。

对于磁盘配置这一项,平台反对很多 RAID 配置。例如 RAID01、RAID5、RAID10 等。另外适配的 RAID 控制器也绝对较多,惯例服务器的 RAID 卡都会反对,还波及到磁盘的分区,另外就是装置操作系统。

平台反对物理机的生命周期治理,如近程进行开关机等操作,同时调整配置的操作,如增加内存也能够通过平台进行同步。

云平台物理机治理劣势

首先,平台提供装机性能,装机能够自动化实现,规模较大时可能晋升效率,同时缩短交付工夫。

并且一个平台治理大规模的物理机也比拟不便。

以交付 100 台物理机为例,如果应用传统形式,人工操作或者自动化水平较低,应用 kickstart 无人值守装机,所需工夫也要一天以上。交付工夫须要以天为单位进行计算,而平台能够并行装机,只需 30 分钟即可实现,交付工夫大大缩短。

在配置硬件方面,传统形式须要手动配置 RAID、分区、网卡 bonding,操作简单。平台能够提供 API 自动化配置。

物理机大规模过后,须要对机器的机房、机架地位、硬件配置等硬件信息进行保护,传统记录形式是应用 excel 或第三方零碎。用户将相干信息注册存储到平台后,咱们提供方便灵便的 API 查问这些信息。

物理机治理架构

  • 服务架构

Region API 控制器提供 API,前端命令行外面发到装机、查问物理机操作的一些记录会先走 API 控制器,Region API 和后端 Baremetal Agent 服务间接通信,Baremetal Agent 服务间接治理物理机,和物理机通信。

其治理物理机的形式是近程管制,近程管制会应用 SSH 协定,带外管制(IPMI/Redfish)等协定进行管制。

云联壹云平台提供物理机装机的性能,装机的镜像是从 Glance 的服务中下载的,这个镜像是物理机和虚拟机共用,该镜像能够给虚拟机用或物理机应用,比拟对立,不须要独自给物理机做额定镜像。

物理机网络结构

Baremetal Agent 后端服务治理物理机的治理协定是 SSH 或 IPMI/Redfish。

理论环境中,物理机上有多张网卡,每张网卡的用处都不雷同,例如银行客户的物理机上会把网卡分成三个性能应用,会独自用一张网卡作为业务口,业务口间接连贯业务网,其上的利用流量通过业务口进来。

业务网不须要和 Baremetal Agent 通信,但须要物理机的治理口和带外治理口与 Baremetal Agent 通信。

顾名思义,治理口是治理用的用处,例如要 SSH 上物理机,就是治理口,带外治理是独自 BMC 控制器本人所具备的带外治理口。会走 IPMI/Redfish 带外治理的流量。这是比拟全面的物理机网络布局。实际上,在绝对简略不做辨别的状况下,走一个网卡进来也能够。

网络环境治理拓扑

物理机会分治理口(ethx)网卡的网口,以及带外治理口(IPMI),物理机会连贯到交换机上,物理机子网中,咱们给治理口的子网是 192.168.2.0/24 的网段。

带外治理口是 192.168.20.0/24 的网段,是不同子网,接到交换机上,交换机再接路由器。

路由器会和 Baremetal Agent 服务做通信,路由器这边也是另外一个子网,例如 Baremetal Agent 是 192.168.1.10,它在 192.168.1.0/24 的这个网段中。

它们要如何通信呢?这就须要在物理机上把路由器配好。

Baremetal Agent 能够治理物理机的 IP 调配。治理 IP 调配通过 DHCP 协定,DHCP 协定无奈跨三层网络进行通信,所以须要在路由器上配 dhcp_relay,要把治理口的子网和带外治理口的子网都 relay 到 Baremetal Agent 监听的 IP 上,Baremetal Agent 中内置了 DHCP 和 TFTP 的服务,可能帮忙物理机调配 IP。

注册场景介绍

平台治理物理机的第一步就是把物理机的信息收集到平台,这个步骤称为注册。

注册形式分为三种,第一种是 ISO 疏导注册,若物理机中曾经配好 IPMI 带外信息、IPMI 的 IP、用户名、明码等。然而网络环境中没有配 DHCP Relay,想要动态调配 IP。平台也反对不走 DHCP 协定,网络调配形式就是动态的,咱们要做启动疏导,进入疏导零碎将物理机硬件信息采集到平台。

进入平台的小零碎,如果是 ISO 疏导注册,就会下发一个 ISO 到物理机。

ISO 必须依赖 Redfish API,传统的 IPMI 协定,不反对挂载 ISO,Redfish API 在较新的服务器上带外都反对,而较旧的服务器可能不反对 Redfish API。

如果不能应用 ISO 疏导注册,则只能用以下两种注册形式,第二种注册形式是 PXE 疏导注册,前提是物理机曾经配好 IPMI 信息。

该疏导形式是通过 PXE,PXE 协定依赖 DHCP 协定,所以须要在网络环境中将 DHCP Relay 配好,它的网络调配形式是用 Baremetal Agent 去 DHCP 动静给机器去调配 IP,不依赖 Redfish,应用 IPMI 的信息即可。

第三种形式是预注册,预注册这种场景是若物理机刚出厂,不配 IPMI 信息,间接进行 PXE 疏导。

PXE 疏导会发 DHCP 播送,只有交换机或路由器上配好 DHCP Relay,并且 Relay 到 Baremetal Agent 服务,平台即可感知到并发送来自 DHCP Relay 的 PXE 申请,而后就会进行响应。之后动态分配 IP,这就是预注册,预注册须要提前将物理机网卡的 MAC 地址填上。

1、ISO 疏导注册须要填写的参数

首先须要将物理机名称,IPMI 的连贯信息记录到平台。

另外就是填写治理口 IP,因为 ISO 疏导注册不依赖 DHCP 动态分配 IP,所以须要手动写一个动态 IP,当物理机配置网络时会应用动态 IP 设置。

2、PXE 疏导注册

PXE 疏导注册必须填写名称和 IPMI 信息。然而治理口 IP 能够选填,若固定,平台就会以固定的进行调配,若不填写,就会走 DHCP,Relay 后动态分配 IP。

3、预注册

必须要填 MAC 地址、名称,IPMI 的信息在填上之后,平台就会依据填写的 IPMI 信息设置机器上的 BMC。

如果不填写,零碎会用默认的连贯信息进行设置,这就是预注册。

如果洽购机器之后不想人工配置 IPMI 信息,能够间接应用预注册。

只须要将网络环境中的 DHCP Relay 配好,残余工作能够间接交给平台实现。

如果有一批机器曾经配置好,则须要应用前两种疏导注册。

4、主动注册

另外一种比拟弱小的性能是主动注册,预注册须要填写 MAC 地址,如果开启主动注册,则 MAC 地址不必填写。

只有关上过主动注册的性能,物理机开始发 PXE 申请,平台就会承受所有来自 DHCP Relay 的 PXE 的申请。

平台会主动将其变成平台的物理机,主动做 PXE 疏导,采集物理机的硬件信息。

这种场景实用于自动化、大规模的场景,比后面几种形式缩小人为干涉的动作,然而对网络要求较高,须要提前将子网的 Relay 设置好。

而且子网中不能有本人的 DHCP 服务,依赖平台做 DHCP 调配。开启办法须要后端用命令行做配置,而后将 auto_register_baremetal:ture 选项关上。

注册实现的物理机

注册实现的物理机会在平台的物理机列表中展现:

注册实现过后,能够将治理口和带外口的 IP 调配进来,包含物理机的规格、品牌、治理口网卡的 MAC 等。

关上机器详情,还能看到更加具体的 CPU 型号、内存、磁盘大小、每块磁盘 RAID 驱动、型号、插槽序号、硬盘类型、网卡信息、品牌信息等。

装机实际

上面通过预注册的形式对装机过程进行演示。

首先在云平台中增加物理机信息,抉择预注册,填写治理口的 MAC 地址,并填写名称。

点击确定按钮提交过后就会在物理机列表中呈现记录,状态为初始化状态。

此时还在期待物理机注册进来,所以须要到物理机上设置做 PXE 启动,能够应用 IPMITOOL 的命令行工具近程设置物理机做 PXE 启动。

若曾经配好 IPMI,能够关上服务器的虚构终端,设置下一次疏导为 PXE,再使机器启动。

在网络曾经配置好的前提下,当物理机启动时,DHCP 的 PXE 申请会被 Baremetal Agent 搜到。

Baremetal Agent 会响应 PXE 申请,并给物理机下发 PXE 疏导零碎。

此图即为物理机从 Baremetal Agent 下载 PXE 疏导固件的截图。

只有下载好此固件,即便物理机磁盘中没有装零碎,也能够间接从疏导系统启动,此零碎间接在内存当中运行。

物理机 PXE 进入疏导零碎

物理机的 PXE 固件下载胜利过后,就会进入疏导零碎,能够看到登录界面。

进入到疏导零碎过后,平台上物理机的状态即可变更为筹备中,会帮物理机做 IP 配置,采集硬件信息。

当状态变更为筹备中时,便会设置好 IP 信息。

注册实现后,物理机状态会变更为运行中,同时会把规格、品牌、序列号等信息进行采集并记录。

至此,物理机便曾经退出云平台的物理机治理资源池中,能够对其进行装机等其余自动化操作。

装置操作系统

点击界面中装置操作系统的按钮,即可进入物理机装机界面,首先须要抉择物理机应用的镜像,第二步须要给物理机做 RAID 配置。

之前曾经通过注册的形式将所有磁盘信息和 RAID 卡信息收集实现,所以这里有配置 RAID 的界面。

新建分区

须要明确给 RAID 做的逻辑盘中做哪些分区,一块盘中能够做 n 个分区,每个分区都有不同的挂载点,文件系统和大小。

分区后果

以下为分区和 RAID 做完之后的总览:

配置网络

从云平台中抉择物理机所在的网络。其中一个性能能够启用 Bonding,当物理机中有两块以上网卡,如果都插到网线,同时又在同一个交换机下或者物理下面与网络相通,能够依据本人的抉择做 Bongding。

开始装机

1、裸金属记录

平台会用称为裸金属的资源做记录,裸金属的状态会变更为部署中。

当装机实现过后即可看到裸金属的状态变成运行中,此时物理机装机过程曾经实现,能够登录后进行业务部署等操作。

2、获取登陆信息

登录过后能够拿到 IP 以及近程登录的用户名和明码。之后即可到命令行中登录物理机。

3、SSH 登陆裸金属

以上即是装机过程展现。

正文完
 0