本文将分享物理机治理应用场景和实际,别离是物理机相干背景、平台物理机治理架构的介绍,并结合实际场景,进行装机实际,演示物理机性能。
背景介绍
能够把物理机设想成机房的服务器,物理机都有较好的硬件配置,例如内存会达到上百G,还会应用英特尔至强系列等性能较好的CPU, 另外在磁盘方面,物理机上都有独自的RAID控制器。
RAID控制器上能够挂多块HDD机械硬盘或者SSD固态硬盘。
服务器上个别会有多块万兆网卡,能够把它们组成逻辑Bonding,可能实现网络的高可用。
比拟要害的一点是,咱们对物理机的要求是物理机要具备带外控制系统。
带外控制系统个别是指服务器主板上会有独自的BMC控制器,BMC控制器上能够反对IPMI和Redfish API等近程控制协议。
这种协定的益处是如果物理机上装的操作系统解体,然而依然能够通过BMC控制器近程管制机器的开关机。
通过BMC 能够近程管制物理机的疏导,例如从磁盘启动或网络启动,也能够近程管制开关机,甚至能够近程挂载ISO并进行装机。
所以说BMC对于物理机而言是十分重要的带外控制系统。
传统形式下物理机治理的痛点
当物理机的规模变大时,就会存在交付效率变低的问题,企业洽购物理机数量较多,若有几十台物理机,须要将其放到机房中,把机器上架,同时记录每台物理机的硬件信息。并且人工装置操作系统,在操作系统上部署业务并交付。
这些反复操作如果手工去做,不仅工夫会线性增长,而且其过程非常干燥,效率低下,这个过程是能够自动化的。
另外,给物理机装置操作系统时,配置也比拟繁琐, 一般来说,物理机须要去管理网络调配,在装置操作系统之前还要给磁盘做RAID分区,相对而言比较复杂。
每个物理机都有不同型号,例如戴尔和惠普的服务器的控制器都不同,这也须要大家区别对待,如果进行人工操作做完并交付给业务部门,当业务部门不再应用物理机,还要进行回收,又要波及到物理机上的零碎打消,前期又要重装系统再行交付,这些机械化劳动会导致企业效率低下。
云平台提供的治理性能
云联壹云平台能够提供多种物理机治理性能,首先,平台能够自动记录物理机的硬件信息,物理机注册到平台之后,平台会主动探测物理机的内存、cpu型号、硬盘、网卡等信息。
另外,平台可能主动给物理机装置操作系统。其中包含配置网络,调配IP,给网卡配置Bonding。
对于磁盘配置这一项,平台反对很多 RAID配置。例如RAID01、RAID5、RAID10等。另外适配的RAID控制器也绝对较多,惯例服务器的RAID卡都会反对,还波及到磁盘的分区,另外就是装置操作系统。
平台反对物理机的生命周期治理,如近程进行开关机等操作,同时调整配置的操作,如增加内存也能够通过平台进行同步。
云平台物理机治理劣势
首先,平台提供装机性能,装机能够自动化实现,规模较大时可能晋升效率,同时缩短交付工夫。
并且一个平台治理大规模的物理机也比拟不便。
以交付100台物理机为例,如果应用传统形式,人工操作或者自动化水平较低,应用kickstart无人值守装机,所需工夫也要一天以上。交付工夫须要以天为单位进行计算, 而平台能够并行装机,只需30分钟即可实现,交付工夫大大缩短。
在配置硬件方面,传统形式须要手动配置RAID、分区、网卡bonding,操作简单。平台能够提供API自动化配置。
物理机大规模过后,须要对机器的机房、机架地位、硬件配置等硬件信息进行保护,传统记录形式是应用excel或第三方零碎。用户将相干信息注册存储到平台后,咱们提供方便灵便的API查问这些信息。
物理机治理架构
- 服务架构
Region API控制器提供API,前端命令行外面发到装机、查问物理机操作的一些记录会先走API控制器,Region API和后端Baremetal Agent服务间接通信,Baremetal Agent服务间接治理物理机,和物理机通信。
其治理物理机的形式是近程管制,近程管制会应用SSH协定,带外管制(IPMI/Redfish)等协定进行管制。
云联壹云平台提供物理机装机的性能,装机的镜像是从Glance的服务中下载的,这个镜像是物理机和虚拟机共用,该镜像能够给虚拟机用或物理机应用,比拟对立,不须要独自给物理机做额定镜像。
物理机网络结构
Baremetal Agent后端服务治理物理机的治理协定是SSH或IPMI/Redfish。
理论环境中,物理机上有多张网卡,每张网卡的用处都不雷同,例如银行客户的物理机上会把网卡分成三个性能应用,会独自用一张网卡作为业务口,业务口间接连贯业务网,其上的利用流量通过业务口进来。
业务网不须要和Baremetal Agent通信,但须要物理机的治理口和带外治理口与Baremetal Agent通信。
顾名思义,治理口是治理用的用处,例如要SSH上物理机,就是治理口,带外治理是独自BMC控制器本人所具备的带外治理口。会走IPMI/Redfish带外治理的流量。这是比拟全面的物理机网络布局。实际上,在绝对简略不做辨别的状况下,走一个网卡进来也能够。
网络环境治理拓扑
物理机会分治理口(ethx)网卡的网口,以及带外治理口(IPMI),物理机会连贯到交换机上,物理机子网中,咱们给治理口的子网是192.168.2.0/24的网段。
带外治理口是192.168.20.0/24的网段,是不同子网,接到交换机上,交换机再接路由器。
路由器会和Baremetal Agent服务做通信,路由器这边也是另外一个子网,例如Baremetal Agent是192.168.1.10,它在192.168.1.0/24的这个网段中。
它们要如何通信呢?这就须要在物理机上把路由器配好。
Baremetal Agent能够治理物理机的IP调配。治理IP调配通过DHCP协定,DHCP协定无奈跨三层网络进行通信,所以须要在路由器上配dhcp_relay,要把治理口的子网和带外治理口的子网都relay到Baremetal Agent监听的IP上,Baremetal Agent中内置了DHCP和TFTP的服务,可能帮忙物理机调配IP。
注册场景介绍
平台治理物理机的第一步就是把物理机的信息收集到平台,这个步骤称为注册。
注册形式分为三种,第一种是ISO疏导注册,若物理机中曾经配好IPMI带外信息、IPMI的IP、用户名、明码等。然而网络环境中没有配DHCP Relay,想要动态调配IP。平台也反对不走DHCP协定,网络调配形式就是动态的 ,咱们要做启动疏导,进入疏导零碎将物理机硬件信息采集到平台。
进入平台的小零碎,如果是ISO疏导注册,就会下发一个ISO到物理机。
ISO必须依赖Redfish API,传统的IPMI协定,不反对挂载ISO,Redfish API在较新的服务器上带外都反对,而较旧的服务器可能不反对Redfish API。
如果不能应用ISO疏导注册,则只能用以下两种注册形式,第二种注册形式是PXE疏导注册,前提是物理机曾经配好IPMI信息。
该疏导形式是通过PXE,PXE协定依赖DHCP协定,所以须要在网络环境中将DHCP Relay配好,它的网络调配形式是用Baremetal Agent去DHCP动静给机器去调配IP,不依赖Redfish ,应用IPMI的信息即可。
第三种形式是预注册,预注册这种场景是若物理机刚出厂,不配IPMI信息,间接进行PXE疏导。
PXE疏导会发DHCP播送,只有交换机或路由器上配好DHCP Relay,并且 Relay到Baremetal Agent服务,平台即可感知到并发送来自DHCP Relay的PXE申请,而后就会进行响应。之后动态分配IP,这就是预注册,预注册须要提前将物理机网卡的MAC地址填上。
1、ISO疏导注册须要填写的参数
首先须要将物理机名称,IPMI的连贯信息记录到平台。
另外就是填写治理口IP,因为ISO疏导注册不依赖DHCP动态分配IP, 所以须要手动写一个动态IP,当物理机配置网络时会应用动态IP设置。
2、PXE疏导注册
PXE疏导注册必须填写名称和IPMI信息。然而治理口IP能够选填,若固定,平台就会以固定的进行调配,若不填写,就会走DHCP,Relay后动态分配IP。
3、预注册
必须要填MAC地址、名称,IPMI的信息在填上之后,平台就会依据填写的IPMI信息设置机器上的BMC。
如果不填写,零碎会用默认的连贯信息进行设置,这就是预注册。
如果洽购机器之后不想人工配置IPMI信息,能够间接应用预注册。
只须要将网络环境中的DHCP Relay配好,残余工作能够间接交给平台实现。
如果有一批机器曾经配置好, 则须要应用前两种疏导注册。
4、主动注册
另外一种比拟弱小的性能是主动注册,预注册须要填写MAC地址,如果开启主动注册,则MAC地址不必填写。
只有关上过主动注册的性能,物理机开始发PXE申请,平台就会承受所有来自DHCP Relay的PXE的申请。
平台会主动将其变成平台的物理机,主动做PXE疏导,采集物理机的硬件信息。
这种场景实用于自动化、大规模的场景,比后面几种形式缩小人为干涉的动作,然而对网络要求较高,须要提前将子网的Relay设置好。
而且子网中不能有本人的DHCP服务,依赖平台做DHCP调配。开启办法须要后端用命令行做配置,而后将auto_register_baremetal:ture选项关上。
注册实现的物理机
注册实现的物理机会在平台的物理机列表中展现:
注册实现过后,能够将治理口和带外口的IP调配进来,包含物理机的规格、品牌、治理口网卡的MAC等。
关上机器详情,还能看到更加具体的CPU型号、内存、磁盘大小、每块磁盘RAID驱动、型号、插槽序号、硬盘类型、网卡信息、品牌信息等。
装机实际
上面通过预注册的形式对装机过程进行演示。
首先在云平台中增加物理机信息,抉择预注册,填写治理口的MAC地址,并填写名称。
点击确定按钮提交过后就会在物理机列表中呈现记录,状态为初始化状态。
此时还在期待物理机注册进来,所以须要到物理机上设置做PXE启动,能够应用IPMITOOL的命令行工具近程设置物理机做PXE启动。
若曾经配好IPMI,能够关上服务器的虚构终端, 设置下一次疏导为PXE,再使机器启动。
在网络曾经配置好的前提下,当物理机启动时,DHCP的PXE申请会被Baremetal Agent搜到。
Baremetal Agent会响应PXE申请,并给物理机下发PXE疏导零碎。
此图即为物理机从Baremetal Agent下载PXE疏导固件的截图。
只有下载好此固件 ,即便物理机磁盘中没有装零碎,也能够间接从疏导系统启动,此零碎间接在内存当中运行。
物理机PXE进入疏导零碎
物理机的PXE固件下载胜利过后,就会进入疏导零碎,能够看到登录界面。
进入到疏导零碎过后,平台上物理机的状态即可变更为筹备中,会帮物理机做IP配置,采集硬件信息。
当状态变更为筹备中时,便会设置好IP信息。
注册实现后,物理机状态会变更为运行中,同时会把规格、品牌、序列号等信息进行采集并记录。
至此,物理机便曾经退出云平台的物理机治理资源池中,能够对其进行装机等其余自动化操作。
装置操作系统
点击界面中装置操作系统的按钮,即可进入物理机装机界面,首先须要抉择物理机应用的镜像,第二步须要给物理机做RAID配置。
之前曾经通过注册的形式将所有磁盘信息和RAID卡信息收集实现, 所以这里有配置RAID的界面。
新建分区
须要明确给RAID做的逻辑盘中做哪些分区,一块盘中能够做n个分区,每个分区都有不同的挂载点,文件系统和大小。
分区后果
以下为分区和RAID做完之后的总览:
配置网络
从云平台中抉择物理机所在的网络。其中一个性能能够启用Bonding,当物理机中有两块以上网卡,如果都插到网线,同时又在同一个交换机下或者物理下面与网络相通,能够依据本人的抉择做Bongding。
开始装机
1、裸金属记录
平台会用称为裸金属的资源做记录,裸金属的状态会变更为部署中 。
当装机实现过后即可看到裸金属的状态变成运行中 ,此时物理机装机过程曾经实现,能够登录后进行业务部署等操作。
2、获取登陆信息
登录过后能够拿到IP 以及近程登录的用户名和明码。之后即可到命令行中登录物理机。
3、SSH登陆裸金属
以上即是装机过程展现。