关于ceph:Ceph集群搭建篇
环境筹备ceph官网文档:https://docs.ceph.com/en/latest/ 本次搭建用到的测试机器,布局如下: 主机名IP数据盘ceph-node01192.168.11.135块1TB容量硬盘ceph-node02192.168.11.145块1TB容量硬盘ceph-node03192.168.11.155块1TB容量硬盘解下来在所有节点实现上面的筹备工作敞开防火墙、selinux、禁用swapsystemctl stop firewalldsystemctl disable firewalldsetenforce 0sed -i 's/enforcing/disabled/' /etc/selinux/configswapoff -ased -ri 's/.*swap.*/#&/' /etc/fstab在部署 Ceph 集群时,倡议将所有节点的替换分区(swap)禁用或调整到最小值。这是因为 Ceph 对于节点内存的需要较高,如果零碎中开启了 swap 分区,那么当内存不足时,零碎会将一些内存数据转储到 swap 中,这会导致性能降落和零碎不稳固。因而,禁用或调整 swap 分区大小能够确保零碎有足够的内存来反对 Ceph 的失常运行和性能。 配置阿里云yum源mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bakcurl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repoyum makecache装置epelyum install epel-release -y装置dockerwget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo && yum -y install docker-ce && systemctl enable docker && systemctl start dockercat > /etc/docker/daemon.json << EOF{ "registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com"], "exec-opts": ["native.cgroupdriver=systemd"]}EOFsystemctl restart docker装置lvm2、python3、ntpyum install lvm2 python3 ntpdate -y && ntpdate ntp1.aliyun.com部署ceph集群在每个节点装置Cephadm和ceph工具包# curl --silent --remote-name --location https://github.com/ceph/ceph/raw/octopus/src/cephadm/cephadmchmod +x cephadmmv cephadm /usr/local/bin/# 查看版本的同时会下载镜像quay.io/ceph/ceph:v15,倡议在这一步提前下载好,等会部署ceph集群和退出osd的时候,都要用到这个镜像# 在一台下载后能够导出散发到其余节点进行导入,省心省力。[root@ceph-node01 yum.repos.d]# cephadm versionceph version 15.2.17 (8a82819d84cf884bd39c17e3236e0632ac146dc4) octopus (stable) # 留神这个版本号octopus[root@ceph-node01 ~]# docker imagesREPOSITORY TAG IMAGE ID CREATED SIZEquay.io/ceph/ceph v15 93146564743f 7 months ago 1.2GB# 装置对应版本号的相干软件包cephadm add-repo --release octopus && cephadm install ceph-common在第一个节点(ceph-node01)上,初始化Ceph集群和创立OSDcephadm bootstrap --mon-ip 192.168.11.13# 胜利后的输入:Ceph Dashboard is now available at: URL: https://ceph-node01:8443/ User: admin Password: 71w76yawguYou can access the Ceph CLI with: sudo /usr/local/bin/cephadm shell --fsid 09588bf8-ce9d-11ed-b54e-0050563ecf1e -c /etc/ceph/ceph.conf -k /etc/ceph/ceph.client.admin.keyringPlease consider enabling telemetry to help improve Ceph: ceph telemetry onFor more information see: https://docs.ceph.com/docs/master/mgr/telemetry/Bootstrap complete.在创立实现后,您将看到输入中显示的管理员账号和明码,能够应用浏览器登录到web治理页面。 查看集群状态: [root@ceph-node01 ~]# ceph -s cluster: id: cf322aa0-ce9d-11ed-a072-0050563ecf1e health: HEALTH_WARN OSD count 0 < osd_pool_default_size 3 services: mon: 1 daemons, quorum ceph-node01 (age 16m) mgr: ceph-node01.qzkggl(active, since 15m) osd: 0 osds: 0 up, 0 in data: pools: 0 pools, 0 pgs objects: 0 objects, 0 B usage: 0 B used, 0 B / 0 B avail pgs: 能够看到ceph集群曾经有一个节点ceph-node01,它负责了mon、mgr的角色,在我的布局中,也是要让ceph-node01节点作为osd角色的,它的osd数量目前为0,接下来咱们在ceph-node01上创立osd # 查看存储设备列表,它有5块盘[root@ceph-node01 ~]# ceph orch device lsHostname Path Type Serial Size Health Ident Fault Available ceph-node01 /dev/sdb hdd 1073G Unknown N/A N/A Yes ceph-node01 /dev/sdc hdd 1073G Unknown N/A N/A Yes ceph-node01 /dev/sdd hdd 1073G Unknown N/A N/A Yes ceph-node01 /dev/sde hdd 1073G Unknown N/A N/A Yes ceph-node01 /dev/sdf hdd 1073G Unknown N/A N/A Yes # sda是系统盘,sdb-sdf打算用来做osd盘,通过查看目前的状态能够晓得,这5块盘还没有交由ceph治理[root@ceph-node01 ~]# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTsda 8:0 0 500G 0 disk ├─sda1 8:1 0 2G 0 part /boot└─sda2 8:2 0 498G 0 part ├─centos-root 253:0 0 122G 0 lvm / ├─centos-swap 253:1 0 16G 0 lvm ├─centos-usr 253:2 0 60G 0 lvm /usr ├─centos-var 253:3 0 250G 0 lvm /var ├─centos-tmp 253:4 0 30G 0 lvm /tmp └─centos-home 253:5 0 20G 0 lvm /homesdb 8:16 0 1000G 0 disk sdc 8:32 0 1000G 0 disk sdd 8:48 0 1000G 0 disk sde 8:64 0 1000G 0 disk sdf 8:80 0 1000G 0 disk # 接下来咱们创立新的OSD,间接通知Ceph应用任何可用和未应用的存储设备ceph orch apply osd --all-available-devices# 接着查看,sdb-sdf磁盘曾经交由ceph治理,并作为osd盘,[root@ceph-node01 ~]# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTsda 8:0 0 500G 0 disk ├─sda1 8:1 0 2G 0 part /boot└─sda2 8:2 0 498G 0 part ├─centos-root 253:0 0 122G 0 lvm / ├─centos-swap 253:1 0 16G 0 lvm ├─centos-usr 253:2 0 60G 0 lvm /usr ├─centos-var 253:3 0 250G 0 lvm /var ├─centos-tmp 253:4 0 30G 0 lvm /tmp └─centos-home 253:5 0 20G 0 lvm /homesdb 8:16 0 1000G 0 disk └─ceph--e445c08f--1564--443c--9f7c--de2772686c56-osd--block--91538bd9--a63e--4d2a--9283--8bc66f01726f 253:6 0 1000G 0 lvm sdc 8:32 0 1000G 0 disk └─ceph--660d76c7--6f90--422e--baa2--ce8441bd8812-osd--block--1820432c--3ee3--4fb6--9c7f--682160c3b13b 253:7 0 1000G 0 lvm sdd 8:48 0 1000G 0 disk └─ceph--0c0eaf4c--2b6f--45d9--a8a3--a6cac35b285d-osd--block--1f060c14--2dd7--4fdd--839f--9402616bf9fb 253:8 0 1000G 0 lvm sde 8:64 0 1000G 0 disk └─ceph--60fceaeb--a0c7--45e5--babe--bd714884fbea-osd--block--7eb9b03a--ea87--4ab3--97f4--2c1dcf802930 253:9 0 1000G 0 lvm sdf 8:80 0 1000G 0 disk └─ceph--8beea209--9020--4c91--b4a4--38b862de7cc0-osd--block--b224910e--7894--470b--8617--0b28c6a1add8 253:10 0 1000G 0 lvm # 查看集群中的osd状态[root@ceph-node01 ~]# ceph osd statusID HOST USED AVAIL WR OPS WR DATA RD OPS RD DATA STATE 0 ceph-node01 1026M 998G 0 0 0 0 exists,up 1 ceph-node01 1026M 998G 0 0 0 0 exists,up 2 ceph-node01 1026M 998G 0 0 0 0 exists,up 3 ceph-node01 1026M 998G 0 0 0 0 exists,up 4 ceph-node01 1026M 998G 0 0 0 0 exists,up 将另外2个节点增加到集群和创立OSD(在ceph-node01节点上操作)# 下发ceph集群的公钥和增加节点ssh-copy-id -f -i /etc/ceph/ceph.pub root@192.168.11.14ssh-copy-id -f -i /etc/ceph/ceph.pub root@192.168.11.15ceph orch host add ceph-node02 192.168.11.14ceph orch host add ceph-node03 192.168.11.15ceph-node02和ceph-node03退出ceph集群后,会主动将任何可用和未应用的存储设备作为osd盘当然也能够手动指定从特定主机上的特定设施创立OSD,命令如下: ceph orch daemon add osd 192.168.11.14:/dev/sdb,/dev/sdc,/dev/sdd,/dev/sde,/dev/sdfceph orch daemon add osd 192.168.11.15:/dev/sdb,/dev/sdc,/dev/sdd,/dev/sde,/dev/sdf至此,ceph集群曾经搭建实现。实现后,查看集群状态、osd状态、集群应用状况[root@ceph-node01 ~]# ceph -s cluster: id: cf322aa0-ce9d-11ed-a072-0050563ecf1e health: HEALTH_OK services: mon: 3 daemons, quorum ceph-node01,ceph-node03,ceph-node02 (age 7m) mgr: ceph-node01.qzkggl(active, since 34m), standbys: ceph-node02.ioyzpg osd: 15 osds: 15 up (since 6m), 15 in (since 6m) data: pools: 1 pools, 1 pgs objects: 0 objects, 0 B usage: 15 GiB used, 15 TiB / 15 TiB avail pgs: 1 active+clean [root@ceph-node01 ~]# ceph osd statusID HOST USED AVAIL WR OPS WR DATA RD OPS RD DATA STATE 0 ceph-node01 1030M 998G 0 0 0 0 exists,up 1 ceph-node01 1030M 998G 0 0 0 0 exists,up 2 ceph-node01 1030M 998G 0 0 0 0 exists,up 3 ceph-node01 1030M 998G 0 0 0 0 exists,up 4 ceph-node01 1030M 998G 0 0 0 0 exists,up 5 ceph-node02 1030M 998G 0 0 0 0 exists,up 6 ceph-node02 1030M 998G 0 0 0 0 exists,up 7 ceph-node02 1030M 998G 0 0 0 0 exists,up 8 ceph-node02 1030M 998G 0 0 0 0 exists,up 9 ceph-node02 1030M 998G 0 0 0 0 exists,up 10 ceph-node03 1030M 998G 0 0 0 0 exists,up 11 ceph-node03 1030M 998G 0 0 0 0 exists,up 12 ceph-node03 1030M 998G 0 0 0 0 exists,up 13 ceph-node03 1030M 998G 0 0 0 0 exists,up 14 ceph-node03 1030M 998G 0 0 0 0 exists,up [root@ceph-node01 ~]# [root@ceph-node01 ~]# ceph df--- RAW STORAGE ---CLASS SIZE AVAIL USED RAW USED %RAW USEDhdd 15 TiB 15 TiB 104 MiB 15 GiB 0.10TOTAL 15 TiB 15 TiB 104 MiB 15 GiB 0.10 --- POOLS ---POOL ID PGS STORED OBJECTS USED %USED MAX AVAILdevice_health_metrics 1 1 0 B 0 0 B 0 4.6 TiB[root@ceph-node01 ~]# 登录ceph web治理页面看看: ![图片]() 写在最初对于工夫同步 在 Ceph 集群中,每台节点的工夫同步十分重要,因为 Ceph 集群的各个组件都须要严格的工夫同步能力失常运行。以下是一些重要起因:防止数据不统一:Ceph 集群中的数据正本散布在不同的节点上,如果节点之间的工夫不同步,可能会导致写操作的数据不统一,或者无奈正确地读取数据。防止时钟漂移:因为硬件和软件的起因,每个节点的时钟可能会呈现漂移。如果这种漂移超过了肯定的阈值,可能会导致 Ceph 零碎无奈失常工作。防止锁竞争问题:Ceph 集群中的许多组件都应用锁来管制拜访资源的程序。如果节点之间的工夫差别太大,可能会导致锁竞争问题,从而影响零碎的性能。因而,确保每台节点的工夫同步是 Ceph 集群稳定性和可靠性的重要保障。能够通过应用 NTP(网络工夫协定)或其余工夫同步工具来实现工夫同步。在本次搭建中,同步的是公网阿里云的工夫服务器。须要留神的是,如果在生产环境,还要配置定期可能主动同步,本次只是测试,所以就不配置了,如果是生产环境且不能出外网的机器,还要确保本地有NTP服务器。对于mon节点的数量一个典型的 Ceph 集群官网倡议部署3个或5个监控守护过程(MON),散布在不同的主机上。因为 MON 负责保护 Ceph 集群的状态信息,包含存储池和 OSD 的映射关系、客户端的连贯信息等,它们须要进行定期的状态信息替换和协调。如果某个 MON 产生故障,那么其余的 MON 能够协同工作来保护集群的状态信息。一般来说,部署更多的 MON 能够进步集群的可靠性和容错性,因为它们能够更好地协同工作来保护集群的状态信息。同时,部署更多的 MON 还能够进步集群的性能,因为它们能够更好地分担状态信息替换的负载。 倡议在 Ceph 集群中至多部署五个或更多的 MON,以进步集群的可靠性、容错性和性能。本文转载于WX公众号:不背锅运维(喜爱的盆友关注咱们):https://mp.weixin.qq.com/s/YzuaRf2ZABFIU7Wkyro4vw