关于大数据:数栈运维案例云上RAC部署运维及实践案例

40次阅读

共计 1906 个字符,预计需要花费 5 分钟才能阅读完成。

数栈是云原生—站式数据中台 PaaS,咱们在 github 和 gitee 上有一个乏味的开源我的项目:FlinkX,FlinkX 是一个基于 Flink 的批流对立的数据同步工具,既能够采集动态的数据,也能够采集实时变动的数据,是全域、异构、批流一体的数据同步引擎。大家喜爱的话请给咱们点个 star!star!star!

github 开源我的项目:https://github.com/DTStack/fl…

gitee 开源我的项目:https://gitee.com/dtstack_dev…

数据库产品越来越多,各家云厂商也都推出基于开源 MySQL、Postgre 等的关系型数据库产品,多正本、高可用、读写拆散、分库分表等性能更是集成在各类产品中,升高了机房建设和运维老本,助力更多的客户上云。

唯独鲜见 Oracle 的云产品输入,除非是 Oracle Cloud。

对于以后业务零碎基于 Oracle 零碎开发,且革新难度较大,如 OA、ERP 等零碎;或对数据库要求较高,必须应用 Oracle 数据库的场景,如订单流水、金融交付零碎,袋鼠云能够提供阿里、华为、腾讯私有云,阿里、Zstack 专有云上欠缺的云上 Oracle RAC 施行部署、运维计划,帮助客户无缝上云。

云上单机还是集群,Oracle 的部署都遵循官网的领导文档,没有差异。

然而在根底配置下面,云环境将网络、服务器、磁盘等以产品化输入,有其特殊性:

  • 云交换机:倡议云环境中所有的业务零碎运行在专有网络 VPC 中,创立不同网段交换机,供应 RAC 集群、业务零碎应用;同一个 VPC 网络默认互通
  • 云服务器:云环境有地区 / 可用区一说,同一地区不同可用区相似于同城不同机房,集群计算节点须要在同一个可用区中,购买在同地区不同可用区或不同地区的机器可用于部署业务 / 数据库灾备环境
  • 云盘:同样须要依据布局购买与 RAC 计算节点同地区同可用区的云盘,并挂载到计算节点上;

不同云环境对一台云服务器上挂载磁盘个数的有不同限度,在集群布局阶段须要思考预估数据量大小以及云盘大小。

云服务器规格能够升配或减配,对于集群计算节点,能够逐个进行,升高对业务的影响。

一、云上 RAC 布局一览

二、稳固高效运行

1、规范压力测试

Swingbench 能够构建实在 OLTP 事务场景,比方订单类业务、新建客户、订购、下单等流程操作,通过大批量增删改查操作,测试不同并发场景下数据库性能趋势和稳定性,同时联合其余监控工具,察看服务器内存、负载、磁盘等的性能趋势和稳定性;依据压测后果及早发现和优化问题,评估数据库的最佳应用形式。

根据袋鼠云的集群运维教训,短时间、低并发的压测无奈验证集群的稳定性,所以在云上集群部署之后,会进行长时间(4 小时以上)、高并发的继续压测;

同时对压测进去的集群性能问题进行剖析,优化集群参数配置,并被动提供云服务器、存储资源优化倡议,以期交付一个稳固、高性能的数据库环境。

阿里云 2 节点 12.2.0.1RAC 压测举例:

2、业务回放测试

DBReplay 的测试方法,抓取生产环境某一时间段业务负载,单次 capture 能够屡次 replay,更靠近于正式的生产负载,更直观无效。次要用于数据库降级、迁徙,应用程序部署等的预演,量化评估出变更施行后对现有的性能的影响水平。

对于平时压力较大的业务零碎,在迁徙割接之前有必要进行此类测试。

三、案例分享

1、某日企客户

(1)需要剖析

  • 业务整体上云,须要部署云上 Oracle RAC 12C/11G 各 1 套
  • 满足高可用、容灾等需要

(2)架构布局

  • 布局 20G 3 云盘做 OCR/Voting 组、60G 2 云盘做 REDODG1/ 2 组、200G 1 云盘做 ARCHDG 组、布局 500G 1 云盘做 DATADG 组、100G* 1 云盘做 MGMTDG 组
  • 布局云服务 32C64G* 2 作为计算节点
  • 倡议客户采纳业务拆散的模式拜访数据库

2. 某国企招聘网站

(1) 需要剖析

  • 须要同时满足 1w 人在线拜访,并发事务 2000 以上
  • 自行搭建云上 Oracle 单机数据库,预计很快达到瓶颈
  • 须要高可用、容灾的架构保障业务的继续运行

(2) 架构布局

  • 新购高规格云 ECS 作为计算节点,保障短缺的计算资源
  • 原单机数据库割接后作为 DG 备库运行
  • 配置正当备份策略,上传备份集到 OSS 对象存储,异地保留

3、某省级专有云交管平台

汇总全省交管数据,并提供查问、剖析平台。

(1)需要剖析

  • 自建机房,部署在 Windows 服务器单机 Oracle11.2.0.1
  • 18T 数据,并在逐渐上涨中
  • 业务调试须要和部里对接、调整,理论没有测试的可能
  • 可保护工夫短

(2)架构布局

  • 专有云环境部署,2 节点 RAC 集群,并搭建容灾备库
  • 通过 ADG 实时同步机房数据,进行 DBRelay 压测
  • 持续应用备份一体机备份生产数据
正文完
 0