据库虚拟化宣称突破了供应商对数据仓库技术的锁定。它的适用性如何?IT 领导者如何评估该技术?
咱们正在经验一场不堪设想的振兴。长期以来被讥笑为过期的数据库忽然成为行业的宠儿。在权威人士发表数据库简直已死多年后,一种新型的初创公司引起了华尔街的留神。然而,IT 领导者依然难以无效地将他们现有的工作负载迁徙到这些零碎。
对数据库的供应商锁定是传奇。没有其余部门对其用户产生如此大的影响。天然地,供应商锁定使客户对现有技术心存感谢。然而,它也让竞争和新贵们望而生畏。Snowflake 的 CEO 曾感叹打入这个市场有多难,过后他说:“Teradata 让他们很难来到他们的平台。”
随着数据库虚拟化 (DBV)(而非数据虚拟化) 的呈现,一种新的办法已进入舞台。DBV 宣称突破了供应商对数据仓库技术的锁定。它的适用性如何?IT 领导者如何评估该技术? 以下是对于 DBV 的五件事。
1)DBV 是如何工作的?
DBV 平台位于数据库和应用程序之间。它使为一个数据库编写的应用程序可能在另一个数据库上本地运行。所有查问和通信都是实时翻译的。例如,为 Teradata 编写的应用程序能够间接在 MicrosoftAzureSynapse 上运行,甚至不会“晓得”它们不再在 Teradata 上运行。
DBV 是齐全通明的,目标是应用程序不须要任何或只须要很少的调整。这不仅包含规范 SQL,还包含专有扩大。为了在实践中取得成功,还必须反对加载程序、驱动程序和实用程序。
因为 DBV 零碎实现了查问和数据的转换,因而它们能够以相当低的开销运行。理论的数据处理始终在数据仓库自身上执行,并利用该零碎的大规模并行处理 (MPP) 性能。
2)何时应用 DBV 而非传统迁徙?
在传统迁徙中,所有现有的 SQL 代码、驱动程序、工具和实用程序都被替换为新指标零碎的对应项。对于具备大量应用程序的紧凑型数据仓库零碎,这可能是首选办法。只有无限数量的用户的数据集市可能有资格这样做。
然而,在简单的企业数据仓库 (EDW) 的状况下,DBV 能够显着优于传统迁徙。DBV 以极少的工夫、老本和危险实现工作负载的迁徙。
3)DBV 能够笼罩我的工作量吗?
一些工作负载宽泛应用专门的性能。还有一些应用早于标准化工作的性能。换句话说,没有两个数据仓库工作负载是雷同的。这会使评估 DBV 零碎的覆盖范围变得艰难。
反对性能的残缺文档仿佛是可取的,但实际上并不是很有帮忙。大多数客户无奈简洁地形容他们的工作负载以后正在应用哪些性能。更简单的是,查问或函数的原始作者通常不再在公司工作。
然而,这不肯定是采纳 DBV 的阻碍。因为 DBV 的采纳危险较低,因而它能够实现十分无效的概念验证 (POC) 施行。客户无需更改其应用程序即可应用 DBV。他们能够间接在 POC 中测试他们的理论应用程序。
而后,POC 能够疾速辨认任何缺失的覆盖范围。重要的是要了解,尽管 100% 的覆盖率仿佛是可取的,但通常 90% 就足够了。解决剩下的问题通常只须要微不足道的致力。
4)DBV 与数据虚拟化有何不同?
数据虚拟化是一种有些相干但又齐全不同的办法。要使数据虚拟化胜利,首先须要重写所有应用程序并采纳形象的 SQL 方言。而后,只有这样,它能力避免将来的供应商锁定。次要应用领域是不须要思考现有利用的“绿地”场景。
相比之下,DBV 突破了现有的供应商锁定。它使应用程序放弃原样。随着工夫的推移,这可能会导致各种各样的不同利用技术。然而,这可能不是什么大问题,并且被新数据技术的采纳很好地对消了。
5)DBV 是否将 EDW 从新平台化为任何技术?
每隔几年,一项新技术就会挑战企业数据仓库零碎的霸主位置。新来者通常在一个显着维度上优于现有堆栈。例如,新技术可能更具可扩展性。另一个可能会简化数据的共享。还有一些更吸引开源开发者。
通常,专家团队能够构建定制解决方案,将工作负载从 EDW 转移到大多数新技术。然而,性能上的差距越大,运行这些零碎所需的软件工程就越多。例如,将 EDW 迁徙到 NoSQL 零碎在技术上可能是可行的,但在经济上并不总是可取的。
要使 DBV 胜利,源和指标必须有意义地类似。然而,这不须要等效性能。DBV 能够补救大多数高级性能的有余,例如存储过程、宏,甚至是不受反对的数据类型。目前,云原生 PaaS 解决方案在 DBV 环境中最为胜利。
抉择正确的迁徙办法
在为现有 EDW 抉择新的指标零碎时,须要思考许多因素。一个常常被忽视的是迁徙办法。DBV 在突破供应商对遗留数据仓库的锁定方面十分无效。
通过将迁徙办法思考到他们对指标零碎的抉择中,IT 领导者能够优化疾速采纳,同时管制危险和老本。