据库虚拟化宣称突破了供应商对数据仓库技术的锁定。它的适用性如何?IT领导者如何评估该技术?
咱们正在经验一场不堪设想的振兴。长期以来被讥笑为过期的数据库忽然成为行业的宠儿。在权威人士发表数据库简直已死多年后,一种新型的初创公司引起了华尔街的留神。然而,IT领导者依然难以无效地将他们现有的工作负载迁徙到这些零碎。
对数据库的供应商锁定是传奇。没有其余部门对其用户产生如此大的影响。天然地,供应商锁定使客户对现有技术心存感谢。然而,它也让竞争和新贵们望而生畏。Snowflake的CEO曾感叹打入这个市场有多难,过后他说:“Teradata让他们很难来到他们的平台。”
随着数据库虚拟化(DBV)(而非数据虚拟化)的呈现,一种新的办法已进入舞台。DBV宣称突破了供应商对数据仓库技术的锁定。它的适用性如何?IT领导者如何评估该技术?以下是对于DBV的五件事。
1)DBV是如何工作的?
DBV平台位于数据库和应用程序之间。它使为一个数据库编写的应用程序可能在另一个数据库上本地运行。所有查问和通信都是实时翻译的。例如,为Teradata编写的应用程序能够间接在MicrosoftAzureSynapse上运行,甚至不会“晓得”它们不再在Teradata上运行。
DBV是齐全通明的,目标是应用程序不须要任何或只须要很少的调整。这不仅包含规范SQL,还包含专有扩大。为了在实践中取得成功,还必须反对加载程序、驱动程序和实用程序。
因为DBV零碎实现了查问和数据的转换,因而它们能够以相当低的开销运行。理论的数据处理始终在数据仓库自身上执行,并利用该零碎的大规模并行处理(MPP)性能。
2)何时应用DBV而非传统迁徙?
在传统迁徙中,所有现有的SQL代码、驱动程序、工具和实用程序都被替换为新指标零碎的对应项。对于具备大量应用程序的紧凑型数据仓库零碎,这可能是首选办法。只有无限数量的用户的数据集市可能有资格这样做。
然而,在简单的企业数据仓库(EDW)的状况下,DBV能够显着优于传统迁徙。DBV以极少的工夫、老本和危险实现工作负载的迁徙。
3)DBV能够笼罩我的工作量吗?
一些工作负载宽泛应用专门的性能。还有一些应用早于标准化工作的性能。换句话说,没有两个数据仓库工作负载是雷同的。这会使评估DBV零碎的覆盖范围变得艰难。
反对性能的残缺文档仿佛是可取的,但实际上并不是很有帮忙。大多数客户无奈简洁地形容他们的工作负载以后正在应用哪些性能。更简单的是,查问或函数的原始作者通常不再在公司工作。
然而,这不肯定是采纳DBV的阻碍。因为DBV的采纳危险较低,因而它能够实现十分无效的概念验证(POC)施行。客户无需更改其应用程序即可应用DBV。他们能够间接在POC中测试他们的理论应用程序。
而后,POC能够疾速辨认任何缺失的覆盖范围。重要的是要了解,尽管100%的覆盖率仿佛是可取的,但通常90%就足够了。解决剩下的问题通常只须要微不足道的致力。
4)DBV与数据虚拟化有何不同?
数据虚拟化是一种有些相干但又齐全不同的办法。要使数据虚拟化胜利,首先须要重写所有应用程序并采纳形象的SQL方言。而后,只有这样,它能力避免将来的供应商锁定。次要应用领域是不须要思考现有利用的“绿地”场景。
相比之下,DBV突破了现有的供应商锁定。它使应用程序放弃原样。随着工夫的推移,这可能会导致各种各样的不同利用技术。然而,这可能不是什么大问题,并且被新数据技术的采纳很好地对消了。
5)DBV是否将EDW从新平台化为任何技术?
每隔几年,一项新技术就会挑战企业数据仓库零碎的霸主位置。新来者通常在一个显着维度上优于现有堆栈。例如,新技术可能更具可扩展性。另一个可能会简化数据的共享。还有一些更吸引开源开发者。
通常,专家团队能够构建定制解决方案,将工作负载从EDW转移到大多数新技术。然而,性能上的差距越大,运行这些零碎所需的软件工程就越多。例如,将EDW迁徙到NoSQL零碎在技术上可能是可行的,但在经济上并不总是可取的。
要使DBV胜利,源和指标必须有意义地类似。然而,这不须要等效性能。DBV能够补救大多数高级性能的有余,例如存储过程、宏,甚至是不受反对的数据类型。目前,云原生PaaS解决方案在DBV环境中最为胜利。
抉择正确的迁徙办法
在为现有EDW抉择新的指标零碎时,须要思考许多因素。一个常常被忽视的是迁徙办法。DBV在突破供应商对遗留数据仓库的锁定方面十分无效。
通过将迁徙办法思考到他们对指标零碎的抉择中,IT领导者能够优化疾速采纳,同时管制危险和老本。