关于数据挖掘:思迈特软件Smartbi创建有效的大数据模型6个步骤

37次阅读

共计 749 个字符,预计需要花费 2 分钟才能阅读完成。

不要将传统的建模技术强加于大数据
传统的固定记录数据在其增长中稳固且可预测的,这使得建模绝对容易。相比之下,大数据的指数增长是不可预测的,其有数模式和起源也是如此。当网站思考建模大数据时,建模工作应该集中在构建凋谢和弹性数据接口上,因为人们永远不晓得何时会呈现新的数据源或数据模式。这在传统的固定记录数据世界中并不是一个优先事项。

设计一个零碎,而不是一个模式
在传统的数据畛域中,关系数据库模式能够涵盖业务对其信息反对所需的数据之间的大多数关系和链接。大数据并非如此,它可能没有数据库,或者可能应用像 NoSQL 这样的数据库,它不须要数据库模式。
正因为如此,大数据模型应该建设在零碎上,而不是数据库上。大数据模型应蕴含的零碎组件包含业务信息需要、企业治理和平安、用于数据的物理存储、所有类型数据的集成、凋谢接口,以及解决各种不同数据类型的能力。

寻找大数据建模工具
有商业数据建模工具能够反对 Hadoop 以及像 Smartbi 这样的大数据报告软件。在思考大数据工具和办法时,IT 决策者应该包含为大数据构建数据模型的能力,这是要求之一。

关注企业的业务的需要数据
企业每天都会输出大量的数据,而这些大数据大部分是无关紧要的。创立蕴含所有数据的模型是没有意义的。更好的办法是确定对企业来说至关重要的大数据,并对这些数据进行建模。

提供高质量的数据
如果组织专一于开发数据的正确定义和残缺的元数据来形容数据来自何处、其目标是什么等等,那么能够对大数据模型产生更好的数据模型和关系。能够更好地反对反对业务的数据模型。

寻找数据的要害切入点
当今最罕用的大数据载体之一就是地理位置,这取决于企业的业务和行业,还有其余用户须要的大数据罕用密钥。企业越可能辨认数据中的这些罕用入口点,就越可能设计出反对企业要害信息拜访门路的数据模型。
 

正文完
 0