共计 1139 个字符,预计需要花费 3 分钟才能阅读完成。
在过来的几十年里,数据建模的致力通常集中在关系数据建模或可扩大标记语言 (XML) 的建模上。只有数据存储在关系数据库中,关系数据建模就会很好,但除此之外,它很少会有其余的用处。大数据建模是一个数据挖掘的过程,就是从数据之中发现问题,解释这些问题,建设相应的数据模型,能够通过预测发明新的决策参考,对于数据建模有不同的平台以及不同的工具,这个过程中也是有相应的规范,能够大大提高大数据建模的成功率。想要做好数据建模也并非难事。但前提是必须恪守好这五大准则,不愁做不好大数据建模。
准则一:以业务指标作为实现目标
大数据建模不只是一个技术,而是一个为了解决业务流程的问题的过程,如果没有指标或者说不是以解决业务方面的问题作为指标,那么就没有大数据建模。
准则二:理解业务知识
从大数据建模开始到完结,并且要基于理解业务知识的商业了解的根底上,晓得这些相干的数据与业务问题有什么的关系,是怎么相干起来的,到最初的塑造阶段,也是要利用业务知识来进行模型塑造,建设起来的大数据模型要通过业务问题的发问和解答。
准则三:做好数据预处理
做大数据建模,不仅仅是建模这一个动作,整个过程的多个环节都是很重要的,在大数据建模的过程中,找到适合的数据源才是重点,对于数据源进行预处理则是难点,数据预处理是艰难,尽管说当初曾经有很多的自动化的数据处理工具能够被应用,然而这些剖析工具以及各种分析方法也是通过了很长的一段摸索工夫。做大数据建模的时候,在数据预处理阶段不能焦急,要找到适合数据预处理的分析方法。
准则四:重视数据原有的模式
在进行大数据建模的时候重视一些数据原有的模式,例如在进行客户购买行为剖析过程中,可客户之后的购买预测可能和之前的购买行为有关系,当然这个过程和操作者的教训有很大的相关性,特地是在理解一开始的业务知识之后,可能对于这种原有的模式会有更好的了解。
准则五:大数据建模的价值不在于预测的准确率
一个模型建设起来了,很多人会按照这个模型进行各种预测,如果预测的精确,就阐明模型是好的模型,是有价值的,实际上这个不能作为判断价值的规范,一个好的大数据模型是为了扭转企业的行为以及以预测的后果来改善企业的行为,传递新的常识和见解,以及会不会适应业务的倒退的须要才是它的掂量尺标。
想要全面意识大数据建模,能够到 Smartbi 理解体验。Smartbi Mining 通过深度数据建模,为企业提供预测能力反对文本剖析、五大类算法和数据预处理,并为用户提供一站式的流程式建模、拖拽式操作和可视化配置体验。Smartbi Mining 不仅可为用户提供直观的流式建模、拖拽式操作和流程化、可视化的建模界面,还提供了大量的数据预处理操作。此外,它基于 Smartbi 对企业客户的长期教训,提供了大量实用的企业级平台个性。