共计 1275 个字符,预计需要花费 4 分钟才能阅读完成。
提起数据挖掘的利用,大家个别会想起预测剖析。例如,预测明年公司的业绩将会是多少?哪些客户可能散失?而实际上,数据挖掘除了预测将来,还能够帮忙企业进行聚类分析、举荐、异样监测、相关性剖析等等,还能广泛应用于企业经营、生产管制、城市规划、市场剖析等各个领域。
大家都晓得数据挖掘牛逼,然而真正能把数据挖掘技术用起来的却并不多,究其原因,次要是感觉数据挖掘太难了!不仅须要用户具备肯定的专业知识,还须要破费大量的精力进行算法抉择、数据训练。所以,数据挖掘的门槛很高,非专业高阶人士不可用。
那对于想用数据挖掘性能的普通用户来说,他们该怎么实现数据更深层的价值开掘呢?上面,小麦给大家介绍 Smartbi 产品数据挖掘的一些性能,这些性能非常简单便捷,就算是业务人员都能够应用:
一、丰盛的开掘组件,拖拽即可应用
封装意味着屏蔽了底层技术的复杂性,留给用户的是可见的成品。Smartbi 产品封装 20+ 数据预处理办法、10+ 特色工程办法、50+ 数据挖掘算法,含统计分析、文本剖析、分类、回归、聚类、关联算法等,用于对数据进行统计、解决、剖析、预测和分类。
这些组件通过简略的拖拽即可利用:
二、自助机器学习,疾速创立试验
创立试验时,尽管通过拖拽即可进行组件的组合和流程的创立,但有的用户可能还是会感觉简单,那咱们就把组合和流程再次封装,实现向导化,进一步升高用户的应用门槛。
咱们反对应用自助机器学习性能疾速创立数据挖掘试验,你只须要依据页面向导提醒,配置数据源、算法、特色三个步骤的设置项,即可疾速主动生成试验,即便没有太多专业知识,也能应用机器学习。
三、模型自学习,实现模型主动训练
有娃的都晓得,若是家里的娃娃能够自主学习,那老母亲真是太幸福了。而对于模型来讲,可能自学习,也是代表着模型可能主动通过训练进步准确性。
曾经公布的模型随着时间推移,准确性可能会逐渐升高。这时若通过补充新的数据,从新进行训练,则有可能进步模型的准确性。模型自学习则是将这个步骤自动化,并能主动将合乎肯定要求的模型公布或者部署到生产中,它能解决模型长期得不到更新而导致准确性升高的问题,并极大地加重运维人员的工作量。
四、已训练模型,可间接进行利用
相似于模板的复用,咱们已保留的训练模型无需再次训练,可间接利用特色进行分类和回归预测,应用起来也更加简略不便。
如下图示例,咱们能够将曾经训练好的垃圾短信模型,间接拖拽进来对“垃圾短信辨认”的数据进行预测,查看其是否为垃圾短信。
五、模型比照性能,一键生成报告
用户创立好模型后,须要进行比照,判断哪个模型的算法准确性更高。产品反对模型比照性能,通过可视化抉择须要比照评估的算法模型,能把扩散的后果对立汇总,一键生成比照报告,便于业务人员查看保留。
六、内置丰盛案例,可供学习应用
产品还内置丰盛的案例,包含银行批发客户散失预测、波士顿房价预测、城市功能区辨认、动物品种分类、二手车交易价格预测、购物篮剖析等等,关上即可参考利用。
比方购物篮剖析,应用 FP-Growth 关联规定算法实现,能够发现超市不同商品之间的关联关系,并依据商品之间的关联规定制订销售策略。