Tagged: 机器学习

关于机器学习:OpenMLDB-一文了解窗口倾斜优化技术细节

OpenMLDB是针对AI场景优化的开源数据库我的项目,实现了数据与计算一致性的离线MPP场景和在线OLTP场景计算引擎。MPP引擎可基于Spark实现,并通过拓展Spark源码实现数倍性能晋升。本文次要解释OpenMLDB如何基于Spark来解决窗口数据的歪斜问题。

关于机器学习:AI的中心到底是模型还是数据

个别的AI课程会介绍很多如何通过参数优化来进步机器学习模型准确性的办法,然而这些办法通常都存在肯定的局限性。这是因为咱们经常漠视了古代机器学习一个十分重要的外围——数据。如果咱们没有解决好训练数据没,上百个小时的工夫都会被节约在调整一个低质量数据训练进去的模型上,模型的准确度很容易就会低于预期,而这…

关于机器学习:小样本学习及其在美团场景中的应用

美团的各个业务有着丰盛的NLP场景,而这些场景中模型的构建须要很多的标注资源,老本很高。小样本学习致力于在数据资源稀少的状况下训练出比拟好的模型。本文从被动学习、数据加强、半监督学习、畛域迁徙、集成学习&自训练几个方向介绍了现有的一些办法,并在美团场景进行了试验,成果上也获得了肯定的晋升。心愿能…

关于机器学习:如何将知识引入机器学习模型提升泛化能力

基于物理学的模型是当今技术和迷信的外围。近年来,基于数据驱动的机器学习模型开始提供可代替的办法,并在许多工作中优于纯物理学驱动模型。然而,基于数据驱动的模型训练须要大量的数据,而且它们的决策推理可能难以解释,而且泛化性能依然是一个挑战。而同时联合数据和物理学则能够两败俱伤,当机器学习算法在学习时…

关于机器学习:KDD-2021|美团联合多高校提出多任务学习模型已应用于联名卡获客场景

很多利用通常都须要用定向展现广告来进行获客,对信用卡广告来说,因为用户转化存在较长的链路,继续无效的获客比传统广告更具挑战性。本文联合美团联名信用卡业务中的具体实际,以及往年发表在KDD 2021上的论文,介绍了一种自适应信息迁徙多任务(AITM)框架,通过该框架可建模用户多步转化之间的序列依赖关系,并进步…

关于机器学习:浅谈MindSpore之一训练性能为何能够近似线性提升

萌新一枚,之前断断续续应用了一段时间的MindSpore框架,在和搭档们交换的过程中,很多人发现MindSpore相比于tensorflow/pytorch在训练性能上有着近乎线性的晋升,而且是在昇腾芯片上才体现进去,遂始终好奇这其中的个中原因。最近看了《昇腾AI处理器架构与编程》这本书后,茅塞顿开,豁然开朗。神秘藏在MindSpore精妙设…