关于机器学习:5篇关于特征嵌入的研究论文推荐

32次阅读

共计 2523 个字符,预计需要花费 7 分钟才能阅读完成。

1、Continual Learning for Visual Search with Backward Consistent Feature Embedding

Timmy S. T. Wan, Jun-Cheng Chen, Tzer-Yi Wu, Chu-Song Chen

https://arxiv.org/pdf/2205.13384

在图像搜索算法中,数据库中的图片会随着工夫的增长而减少。然而现有办法依赖于在整个数据集上训练的模型,而疏忽了模型的不断更新。随着模型的更新,新模型必须为整个图库集从新提取特色以放弃兼容的特色空间,这为大型图库集带来了很高的计算成本。为了解决长期视觉搜寻的问题,论文引入了一种继续学习 (CL) 办法,该办法能够解决增量增长的图片集。该办法强制执行会话间数据一致性和模型一致性还有不同训练会话(数据增长后的从新训练)损失区别来进行继续学习,解决方案还解决了为含糊边界增加新类的状况,而不假如所有类别在开始时和模型更新期间都已知的。这应该是第一个解决后向统一特色嵌入问题并容许在新会话中呈现新类的 CL 办法。对各种基准的宽泛试验表明论文的办法在各种设置下的有效性

2、Bootstrap Confidence Regions for Learned Feature Embeddings

Kris Sankaran

https://arxiv.org/pdf/2202.00180

算法特色学习器为非矩阵结构化信号(如图像、音频、文本和图形)提供高维向量示意。从这些示意派生的低维投影可用于摸索这些数据汇合之间的变动。然而目前尚不分明如何评估与这些预测相干的不确定性。论文采纳 bootstrapping principal components analysis 的办法,以适应从非矩阵数据中学习特色。论文凭教训比拟了派生的相信区域,影响特色学习和疏导的不同因素。改办法在空间蛋白质组数据上进行了阐明。代码、数据和训练模型应用 R 语言进行开发并且已开源。

3、Who supervises the supervisor? Model monitoring in production using deep featureembeddings with applications to workpiece inspection

Michael Banf, Gregor Steinhagen

https://arxiv.org/pdf/2201.06599

自监督畛域在近期有了的巨大进步。然而这些模型变的弱小的同时也变得越来越简单,并且不通明和也无法解释。这里面临的一个次要挑战是监控这些机器学习零碎的实时部署,并在遇到可能影响模型性能的事件时收回警报。特地是目前的监督分类器通常是在根底数据分布的平稳性假如下构建的。比如说针对一组资料外表缺点进行训练的视觉检测零碎通常无奈适应甚至辨认数据分布的逐步变动——即所谓的“数据漂移”问题(例如新型外表缺点的呈现)。如果呈现这种状况可能会导致十分重大的谬误预测,例如来自新缺点类别的样本被归类为无缺点。所以提供对分类器性能的实时跟踪,并且监控额定错误类别以及在分类器从新训练方面手动干涉是十分必要的。这篇论文提出了一个在有监督的分类零碎之上的无监督框架,它从而利用其外部深度特色示意作为代理来跟踪部署期间数据分布的变动,从而预测分类器性能降落

4、Extreme Beam-forming with Impedance Metasurfaces Featuring Embedded Sources and Auxiliary Surface Wave Optimization

Gengyu Xu, Vasileios G. Ataloglou, Sean V. Hum, George V. Eleftheriades

https://arxiv.org/pdf/2107.12025

论文提出了一种端到端的紧凑型无源无损超外表(MTS)天线的设计方案。整个零碎由单层无功阻抗 MTS 组成,建设了一种准确高效的基于 体积 - 外表 积分方程的器件模型,并将其作为疾速优化器件性能的根底。论文推导出了几种可行性束缚,这些束缚在理论利用中能够显著进步 MTS 天线的功率效率和带宽。全波数值模仿证实了该办法的有效性,以及综合设计的极其场变换能力。

5、ContextNet: A Click-Through Rate Prediction Framework Using Contextual information to Refine Feature Embedding

Zhiqiang Wang, Qingyun She, PengTao Zhang, Junlin Zhang

https://arxiv.org/pdf/2107.12025

点击率 (CTR) 预计是个性化广告和举荐零碎中的一项根本工作,对于排名模型无效捕获简单的高阶特色十分重要。论文的灵感来自 ELMO 和 Bert 在 NLP 畛域的胜利,它们能够动静地细化词嵌入并依据单词呈现的上下文句子信息,所以论文认为在 CTR 预计工作中依据输出实例中蕴含的上下文信息逐层动静地细化每个特色的嵌入也很重要,能够通过这种形式无效地捕捉每个特色的有用特色交互。提出了一种名为 ContextNet 的新型 CTR 框架,该框架通过依据输出上下文动静细化每个特色的嵌入来隐式建模高阶特色交互。具体来说,ContextNet 由两个要害组件组成:上下文嵌入模块和 ContextNet 块。上下文嵌入模块从输出实例中聚合每个特色的上下文信息,ContextNet 块逐层保护每个特色的嵌入,并通过将上下文高阶交互信息合并到特色嵌入中来动静地细化其示意。为了使框架具体化,还通过在 ContextNet 块中引入线性上下文嵌入网络和两个非线性映射子网络,在该框架下提出了两个模型(ContextNet-PFFN 和 ContextNet-SFFN)。通过对四个真实世界的数据集进行了宽泛的试验,试验结果表明,ContextNet-PFFN 和 ContextNet-SFFN 模型显著优于 DeepFM 和 xDeepFM 等最先进的模型。

https://avoid.overfit.cn/post/8987c6b35a3c4131887de97a4031d665

作者:Monodeep

正文完
 0