共计 2884 个字符,预计需要花费 8 分钟才能阅读完成。
近日,两年一度的计算机视觉畛域顶级学术会议 ICCV (InternationalConference on Computer Vision) 圆满落幕。本次大会中,美团入选 2 篇接管论文,一篇论文获 HTCV 研讨会最佳论文提名奖,拿下两项出名挑战赛亚军,涵盖了人脸技术、人体技术、模型优化、低功耗等多个畛域。并首次联结中科院计算所、北京智源、巴塞罗那大学独特举办了 LargeFineFoodAI(大规模细粒度食品剖析)技术研讨会,吸引了来自不同时区的泛滥参会者积极参与及探讨,在国际舞台推动计算机视觉技术利用于食品剖析畛域,帮大家吃得更好,生存更好。
ICCV 是计算机视觉三大顶会中公认级别最高的,其论文录用率非常低。往年 ICCV 共收到无效投稿 6236 篇,1617 篇被收录,接管率仅为 25.9%。在这些论文中,中国学者简直拿下了“半壁江山”,占比 45.7%,超过第二名美国近一倍,是第三名英国的近 13 倍。
美团举办大规模细粒度食品剖析畛域研讨会 专家齐聚探讨人工智能助力食品衰弱
研讨会由专家特邀报告、挑战赛汇报及论文报告三个局部组成。在研讨会上,专家学者针对食品智能剖析畛域给出了有洞察力的分析及新的问题定义,独特探讨了计算机视觉为食品畛域赋能的倒退方向和利用,促成了计算机视觉、食品科学、养分衰弱等跨畛域的交融。
来自美国加州大学欧文分校传授、将来衰弱研究所开创主任 Ramesh 讲述了定制化食品模型的重要性。在模型设计中将集体偏好与身材所需的食物进行无效均衡,针对性地给每个用户举荐最贴合其养分平衡的食物。东京大学信息与通信工程系 Kiyoharu 传授介绍了一款新型的食物日志工具 - FoodLog Athl,它可用于与饮食相干的医疗保健及饮食评估服务,该工具反对食物图像识别、养分膳食评估、食物养分值测算等性能。巴塞罗那大学数学与计算机科学学院 Radeva 传授探讨了不确定性预计的必要性并展现了食品图像识别中不确定性建模的办法。另外,美国卡耐基梅隆大学和普渡大学投稿的论文也被选中在研讨会上进行报告。
美团举办 2 项食品畛域挑战赛 推动学术交流
同时,美团还组织了首届“大规模食品图像识别和检索”挑战赛,吸引了国内外泛滥有实力的团队参加,包含清华大学、中国科技大学、南京理工大学、巴塞罗那大学、新加坡南洋理工大学等高校,阿里巴巴、深兰科技、OPPO、欢聚时代等公司在内的 143 个国内外团队加入较量。
作为国内当先的生存服务平台,美团率先提出借助计算机视觉算法对食品图像进行细粒度剖析,疾速响应和满足商户和用户大量多样的在线食品图像审核、治理、浏览、评估等需要。两个赛道的数据集均源自美团自建菜品图像数据集“Food2K”,蕴含 1,500 个类别和大概 800,000 张图像。其中每张图像均由不同集体,采纳不同设施,在不同环境场景下拍摄获取,是难得的能够公正评估算法鲁棒性和成果的图片数据。相比其余支流食品图像识别数据集,“Food2K”齐全人工标注,噪声比管制在 1% 以内,数据分布与实在场景相符,并构建了对立的食品划分规范体系,该体系涵盖中东方 12 大类食品上司的 2000 类食物(以披萨为例,细分为如鲜虾披萨、榴莲披萨等类别)。
食品细粒度辨认及检索技术相比于通用图像识别及检索难度更大,因为许多不同类型的食品外观看起来十分相近,而同一种类型的食品因为烹饪办法不同看起来差别较大。另外,光线、拍摄角度、拍摄背景的不同都会对算法的精度产生影响,即使是业余人员也很难疾速精确的进行分别。最终依据比赛结果及技术计划,来自欢聚时代、南京理工大学、OPPO 的参赛团队分获辨认赛道的前三名,来自深兰科技、中国科技大学以及 OPPO 的参赛团队分获检索赛道的前三名。
美团在 ICCV2021 的成绩单:2 篇论文被顶会接管、在低功耗及 ReID 畛域研讨会上论文被接管,并荣获挑战赛亚军
在本届 ICCV 大会上,美团共入选了两篇论文。别离为:
论文题目:《Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for Open-Set Semi-Supervised Learning》
摘要 :本文针对开集半监督学习场景提出了一个通用的开集半监督图像分类训练框架,通过设计一个兼容图像分类工作指标的多模态匹配机制,为后续半监督图像分类工作剔除无标注数据中的离群样本,同时应用自监督学习技术,充分利用所有的无标注数据(蕴含离群样本),以加强模型特征提取器对图像高级语义的理解能力。
论文题目:《Learn to Cluster Faces via Pairwise Classification》
摘要 :本文提出一种基于配对分类(Pairwise Classification)的疾速人脸聚类办法,能够解决大规模数据推理对内存的依赖和效率的问题,同时,为升高聚类工作离群点所导致的簇核心预计偏移的影响,提出一种基于位次加权的样本密度值(Rank-Weighted Density)计算形式,用于领导预测阶段配对的抉择,可使用基于 k 近邻中位次排序的枯燥递加函数给样本间类似度进行加权,更精确地预计簇核心,进一步提高了聚类的精度。在 MS1M、IJB- B 等公开数据集上,均获得了 SOTA 的性能。
在第五届 lpcv 低功耗视觉国内较量和 VIPriors 行人重辨认挑战赛中荣获亚军。
另外,同样在 ReID 畛域的 HTCV 研讨会上,获得最佳论文提名奖:
论文题目:《Transformer Meets Part Model: Adaptive Part Division for Person Re-Identification》
摘要 :基于部分划分的办法曾经成为了行人重辨认畛域的最支流办法,次要有两种实现形式:一是将行人划分成几个固定区域,然而行人图像不对齐会导致性能降落;二是引入额定的行人姿势预计或者行人宰割模型,然而须要更多的计算量和标注数据。受到最近 Vision Transformer 的启发,本文提出一种自适应的部分划分办法,无需额定标注,仅需极少的额定计算量,就能够主动提取不同的重要部分特色。目前该办法在 Market-1501,CUHK03、DukeMTMC ReID 和 MSMT17 四个最支流数据集上都达到了国内领先水平。
适应 AI 潮流 为数字中国建设贡献力量
美团 AI 以“帮大家吃得更好,生存更好”为外围指标,致力于在理论业务场景需要上摸索前沿人工智能技术,并将之迅速落地在理论生存服务场景中。美团视觉智能部致力于构建世界一流的视觉核心技术能力与平台服务。以后,视觉智能部技术布局已涵盖图像处理、文字辨认、视频剖析、人脸 / 人体辨认、无人驾驶视觉感知等多个畛域,在积攒了国内 / 国内当先技术成绩的同时,兼顾办法翻新与成绩转化,深度赋能批发、智慧交通、物流仓储、无人配送等业务场景。
” 十四五 ” 布局中提出 : 要坚韧不拔建设数字中国,放慢数字化倒退。在数字化浪潮席卷而来的当下,人工智能将已成为全新赛点,AI 也成为中国经济倒退的要害一环。美团也正施展人工智能技术能力,继续摸索更多的利用场景和利用空间,让更多的用户享受到科技带来的红利,为数字中国建设贡献力量。