关于图像检索:大厂技术实现-图像检索及其在高德的应用-计算机视觉系列
作者:韩信子@ShowMeAI,章鱼@高德 大厂解决方案系列教程:https://www.showmeai.tech/tutorials/50 本文地址:https://www.showmeai.tech/article-detail/93 申明:版权所有,转载请分割平台与作者并注明出处 珍藏 ShowMeAI 查看更多精彩内容一图看懂全文 ShowMeAI社区的技术专家小伙伴们对图像检索的典型算法做了实现,构建了相干利用 『基于CNN与三元组的图像检索实现』,对细节感兴趣的话,请返回 这里 查看实现代码参考。代码的整顿破费了很多心理,欢送大家 PR 和 Star! ⭐ ShowMeAI官网GitHub:https://github.com/ShowMeAI-Hub/ 一、高德图像检索的业务背景本文利用到的技术是图像检索,利用场景为高德地图,利用点是高德地图的 POI信息更新(在高德图像数据中,POI牌匾和POI一一对应)。 POI:Point of Interest,在电子地图上,POI 代表餐厅、超市、政府机关、旅游景点、交通设施等。POI是电子地图的外围数据。 POI 数据蕴含的名称信息、地位信息等,能满足用户的根本需要——应用电子地图“查找目的地”,进而唤起导航服务。POI 数据能够反对电子地图提供“搜寻左近”、“点评”等性能,这些操作能够进步用户的应用和沉闷时长。POI 数据还是线上线下连贯互动的一个纽带,是基于位置服务(Location Based Service)产业的一个重要组件。 高德地图的业务场景,须要依据自有图像源,将每个新增或调整的 POI及时制作成数据。 一般来讲,短时间片(月度)内,同一地点的 POI 的变动量很低(如图,只有“汤火功夫”POI 是一个新增的挂牌)。因而,从技术实现的角度来看,不能采纳『每次都解决全副 POI 』的计划,因为作业老本太高了。更好的实现计划是,将没有变动的 POI 自动化地过滤掉。这个场景工作是十分典型的图像检索工作,其中关键技术图像匹配。1.1 图像检索的工作定义图像检索问题定义:给定查问图像(Query),通过剖析视觉内容,在大型图像库中(Gallery)中搜寻出类似的图像。图像检索始终是计算机视觉畛域的一个长期研究课题,在『行人重辨认』、『人脸识别』、『视觉定位』等工作中均有宽泛的利用。 图像检索的过程须要『图像特色抽取』+『比对检索』两个环节: 1)图像特征提取通常包含:全局特色、部分特色、辅助特色等,次要是针对不同工作特点进行相应的优化。例如:行人重辨认以及人脸识别具备很强的刚性束缚,并且具备显著的要害特色(行人/人脸关键点),因而会将人体宰割或关键点检测信息交融到模型特征提取中。 2)比对检索核心技术是度量学习,其指标是在固定维度的特色空间中,束缚模型将同类别样本拉近,不同类别样本推远。在深度学习时代,次要有几种经典的构造,均是通过正负样本定义以及损失函数设计上进行优化: 比照损失(Contractive Loss)三元组损失(Triplet Loss)核心损失(Center Loss)1.2 高德业务问题与难点POI 牌匾的图像检索和学术上支流检索工作(如行人重辨认)有着较大的区别,次要包含以下几点: 异质数据遮挡影响文本依赖性1)异质数据异质数据指的是不同相机拍摄、不同环境、不同条件下的图像差别。比方,在 POI 牌匾检索场景中,有比较严重的异质数据问题。如下图所示,是不同拍摄条件下的异源图像。 因为拍摄相机的品质、拍摄视角的不同,POI 牌匾最终的亮度、形态、清晰度等都存在十分大的差别。如何在差别较大的异质数据中实现 POI 牌匾检索,则是一个十分具备挑战性的问题。 2)遮挡影响在路线场景中,常常存在树木以及车辆等烦扰信息,并且因为拍摄视角起因,拍摄到的 POI 牌匾常常会面临重大的遮挡问题。遮挡给 POI 牌匾检索带来微小的挑战。 3)文本依赖性POI 牌匾还有一个独有个性就是对文本强依赖,次要是对 POI 名称文本的依赖。 ...