关于人工智能:曼孚科技揭开计算机视觉的神秘面纱物体检测技术

28次阅读

共计 1506 个字符,预计需要花费 4 分钟才能阅读完成。

计算机视觉是以后人工智能最热门的畛域之一,在其疾速倒退中,物体检测倒退施展了关键作用。本文旨在详解物体检测基本概念、衍生技术及其社会化利用,揭开计算机视觉的神秘面纱,深刻理解人工智能的独特魅力。

什么是物体检测?

简略来说,在图像中锁定目标便是物体检测。

物体检测是一种图像分类技术,该技术不仅能对图像内物体进行分类,也能够从天然图像中的大量类别中辨认出指标实例的地位,即指标定位。

物体检测通过对指标四周绘制边界框,帮忙机器在给定场景中辨认分类。

物体检测与图像识别 :同为计算机视觉技术的典型,物体检测与图像识别都在围绕图像中的指标辨认开展。

值得注意的是,图像识别通过分类器提取重要特色,排除多余信息来实现图像分类,该技术无奈实现指标定位。

图像识别技术的过程包含以下几步:信息的获取、预处理、特色抽取和抉择、分类器设计和分类决策。

物体检测与图像宰割 :如果按难易度排名——图像识别 < 物体检测 < 图像宰割。

图像宰割是从像素级别了解图像,实现指标辨认。

与物体检测不同,图像宰割并没有独自分类性能,但会沿着指标轮廓精准标注进去,这一点物体检测的矩形框无奈达成。

物体检测局限性

指标品种与数量的局限性 。以路线图像为例,指标检测须要对路线上的行人、车辆 (机动车与非机动车)、红绿灯、绿化带、路标等各种物体进行辨认。而检测品种过多,会减少机器辨认复杂度。

指标尺度的问题 。同一张图像会呈现指标十分大与十分小的景象,遇到十分小的指标如密集的极小人脸识别时,会存在漏检或误检景象,升高检测准确度。

外在环境的影响 。计算机视觉易受外界环境影响,如光照变动、遮挡物、图片清晰度以及动静物体都会加大指标检测的难度。

物体检测工作原理

现阶段物体检测算法次要分为两大类:One-Stage 与 Two-Stage。

原理简述 :One-Stage 利用卷积神经网络提取特色,预测指标的分类与定位。Two-Stage 需学生成候选区域 (Region Proposal),再通过卷积神经网络预测指标的分类与定位。

特点剖析 :One-Stage 速度快于 Two-Stage,精度较低,小物体的检测成果不好。Two-Stage 精度高,但速度慢,训练工夫长且误报绝对高。

次要算法 :One-Stage 次要利用 YOLO 系列 (v1-v5),SSD 系列 (R-SSD、DSSD、FSSD 等),Retina-Net,DetectNet,SqueezeDet。Two-Stage 次要利用 R -CNN 系列 (Fast-RCNN、Faster-RCNN、Mask-RCNN),SPPNet,R-FCN 等。

物体检测社会化利用

物体检测可能搜寻特定指标品种,目前该技术已被利用至社会方方面面,常见场景如下:

人脸识别 :基于面部特色进行身份辨认的生物技术,人脸识别可对情绪或表情进行分类,并将生成的矩形框提供给图像检索系统,以辨认群体中的特定人。

主动驾驶 :主动驾驶汽车应用物体检测辨认路线上的行人、其余汽车与障碍物,以便平安出行。装备激光雷达的主动驾驶汽车也会应用 3D 对象检测。

医疗手术 :在手术过程中从窥镜内获取的视频数据十分嘈杂,物体检测可帮忙医生发现难以看到的部位,如须要外科医生立刻关注的息肉或器官病变,此外它还能够检测手术的状态,及时揭示医生。

OCR 文本辨认 :文本辨认是指通过输出文字图片,而后解码文字的办法。精确来说,文字辨认由物体检测与宰割相结合,是目前利用最宽泛的视觉技术,如二维码、车牌辨认、物品包装质检等。

行人检测:作为机器人、视频监控与车辆辅助驾驶零碎最重要的计算机视觉工作之一,行人检测利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪,行人重辨认等技术联合。

正文完
 0