关于人工智能:火爆-GitHub这个图像分割神器开源了

51次阅读

共计 2998 个字符,预计需要花费 8 分钟才能阅读完成。

最近寰球各大新权势造车公司几乎不能再火!小编看着蹭蹭飙升的股价切实是眼红的不要不要的。而懂行的人都晓得,以特斯拉为首,各大公司都采纳计算机视觉作为主动驾驶的技术底座,而其中正是通过图像宰割技术,汽车能力分分明哪里是路,哪里是人。

那图像宰割重不重要还须要我强调么?而明天我要给大家介绍的这个开源套件,就涵盖业界最前沿的图像宰割算法,并成果超群,这就是 PaddleSeg!!OMG,还在等什么?!盘他!盘他!盘他!

在如期举行的寰球计算机视觉顶会 CVPR2021 上,PaddleSeg 再次绽开高光。其中 AutoNUE 挑战赛是近年来主动驾驶场景了解畛域极具影响力的一场赛事,十分考验参赛者在非结构化环境中的语义宰割算法能力。百度 PaddleSeg 团队最终击败其余参赛队伍,在 Level 1,Level 2,Level 3 三项测试指标上均以第一名的问题摘获冠军。

焦急的小伙伴能够间接去看较量详情:

https://bj.bcebos.com/paddles…

那么 PaddleSeg 到底是个啥呢?小编去 GitHub 下来扒了一下官网的解释:

PaddleSeg 是基于飞桨开发的端到端图像宰割开发套件,涵盖了高精度和轻量级等不同方向的大量高质量宰割模型。通过模块化的设计,帮忙开发者实现从训练到部署的全流程图像宰割利用。上面就给大家讲讲 PaddleSeg 的特点和近期更新的内容:

  • 全新降级了人像宰割性能,提供了 web 端超轻量模型部署计划;
  • 推出了精细化的宰割解决方案 PaddleSeg-Matting;
  • 开源了全景宰割算法 Panoptic-DeepLab,丰盛了模型品种;
  • 公布了交互式宰割的智能标注工具 EISeg。极大的晋升了标注效率。

Web 视频会议

Matting

全景宰割

交互式宰割

提供了产业级的部署形式。现在又减少了这么多的新性能。能够说 PaddleSeg 曾经能够全方位、立体式地满足开发者各个维度的需要。不得不大说一声:、

这么好的产品,还不快上车?

上车地址:
https://github.com/PaddlePadd…

产业级人像宰割计划 PPSeg

人像宰割是图像宰割畛域十分常见的利用,在理论利用过程中人像的数据集起源多种多样,数据可能来源于手机、相机、监控等,图片尺寸可能是横屏、竖屏或者方屏。部署场景多种多样,有的利用在服务器端,有的利用在挪动端,还有的利用在网页端。为此 PaddleSeg 团队推出了在大规模人像数据上训练的人像宰割 PPSeg 模型,满足在服务端、挪动端、Web 端(Paddle.js)多种应用场景的需要。

PPSeg 模型在产业中失去了宽泛的利用。近期“百度视频会议”也上线了虚构背景性能,反对用户在视频会议时进行背景切换。其中人像换背景模型采纳 PaddleSeg 团队开发的 PPSeg 系列模型中的超轻量级模型。通过 Padddle.js 实现了在 web 端部署,间接利用浏览器的算力进行图像宰割,宰割成果受到统一好评。

产业级解决方案详解:
https://github.com/PaddlePadd…

小伙伴们也可前去百度首页体验百度视频会议,直观体验一下 PaddleSeg 和 Paddle.js 为大家提供的人像宰割性能。

精细化的宰割解决方案 PaddleSeg-Matting

随着宰割技术的倒退,人们对宰割的精细化的要求也越来越高。比方在一些影视行业,绿幕作为拍摄的换背景罕用的工作,但指标不在绿幕前拍摄,是否还能达到很好的背景宰割性能呢?

答案是:能!

最近 PaddleSeg 团队开源的精细化宰割解决方案 PaddleSeg-Matting 就很好的解决了这个问题。将指标的发丝实现了精准的宰割。

PaddleSeg 通过内建 trimap 生成机制实现 alpha 预测,无需任何辅助信息的输出即可实现预测,极大缩小了人工成本。通过共享 encoder 权重缩小网络的参数量,并在 decoder 阶段利用 attention module 实现 trimap 信息流对 alpha 预测的领导。而后利用 error map 提取错估区域的 patch,通过 refinement 子网络进行 refine 失去最终的 alpha。

交互式宰割智能标注工具

业界对于人工智能有这么一句话:“深度学习有多智能、背地就有多少人工”。这句话间接说出了深度学习从业者心中的痛处,毕竟模型的好坏数据占据着很大的因素,然而数据的标注老本却让很多从业的小伙伴们感到头疼。

为此 PaddleSeg 团队重磅推出的交互式宰割智能标注软件 EISeg 那具体什么是交互式宰割呢?通过上面的动态图来理解一下。

不难发现,交互式宰割通过一系列的绿色点(晚点)和红色点(负点)实现了对指标对象的边缘宰割,交互式宰割次要的利用方向是图像编辑和半自动标注,能够利用于精细化标注,抠图,辅助图像前期解决(例如 PS)等场景。

PaddleSeg 团队联结 PaddleCV-SIG 成员基于 RITM 算法,推出了业界首个高性能的交互式宰割工具 EISeg,咱们反对对 RITM 模型的训练、预测及交互的全流程。PaddleSeg 交互式宰割模型不仅仅反对从头训练弱小的通用场景模型,还反对对特定场景数据进行 Finetune。咱们利用百度自建人像数据集对模型 Finetune,失去预测速度快,精度高,交互点少的人像交互式宰割模型。

软件提供多种装置形式,反对用户应用 pip 和 conda 装置,另外 windows 下提供了可执行的 exe 文件,双击.exe 即可运行程序。

全景宰割 Panoptic-DeepLab

全景宰割是图像宰割畛域在近年来衰亡的一个新畛域,由 FAIR 与海德堡大学在 2018 年首次提出。

什么是全景宰割呢?

图像的信息能够分为 thing 和 stuff,其中 thing 示意可数对象,例如车、动物等等,stuff 示意不可数对象,例如沙滩、天空等等。语义宰割工作不关注图像中的是 stuff 还是 thing,只关注每个像素所属的语义类别,因而无奈实现实例对象的辨别。而实例宰割关注的是 thing 的宰割,将图像中的 thing 辨认进去,辨别出不同的实例个体以及相应的语义信息,对于 stuff 区域,则对立示意为背景。全景宰割是交融了语义宰割和实例宰割的技术,对于 thing,辨认出不同的实例个体以及对应的语义信息,对于 stuff,辨认出对应的语义信息。

Panoptic DeepLab 首次以 bottem-up 和 single-shot 算法模式达到 state-of-the-art 性能,相比于 top-down 算法 Panoptic DeepLab 以简略的网络结构实现了精度、速度双超过,创始了全景宰割算法新方向,目前 Cityscape 全景宰割榜首即基于该算法。

PaddleSeg 全貌

全明星算法阵容
20+ 全面当先同类框架的高精度语义宰割算法,50+ 预训练模型新增全景宰割算法,丰盛了利用场景。提供了高精度的人像宰割算法 HumanSeg,满足多端部署。

全产业链部署
不仅全面反对动态图开发,能够顺畅的实现动静转化;还从数据预处理、算法训练调优、压缩、多端部署等全流程、各环节顺畅买通,极大水平地晋升了用户开发的易用性,减速了算法产业利用落地的速度。尤其是通过 Paddle.js 反对在 web 端部署,赋予了网页端部署的更多可能性。

你还在等什么?!如此用心研发的高水准产品,还不连忙 Star 珍藏上车!

传送门:https://github.com/PaddlePadd…

正文完
 0