美团作为全球最大的本地生活服务平台,拥有由遍布全国的市场人员所拍摄的众多门脸招牌图片数据。每张图片都是由全国的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同目标,是难得的可以公正评价算法鲁棒性和识别效果的图片数据,挑战也非常大。
近年来业界围绕着文字检测和文字识别提出了许多有效的算法和技术方案。由于之前公开的数据集普遍以英文为主,因此所提出的技术方案对中文特有问题关注不足。表现在以中文为主的实际应用场景中,这些技术方案的结果与应用预期差距较大。以美团掌握的某典型中文图片数据为例,在 6000 张图的图片数据集上(已去除文字无法辨识的图片),测试了国内最知名的三个 AI 开放平台,按字段统计识别率分别是 94%,91% 和 86%,经过努力我们也只达到 98%。中文 OCR 在实际应用场景的表现并不乐观。
在此次 ICDAR2019 上,我们挑选出很能代表中文特点的餐饮商家的门脸招牌图片来组织竞赛,这些招牌上的文字存在中文特有的设计和排版,同时也兼有自然场景文字识别中普遍存在的拍照角度、光照变化等干扰因素。我们希望通过竞赛引起同行们对中文识别的关注,群策群力解决中文识别的实际问题。
会议与大赛介绍
国际文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会 (IAPR) 组织的专业会议之一,专注于文本领域的识别与应用。ICDAR 大会每两年举办一次,目前已发展成文字识别领域的旗舰学术会议。为了提高自然场景的文本检测和识别水平,国际文档分析和识别会议(ICDAR)于 2003 年设立了鲁棒文本阅读竞赛(“Robust Reading Competitions”)。至今已有来自 89 个国家的 3500 多支队伍参与。
ICDAR 2019 将于今年 9 月 20-25 日在澳大利亚悉尼举办。美团今年联合国内外知名科研机构和学者,提出了 ” 中文门脸招牌文字识别 ” 比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。
组织者
王栋、张睿、刘曦、周永生,美团
白翔、廖明辉、杨明锟,华中科技大学
Baoguang Shi, Microsoft (Redmond,USA)
Shijian Lu, Nanyang Technological University (Singapore)
Dimosthenis Karatzas,Computer Vision Centre,UAB(Spain)
C. V. Jawahar,IIIT Hyderabad(India)
数据集介绍
美团本次公开的数据,由遍布全国的市场人员所拍摄的众多门脸招牌图片组成,共 25000 张。每张图片是由完全独立的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同商家。该数据集以中文文字为主,也包含一定数量的英文和数字,英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本。是难得的用于研发和评估中文识别技术的数据集。其中,20000 张图片用于训练,2000 张用于验证,3000 张用于测试。
比赛内容
本次门脸招牌识别,共定义了 4 个任务,分别如下:
TASK 1:招牌端到端文字识别
TASK 2:招牌文字行定位
TASK 3:招牌区域内单字识别
TASK 4:招牌区域内字符串识别
奖励方式
颁发奖状:按照最终成绩进行排名,以从高至低顺序依次选取前三名,颁发奖状。比赛奖金:从高至低顺序选取前三名参赛方为学校及科研院所等非盈利机构。奖金详细如下:
重要日期
2019 年 3 月 1 日:报名通道开放
2019 年 3 月 18 日:训练数据集开放
2019 年 4 月 15 日:测试数据集分批开放
2019 年 4 月 16 日:提交通道开放
2019 年 4 月 30 日:提交截止日期
2019 年 5 月 10 日:比赛最终报告提交
2019 年 9 月 20 日:ICDAR 2019 大会召开
参赛报名
扫描下方二维码,直接进入报名链接报名。
报名链接地址:http://rrc.cvc.uab.es/?ch=12 报名链接二维码:
参赛答疑与交流
参赛答疑邮箱:mtdptech@meituan.com(邮件标题请注明“ICDAR2019”)加入参赛交流微信群
步骤 1:微信添加“MTDPtech02”为好友(昵称:美美),或扫描下方二维码直接添加:
步骤 2:回复美美“ICDAR2019”,则会自动将您加入 ICDAR2019-ReCTS 技术交流群