乐趣区

关于人工智能:321京东言犀×NLPCC-2022挑战赛开赛

随着互联网的高速倒退带来了信息过载问题,给人们获取和了解所须要的信息带来了阻碍。因而产生许多精髓概要式服务模式,例如罗振宇的 60 秒语音、疾速讲书、疾速讲电影等等,都是通过提炼外围信息服务受众。近年来 AI 技术获得了微小的提高,尤其是在自然语言解决的文本生成畛域,具备非常宽泛的产业化利用前景,不仅能够基于文本,还能够基于图片等多模态信息,凝练生成柔美的文案。2020 年 OpenAI 公布的 1750 亿参数的 GPT-3,其写作水平可能与人类媲美。


京东发现好货 - 西门子文案


京东发现好货 - 海蓝之谜文案

京东已在本身业务中大规模利用了文本生成技术,能够在短时间内为用户撰写精美的商品摘要文案,并依据用户爱好举荐给用户“种草”,京东言犀基于畛域预训练 K -PLUG 的商品文案生成模型曾经笼罩了京东的 3000+ 个三级品类,人工审核通过率 90% 以上,累计生成文案 30 亿字,利用于京东发现好货频道、搭配购、AI 直播带货等,商品摘要文案反映了商品最独特的差异化价值,最大限度地促成用户的购买,累计带来超过 3 亿元 GMV。此外,言犀还能够领有写诗、写春联、书法创作等多种 AI 能力。


京东发现好货 - 卧式冰箱文案

商品摘要文案的挑战次要来源于三个方面,首先,信息的起源丰盛,蕴含题目、商品规格、产品海报等信息;其次,须要解决多模态和结构化的信息,蕴含文字和图像各类信息,以及商品规格参数等结构化信息;再次,AI 零碎必须要足够智能,可能充沛开掘商品的卖点信息,并在适合的工夫,千人千面的举荐给失当的用户。

基于此,京东言犀凋谢了京东实在场景的脱敏数据,携手 NLPCC 2022 举办多模态商品摘要挑战赛。该工作旨在为一个指定商品生成一段凝练的文本摘要,给定的输出包含商品具体文本形容、商品常识图谱和商品图片。以下将介绍该工作的定义、数据集和评测办法。

退出移动版