共计 1137 个字符,预计需要花费 3 分钟才能阅读完成。
近日,自然语言解决畛域权威排行榜——GLUE(通用语言了解评估基准)新排名出炉。百度自研的语义了解技术与平台文心(ERNIE)以 90.9 的分数再登榜首,当先微软 DeBERTa/TuringNLRv4,谷歌 T5 以及阿里巴巴、华为等研发的其余同类别技术。
在技术产业落地的过程中,文心也在一直发力,将最新的世界级技术冲破转化为易用的产品工具,携手 EasyDL 平台提供了一整套简略高效的 NLP 开发能力,无效晋升模型开发与利用效率。
针对用户文本信息抽取的需要,文心上线了“文本实体抽取 ”和“ 文本实体关系抽取”性能,反对从海量信息源中抽取出特定的实体,并定义实体间的关系。如抽取保险合同中的投保人、投保年限等信息,并建设两者间的关系,辅助保险经理人分析判断。
那如何疾速给数据打标签?
怎么达到高精度的模型成果?
如何从简略信息抽取到构建常识图谱?
零深度学习教训能轻松上手吗?
…
针对以上问题,3 月 25 日,百度 EasyDL-NLP 专场直播课“从技术解析到实战演练,文本信息抽取模型精讲”来袭,从数据处理到模型训练,全程 0 代码可视化操作,教你疾速把握“信息抽取”技能。
课程亮点,先睹为快!
实体抽取与实体关系抽取,高效获取常识
“文本实体抽取”作为文本开掘和信息抽取的外围工作,反对从海量信息源中抽取出特定的事实信息,是信息检索、智能问答、智能对话等人工智能利用的重要根底;“文本实体关系抽取”除了能抽取出预约义的实体类型,还能抽取出实体间的关系类型,失去蕴含语义信息的实体关系三元组,可用于构建和裁减常识图谱。例如:“王雪纯是 87 版《红楼梦》中晴雯的配音者。”能够抽取出“王雪纯 - 配音 - 红楼梦”这一组关系。
在线智能标注,节约老本
为晋升该项能力的易用性,文心还针对数据筹备难题,公布了基于 2 项工作的数据标注工具,反对在文本中间接划选进行标注,给标注人员带来极佳的标注体验和更高的标注效率。如下图所示,能够通过可视化的操作间接对指标信息进行标注,抽取金融类合同中的企业主体、注册资本,并间接建设两者间的关系。
除了上述新性能的介绍,课程还将率领大家全流程实际操作,从理解原理到定制模型,从追随操作到独立实现,疾速买通文本信息开掘的任督二脉。
百度工程师手把手教学案例实现
本次公开课,百度工程师将从创立模型、筹备数据、训练模型、校验模型、公布模型全流程进行实操演练,率领大家基于样例数据三步定制一个实体关系抽取模型。还在等什么,速速报名吧,让咱们一起见证文本智能化的神奇魅力!
工夫:3 月 25 日 20:00-21:00
报名形式 :扫描海报中的二维码,增加小助手微信,备注“NLP”,获取专属报名通道。参加课程,还有 爱奇艺 VIP 黄金会员月卡、百度大脑定制马克杯 等惊喜礼品等你拿!
更多“课程介绍”及“课程亮点”见下图!