关于人工智能:倒计时3天CSIG企业行走进合合信息大咖解密智能文档处理背后的底层技术及AI未来展望

3月18日，由中国图象图形学会（CSIG）主办，合合信息、CSIG文档图像剖析与辨认业余委员会联结承办的“CSIG企业行”系列流动将正式举办，通过搭建学术界与企业交换单干平台，为企业翻新倒退提供科技撑持，为图像图形畛域高校师生提供与企业互动机会，集结产学研力量，独特推动图像图形畛域的倒退。此次流动以“图文智能解决与多场景利用技术瞻望”为主题，聚焦图像文档解决中的构造建模、底层视觉技术、跨媒体数据协同利用、生成式人工智能及对话式大型语言模型等热门话题，特邀来自上海交大、厦门大学、复旦、中科大的出名高校的学者与合合信息技术团队一道，以直播的模式分享文档解决实践经验及NLP发展趋势，探讨ChatGPT与文档解决将来。

嘉宾及议题介绍：

                     报告人：杨小康
                报告题目：《生成式人工智能》

报告简介：生成式人工智能通过机器学习办法从数据中学习特色，进而生成全新的、原创的数据。
据Gartner预测，到2025年，生成式人工智能产生的数据将占据人类全副数据的10%，生成式人工智能技术正减速数字经济和元宇宙倒退。本报告首先分享团队对元宇宙和生成式人工智能发展趋势的思考，而后介绍团队在流体景象模仿推理、物理环境继续预测学习、强化学习中世界模型表征解耦、虚构数字人重建与驱动等方面的生成式人工智能初步成绩。

报告人简介：杨小康，上海交通大学人工智能研究院常务副院长，人工智能教育部重点实验室主任，长江学者、国家杰青、IEEE Fellow。次要钻研图像处理与机器学习，获国家科技进步二等奖、上海市科技进步一等奖、国家研究生教育成绩二等奖。任中国图象图形学会常务理事、上海市图象图形学会理事长。

                        报告人：纪荣嵘
            报告题目：《简单跨媒体数据协同剖析与利用》

报告简介：社交媒体蕴含了海量非单干、异构化、跨模态的数据，既蕴藏了大量的人类常识与高价值信息，也蕴含了各种天然与人为的噪声，对其剖析与解决须要交融类脑计算、计算机视觉、自然语言解决等多个维度的智能技术。本报告次要关注基于深度学习的多模态内容协同剖析与示意、跨模态信息交融及智能反抗攻防，介绍课题组在图像形容与视觉问答、语言领导的指标检测与宰割、用户隐衷爱护、社交网络分析疏导等方面的一些研究进展。

报告人简介：纪荣嵘，厦门大学南强特聘传授，科技处处长，人工智能研究院负责人，多媒体可信感知与高效计算教育部重点实验室主任。国家杰青、国家优青、中组部万人打算青年拔尖人才。长期从事计算机视觉与机器学习等人工智能畛域前沿技术钻研，近年来发表CCF-A类论文百余篇，谷歌学术援用1.9万余次，获霍英东青年科学奖及省部级一等奖4项。主持科技部科技翻新2030重大项目、军科委根底增强我的项目、国家自然科学基金联结重点、教育部配备预研翻新团队我的项目等。任CVPR和ACM Multimedia畛域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委委员，人工智能国家标准工作组联结组长。

                            演讲嘉宾：邱锡鹏
                    报告题目：《对话式大型语言模型》

报告简介：2022年底，美国OpenAI公司公布了ChatGPT，一个能够与人类对话交互的千亿规模参数的大型语言模型。它能够依据用户输出的指令实现各种语言相干的工作，例如写文章、写代码、答复问题、日常聊天等等，可能极大地提高人们的生产力，这归功于它所体现出的弱小的用意理解能力、晦涩的对话能力和丰盛的世界常识。ChatGPT展示了研发通用人工智能助手广大的钻研和利用前景。目前，ChatGPT的技术细节及模型参数均未开源。本报告次要介绍对话式大型语言模型的能力评测、能力演变路线剖析以及如何在上游工作中更高效利用大模型的能力。

报告人简介：邱锡鹏，复旦大学计算机学院传授，负责中国中文信息学会理事、上海市计算机学会自然语言解决专委会主任等，次要钻研方向为自然语言解决根底技术和根底模型，发表CCF A/B类论文80余篇，被援用1万余次，取得ACL 2017卓越论文奖（CCF A类）、CCL 2019最佳论文奖、《中国迷信：技术迷信》2021年度高影响力论文奖，有5篇论文入选ACL/EMNLP等会议的最有影响力论文，主持开发了开源框架FudanNLP和FastNLP，已被国内外数百家单位应用，公布了CPT、BART-Chinese、ElasticBERT等中文预训练模型，在中文模型中下载量排名前列。曾获中国科协青年人才托举工程项目、国家优青我的项目、科技翻新2030“新一代人工智能”重大项目课题等，2020年获第四届上海高校青年教师教学比赛优等奖，2021年获首届上海市计算机学会教学成果奖一等奖（第一实现人），2022年获钱伟长中文信息处理科学技术奖一等奖（第一实现人）。造就学生多人次取得国家一级学会优博。

                            演讲嘉宾：杜俊
                报告题目：《面向图像文档的简单构造建模钻研》

报告简介：近年来，随着OCR技术利用的不断深入，面向图像文档中简单构造（如汉字结构，表格构造，文档总体构造等）的建模问题逐步成为钻研热点之一。本报告首先介绍团队基于偏旁部首建模的汉字生成、辨认及书写评估方面的研究进展；其次，介绍一种基于宰割-嵌入-合并框架的表格构造识别方法；最初，跟大家分享下文档构造层次化重建方面的最新进展。报告人简介：杜俊是中国科学技术大学语音及语言信息处理国家工程钻研核心副教授，2009年-2013年就任于科大讯飞研究院和微软亚洲研究院，期间主导开发了语音辨认、手写辨认和OCR多个产品。钻研方向是语音信号处理和模式识别利用，已发表论文200多篇，谷歌学术援用7200余次，取得2018年IEEE信号处理学会最佳论文奖、2019年获安徽省科技进步一等奖以及2022年ISCSLP国内会议最佳论文奖。目前是IEEE和CCF高级会员，并负责IEEE信号处理学会语音及语言解决技术委员会（SLTC）委员、亚太信号与信息处理协会（APSIPA）语音语言音频分会（SLA）技术委员会会长，曾负责语音畛域顶级期刊IEEE-ACM TASLP编委。率领团队加入语音和图文畛域国内评测取得40多项冠军。

                            演讲嘉宾：郭丰俊
                报告题目：《文档图像处理中的底层视觉技术》

报告简介：底层视觉（Low-level vision）次要钻研如何进步或复原各类场景下的图像/视频内容，如清晰度晋升，低质量及破损图像复原等，是计算机视觉畛域的重要钻研方向之一。其实践和办法在手机图像采集与解决，医疗图像剖析等畛域施展着至关重要的作用。底层视觉技术的缺点将会导致很多high-level视觉零碎（检测，辨认了解）难以作为成熟产品真正落地。本次报告，旨在分享合合信息技术团队在文档图像处理零碎中所做的底层视觉钻研工作，从底层视觉技术的间接利用及对上游工作的影响等方面，论述底层视觉技术在文档图像处理/辨认场景下的价值与思考。报告人简介：郭丰俊，2000 年毕业于上海交通大学，模式识别与智能零碎博士。长期从事文字辨认（包含手写/OCR），图像处理钻研，CSIG文档图像剖析与辨认专委会常务委员。近年来，率领团队取得过ICDAR19大会表格检测比赛冠军，中国图象图形学会2021年度科技进步二等奖等奖项，CSIG2022中英文购物小票信息了解大赛冠军、第三届CSIG图像图形技术挑战赛决赛总冠军，现任合合信息图像算法研发总监。

扫码预约观看直播~

关于人工智能:倒计时3天CSIG企业行走进合合信息大咖解密智能文档处理背后的底层技术及AI未来展望

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于人工智能:倒计时3天CSIG企业行走进合合信息大咖解密智能文档处理背后的底层技术及AI未来展望

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复