关于人工智能:倒计时3天CSIG企业行走进合合信息大咖解密智能文档处理背后的底层技术及AI未来展望

3 月 18 日，由中国图象图形学会（CSIG）主办，合合信息、CSIG 文档图像剖析与辨认业余委员会联结承办的“CSIG 企业行”系列流动将正式举办，通过搭建学术界与企业交换单干平台，为企业翻新倒退提供科技撑持，为图像图形畛域高校师生提供与企业互动机会，集结产学研力量，独特推动图像图形畛域的倒退。此次流动以“图文智能解决与多场景利用技术瞻望”为主题，聚焦图像文档解决中的构造建模、底层视觉技术、跨媒体数据协同利用、生成式人工智能及对话式大型语言模型等热门话题，特邀来自上海交大、厦门大学、复旦、中科大的出名高校的学者与合合信息技术团队一道，以直播的模式分享文档解决实践经验及 NLP 发展趋势，探讨 ChatGPT 与文档解决将来。

嘉宾及议题介绍：

                     报告人：杨小康
                报告题目：《生成式人工智能》

报告简介：生成式人工智能通过机器学习办法从数据中学习特色，进而生成全新的、原创的数据。
据 Gartner 预测，到 2025 年，生成式人工智能产生的数据将占据人类全副数据的 10%，生成式人工智能技术正减速数字经济和元宇宙倒退。本报告首先分享团队对元宇宙和生成式人工智能发展趋势的思考，而后介绍团队在流体景象模仿推理、物理环境继续预测学习、强化学习中世界模型表征解耦、虚构数字人重建与驱动等方面的生成式人工智能初步成绩。

报告人简介：杨小康，上海交通大学人工智能研究院常务副院长，人工智能教育部重点实验室主任，长江学者、国家杰青、IEEE Fellow。次要钻研图像处理与机器学习，获国家科技进步二等奖、上海市科技进步一等奖、国家研究生教育成绩二等奖。任中国图象图形学会常务理事、上海市图象图形学会理事长。

                        报告人：纪荣嵘
            报告题目：《简单跨媒体数据协同剖析与利用》

报告简介：社交媒体蕴含了海量非单干、异构化、跨模态的数据，既蕴藏了大量的人类常识与高价值信息，也蕴含了各种天然与人为的噪声，对其剖析与解决须要交融类脑计算、计算机视觉、自然语言解决等多个维度的智能技术。本报告次要关注基于深度学习的多模态内容协同剖析与示意、跨模态信息交融及智能反抗攻防，介绍课题组在图像形容与视觉问答、语言领导的指标检测与宰割、用户隐衷爱护、社交网络分析疏导等方面的一些研究进展。

报告人简介：纪荣嵘，厦门大学南强特聘传授，科技处处长，人工智能研究院负责人，多媒体可信感知与高效计算教育部重点实验室主任。国家杰青、国家优青、中组部万人打算青年拔尖人才。长期从事计算机视觉与机器学习等人工智能畛域前沿技术钻研，近年来发表 CCF- A 类论文百余篇，谷歌学术援用 1.9 万余次，获霍英东青年科学奖及省部级一等奖 4 项。主持科技部科技翻新 2030 重大项目、军科委根底增强我的项目、国家自然科学基金联结重点、教育部配备预研翻新团队我的项目等。任 CVPR 和 ACM Multimedia 畛域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委委员，人工智能国家标准工作组联结组长。

                            演讲嘉宾：邱锡鹏
                    报告题目：《对话式大型语言模型》

报告简介：2022 年底，美国 OpenAI 公司公布了 ChatGPT，一个能够与人类对话交互的千亿规模参数的大型语言模型。它能够依据用户输出的指令实现各种语言相干的工作，例如写文章、写代码、答复问题、日常聊天等等，可能极大地提高人们的生产力，这归功于它所体现出的弱小的用意理解能力、晦涩的对话能力和丰盛的世界常识。ChatGPT 展示了研发通用人工智能助手广大的钻研和利用前景。目前，ChatGPT 的技术细节及模型参数均未开源。本报告次要介绍对话式大型语言模型的能力评测、能力演变路线剖析以及如何在上游工作中更高效利用大模型的能力。

报告人简介：邱锡鹏，复旦大学计算机学院传授，负责中国中文信息学会理事、上海市计算机学会自然语言解决专委会主任等，次要钻研方向为自然语言解决根底技术和根底模型，发表 CCF A/ B 类论文 80 余篇，被援用 1 万余次，取得 ACL 2017 卓越论文奖（CCF A 类）、CCL 2019 最佳论文奖、《中国迷信：技术迷信》2021 年度高影响力论文奖，有 5 篇论文入选 ACL/EMNLP 等会议的最有影响力论文，主持开发了开源框架 FudanNLP 和 FastNLP，已被国内外数百家单位应用，公布了 CPT、BART-Chinese、ElasticBERT 等中文预训练模型，在中文模型中下载量排名前列。曾获中国科协青年人才托举工程项目、国家优青我的项目、科技翻新 2030“新一代人工智能”重大项目课题等，2020 年获第四届上海高校青年教师教学比赛优等奖，2021 年获首届上海市计算机学会教学成果奖一等奖（第一实现人），2022 年获钱伟长中文信息处理科学技术奖一等奖（第一实现人）。造就学生多人次取得国家一级学会优博。

                            演讲嘉宾：杜俊
                报告题目：《面向图像文档的简单构造建模钻研》

报告简介：近年来，随着 OCR 技术利用的不断深入，面向图像文档中简单构造（如汉字结构，表格构造，文档总体构造等）的建模问题逐步成为钻研热点之一。本报告首先介绍团队基于偏旁部首建模的汉字生成、辨认及书写评估方面的研究进展；其次，介绍一种基于宰割 - 嵌入 - 合并框架的表格构造识别方法；最初，跟大家分享下文档构造层次化重建方面的最新进展。报告人简介：杜俊是中国科学技术大学语音及语言信息处理国家工程钻研核心副教授，2009 年 -2013 年就任于科大讯飞研究院和微软亚洲研究院，期间主导开发了语音辨认、手写辨认和 OCR 多个产品。钻研方向是语音信号处理和模式识别利用，已发表论文 200 多篇，谷歌学术援用 7200 余次，取得 2018 年 IEEE 信号处理学会最佳论文奖、2019 年获安徽省科技进步一等奖以及 2022 年 ISCSLP 国内会议最佳论文奖。目前是 IEEE 和 CCF 高级会员，并负责 IEEE 信号处理学会语音及语言解决技术委员会（SLTC）委员、亚太信号与信息处理协会（APSIPA）语音语言音频分会（SLA）技术委员会会长，曾负责语音畛域顶级期刊 IEEE-ACM TASLP 编委。率领团队加入语音和图文畛域国内评测取得 40 多项冠军。

                            演讲嘉宾：郭丰俊
                报告题目：《文档图像处理中的底层视觉技术》

报告简介：底层视觉（Low-level vision）次要钻研如何进步或复原各类场景下的图像 / 视频内容，如清晰度晋升，低质量及破损图像复原等，是计算机视觉畛域的重要钻研方向之一。其实践和办法在手机图像采集与解决，医疗图像剖析等畛域施展着至关重要的作用。底层视觉技术的缺点将会导致很多 high-level 视觉零碎（检测，辨认了解）难以作为成熟产品真正落地。本次报告，旨在分享合合信息技术团队在文档图像处理零碎中所做的底层视觉钻研工作，从底层视觉技术的间接利用及对上游工作的影响等方面，论述底层视觉技术在文档图像处理 / 辨认场景下的价值与思考。报告人简介：郭丰俊，2000 年毕业于上海交通大学，模式识别与智能零碎博士。长期从事文字辨认（包含手写 /OCR），图像处理钻研，CSIG 文档图像剖析与辨认专委会常务委员。近年来，率领团队取得过 ICDAR19 大会表格检测比赛冠军，中国图象图形学会 2021 年度科技进步二等奖等奖项，CSIG2022 中英文购物小票信息了解大赛冠军、第三届 CSIG 图像图形技术挑战赛决赛总冠军，现任合合信息图像算法研发总监。

扫码预约观看直播~