共计 1674 个字符,预计需要花费 5 分钟才能阅读完成。
CVPR 作为计算机视觉和模式识别畛域的世界级学术顶会,不仅是学者们展现前沿科技成果的学术会议,也是企业界摸索前沿利用的一大平台。近年来,随着大模型技术的爆发式倒退,基于大模型技术的翻新利用正逐渐在产业界开释出微小价值空间。作为人工智能技术畛域的领军者与深耕者,百度在大模型技术畛域领有弱小的技术劣势和深厚技术积攒,百度自主研发的产业级常识加强大模型体系文心大模型曾经建设了残缺的大模型体系 , 涵盖根底大模型、工作大模型、行业大模型等,全面满足产业利用需要。作为文心大模型的外围之一, 文心 · CV 大模型 VIMER 已广泛应用在主动驾驶、云智一体、挪动生态等外围业务。
百度召开 CVPR 首届大模型研讨会
共探大模型技术现状和将来
为了进一步推动视觉大模型技术的倒退,百度联结浙江大学、香港大学、中科院空天院在 CVPR 2023 上独特举办了首届大模型 Workshop,大模型畛域内的顶级学者和精英们独特探讨了大模型技术的最新进展和将来动向,并收录了来自百度、剑桥大学等企业 / 高校的论文。
在 6 月 19 日举办的 CVPR 2023 Foundation Model Workshop 上,来自百度的资深工程师、中科院空天院客座研究员希滕传授和百度主任架构师张刚别离进行了开幕式和闭幕式致辞。希滕传授还重点介绍了百度文心 CV 大模型及文心交通大模型。
来自华为的资深研究员谢凌曦介绍了 NLP 大模型与 CV 大模型的区别并提出了 CV 大模型将来的时机与挑战。
千支队伍逐鹿产业级大模型盛赛
产学共探技术革新之道
智能交通畛域首个多任务大模型国内较量的举办是往年 CVPR 2023 大模型研讨会的一大亮点,比赛从 Foundation Model 畛域的关键问题登程,设置了多任务大模型赛道及跨模态大模型赛道,吸引了寰球 35 个国家和地区、超过 1500 人参赛,征集到来自美团、网易、大华等公司以及清华大学、香港科技大学、华中科技大学、中科院等高校的泛滥解决方案。
近年来,智慧汽车、人工智能等产业倒退,为智能交通倒退发明了良好的倒退时机。智能交通相干技术曾经渗透到咱们的日常生活中,然而现有大模型的多任务处理模式以及传统的感知办法(如分类、检测、宰割等)无奈满足咱们对更广交通场景以及更高主动驾驶程度的追赶。百度 从以后理论技术钻研中的关键问题登程, 设置了 两大赛道:
赛道一:对立多任务大模型赛道
本赛道旨在解决多任务、多数据的合并抵触问题。对于设计精良的网络结构和损失函数,多个工作独特训练能大幅晋升模型的泛化性。因为特定工作的数据存在 noise,仅应用繁多工作的数据进行训练,存在过拟合的危险。对立多任务大模型通过将多个工作的数据整合进行对立训练,可能对不同工作的 noise 做一个均匀,进而使模型学到更好的特色。为了进一步摸索对立多任务大模型的能力下限,本赛道以交通场景典型工作为题,笼罩了分类、检测、宰割三大类 CV 工作至繁多大模型中,使得繁多大模型具备能力的同时取得当先于特定单任务模型的性能。最终 Allin one 大模型在分类、检测、宰割工作上的加权指标会作为获奖规范。
赛道二:跨模态图像检索赛道
本赛道旨在晋升文本图像检索的精度。在交通场景中高性能的图像检索能力对于交通执法、治安治理具备非常重要的作用,传统的图像检索形式通常应用先对图像进行属性辨认再通过与冀望属性的比照实现检索能力。随着多模态大模型技术的倒退,文本与图像的表征对立和模态转换已有广泛应用,应用该能力能够进一步晋升图像检索的准确性和灵活性。
研讨会上,希滕传授发表了往年 Foundation Model 国内较量的胜出队伍,最终 CTRL 队、njust 队别离取得了多任务大模型赛道及跨模态大模型赛道的冠军,并现场进行了技术计划的分享。
随着 CVPR 2023 大模型研讨会的正式闭幕,会议中探讨的利用场景正在陆续走向行业落地。百度作为人工智能技术畛域的领军者与深耕者,在修炼好 AI 技术“内功”的同时,也将一直向各行业场景输入技术能力与解决方案,进一步推动产业智能化降级倒退。
文心·CV 大模型地址
https://github.com/PaddlePaddle/VIMER