关于大数据:技术创新再被认可Smartbi荣获2023大数据产业年度创新技术突破大奖

56次阅读

共计 1246 个字符,预计需要花费 4 分钟才能阅读完成。

近日,由金猿、数据猿、上海大数据联盟主办,上海市经济和信息化委员会、上海科学技术委员会领导的“第六届金猿季 & 魔方论坛——大数据产业倒退论坛”在上海举办。思迈特软件凭借“基于数据模型的自然语言数据查问零碎“荣获“2023 大数据产业年度翻新技术冲破”奖。

除此之外,此次由思迈特软件董事长吴华夫率领的开发团队也取得了本次大奖的荣誉认可,此份奖项不仅是对思迈特软件产品整体创新能力的认可,更是对开发团队智慧结晶与辛勤付出的高度肯定。吴华夫学生以其前瞻性的战略眼光和百折不挠的科研精力,率领开发团队一直攻坚克难,推动 NLA 技术研发与利用实际深度交融,胜利实现了从理念到产品的逾越,无力助推了商业智能与大数据分析产业的技术提高和翻新倒退。

          
基于数据模型的自然语言数据查问零碎的倒退背景是次要源于解决在经典自然语言查问利用计划中发现的痛点,这类零碎依靠于数据模型构建,其中端到端的语言模型充当中间层将用户输出的自然语言转化为 SQL 执行语句,数据库作为底层存储和数据处理的引擎,负责承受和执行从大模型发送过去的 SQL 语句,对数据进行聚合、筛选、排序等操作,满足基于数据集的查问剖析需要。

然而,这类零碎在理论落地过程中经常面临着不少挑战,比如说数据口径凌乱,用户表白歧义,尤其在解决简单关联和跨表查问时准确性受限;性能呈现瓶颈,仅依赖数据库导致查问效率低下;私域常识辨认问题在于模型不足畛域常识,难以深刻了解业务语义。

针对以上难点,Smartbi 解决思路是将以上挑战逐个拆解,通过组件叠加分阶段欠缺智能问答的架构构建:
第一,利用数据模型减少语义层,无效解决了简单数据处理中的口径不统一问题,通过简化多表关联至单表查问晋升了语义转换精确度,并使业务分析师可能灵便定义多源数据的规范语义信息。
其次,针对大数据量下的查问问题,Smartbi 采纳了 Clickhouse 作为查问引擎,并基于数据模型建模进行了指标的预聚合,并增加了数据查问的缓存库,显著晋升了数据查问响应速度。再来,针对私域常识的问题,提供了配置的同义词知识库和一个用户行为知识库。在查问过程中为语言模型提供个性化补充信息,从而加强了对私域常识的了解和解决成果,晋升了整体语言解决品质。
因而,基于数据模型的自然语言数据查问零碎通过构建层次化数据模型、集成高性能查问引擎及个性化知识库,胜利应答了业务语义在理论利用中的复杂性挑战,实现了数据口径统一到查问性能优化再到私域常识了解的全面晋升,确保了对话式剖析性能在各类业务场景中可能精确、高效地为用户提供深度洞察和决策反对。

这一成就不仅体现了 Smartbi 在 BI 畛域的深厚积攒与技术实力,也活泼诠释了 AI+BI 交融对于推动企业数字化转型及晋升数据决策效率的重要性。展望未来,随着人工智能与大数据模型等新兴科技继续重塑各行各业的生产力格局,作为国内当先的 BI 厂商,Smartbi 将持续深耕 BI 畛域,一直摸索 AI 与 BI 技术交融的可能性,致力构建翻新且实用的技术办法,为客户提供更优质的解决方案和服务。

正文完
 0