关于数据库:TDengine在数益工联工业物联采集平台建设中的初步实践

4次阅读

共计 1634 个字符,预计需要花费 5 分钟才能阅读完成。

作者:易永耀 夏杭泰 邓炜兴

公司介绍

数益工联致力于打造基于数据流 + 价值流的离散制造业数字化软件;利用新一代的物联网技术与丰盛的现场交互伎俩,交融工业工程精益思维,为离散制造业客户的数字化降级提供从布局到施行落地的端到端工厂级解决方案;打造行业与客户的工业数据平台,继续提供数据智能服务。外围团队来自清华大学等出名院校,同时领有深厚的制造业精益经营治理能力和丰盛的数字化工厂成功经验。团队以 IE+IT 为外围能力,实现产品和技术的双轮驱动,旨在服务离散制造业客户通过数字化显著改善品质管理水平、晋升企业生产效率、升高制作老本。

业务场景

工业设施物联采集是数字化工厂建设的根底,设施在运行过程中会产生大量有价值的数据,例如:设施状态、实时工艺参数、合格报废数量、生产节奏、异样报警信息等,设施物联采集能够为后续的数据分析开掘提供最根底、通明、牢靠的数据起源。

目前咱们的客户,其设施的次要特点是:

  • 设施类型繁多,不同类设施的通信接口、采集协定、采集参数各不相同
  • 单个工厂的设施数量:几十至几千
  • 单台设施的采集参数数量:几十至几百
  • 采集频次的根本要求:每秒采集一次,反对变动上报
  • 参数类型蕴含:数值、文本

咱们对自研工业物联采集平台的定位是:可对物联数据进行采集、存储和查问,可用于单个工厂或多个工厂的设施物联采集。

须要反对的个性:

  • 性能稳固
  • 高效的数据写入
  • 高效的数据查问,包含最新数据和历史数据
  • 可云化部署
  • 可私有化部署
  • 线性扩大
  • 高可用
  • 便于连贯大数据平台

不须要反对的个性:

  • 批改 / 删除数据
  • 数据分析

技术选型

基于业务场景的需要,咱们抉择时序数据库作为物联采集平台的外围组件,并调研了几款产品:InfluxDB、OpenTSDB 和 TDengine。

  • InfluxDB:利用最宽泛,稳定性高。劣势是集群版不开源,须要付费,性能不突出。
  • OpenTSDB:基于 HBase,扩容不便。劣势是压缩比拟低,存储空间大。
  • TDengine:性能弱小,部署简略,集群版已开源,社区沉闷,国内产品。超级表的设计,与设施类型的概念完满符合,聚合查问十分不便。劣势是推出工夫较短,产品比拟年老。

比照之后,咱们最终抉择了 TDengine 这款性能出众、后劲微小的产品。通过充沛的测试和验证,能够补救劣势。

技术架构

咱们应用 TDengine 存储两类数据:

  • 原始的设施物联数据。同类设施应用同一个超级表。
  • 与业务有关联的设施物联数据,经解决后再存入。同类业务应用同一个超级表。

物联采集相干的架构如下:

工控机是设施与物联采集平台之间的重要枢纽,依据设施治理模块下发的配置,将各类设施的物联数据转化为对立的格局,加密后上报给物联采集平台。

物联采集平台接管到数据后,依据数据类型进行散发。原始数据间接存入 TDengine;局部类型的数据推送到 Kafka 或者是 RabbitMQ 中,经业务解决后再存入 TDengine。

应用体验

TDengine 的写入和查问的效率十分高,均匀在 10ms 以内,性能齐全满足咱们的要求。给人印象最粗浅的是超强的数据压缩能力,以某个客户的数据状况为例:运行一个月工夫,产生约 3.2 亿条记录的数据,每条记录蕴含约 800 列,理论占用的磁盘空间居然不到 30G。

问题解决

在应用过程中,也遇到过些许问题,例如局部数据在超级表中能够失常查问到,然而无奈通过子表查问到。

咱们分割了涛思数据的技术支持,涛思很快就协调了开发资源进行问题排查,甚至是通宵解决,最终定位到了起因:咱们通过连接池的形式连贯 TDengine,并进行较为频繁的 show tables 操作,以测试连贯是否失常,该频繁操作最终触发 TDengine 外部的异样。公布新版本后该问题失去解决,咱们也缩小了不必要的 show tables 操作。

非常感谢涛思数据的工程师,十分赤诚,及时高效地帮忙咱们解决了问题!

将来冀望

TDengine 是个年老又充满活力的产品,在工业物联畛域具备十分大的价值。

心愿涛思数据在将来能够推出更敌对的开发和运维工具,也十分心愿能在开源社区推出一个绝对稳固、兼容性较好的版本。

正文完
 0