关于数据库:在数睿数据nextionBI线上发布会上传统企业展示了对数据分析的深度理解

47次阅读

共计 2942 个字符,预计需要花费 8 分钟才能阅读完成。

2022 年 2 月 25 日,数睿数据正式公布下一代专一常识的 BI 产品——nextionBI,启动了本人“无代码 +BI”的双产品策略布局。数睿数据总裁刘超总结,以后的 BI 产品过于依赖业余人员,但从根本上看是因为对于机器、常识和环境的依赖。外表上是 BI 产品须要业余的人去治理机器产生的脏数据,去梳理业余畛域的常识,去实现常识在零碎间的迁徙。但实质是 BI 产品要求机器须要产出规范对立、质量上乘的根底数据,要求有大量能够间接录零碎的行业常识,要求有一个对立的外部环境供常识在零碎间自在分享。过渡的依赖外部环境,反而限度的 BI 产品本身的倒退。下一代 BI 应该专一于从外部登程,被动去解决这些依赖,倒退常识积攒能力,被动优化交融现有数据资产,倒退常识发现能力,可能疾速总结演绎行业常识,倒退常识流传能力,可能便捷打包成绩对外输入。

而早在之前,传统行业也发现了现有的 BI 产品只能帮忙他们看清当初,但无奈看到将来,没有方法对发现的异样,从根本上给出措施倡议开始摸索通过新的视角从新扫视业务痼疾,寻求解决之道。

nextionBI 也在发布会上分享了和一些传统企业共谋数字化解决方案的实在故事,这些企业试图解决所在行业的共性问题,基于传统伎俩曾经很难获得显著的冲破。而通过与数睿数据这样的数字科技企业的单干,摸索问题的另一种解法,将逐步成为所在行业技术创新的支流。

发布会上首先分享的是一家纸资料生产制作企业,次要生产白卡纸。白卡纸属于工业用纸,采纳 100% 漂白化学制浆抄制,具备坚挺厚实、平滑度高的特点,个别定量在 210g-400g/㎡。白卡纸的产品类型次要分为纸盒、卡纸、纸袋,别离占比 60%、20%、10%;上游次要利用于各类精密产品包装,如烟酒、化妆品、日用品、药品、食品、3C 等日常生产产品包装。白卡纸的上游利用以必须消费品包装为主,终端需要继续稳定增长。

从中国造纸协会公布的《中国造纸工业 2020 年度报告》中数据来看,2020 年包装用纸生产量 705 万吨,较上年增长 1.44%;消费量 718 万吨,较上年增长 2.72%,是 2020 年纸产品中多数生产增长高于产量增长的品类。

白卡纸以后已出现寡头垄断格局,以金光纸业、博汇纸业、晨鸣纸业、万国太阳为代表的寡头共计产能占比高达 79%。金光、博汇和晨鸣的白卡纸年产能均达到 200 万吨以上,其中,金光纸业旗下的白卡纸生产企业包含亚洲浆纸业(150 万吨 / 年)、广西金桂(100 万吨 / 年)、宁波中华(62 万吨 / 年),散布在浙江、广西等地;博汇纸业的白卡纸生产规模仅次于金光,产能次要散布在山东和江苏,共计年产能 215 万吨 / 年;晨鸣的产能次要散布在广东、山东、江西等地,共计年产能 200 万吨 / 年。

会上分享的企业作为现有的寡头之一,心愿在良好的市场环境下,放弃现有的竞争劣势,除了营销工作之外,产品质量的稳定性是一个重要的根底。对于白卡纸来说,纸张的克重是掂量产品质量的重要指标。每个批次的纸张克重偏差越小,产品的品质稳定度也就越高。

但该企业的研发部门统计数据之后发现,目前白卡纸产品存在克重偏差较大的品质稳定性问题。因为克重不稳固,为了保障整体良品率,就不得不减少每个批次生产过程中的原料应用,从而保障即便偏差较大,但少数产品仍可能满足品质要求。但这样做显然会进步企业的生产成本,且整体的产品质量参差不齐,极大的侵害了产品口碑,优化生产过程迫不及待。

在接触 nextionBI 之前,该企业也早就开始针对这一问题摸索解决方案,然而遇到几个事实的艰难。首先,造纸过程相干的数据量极大,品种繁多。有的来自于自动化设施,有的来自于软件系统,有的靠人员手工记录,还有局部非结构化数据。这其中还蕴含大量的脏数据,存在诸如规范不对立、空值比例高、数据乱码等问题。在数据分析之前须要先实现简单的数据荡涤、数据标准化、数据关联等工作。企业研发部的人员尽管理解纸张生产数据的正确格局、晓得不同字段的规范度量、可能将编码代号翻译成文本,然而他们大多不懂 SQL 语句,无奈实现批量的数据加工解决工作。其次,通过资料研发人员对于大量历史数据的整顿,生产制作过程中影响纸张克重的因素超过 140 种。然而具体是哪个因素对于克重有影响,是正相干还是负相关,这都须要一一测试。依照控制变量法的实践要求,至多要测试 140 次,每次都须要设计试验,调整参数,统计后果,这显然不具备可操作性。最初,难以定位影响因素对最终品质的影响值,不晓得如何进行优化,针对某个因素具体优化值是多少?明确相关性只是第一步,下一步须要明确是线性相关还是指数相干,要有具体的相干函数能力造成量化可落地的操作倡议。

对于数字化生产,企业认为不能简略的只是通过大屏展现生产后果数据现状,而后靠老师傅的教训决定优化形式,再通过一段时间的数据反馈判断优化成果,这种模式周期长,危险高。正当的形式应该是基于生产过程的数据分析,给出精准的操作倡议,再通过生产测试进行验证,敲定生产优化措施。这就须要用到 nextionBI 的数据交融能力与加强剖析中的主因子分析和根因定位能力。

针对第一个痛点,nextionBI 对接生产数据,通过弱小的数据交换机能力,实现简单的数据处理流程,实现接入数据的荡涤加工,排除异样数据对于剖析后果的影响。这个过程不必写任何技术代码,一个纸资料的研发人员通过简略的培训,本人就能够通过拖拽数据加工算子的形式,配置加工流程,实现大量原始数据的加工解决。如上图所示是将三个来自不同零碎的数据表通过加工解决,最终交融造成了一个数据资产。整个过程清晰可见,每个步骤对应的模块都能够动静调整,大大晋升了数据处理过程的灵便度。这样就解决了数据分析根底素材的问题,为后续的剖析打好了根底。

针对第二个痛点,利用 nextionBI 加强剖析中的主因子分析能力,帮忙客户从 140 多个影响因子中,疾速定位影响纸张克重的次要影响因子,并提供主因子对后果的影响剖析,并提供每个因子的影响值剖析。如上图所示,影响因子的影响值排名从高到低别离显示的是 2 号浆液流量、车速、1 号浆液流量、冲浆流量这四个因子,并且给出了具体的影响值,这就为下一步的剖析工作提供了量化的参考根据。
针对第三个痛点,采纳根因剖析,通过根因定位剖析能力,对影响纸张克重的可能进行根因组合,列出组合排名。提取主因子,将每种组合的具体值列出,提供系数调整优化值倡议,间接提供量化的领导。

如上图中所示,为不同因子调配不同的参数抉择,造成多种组合。针对不同的组合分析其可能性的占比。比方图中的组合三就代表了 2 号纸浆流量小于等于 14.25,1 号纸浆流量小于等于 32.05,车速小于 33.156 这种参数组合模式,然而这种组合形式相较于组合一的可能性占比是偏低的,为了达到优化指标,最终应该抉择组合一对应的参数设计。基于这些剖析,进行了屡次试验,研发部门给出了具体操作倡议,帮忙生产部门疾速改善生产过程,稳固生产品质。

企业依照筹备数据,确定方向,量化措施的过程,一步一步井井有条的实现之前始终困扰他们的产品质量稳定性问题。nextionBI 作为新公布的下一代 BI 的代表,其弱小的数据交融解决能力、加强剖析能力都很好地帮忙企业实现了这次优化生产过程的指标。下一代 BI 的新能力,给企业提供了解决问题的新伎俩和方向。

正文完
 0