关于大数据:Python-太难懂火山引擎数智平台这款产品可以了解一下

3次阅读

共计 1412 个字符,预计需要花费 4 分钟才能阅读完成。

「自学 Python?个别人我还是劝你算了吧!」
在国内常识分享平台「知乎」上,这一吐槽话题取得了超过 2600 次点赞,引发近 600 条探讨。

从该话题下的高赞探讨来看,少数人对 Python 的应用性都持必定态度,但在门槛上却褒贬不一,有人认为 Python 可能让新人很快入门,从而在初始阶段就取得成就感,晋升趣味度;而有人则保持久远倒退观点,认为 Python 在语法上暗藏了大量概念,比方类型、多态利用原理等,如果基本功不扎实,即使是老手入了门,也难以进一步深刻。

作为目前被宽泛应用的解释型编程语言,Python 凭借多种弱小的算法和模型,和数据灵便整合剖析与建模等性能,近年来风头一时无两。依据 2021 年 TIOBE 编程语言社区的排名数据,Python 以市场占比 12.90% 排名第一位,市场占比回升 0.69%;从 Python 市场占比的历史趋势来看,从 2014 年开始,Python 市场占比就开始逐年走高,至 2022 年,Python 市场占比达到历史最高峰。

但另一方面,Python 在应用过程中始终存在门槛问题,这导致企业内除算法工程师之外的员工,很难深度利用。

个别状况下,企业数据的采集、治理、剖析、利用往往都在平安权限的管控下有着既定流转链路,各环节对应不同岗位员工的工作要则,但不同岗位工作交接的过程中,却偶有呈现能力“断点”。

如,数据开发个别会提供宽表来应答火线业务的需要,但在局部状况下须要将数据做行列转换,能力对数据进行更进一步剖析,而这项操作能力对一般业务岗位员工来说,是一道“拦路虎”;即使是置身这一环节“专业对口”的算法工程师,也仍旧面临着另一个问题:目前市场上短少能够将长期生产好的数据与可视化图表联动的产品,但这凑巧又是数据能被后链路环节高效利用的要害。

针对将数据挖掘与可视化图表联动,以及升高非算法工程师岗位对数据挖掘需要的了解门槛,火山引擎数智平台 VeDI 旗下数智洞察 DataWind,近期推出了降级性能:可视化建模。

这项新性能封装了超过 30 类常见的 AI 算子能力,用户仅需理解算法的作用,就能够通过配置化的形式配置算法算子的输出和训练指标,实现模型训练,并依据配置的其余数据内容疾速失去预测后果。

过来,简单算法模型往往须要通过 Python 才得以实现,但当初通过 DataWind 同样可能实现搭建。

以电商企业场景为例,当员工须要依据现有数据构建「用户回购模型」时,思考整个过程须要通过数据荡涤、格局转换之后采纳梯度晋升树构建,外围波及的环节包含合并行、缺失值替换、one-hot 编码、梯度晋升树、聚合、提取字段总共 6 个,因而通过 DataWind 可视化建模构建的「用户回购模型」流程能够参考下图:

可视化搭建的形式,一方面升高了非算法工程师对流程的了解老本,另一方面对算法工程师本身来说,操作也将更加简略便捷,进一步晋升工作效率。

而可视化建模只是 DataWind 近期性能降级的一个缩影,在往年更早之前,DataWind 就曾经迎来协同层面大动作,实现与飞书、企业微信等在线协同办公 IM 工具全面协同,用户通过飞书等就能够实现 DataWind 数据服务一键订阅,随时随地查看数据、应用数据。

据理解,在历经字节跳动外部多业务多场景实际之后,目前火山引擎的系列数智能力曾经通过 DataWind 等产品全面对外输入,并在互联网、汽车、批发、金融等多个行业在内的数百家标杆企业取得利用实效。

点击跳转火山引擎智能数据洞察 DataWind 官网理解更多

正文完
 0