关于数据分析:思迈特再获国家权威认证代码自主率9878

日前,思迈特软件自主研发的商业智能与数据分析软件(Smartbi Insight)通过中国赛宝实验室(工业和信息化部电子第五研究所)代码扫描测试,Smartbi Insight V11版本扫描测得代码自主率为98.78%的好问题,与同类产品中自主率排名遥遥领先,进一步展现了思迈特软件在自主研发方面的卓越实力。 在“数字化”和“信创化”的减速推动下,国内软件行业的技术迭代和产品升级一直减速,代码自主率测试报告逐步成为检测软件产品自研程度的关键性资质。 代码自主率是指在开发者自主申明的根底上,通过对关键技术实现的全副源代码同源性剖析伎俩,剖析软件代码的开源成分、平安危险等方面信息,确定测试委托方是否具备自主研发该产品的能力,并对产品的原创性进行综合评判,从而帮忙企业实现“自主可控”信息安全要求。 不仅如此,Smartbi Insight V11还获得了软件著作权,标记着思迈特在大数据和商业智能畛域的研发实力和创新能力失去了业界的宽泛认可,彰显了思迈特在数字化技术研发和产品开发等方面的外围竞争力和行业位置。 Part1保持自主可控提供全栈信创数据分析平台在国家“十四五”布局中,明确提出将科技自立自强作为撑持国家倒退的策略方向,以确保重要产业、基础设施、策略资源和其余要害畛域的平安可控性。信创产业成为塑造中国IT产业根底的重要推动力,正迎来蓬勃发展的期间。与此同时,推动“国产化”代替也已成为国内厂商新的使命。 相较于采纳开源软件,培养具备自主可控性的根底软件更有助于激发翻新解决方案的涌现和产品的一直降级。为了推动我国大数据根底软件行业在目前由国外厂商主导的场面中获得冲破,迫切需要呈现领有自主知识产权且性能达到国内领先水平的大数据根底软件厂商,以实现国产代替并推广自主研发技术的利用。 作为老牌国产BI厂商,思迈特软件深耕大数据畛域十余年,积极参与并成为大数据根底软件国产化的重要推动者,助力各行各业特地是重点畛域缩小对国外厂商及开源技术框架的依赖。截止目前,思迈特软件曾经与海光、兆芯、鲲鹏、飞腾、龙芯等国产芯片,河汉麒麟、统信软件、中科方德等国产操作系统,西方通、金蝶天燕、宝兰德等国产中间件,华为高斯、人大金仓、南大通用、达梦、星环等国产数据库适配,并取得了相应的互认证明。 Part2保持信创体系提供全栈信创解决方案思迈特基于信创体系构建的大数据分析平台,为用户提供自主可控、安全可靠、技术当先的数据接入、数据处理、剖析展示、经营推广等一体化的整体计划,全面建设“党政信创”到“金融信创”再布局到“行业信创”。 例如在金融行业,思迈特软件推出了证券投资基金业绩评估与剖析解决方案,基于基金产品快速增长的竞争背景下,在信创环境中,通过利用主观数据,帮忙金融机构构建证券投资基金评估指标体系和评估模型,进步经营管理水平,赋能金融业务场景与信息技术利用翻新深度交融。 保持国产化信创,不仅在金融等支流行业添砖加瓦,在国家航天我的项目中,Smartbi国产化个性也充沛适配北京航天航行控制中心应用的国产化的高性能数据库,成为了北京航天航行控制中心认可的大数据分析平台厂商。 Part3AI大模型+BI自主研发产品成绩化思迈特始终以来秉承技术自主可创、产品自主研发理念,引领BI技术趋势。从2019年起,思迈特将人工智能AI技术与BI深度交融,自主研发了自然语言剖析NLA,并凭此取得多项发明专利。往年,为了将NLA更好的产品化,思迈特率先公布了Smartbi对话式剖析大模型版本,实现大模型+BI联合利用的产品化。 通过对话式剖析大模型版本及专利技术,能够让BI能充沛了解用户的用意,并且更高效、更精确地解决剖析问题,帮忙用户更简略、更深度地做好数据分析及决策。 为了更好地落地对话式剖析大模型版本,真正帮忙用户站在业务视角解决问题,思迈特主张将AI+BI深刻交融到行业实际中,搭建了一个参考性强的治理指标体系,让用户依据本身业务需要做指标删减,真正实现行业know-how和大模型的联合。 作为国内当先的BI服务商,思迈特深知,早日实现高水平的自主自强、减速推动国产化代替正过后,将来,思迈特将进一步增强信创畛域的布局,晋升产品的自主研发程度,携手各生态搭档独特建设欠缺的信创产业生态系统,以客户为核心,以助力客户实现数智化经营为使命,推动国家数字经济实现自主可控和安全可靠的倒退奉献绵薄之力。

February 18, 2024 · 1 min · jiezi

关于数据分析:商业智能必备利器帆软powerBI替代工具

随着商业智能畛域的倒退,越来越多的企业开始意识到数据对于业务倒退的重要性。而在这个过程中,BI(商业智能)工具成为了企业进行数据分析、决策反对的必备利器。然而,市场上BI工具品种繁多,每个工具都有其独特的劣势和毛病,抉择适合的BI工具并不容易。在此背景下,一款名为JVS的智能BI工具备受瞩目。这款私有化BI工具被视为帆软、powerBI的替代品,因为它具备更加智能化、灵活性和可靠性。 JVS智能BI自我介绍JVS智能BI是JVS整体企业数字化解决方案的外围能力之一,是JVS疾速开发平台中的自助式数据分析平台。能够主动进行数据荡涤、整合和可视化解决;具备自然语言解决性能,能够通过简略的语音或文字输出来疾速生成数据分析报告;它反对多种数据状态,通过对立接入不同的数据起源,实现将不同的数据实现对立的数据加工、数据利用; 同时,它采纳了多层次的安全控制机制,包含权限管制、数据加密等多种安全措施。 JVS智能BI有哪些外围性能?1、数据源配置数据源是JVS-智能BI反对多种数据状态的根底,外围的指标是将不同的数据起源通过对立接入,实现将不同的数据实现对立的数据加工、数据利用。目前JVS-智能BI次要反对3种状态的数据:数据库、API、离线文件。 2、数据集数据集是JVS-智能BI中承载数据、应用数据、治理数据的根底,同样也是构建数据分析的根底。能够艰深地将其了解为数据库中的一般的表,它来源于智能的ETL数据加工工具,能够将数据集进行剖析图表、统计报表、数字大屏、数据服务等制作。 3、图表基于可视化的图标,对数据进行剖析展示造成可视化的看板页面。通过拖拽化的形式对数据实现可视化的渲染,反对多种图形组件。 图表的数据联动图表的数据联动是指在可视化图表中,当一个图表的数据发生变化时,另一个图表中的数据也会自动更新。这种性能通常用于展现互相关联的数据集,帮忙用户更直观地理解数据之间的关系和趋势。理论的成果,如下: 4、报表通过表格化的数据展现,造成数据分析汇总的统计报表,报表类型分为多种:穿插报表、统计报表、一般报表、分组汇总表、数据追踪、静态数据表等等。 5、数据大屏通过可视化的技术,采纳高清晰度的大屏幕作为展现平台,通过图表、地图、仪表盘等多种形式将数据进行直观、活泼的将数据以丰盛、贴切的展示。 6、数据服务数据服务是将智能BI外部加工剖析生成的数据集通过API的形式 凋谢给其余零碎应用;是将规范的数据集向外提供可配置化的API服务。 智能BI特点企业级、私有化:数据分析工具 :智能数据洞察自研的急速列存OLAP引擎,解决了业界大数据多维分析的性能难题。全自助剖析,应用低门槛:解放IT人力 :只需拖拽数据,即可实现查问和剖析。依据不同的业务场景,智能数据洞察还会提供智能解决方案,实现了数据分析的零门槛、全自助。办公集成打造在线数据协同数据办公:反对与各种办公工具集成,比方钉钉、企业微信以及自建APP等,将数据实时/监控告警形式推送给对应人员/群组,造成数据追人。增强型ABI,智能数据洞察 :智能数据洞察可能基于机器学习算法,自动检测异样数据,反对场景化剖析主动归因,和智能报警监控。技术开放性与普惠性:作为业余的企业数字化技术供应商,提供普惠的技术实现,灵便的技术服务模式:产品受权、代码凋谢、技术适度、定制服务等。配置可视化,采纳性能配置与实时预览的模式,去掉SQL、脚本等技术操作,转换为页面级性能操作,所见即所得高度的集成化,采纳插件的模式,作为后续性能的扩大根底,集成数据采集、数据加工、数据利用数据长久化,周期化实现数据的刷新,造成数据资产gitee地址:https://gitee.com/software-minister/jvs-bi在线demo:http://bi.bctools.cn/智能BI往期性能介绍自助式数据分析平台:JVS智能BI性能介绍(一)数据源

September 8, 2023 · 1 min · jiezi

关于数据分析:jvs智能bi自助式数据分析91更新内容

jvs-智能bi更新性能1.报表减少权限性能(服务、模板、数据集、数据源可进行后盾权限调配)每个报表能够独立设置权限,通过自定义调配,给不同的人员调配不同的权限。 2.报表新增执行模式可抉择首次报表加载数据为最新数据和历史数据,进步报表拜访效率。 3.大屏减少组件交互(事件)性能可设置组件事件,蕴含单击、双击、移入移出等,目前可实现画布跳转和页面跳转性能。 4.大屏新增组件坐标及宽高设置性能 5.新增数据集追加合并操作成果追加合并次要利用在数据结构简直雷同的数据表合并为一个数据表,合并的过程中能够调整字段的映射关系。 6.数据集新增配置详情预览性能,配置了节点字段后,可预览数据 优化局部1.优化数据集条件筛选节点批量增加条件性能2.优化数据源详情页款式、目录展现款式、数据集日志详情款式3.优化数据源权限管制异样问题 在线demo:http://bi.bctools.cn/gitee地址:https://gitee.com/software-minister/jvs-biJVS智能BI往期干货自助式数据分析平台:JVS智能BI性能介绍(一)数据源jvs·bi新增API数据源及其他新增性能介绍

September 6, 2023 · 1 min · jiezi

关于数据分析:西贝餐饮集团贺赞贤Smartbi及指标体系的应用助力销供产业务协同

“传统的供应链数字化经营,是自下而上的需要驱动,存在效率低下、口径不对立、剖析不麻利等问题。西贝亟需自上而下构建欠缺迷信的指标体系,实现麻利、灵便、对立的利用。因而借助Smartbi以指标为外围的一站式ABI平台,梳理指标体系,进行指标的对立治理、落地和利用,助力销供产高效协同。”——西贝餐饮团体 IT资深高级总监  贺赞贤作为中国头部餐饮标杆,西贝餐饮团体的数字化翻新建设走在行业前列,与Smartbi施行落地数智化我的项目,通过大数据分析平台监控整个业务经营状况,基于Smartbi以指标为外围的ABI平台,整体规划了笼罩80多个指标、6个维度会员的指标体系,为西贝餐饮团体提供了开发、利用都十分便捷、对立的体验。 8月8日,思迈特软件主办的「指标驱动·智能决策 Smartbi V11系列新品线下发布会」圆满闭幕。邀请来自金融、制作、批发等不同行业的企业首领、数字化转型标杆企业代表及专家等共计百余位数字化大咖会聚广州。独特探讨在数字中国建设浪潮下,从业务数字化、流程数字化、全员数字化等多维度麻利撑持大型企业构建全面的数字化能力建设。 西贝餐饮团体IT资深高级总监贺赞贤光临发布会现场,带来《助力销供产业务协同:Smartbi及指标体系在西贝餐饮团体的利用》主题分享,为现场观众深度解说了西贝餐饮团体销供产数字化建设的实践经验,为更多冀望实现“指标驱动”的企业提供门路参考。 以下为贺赞贤演讲全文。 ————大家好,我是来自西贝餐饮团体的贺赞贤,明天和大家分享的主题是《助力销供产业务协同:Smartbi及指标体系在西贝餐饮团体的利用》。 上面是我分享的次要四个方面: 销供产业务简介及挑战销供产协同规范与流程Smartbi在销供产协同中的利用、价值及存在的问题基于Smartbi Insight V11的供应链指标体系共建瞻望 Part 1 销供产业务简介及挑战 上面首先来介绍一下西贝的业务状况: 西贝目前次要有三种业务。西贝莜面村是咱们的正餐业务,也是西贝的成熟业务,目前全国50多个城市300多家门店;第二是西贝功夫菜,是从21年初开始的批发业务;第三是咱们的快餐业务—贾国龙中国堡,目前北京也有了30多家门店。 这些业务销售的背地,都是咱们的供应链在负责供货。而在供应链的前面,咱们还有散布在北上深的地方厨房、几十家委外工厂、几百家原物料供应商、几十个外租仓库、十几家物流单干商,这些用来保障产品及原物料供应。 然而,销售翻新带来了供给挑战。上面咱们看看正餐业务和批发业务的销售比照状况: 正餐业务的整体销售十分有节奏,供给根本没出过问题。而2021年开始的批发业务,它的销售状况难以捉摸,给销供产协同带来了新的挑战。 比方销售打算的不谨严、产能和需要不匹配、供给周期与需要周期匹配度低等问题导致商机失落,毛利低下。 那咱们该怎么办呢?第一,咱们一直优化销供产协同规范与流程。第二,咱们在2022年初和Smartbi单干,通过大数据分析平台来监控整个业务经营的状况。  Part 2  销供产协同规范与流程 上面,咱们先来看一下销供产协同规范和流程。 对于业务规范,咱们是从打算和订单两条线来开展。打算咱们分为规范月打算、我的项目型打算和打算调整,订单分为规范订单和非标订单。打算用于备料,订单用于成品生产,联合规范的作业工夫,让销供产协同有了比拟清晰的节奏感。 对于业务流程,首先三大业务要定期的提供销售打算/订单打算;供应链公司联合给各个门店和电商备货的仓库库存状况,做对应库存打算;如果须要补货则通过地方厨房、委外工厂、原物料供应商进行备货,这里就须要生产、洽购等的打算/订单;物流打算贯通实物流转的各个阶段。 光有规范和流程还不行,咱们还定制权责机制,从不同的权责主体和权责类型细化责任,让大家器重起来,对本人的事件负责。 有了规范流程之后,咱们就通过Smartbi把整个经营监控落实了上来。  Part 3  Smartbi在销供产协同中的利用 目前,Smartbi曾经是咱们销供产协同日常经营的常用工具了。业务人员每个工作日都会应用Smartbi自助查看业务数据,撑持日常经营监控工作。 举个例子,打算人员借助Smartbi构建的报表观测销售打算达成率、库存可销天数等指标,不仅能够实时查看供销匹配度,还能通过预警性能提前示警,及时协同销售方及生产方,躲避断货和僵滞危险。 目前咱们有几百张经营监控报表,通过各种指标来监控供给、老本和资产利用率等状况,保障供给的可靠性和敏捷性的同时驱动业务优化、晋升销售毛利。 然而,数字化经营给西贝带来便捷性的同时,又呈现了新的问题。供应链数字化经营依然是自下而上的需要驱动。指标的应用形式,次要还是基于固定的监控仪表盘,业务端可能更多看剖析后果,较少再持续自助剖析;指标的开发是需要驱动,业务提需要,IT做需要,效率不高,短少整体规划性、灵活性,且不能保障口径的唯一性。 那这个问题又该如何解决呢?今年年初,咱们理解到Smartbi在用指标体系治理本人的老本,也具体理解了一下,发现非常适合咱们的现状。因而,西贝又洽购了Smartbi的指标模块,通过自上而下的驱动来构建指标体系。 目前对于这个指标我的项目,Smartbi曾经帮助咱们先做了会员的指标体系,大略有80多个指标和6个维度,这样整体规划做进去的指标体系,它的开发、利用十分便捷、对立。 因而,咱们就更想做好整个供应链的指标体系。将来咱们筹备参考国内供应链协会的SCOR模型,再联合西贝的理论状况,和Smartbi一起共建。  Part 4  基于Smartbi Insight V11的供应链指标共建瞻望 我来简略讲一下行将要做的一些事件,以及想达到成果的瞻望。 第一是从用户视角构建供给可靠性指标。从指标上看销售/供应商订单的完满履行率,往下拆解包含按量交付率、按日期交付率、品质完好率、单据准确率等。 第二是从用户视角构建敏捷性/响应性指标。这里和SCOR模型有点差异性,咱们思考引入订单和打算的敏捷性指标,也一样做了拆解。不仅包含销售打算/订单提前期的各种指标,也包含销售订单/打算的调整灵便度指标。 同时,咱们还思考从老本和资产角度对指标进行梳理拆解,造成咱们外部的经营指标体系。 最初,这些指标体系须要和Smartbi一起梳理,并最终借助Smartbi产品进行高效的利用和落地。 以上就是我的分享,谢谢大家。

September 5, 2023 · 1 min · jiezi

关于数据分析:数据库内分析利用-SQL-的分析功能

举荐:应用NSDT场景编辑器助你疾速搭建可二次编辑的3D利用场景咱们都晓得数据分析在当今数据驱动的世界中的重要性,以及它如何从可用数据中为咱们提供有价值的见解。但有时,数据分析对于数据分析师来说变得十分具备挑战性和耗时。现在它变得繁忙的次要起因是生成的数据量激增,并且须要内部工具来对其执行简单的剖析技术。 然而,如果咱们剖析数据库自身中的数据,并应用大大简化的查问呢?这能够应用SQL剖析函数来实现。本文将探讨能够在SQL Server中执行的各种SQL剖析函数,并取得有价值的后果。 这些函数基于一组行计算聚合值,超出了根本的行操作。它们为咱们提供了用于排名、工夫序列计算、窗口化和趋势剖析的工具。因而,在不节约任何工夫的状况下,让咱们通过一些细节和理论示例开始逐个探讨这些性能。本教程的先决条件是 SQL 查问的根本实际常识。 创立演示表咱们将创立一个演示表并在此表上利用所有剖析函数,以便您轻松学习本教程。 留神:本教程中探讨的某些函数在 SQLite 中不存在。因而,最好应用MySQL或PostgreSQL Server。此表蕴含几个大学生的数据,蕴含四列学生证、学生姓名、主题和最终问题(满分 100 分)。创立蕴含 4 列的学生表: CREATE TABLE students ( id INT NOT NULL PRIMARY KEY, NAME VARCHAR(255), subject VARCHAR(30), final_marks INT); 当初,咱们将在该表中插入一些虚构数据。 INSERT INTO Students (id, name, subject, final_marks)VALUES (1, 'John', 'Maths', 89), (2, 'Kelvin', 'Physics', 67), (3, 'Peter', 'Chemistry', 78), (4, 'Saina', 'Maths', 44), (5, 'Pollard', 'Chemistry', 91), (6, 'Steve', 'Biology', 88), (7, 'Jos', 'Physics', 89), (8, 'Afridi', 'Maths', 97), (9, 'Ricky', 'Biology', 78), (10, 'David', 'Chemistry', 93), (11, 'Jofra', 'Chemistry', 93), (12, 'James', 'Biology', 65), (13, 'Adam', 'Maths', 90), (14, 'Warner', 'Biology', 45), (15, 'Virat', 'Physics', 56);当初咱们将可视化咱们的表格。SELECT *FROM students ...

September 4, 2023 · 2 min · jiezi

关于数据分析:自助式数据分析平台JVS智能BI功能介绍一数据源

一、数据源配置数据源概述数据源是JVS-智能BI反对多种数据状态的根底,外围的指标是将不同的数据起源通过对立接入,实现将不同的数据实现对立的数据加工、数据利用。目前JVS-智能BI次要反对3种状态的数据:数据库、API、离线文件。 界面介绍进入数据源界面,左侧展现的零碎中曾经配置的数据,右侧展现的对应数据的预览内容,其中包含 蕴含的 数据表,以及根底的通用配置。 创立数据库类型的数据源点击新增按钮 抉择对应的数据源状态目前零碎默认反对 mysql、mongodb、API、JVS低代码数据模型,前期将一直扩大多种数据源。 依据页面提醒,输出数据库IP、数据库名称、用户名、明码端口等信息后,点击校验,能够对数据库链接状况进行验证。 再验证数据库的联通性后,点击“同步构造”,零碎会将对应数据库的库表构造进行同步 同步实现后,能够在数据表中看到 这个数据源下的所有 数据表,且能查看对应表的字段状况 创立API类型数据点击“+” 新增api数据源 设置数据源根本信息: 增加数据接口:设置申请api连贯 设置返回数据内容 二、API数据源的创立JVS智能BI能够通过内部API获取数据,用于数据的加工,生成规范数据集。JVS智能BI中反对多数据源的治理,其中包含数据库、API、低代码等多种状态的数据类型。咱们来看下API数据源的配置形式。如下图所示为数据源治理的界面: 创立API数据源点击创立api数据源按钮,创立api根本数据方的根本信息,包含api的起源根本形容,一个api数据源下能够有多个具体的接口。 抉择API的数据源,进入API数据源新建页面,填写对应名称(api的起源),如果蕴含非凡业务逻辑解决的接口,能够通过上传jar包的模式实现 逻辑性能的上传,例如对外部接口实现非凡的加解密,有业务逻辑性能解决的api等。 jar包的治理界面,对系统中曾经有的接口jar包进行治理。 数据接口治理:入参配置,如图所示: 出参配置如图所示: 在线demo:http://bi.bctools.cn/gitee地址:https://gitee.com/software-minister/jvs-bi 本周干货回顾业务流程与逻辑编排的低代码平台,一文全方位理解它的轻利用信息独立服务编排逻辑引擎:jvs-logic服务原子组件介绍JVS低代码开发工具根底篇:利用核心配置阐明

August 31, 2023 · 1 min · jiezi

关于数据分析:当前经济环境下企业如何落地降本增效

以后经济环境下,竞争局势强烈,IT企业面临着不少的挑战,比如说施行我的项目利润低、用人老本高、盈利能力难预测、项目前期投入大等,导致企业整体盈利能力降落。 不少IT老板都逐步意识到「降本增效」的重要性,那么如何真正落地降本增效?「本」到底在哪里?企业老本形成是什么样的?老本是多少?次要花在哪些环节?花的是否正当?该如何优化? 落地「降本增效」经营指标合成是要害为了真正落地施行「降本增效」,咱们须要先理解分明IT企业的老本构造是如何形成的。家喻户晓,IT 企业次要的业务流程是LTC(Lead to Cash,线索到回款),环节多,每个环节都会产生各类间接和间接成本,比如说销售老本、售前、交付等间接老本,还有研发或治理等间接成本。 老本项这么多,那么怎么去掂量好坏?从哪里去降本呢? 首先构建企业经营指标,量化业务现状。比方下面提到如何掂量和比照企业交付、售前、销售等老本状况, 能够通过比照合同毛利、合同奉献毛利、销售奉献毛利等指标。 合同毛利:支出-间接老本 合同奉献毛利:合同毛利-(售前老本等间接跟我的项目相干的销售费用)销售奉献毛利:合同奉献毛利-销售费用摊派 其次构建指标剖析利用,辅助经营决策。比方降本能够通过企业支出老本形成合成,合成到LTC 交付、售前、销售等次要过程中,并且层层合成,剖析是否正当,找出优化空间。 咱们通过上图案例来看该企业是如何通过指标剖析实现降本。️企业老本是多少?企业均匀100元支出须要95元老本,还不蕴含研发和管理费用,阐明企业显著亏损。️花在哪些环节?花的是否正当?交付老本40元,合同毛利率60% ,属于失常范畴,然而外部人力老本为31元,其中交付闲暇老本为10元占交付人力老本32%,阐明交付人员冗余率太高,业界个别是15%,有很大优化空间。同样咱们看销售核心老本,销售奖金只占销售人工成本13%,销售激励不够,吃大锅饭。️如何优化?• 交付人员冗余率太高:缩小交付闲置人员,减少人力外采。• 销售提成占比低:优化业绩指标考核与奖金调配。 除了从企业角度进行老本剖析,还能够通过业务线、区域、行业等多个维度进行老本剖析。比如说,上图咱们看到业务线A亏损重大,应该如何优化? 咱们先下钻到各个区域分析一下状况,发现除了总部售前老本较低,其余区域售前老本都特地高,能够加大各个区域售前培训,提高效率,同时业务线A 支出占比低,如何去开源?能够通过剖析业务线行业状况,商机状况、新老客户等状况,来调整业务策略。 IT经营治理驾驶舱计划五步走落地「降本增效」通过后面老本剖析案例,咱们看到企业要想更好的降本,须要通过指标掂量比照和指标剖析下钻来辅助决策,同样要想进步企业经营效率,实现更高的经济效益,企业须要一套经营指标体系和指标剖析利用平台,为此,Smartbi精心打磨了一套适宜IT企业的经营治理驾驶舱计划,能够手把手帮忙IT企业真正落地施行「降本增效」,具体怎么做呢? 1、明确战略目标:包含营收增长、老本管制、市场份额增长等。 2、辨认要害业务流程:辨认与战略目标密切相关的要害业务流程,包含销售、洽购、生产等。 3、辨认要害指标:对于每个要害业务流程,辨认出要害指标,比方销售流程中的订单量、成交金额等。 4、建设指标库:将辨认出的所有指标进行对立治理,造成企业的指标库,指标库中的指标个别包含指标的名称、定义、计算方法等等。 5、指标利用:企业能够将指标利用到各个业务场景中,比方制订业务指标、制订业务打算、监控业务执行状况等等,以实现对业务的精细化治理。 上面咱们用一个IT企业的均衡计分卡为例,察看其战略目标、到策略合成、到策略执行过程中的指标实现的策略、要害业务因素,失去要害指标的过程。' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) ' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 四大突出劣势赋能「降本增效」不再是喊口号劣势一:Smartbi内置一套面向IT企业经营治理指标体系,开箱即用:涵盖LTC ,商机、合同、支出等6大类 60+ 要害指标,应用门槛低。 劣势二:Smartbi内置指标剖析利用和工具,指标自助剖析:满足企业经营指标速览到自助剖析,辅助业务决策。 劣势三:Smartbi内置指标接口表,指标疾速灌数:用户将业务数据灌入接口表中,指标数据主动生成。 劣势四:Smartbi内置指标治理平台,指标扩展性强:满足企业个性化经营指标增加,适配企业的理论业务。 计划价值⭐️ 从原先财务数据不可用,降本增效凭表象,转变为业财数据指标化,合成下钻追基本。⭐️ 从原先布局调整无根据,决策只能靠教训,转变为业务危险早预警,数据洞察助决策。⭐️ 从原先业务报喜不报忧,指标执行难管控,转变为达标过程时时控,异样起因深剖析。

June 28, 2023 · 1 min · jiezi

关于数据分析:朝万亿城商行挺进的长沙银行如何借助Smartbi激活数据价值

近年来,随同金融科技的提高,客户行为和生产习惯产生了转变,晋升客户体验火烧眉毛。与此同时,银行业还一直面临来自非传统金融企业、跨界互联网公司带来的挑战,为此泛滥传统商业银行都积极开展了金融科技的摸索与实际,被动拥抱大数据时代催生的金融翻新与改革,充沛开掘和施展数据价值,向大数据驱动的数字银行进化。 作为湖南头部的城商银行,长沙银行扎根外乡,服务1,656.87万户批发客户、39.09万户对公客户,每4个湖南人中有一个长行客户。依据2022年报显示,其资产规模已从1997年成立时的31亿元,一跃冲破9544亿元,目前正在朝着万亿城商行挺进。 特地是在去年12月,由《金融电子化》杂志社主办的“2022中国金融科技年会暨第十三届金融科技利用创新奖颁奖典礼”隆重举办。长沙银行凭借该我的项目荣获“2022金融业数字化转型突出贡献奖”,此次获奖的机构波及清理机构、六大行、全国股份制银行、城商行、农信社、保险、证券、科技、理财公司等。城商行入围机构不到20家,长沙银行是湖南地区惟一获此荣誉的金融机构。 我的项目背景长沙银行很早便开始统一规划,散布进行信息化、数字化建设布局,2014年,长沙银行成立了数据管理部门,负责将行内扩散、异构的数据资源进行集成,造成对立的出入口,给总行业务部门以及分支行提供数据化利用场景。但随着数据统计、剖析须要,明细数据的提取、报表开发等需要变得越来越多,日常数据提取和剖析的需求量变得越来越多,长沙银行也面临着以下挑战: 1、面临“三长”困扰,即沟通工夫长、取数链路长、报表开发周期长原有的体系下,业务指标数量多,数据口径繁冗,业务人员若想要局部明细数据或开发一张报表时须要提需要到科技部门,科技人员承受到需要后因为不懂业务则须要找业务人员重复沟通确认需要定义,进而减少了沟通老本,为数据应用带来了极大不便。 2、数据分析门槛高数据人员进行取数时是须要有SQL等语言根底,然而许多业务人员没有技术背景,难以独自实现取数、荡涤、剖析的全流程,面对庞杂数据,很难自主、深刻开掘数据背地的意义。 3、平安管控限度依据科技部平安治理的要求,业务人员应用数据分析必须在办公网虚构桌面里拜访,各种用户权限的申请及审批流程比较复杂,以致数据分析的应用及推广过程中存在艰难。 ▎建设自助生产的数据服务体系为解决上述问题,长沙银行在综合思考产品性能完整性、平台理念符合度及建设教训成熟度后,决定携手Smartbi建设大数据智能剖析平台,旨在让业务人员能够缩小对科技部门的依赖,自主进行数据分析,以此来晋升工作效率并促成全行数据化经营。该我的项目通过将BI工具与数据分析环境进行无缝对接,构建基于长行云为根底的数据底座,业务部门可依据业务须要,自定义传统报表、看板、即席查问等,进行灵便的数据自助生产。数据的筹备、加工、展现全流程齐全由业务部门自主实现。 数据底层:数据实验室构建了多租户的管理模式,为业务部门提供了弱小的存储和计算资源。 数据获取:通过数据治理后,业务部门可在本人的租户空间内进行数据的关联、清理等数据整合工作,构建自助剖析所需的数据集。 数据利用:业务方连贯整合后的数据集,构建数据主题,以报表、看板等多种形式进行展现。业务人员通过利落拽的形式轻松自定义报表或仪表盘,并通过过滤、钻取、跳转等丰盛的交互和剖析性能迅速摸索根因,麻利业务决策。 平安管控:依据组织构造主动划分数据权限范畴,严格防止数据越权拜访。同时通过数据脱敏、重要数据审核、下载权限管制等安全措施,防止敏感信息的外泄危险。 ' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) 目前该平台次要利用于明细查问、仪表自助、透视剖析、SQL摸索、数据播报5大板块,且每个板块都有相应的用户群。 ' fill='%23FFFFFF'%3E%3Crect x='249' y='126' width='1' height='1'%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E) ▎造气氛,构建数据驱动型的组织要达到商业银行数据化经营的指标,光有平台不够的,还必须让行内人员意识到数据分析的价值和必要性,但在理论的推广过程中,员工观点转变不是一个容易的过程,为此,长沙银行在做培训、引人才、树标杆这三方面做了大量的工作,为业务人员可能自主剖析数据扫清阻碍,晋升一线数字作战能力以及数据协同能力 目前,该平台成为了长沙银行数据工作的主战场,平台用户数4000+,月活500+,并胜利开发了约600张报表和100余张看板,报表无效访问率达到89.5%。2022年,每季度的访问量增长率放弃在10%以上。我的项目落地后,不仅无效开释IT生产力,还进步了业务人员的工作效率和数据分析能力。 具体来说,该我的项目有以下几点价值: 1、数据分析成绩公布周期大大缩减以前制作一张报表从立项到上线至多要60天以上,当初业务部门的数据人员可自行处理制作报表,即便通过传统提需要的形式,基于Smartbi的自助剖析平台制作报表也只有1-3天即可实现。 2、更高效地满足银行对业务翻新的需要通过自助剖析平台的搭建,业务团队和开发团队得以各司其职,专一“更有价值、更业余的事”,节约工夫同时也节约IT用人老本,这种效率的晋升最终都会体现在业务的精进之上。 3、晋升数据翻新效力  通过BI平台可能疾速获取对应的业务数据,搭建银行竞争力指标体系,满足了总行、分支行及网点的数据需要,并通过简略拖拽的形式,对网点竞争力指标数据灵便便捷的自主定义展现,不便各层级把握银行的经营状况,加强对基层营销、治理一线的反对,晋升数据翻新效力。 4、推动数据分析人才队伍建设激发业务人员数据分析的积极性,在全行造成盲目、自发剖析数据的浓重气氛,在业务条线造就出一批具备根本数据分析思维、把握根本剖析技巧和工具的数据分析师能手。

June 28, 2023 · 1 min · jiezi

关于数据分析:通过python封装接口用商品ID获取淘宝商品详情数据淘宝商品详情接口淘宝API接口

本文介绍如何应用 Python 封装接口来采集淘宝天猫商品详情数据。淘宝平台是目前寰球大型的综合性 B2B 电子商务平台,具备微小的商品资源,因为其商品数量泛滥,手动采集是十分费时费力的。因而,能够应用 Python 封装接口来自动化采集速卖通商品详情数据,提高效率。1、装置requests 应用 Python 封装接口采集数据,首先须要装置 requests 库,能够应用 pip 命令进行装置。2、获取接口链接 速卖通的商品详情页面有多种展现形式,但其对应的接口链接是雷同的。咱们能够通过浏览器开发者工具(F12)来查看该链接。以 Chrome 浏览器为例,关上开发者工具,在 Network 标签下找到地址栏右侧的 Preserver log 选项,选中该选项后,在地址栏中输出速卖通商品详情的链接,页面加载实现后,能够在开发者工具中找到申请数据的接口链接。将该链接复制下来,用于后续的代码编写。 3、封装接口函数 应用 requests 库向速卖通商品详情接口发送 get 申请,即可获取该商品的详情数据。将申请参数封装到字典中,并将接口链接和申请参数传给 requests 库的 get() 函数即可。申请胜利后,能够通过 json() 办法将返回的 json 字符串转换为 Python 字典对象。Taobao.item_get - 取得淘宝商品详情(复制Taobaoapi2014)封装接口代码展现  申请形式:HTTP POST GET2. 申请地址:http://o0b.cn/opandy 3.申请参数:参数阐明:num_iid:淘宝商品ID 4.申请示例: # coding:utf-8"""Compatible for python2.x and python3.xrequirement: pip install requests"""from __future__ import print_functionimport requests# 申请示例 url 默认申请参数曾经做URL编码url = "https://api-vxx.Taobaoapi2014.cn/taobao/item_get/?key=<您本人的apiKey>&secret=<您本人的apiSecret>&num_iid=652874751412&is_promotion=1"headers = { "Accept-Encoding": "gzip", "Connection": "close"}if __name__ == "__main__": r = requests.get(url, headers=headers) json_obj = r.json() print(json_obj)5.响应样例(展现局部) ...

June 14, 2023 · 1 min · jiezi

关于数据分析:以CRM系统为案例讲解数据分析重要性介绍及分析方法

顾名思义,CRM指客户关系治理,是Customer Relationship Management的简称,指企业为进步外围竞争力,利用相应的信息技术以及互联网技术协调企业与顾客间在销售、营销和服务上的交互,从而晋升其治理形式,向客户提供翻新式的个性化的客户交互和服务的过程。CRM的次要价值有: 在做CRM前,咱们要首先明确须要剖析哪些数据,要想让数据施展价值,必然要通过解决剖析和展现的过程,而后呈献给终端治理经营人员查看、追踪,理解以后的业务倒退情况,以取得增长的突破点,以及经营治理的问题所在。而剖析数据的第一步就是要跟进要害指标。 要害指标跟进重点关注在日常经营中的客流、动向信息、订单、销售额、退单等多个指标: 客流:进店的客户数信息:动向客户数订单:预约订单数主单:生产订单数留信息率:客流到动向客户的转化率(动向客户数/客流*100%)信息转化率:动向客户到预约订单的转化率(预约订单数/动向客户数*100%)退单率:退复数/预约订单数*100%订单转化率:预约订单到生产订单的转化率回款:回款总额完成率:回款完成率CRM剖析过程明确了以上要害指标,咱们能够开始着手数据分析的具体流程,我将从售前、售中、售后三个大方面动手,将客户关系治理分成六个阶段来具体分析。 售前:市场获客,线索剖析在售前阶段,咱们通过多种渠道获客后录入crm零碎成为线索,咱们须要对市场线索进行剖析,剖析线索量和转客户比例,从而进一步进行营销剖析。 售中:客户跟进,商机剖析在售中阶段,通过销售人员对客户的跟进推动商务过程,咱们须要对客户进行剖析,剖析客户数量和客户资源,从而进一步剖析商机状况。 售后:售后服务,订单剖析在售后阶段,通过对客户退单和其余服务的落实和实现,咱们能够对整个客户关系治理进行剖析和总结,立足全局,剖析订单状况。 在具体的分析阶段,仍然有很多细节的工作须要咱们器重,其中最次要的就是销售过程的剖析和对客户的分层,我将借助内部工具对这两个阶段的剖析进行具体解释。 销售剖析:销售漏斗咱们在进行销售剖析时,个别都会波及到以下剖析维度。 销售效率剖析。蕴含销售额或销售量、业绩完成率、同比环比增长、客单值。市场剖析。市场占有率。人员剖析。销售排名。盈利能力剖析。销售毛利率、净利率、费用率等财务指标。经营效率剖析。库存周转率、应收账款周转率、畅销库存比率。(自己所在公司是定制产品,不波及成品库存,而且公司只负责终端销售及服务,所以也没有资料、半成品的库存剖析。)渠道剖析。渠道销售额/销售量占比、渠道毛利率、渠道客单值等。产品剖析。产品的构造剖析、热卖单品剖析、产品配套率剖析、产品客均单价剖析。顾客剖析。顾客区域分析、客单值剖析、顾客转化率剖析(销售漏斗)、RFM剖析时序剖析。工夫变动剖析、同比和环比剖析。 上图是经典的营销漏斗,形象展现了从获取用户到最终转化成购买这整个流程中的一个个子环节。相邻环节的转化率则就是指用数据指标来量化每一个步骤的体现,所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,而后用转化率来掂量每一个步骤的体现,最初通过异样的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到晋升整体购买转化率的目标。体验模板:CRM零碎客户分层:RFM模型在客户分析阶段,很多企业面临的痛点问题就是不会进行客户分层,也不晓得如何这些数据去开掘客户: 哪些是咱们的利润奉献客户?哪些是咱们的忠诚老客户?哪些是咱们的有待开掘其购买力的老客户?哪些咱们须要重点关注的面临散失可能的高价值顾客?哪些是咱们的新增顾客、哪些是咱们的低频购买老顾客?要想答复这些问题,首先咱们须要用看得见的数据分析指标来出现它们。正如彼得·德鲁克所言“如果你不能掂量它,你就无奈增长它”。让这些静止的数据动起来,变成有生命力的有价值的信息,帮忙咱们实现客户增长,实现客户价值最大化,加强客户粘性,RFM模型将会帮你实现这个指标:在泛滥的用户价值分析模型中,RFM模型是被广泛应用的。 把它拆成立体,更容易了解: R(Recency) :客户最近一次交易工夫的距离。 F(Frequency) :客户在最近一段时间内交易的次数。 M(Monetary) :客户在最近一段时间内交易的金额。该模型是通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标,来形容客户/用户的价值情况和创利能力。 由上图可见,依据这三项指标咱们就能够判断客户类型,从而进一步将客户进行分层。R(Recency) :R值越大,示意客户交易产生的日期越久,反之则示意客户交易产生的日期越近。R值越大,证实此客户沉睡工夫越长,散失可能性越大。 F(Frequency) :F值越大,示意客户交易越频繁,反之则示意客户交易不够沉闷。F值越大的顾客也就是咱们的忠诚顾客,是他们沉闷了咱们的店面流量。而F值小的顾客,他们跟咱们的粘性不大,虔诚涣散,随时可能面临被竞争对手抢走的危险。 M(Monetary) :M值越大,示意客户价值越高,反之则示意客户价值越低。M值越大的顾客撑起了咱们的业绩,如果再利用帕累托散布剖析一下,兴许会发现,正是这M值大的20%的顾客,撑起了咱们业绩的80%的天空! 总结以上就是对于crm数据分析的全副干货,全部都是凝固了多年工作教训的精髓,万事开头难,刚开始没关系,置信有志者,事竟成!心愿以上答复有所帮忙。 本文波及到的CRM实现工具:CRM客户管理系统

June 14, 2023 · 1 min · jiezi

关于数据分析:数据可视化指南部分整体类型可视化图表

图表是解决数据的重要组成部分,因为它们是一种将大量数据压缩为易于了解的格局的办法。数据可视化能够让受众疾速Get到重点。 数据可视化的图表类型极其丰富多样,而且每种都有不同的用例,通常,创立数据可视化最艰难的局部是确定哪种图表类型最适宜手头的工作。 本文中,数维图小编将为大家介绍数据可视化图表类型的第四篇 —— “局部与整体类”图表,应用这些图表。 沉积条形图作为条形图(柱形图)的变体,沉积条形图/柱形图显示堆栈与整个条形或柱形之间的关系。整个条形/列也能够显示为 100%。在这种状况下,堆栈以百分比显示整个条形/列的绝对局部。 发散条形图发散条形图(发散柱形图)是相似于惯例条形图的图表。通常用于显示问卷或考察的后果,但不限于此用例,如上例所示。在发散条形图中,应用对比色来显示要比拟的类别。此图表的一个十分常见的变体称为“发散重叠条形图”,它增加了额定的段。换句话说,它与惯例重叠条形图十分类似,但两头有一个额定的基线。然而发散沉积条形图是沉积条形图的一个十分好的代替计划,因为它更容易将沉积条图与它进行比拟。 人口金字塔与发散条形图十分类似,人口金字塔是一种专门可视化人口之间年龄和性别散布的图表。人口金字塔通常由人口统计学家应用,能够成为许多报告中非常简单和不错的补充。 图标数组图标数组是分明地可视化单位比例的图形。图标数组应用图标矩阵,通常为 100.这些图标中的每一个都代表某物(即人)的一个单位。而后将图标的一部分着色以示意咱们数据中的数值。其余图标可能显示为灰色甚至不存在。图标数组是一种十分常见的图形类型,非常容易解释。 华夫饼图华夫饼图与图标数组十分类似。然而,它不是应用不同的图标,而是由 100 个方形(甚至圆形)单元格组成的网格组成。每个单元格代表 1%。此网格模式通常显示实现目标(或实现百分比)的进度,但也可用于显示局部到整体的奉献。华夫饼图通常被称为饼图的方形替代品,并且非常容易解释。它们看起来的确像华夫饼。 饼图饼图能够说是最受欢迎的图表类型,是一种圆形图,可可视化局部与整体的关系。它显示了如何将数据划分为具备特定值的类别(切片),但它始终保持一个类别的值与这些类别的总和(饼图)之间的分割。这意味着切片加起来应该是一个逻辑总和。如果数据以百分比示意,则总数应向上舍入到一百。如果数据采纳绝对值(例如美元),则类别应造成有意义的总计。饼图只实用于几个类别,否则,图表将变得不可读。当一个类别与其余类别相比十分大或十分小时,它也非常适合。 圆环图圆环图实际上与饼图雷同,两头有一个空圆孔的显著区别,使其相似于甜甜圈。然而,圆环图的数据比饼图更好,并且数据由扇区的长度而不是外表示意,后者更易于解释。圆环图的另一个长处是,核心的空间可用于增加题目或从数据派生的重要值。 半圆形圆环图此图表的工作形式与一般饼图或圆环图雷同,只是所有类别的总和会产生半个圆而不是一个残缺的圆。它能够作为仪表图的根底,办法是应用切片显示进度或增加指针。 玛莉美歌图Marimekko 图表是一种二维沉积图,它通过不同段的不同高度和柱形宽度来形容数据。这些列将缩放以填充整个可用图表区。Marimekko最罕用于剖析营销和销售数据。 矩形树状图矩形树状图由多个类别组成,每个类别都有一个矩形。如果要解决数据中的子类别,则能够将这些类别细分为较小的矩形。矩形区域的大小传播值。因而,矩形树状图是疾速查找类别外部和类别之间关系的十分有用的图表。另一个益处是无效利用空间,这使得同时显示大量数据变得容易。 圆形树状图圆形树状图用于应用嵌套圆圈显示分层数据。它就像树状图一样,但应用圆形而不是矩形。每个圆圈代表一个类别,其子类别位于其中。圆圈越大,该类别的价值就越大,反之亦然。 树形图树形图是示意树或网络结构的图。它由重叠的分支组成,用于可视化分类关系(对象之间的分层关系)。树形图在生物学中通常用于显示基因的聚类,但它们能够阐明任何类型的分组数据。 维恩图维恩图应用重叠的圆来阐明两组或多组我的项目之间的逻辑关系。维恩图应用重叠的圆圈来阐明概念、想法、类别或组之间的相似性、差异性和关系。组之间的相似性在圆圈的重叠局部示意,而差别在圆圈的非重叠局部示意。维恩图,也称为汇合图或逻辑图,宽泛用于数学、统计学、逻辑、教学、语言学、计算机科学和商业畛域。 夕阳图夕阳图也称环形图、多级饼图等,是显示分层数据的现实抉择。通过一系列环显示层次结构,这些环针对每个类别节点进行切片。每个环对应于层次结构中的一个级别,核心圆圈示意根节点,层次结构从根节点向外挪动。具备多个类别级别的夕阳图显示了外环与内环的关系。 漏斗图漏斗图是一种图形示意模式,可描述连贯的阶段和一系列数据值。在漏斗图中,因变量的值在流程的后续阶段会减小。漏斗图常常在演示文稿、报告、营销资料和仪表板中应用漏斗图来阐明产品或服务的销售状况。每当须要显示随工夫缩小的数据时,都能够应用漏斗图。漏斗的每个局部都会显示总计的百分比,并且该值会随着向下挪动而减小。所有部件加在一起的值应等于 100%。 总结综上所述,局部整体类图表具备显著的劣势和实用场景,对集体和组织来说都是有用的工具,因为它以清晰易懂的形式无效地显示数据,从而更好地进行数据分析和决策。但同时,也须要留神到此类图表的不足之处,防止在不适宜的场景应用。 心愿本文能帮忙您理解 “局部与整体类” 可视化图表,如果你想疾速创立丑陋适合的数据可视化,能够尝试用 Sovitchart 在线数据可视化工具中设计,能够轻松制作出合乎需要的图表。

May 26, 2023 · 1 min · jiezi

关于数据分析:拉钩数据分析实战训练营8期已讶衾枕冷

download:拉钩数据分析实战训练营8期自然语言解决(NLP):计算机如何了解人类语言自然语言解决是一种人工智能技术,旨在使计算机可能了解、剖析和生成人类语言。它涵盖了从语音辨认到文本处理的各个方面,并且在多个畛域中都失去广泛应用。本文将介绍自然语言解决的概念、常见利用以及将来发展趋势。 自然语言解决的概念自然语言解决是一种波及计算机科学、语言学和心理学等多个学科的穿插畛域。它的指标是使计算机可能了解人类语言并进行有意义的交互。自然语言解决次要包含以下几个方面: 语音辨认:将人类语音转换为文本格式。 语言了解:解析文本内容,提取其中的实体、关系和事件等信息。 机器翻译:将一种语言翻译成另一种语言。 情感剖析:剖析文本中的情感,以判断其情绪状态。 文本生成:应用模型生成新的文本。 自然语言解决的利用自然语言解决曾经在多个畛域中失去了广泛应用。以下是一些常见的利用场景: 智能客服:应用自然语言解决技术来解决客户的问题,并提供个性化倡议。 智能家居:应用语音辨认技术来管制家庭设备,如智能音箱、智能灯光等。 机器翻译:将不同语言的文本进行翻译,以便跨语言交换。 舆情监测:对社交媒体和新闻网站中的评论和文章进行情感剖析,从而理解公众对某个话题的认识。 自然语言解决的将来发展趋势随着人工智能技术的不断进步,自然语言解决也将会迎来更多的倒退机会。以下是一些可能的将来趋势: 更加智能化的语音辨认技术:随着深度学习技术的倒退,语音辨认技术将变得更加精确和智能化。 更加精密的文本了解技术:自然语言解决技术将逐步可能了解更加简单的文本构造,如上下文和语境等。 更加实用的利用场景:自然语言解决技术将被利用到更多的畛域中,如医疗、法律和金融等。 结语自然语言解决技术是人工智能畛域中的重要分支,它为计算机了解和解决人类语言提供了根底。随着技术的不断进步,自然语言解决将会变得更加智能化和实用化。置信将来它会在更多的畛域中失去广泛应用。

May 18, 2023 · 1 min · jiezi

关于数据分析:数据一致性比对番外

我写过很多如何去对数、如何批量对数的技术文档,最近我的项目遇到这个问题,我才发现在官网博客上还没有公布过这个课题的文章。这就像灯下黑,太长用到的知识点,反而没有意识到其重要性。 注:这里对数的场景就是指在阿里云平台应用dataworks等大数据开发工具集成业务零碎数据库(oracle等)数据上云到maxcompute的场景,所以,示例的SQL也是针对maxcompute。 先说说个别业务上怎么对数的,咱们做了一个报表,出了一个数据“某个产品卖了30个”。这个不只是在大数据平台上有这个数据,在业务零碎也有这个数据,这些统计动作在业务零碎通过程序和人工也会有一份,个别做好报表后会先对这个数据。 所以,第一线反馈回来的数据就是这个汇总数据不统一的问题。然而这个后果是十分概括的,因为就像我感觉这个月工资少发了5毛一样,如果我不看我的工资条我其实不晓得本人是不是少发了。工资条不只是一个汇总数据,外面有我税前工资、奖金(浮动)、社保、扣税等一系列的明细数据,这些数据让我去判断我是不是少了5毛,而加工过的数据是简单的。 说到这里,我其实就像表白一个事件,对数是要对明细数据。这是所有计算后事实的根底,能够拿进去作证的。 所以,两边都查一下这个汇总值应用的表的对应的记录,比如说查问“明天这个产品ID的售卖记录”。后果就发现业务零碎有31笔,而大数据平台有30笔。 即使到了这里,其实咱们依然不晓得期间产生了什么,为什么会失落数据。另外咱们还不晓得其余商品ID的数据是不是也有失落的,还有其余的表的数据是不是也会产生相似的状况。 1.明细数据比对既然最终都是对明细数据,那么我是不是能够间接比对明细数据呢?答复是:正确。 个别产生这种状况,首先要比对业务零碎和大数据平台两个表的数据。 1.再利用全量集成工具,从业务零碎的数据库全量抽取一遍数据到大数据平台。比对数据肯定要把数据放到一起,隔空比对是不存在的。因为大数据平台的容量是数百倍于业务零碎的,所以,个别都在大数据平台比对。(这里有一个悖论,如果集成工具自身就有缺点,导致抽取过程中就丢数据,岂不是永远没方法比对了。所以,如果对这个工具也不确定就得从数据库导出数据到文件,而后再加载到某个数据库下来比对。在这里,通过我对离线集成这个产品的长年应用教训,这个工具是十分牢靠的,还未遇到过这个问题。) 2.依据主键关联,比对2个表中的主键的差别。如果是下面提到的记录失落的问题,这一步做完就很容易比对进去了。这里还会发现一个问题,就是业务零碎的表是一直变动的,所以,这时与大数据平台的表比照会有差别。这个差别的外围起因是:大数据平台的表是业务零碎表在每日的日末(00:00:00)的一个时点数据,而业务零碎的数据是始终在变动的。所以,即使有差别超出预期也不要惊恐。如果是应用实时同步能够从归档日志中获取到这期间数据的每一条变动,能够追溯变动起因。如果没有实时同步,也能够通过表中与工夫相干字段去判断数据是否被更新掉。要是什么都没有(这种状况也是存在的),那就去骂骂设计表的业务零碎开发(没错,是他们的锅),也能够跟业务去具体理解一下,这行记录是不是明天做的,而不是昨天。 3.还有一种状况,就是主键统一,数据内容(主键之外的字段)不统一。这种状况,还是须要思考数据变动的状况,能够从日志、工夫字段、业务等几个角度去比对。如果发现数据的确不合乎预期,就须要查问同步工具的问题。 2.比对SQL剖析在下面的章节,我形容了比对明天新抽取的全量表和上日在maxcompute上应用前日全量和上日增量合并的上日全量的环节。比对两张表汇合是否统一的SQL办法其实比较简单,大家第一工夫就会想到汇合操作。在oracle外面有Minus、except,同样在maxcompute外面也有。然而为了便于剖析问题,我还是本人写了一个SQL。示例SQL(maxcompute sql)如下: --限定日期分区,比对上日select count(t1.BATCH_NUMBER) as cnt_left,count(t2.BATCH_NUMBER) as cnt_right,count(concat(t1.BATCH_NUMBER,t2.BATCH_NUMBER)) as pk_inner,count(case when t1.BATCH_NUMBER is not null and t2.BATCH_NUMBER is null then 1 end) as pk_left,count(case when t2.BATCH_NUMBER is not null and t1.BATCH_NUMBER is null then 1 end) as pk_right,count(case when nvl(t1.rec_id ,'') = nvl(t2.rec_id ,'') then 1 end) as col_diff_rec_id,count(case when nvl(t2.rec_creator ,'') = nvl(t1.rec_creator ,'') then 1 end) as col_diff_rec_creator,count(case when nvl(t2.rec_create_time,'') = nvl(t1.rec_create_time,'') then 1 end) as col_diff_rec_create_timefrom ods_dev.o_rz_lms_im_timck01 t1 -- 开发环境从新初始化的明天数据full join ods.o_rz_lms_im_timck01 t2 -- 生产环节昨日长期增量合并的数据on t1.BATCH_NUMBER =t2.BATCH_NUMBER and t1.IN_STOCK_TIME =t2.IN_STOCK_TIMEand t1.OP_NO =t2.OP_NO and t1.STOCK_CODE =t2.STOCK_CODE and t1.YP_ID =t2.YP_ID and t2.ds='20230426'where t1.ds='20230426';--cnt_left 9205131 阐明:左表有记录数 9205131--cnt_right 9203971 阐明:右表有记录数 9203971--pk_inner 9203971 阐明:主键关联统一记录数 9203971--pk_left 1160 阐明:左表比右表多记录数 1160--pk_right 0 阐明:右表比左表多有记录数 0--col_diff_rec_id 9203971 阐明:字段统一记录数与主键统一雷同,阐明关联上的两个表该字段统一--col_diff_rec_creator 9203971 阐明:同上--col_diff_rec_create_time 9203971 阐明:同上在下面的例子中,左表是明天从新初始化的数据,右表是在maxcompute上merge的上日全量数据。在比对之前,咱们其实就应该理解这两个表的数据必然是不统一的。尽管是同一张表,然而时点是不统一的。 ...

May 9, 2023 · 1 min · jiezi

关于数据分析:马哥数据分析Py全栈爬虫Aipython全能工程师江水流春去欲尽

download:马哥数据分析+Py全栈+爬虫+Ai=python全能工程师人工智能(AI)是一种计算机技术,它利用大量数据和算法来模仿人类思维和行为。在古代社会中,AI已成为许多重要畛域的关键字之一,如医疗、金融、交通和制作等。 AI的最大劣势是其高度自动化的个性。通过 AI 技术,企业能够将工作流程自动化,从而进步生产效率和品质。此外,AI还能够帮忙企业收集和剖析大量数据,以便更好地理解客户需要和市场趋势。 另一个重要的关键字是AI的能力,即学习和适应性。通过机器学习和深度学习技术,AI零碎能够主动从数据中学习,并不断改进其性能。这些技术使得AI零碎能够以前所未有的速度和准确度来执行各种工作,包含图像识别、语音辨认、自然语言解决和机器翻译等。 AI还具备高度可定制性的特点。因为不同的企业和行业须要不同的AI解决方案,因而,AI零碎必须具备高度灵活性和可定制性。AI零碎能够依据特定的需要进行调整和优化,以便更好地适应不同的业务场景。 AI的另一个关键字是其潜在危险。只管 AI 技术的倒退为企业带来了微小的商业机会,但也存在一些潜在的危险和挑战。例如,AI零碎可能会产生谬误后果,这可能会对企业的决策和业务产生负面影响。此外,AI零碎还可能蒙受攻打,从而导致数据泄露或其余平安问题。 总之,AI技术曾经成为古代社会中许多畛域的重要组成部分。它具备高度自动化、学习能力、可定制性和潜在危险等关键字。随着AI技术一直倒退和改良,它将持续推动企业和社会的提高和倒退。

April 28, 2023 · 1 min · jiezi

关于数据分析:揭穿数据分析的六大谎言

目前许多企业在决策时仍沿用以往的集体教训,没有用数据谈话,这在理论决策运行时会呈现很多问题。在数据分析行业倒退成熟的国家,90%的市场决策和经营决策都是通过数据分析钻研确定的。用数据谈话,器重定量分析,也逐步成为科学研究、企业经营、政府决策等过程着重思考的问题,越来越多的人们意识到数据分析对经济倒退的重要意义。 什么是数据分析呢?权威组织的定义:一类由数据仓库(或数据集市)、查问报告、数据分析、数据挖掘、数据备份和复原等组成的利用,以帮忙企业决策。 但在古代,商业智能是指利用古代数据仓库技术、在线剖析解决技术、数据挖掘和数据展现技术,进行数据分析。其实质是数据+业务了解, 总结一句话,就是通过各种BI软件的性能,实现商业价值。当下依然有一些企业在担心是否要施行和应用商业智能(BI)解决方案的来帮忙企业更好地实现数字化转型。这种顾虑可能是许多因素引起的,包含BI是不是只能由数据科学家或通过专门培训的业务分析师应用,BI工具或者平台很低廉,BI没有数据安全性等等。好吧,这些担心都曾经过期了,从市场的角度和数据分析倒退的趋势来看,现在,商业智能解决方案服务于越来越多的企业,融入于所有部门的现有业务流程中。让咱们来看看对于数据分析的6大谎话: 误区1:BI仅实用于大型企业信息化时代,企业数据市场面临着大数据攻打,对于企业来说,海量的数据蕴含着大量的价值金矿。对数据的剖析和解决能力,间接决定了企业开掘数据商业价值的能力。随着BI的飞速发展,当初国内很多中小企业也开始施行BI,市场竞争越发强烈。任何行业的任何规模的企业都能够从应用BI中受害。无论您是小公司还是大型企业,对数据分析的需要始终存在。企业通过施行BI解决方案将建立本人的处于劣势位置,因为他们能够应用收集到的海量数据来做剖析,挖掘出更大的数据价值来驱动企业更快决策。例如,一家中小型企业可能精确跟踪销售业绩,从而辨认增长市场并可能依据数据疾速做出决策,并抢占市场先机。IDC考察的2000多个大中型企业在寰球20个国家表明,如果一个公司能够采取一套残缺的数据分析解决方案(包含数据收集、整合、筛选、剖析、共享), 而不仅是单个数据管理技术,那么在将来四年中,企业将从其数据资产中发掘出额定60%的数据红利。 误区2:BI工具对于一般业务用户来说太简单了以后的 BI 工具的发展趋势曾经解脱了传统BI的动态查看数据后果,更多的自助式剖析服务使得企业和组织可能更加自在地摸索、剖析和生成他们想要的数据见解。Wyn 商业智能BI 为业务人员和技术人员的最终用户提供了易于应用的基于Web的数据可视化大屏,报表和交互式查看器。施行自助式 BI 工具可进步工作效率和团队合作,一般企业的业务人员也能够轻松进行数据分析,同时不依赖于 IT 团队,更宽泛地利用于企业的数字化实战中,造成企业日常经营的全景图,反映到产品研发、服务流程改善、精准营销、销售模式降级等各个部门的改良上来。 误区3:BI太贵了这是事实 - 一些BI解决方案的确可能很低廉。很多取决于BI 解决方案的受权形式、用户数量、数据量等。与其余 BI 解决方案相比,Wyn 商业智能BI 提供了较低的洽购老本,没有数据量的限度,没有文档数量的限度,这些因素都有助于适应将来几年的业务增长和可预测的 BI 估算。 误区4:自助式 BI 会侵害数据安全和隐衷数据安全和数据治理在部署任何BI 工具方面都施展着重要作用。应用 BI 工具实现基于用户、组织、角色的安全性将确保适当的人员只容许拜访相干部门的正确数据和信息是保障数据安全的一个重要措施。Wyn BI 反对管理员设置基于用户、组织的数据行级平安,通过行级数据管理,管理员能够管制不同用户和组织只能拜访指定的数据,从而起到数据安全的作用。Wyn通过治理和组织的扩大属性,用户、组织上下文信息,而后在数据过滤和查问中援用具体的用户、组织信息,来实现限度指定数据行级别的数据拜访,在数据可视化大屏和报表中,用户也只可拜访本人权限内的数据。比方:所有员工都只能拜访对应所属大区的销售数据,先在用户上下文中增加“大区”这个属性,而后在过滤器中援用。 误区5:自助式 BI 将吞没数据库和服务器资源许多 BI 解决方案反对应用实时数据、缓存数据、结构化数据、半结构化数据、云数据和基于文件的数据以及混合来自不同起源的数据,这样能够大大加重数据库或服务器资源的读取数据的压力。例如,应用Wyn BI,能够将解决好的要用于剖析的数据提前抽取到Wyn本身的缓存中,同时可依据剖析数据的时效性配置对应的主动刷新打算或者手工刷新,这样大屏在剖析和展现过程中,间接从缓存读取和刷新数据,也不会因为数据库的性能造成数据分析的瓶颈。 误区6:组织只能应用一个 BI 平台大多数企业中应用的BI 工具的均匀数量在两到三个之间,对于高级用户,如数据科学家或 DBA,能够应用技术性很强的 BI 工具进行开发。然而,对于日常BI用户,例如营销或服务部门的用户,能够应用对技术门槛更低、更敌对的自助式BI工具,例如Wyn BI,更大程度的扩充和推广数据分析能力在企业的利用,全面加强企业的数据文化。在往年疫情的缓和局势下,简直所有企业都意识到数字化转型曾经成为一种必然。企业不再纠结于“不转型等死,转不好型找死”的选择题中,而是开始动摇地找寻数字化转型的指标和办法。而商务智能,它是一套残缺的解决方案,用来将企业中现有的数据进行无效的整合,疾速精确地提供报表并提出决策依据,帮忙企业做出理智的业务经营决策。施行BI帮忙的确须要一些工夫和工作,然而BI的益处远远超过挑战,冀望下面六个谎话的突破,能够推动您在BI之旅中释怀的迈出第一步。点击下方收费获取100张数据可视化大屏模板:https://www.grapecity.com.cn/solutions/wyn/demo

March 23, 2023 · 1 min · jiezi

关于数据分析:如何实现报表可视化有没有工具推荐

随着数据量的一直增长,如何更好地进行数据分析和可视化已成为企业和组织面临的重要挑战。实现报表可视化是一个很好的解决方案,它能够帮忙用户更好地了解和剖析数据,发现趋势和模式,并反对数据驱动的决策。本文将介绍如何实现报表可视化,举荐一个优良的工具——SmartBI,并探讨它的劣势。 如何实现报表可视化? 要实现报表可视化,须要进行以下几个步骤: 1、收集和整顿数据首先须要收集和整顿须要出现的数据,包含数据的起源、类型、格局等信息。通常能够应用各种数据管理工具和技术,例如数据库、数据仓库、ETL工具等。 抉择报表类型和设计布局:依据须要出现的数据和指标用户群体,抉择适当的报表类型和设计布局。常见的报表类型包含表格、柱状图、折线图、饼图、地图等。 2、抉择适合的可视化工具依据须要出现的数据和设计布局,抉择适合的可视化工具。常见的可视化工具包含Tableau、Power BI、SmartBI等。 3、数据可视化设计依据所抉择的报表类型和布局,设计相应的数据可视化。须要思考可视化元素的地位、色彩、大小、字体等属性,并确保信息的清晰易懂、视觉效果良好。 公布和分享报表:最初,将数据可视化报表公布和分享给指标用户群体。能够应用在线平台、挪动利用、邮件等多种形式进行公布和分享。 强烈推荐工具:SmartBI SmartBI是一款基于云计算的智能商业剖析和报表可视化工具。它能够帮忙用户轻松创立各种类型的报表和仪表板,包含表格、图表、地图、穿插表等。以下是SmartBI的劣势: 1、多种数据源反对SmartBI能够连贯多种数据源,包含关系型数据库、NoSQL数据库、大数据平台等,能够不便地从不同的数据源中提取数据。 2、数据分析和建模SmartBI反对各种数据分析和建模性能,例如数据荡涤、数据透视、数据筛选、数据聚合等,能够帮忙用户更好地了解数据。 3、灵便的报表设计SmartBI提供了多种报表设计性能,例如可视化元素的调整、数据字段的增加和删除、款式的定制等,能够依据用户需要

March 7, 2023 · 1 min · jiezi

关于数据分析:数据分析的理解

前言这是我对当初遇到的一些专有名词的了解 维度,指标维度能够从某一个角度剖析一个后果,比方,明天的注册人数,这个明天就能够了解成维度。也能够这样了解,不必通过操作,比方加减乘除均匀,这些须要操作的,都当作维度。 举个栗子 指标跟下面的反过来,个别须要加减乘除均匀,这类的操作能力得出的后果,什么,注册人数,订单量,互动量,声量,份额,留存率,这些能简略看进去就是要计算的 举个栗子等等等等,没有全副圈进去 码表我本人了解哈,码表应该是提供关键词命中网上抓取到的合乎录入条件的同时,再润饰一下,而后入库,比方哈题目xxxxx在小红书的关注度超过xxxx内容大家好我是xxx,感激大家巴拉巴拉,在斗鱼充值的时候,巴拉巴拉 依据我的图,关键词小红书命中,所以这条数据要抓,而后呈现过滤词斗鱼充值,再入库的时候把这个过滤掉,而后码表后面有A业务线,小红书,那么最终入库的时候,数据是 业务 品牌 题目 内容A业务线 小红书 xxxxx在小红书的关注度超过xxxx 大家好我是xxx,感激大家巴拉巴拉,在的时候,巴拉巴拉这样看又如同不对,过滤词如果真的这样操作元数据后感觉前后文都不通,那么我猜应该是这样,关键词命中是第一步,而后再判断有没有呈现过滤词,如果有,阐明是有效数据,不抓,如果没有,则抓入库以上是了解,总结,码表是客户提供的,客户通知咱们,他们想要咱们抓什么样子的数据。有了这一步,才有下一步的剖析

February 27, 2023 · 1 min · jiezi

关于数据分析:Apache-Doris-122-Release-版本正式发布

敬爱的社区小伙伴们,咱们很快乐地发表,Apache Doris 于 2023 年 2 月 15 日迎来 1.2.2 Release 版本的正式公布!在新版本中,Apache Doris 团队修复了自 1.2.1 版本公布以来超过 200 个问题或性能改良项。同时,1.2.2 版本作为 1.2 LTS 的迭代版本,具备更高的稳定性,倡议用户降级到这个版本。 GitHub下载:https://github.com/apache/dor... 官网下载页:https://doris.apache.org/zh-C... New Feature数据湖剖析反对主动同步 Hive Metastore 元数据信息。 默认状况下内部数据源的元数据变更,如创立或删除表、加减列等操作不会同步给 Doris,用户须要应用 REFRESH CATALOG 命令手动刷新元数据。在 1.2.2 版本中反对主动刷新 Hive Metastore 元数据信息,通过让 FE 节点定时读取 HMS 的 notification event 来感知 Hive 表元数据的变更状况。参考文档:https://doris.apache.org/docs/dev/lakehouse/multi-catalog/反对读取 Iceberg Snapshot 以及查问 Snapshot 历史。 在执行 Iceberg 数据写入时,每一次写操作都会产生一个新的快照。默认状况下通过 Apache Doris 读取 Iceberg 表仅会读取最新版本的快照。在 1.2.2 版本中能够应用 FOR TIME AS OF 和 FOR VERSION AS OF 语句,依据快照 ID 或者快照产生的工夫读取历史版本的数据,也能够应用 iceberg_meta 表函数查问指定表的快照信息。参考文档:https://doris.apache.org/docs/dev/lakehouse/multi-catalog/icebergJDBC Catalog 反对 PostgreSQL、Clickhouse、Oracle、SQLServer。JDBC Catalog 反对 insert into 操作。 在 Doris 中建设 JDBC Catalog 后,能够通过 insert into 语句间接写入数据,也能够将 Doris 执行完查问之后的后果写入 JDBC Catalog,或者是从一个 JDBC 表面将数据导入另一个 JDBC 表面。参考文档:https://doris.apache.org/docs/dev/lakehouse/multi-catalog/jdbc/主动分桶推算反对通过 DISTRIBUTED BY HASH(……) BUCKETS AUTO 语句设置主动分桶,零碎帮忙用户设定以及伸缩不同分区的分桶数,使分桶数放弃在一个绝对适合的范畴内。参考文档:https://mp.weixin.qq.com/s/DSyZGJtjQZUYUsvfK0IcCg ...

February 15, 2023 · 2 min · jiezi

关于数据分析:填报设置主键

1.单主键Employee 表的主键为 empno,那么脚本中的 update 函数配置为:A1.update@k(employee:employee_old,employee,empno,ename,salary,sex;empno)在英文分号前面配置主键 empno,报表在做更新解决时,会以 empno 为主键比照 employee 和 employee_old 对象的数据,而后将差别数据更新到表 employee 中。完整版脚本内容如下图所示:2.多主键个别状况下,物理表只设置一个主键字段就能够将数据记录辨别开来,非凡状况下会设置两个及以上主键字段,例如上述 employee 表咱们能够通过 empno 字段来辨别数据记录,也能够通过 ename+sex 两个字段来锁定惟一一条符合条件的记录,此时咱们的脚本中应该如何设置主键呢?很简略,只须要用英文逗号隔开多个主键字段就能够了:A1.update@k(employee:employee_old,employee,empno,ename,salary,sex;ename,sex)完整版脚本内容如下图所示:3.自增主键自增主键能够晋升查问效率、节俭磁盘空间,在填报中也有广泛应用。以 mysql 设置为例:能够通过第三方工具(如 Navicat)或者 sql 语句设置某个主键字段的数据主动增长。  在数据库端很容易配置主键字段的主动增长,那么在润乾报表中如何实现主动增长字段的数据更新呢?很简略,只须要增加一个 @1 选项就搞定了。A1.update@1k(employee:employee_old,employee,empno,ename,salary,sex;empno)其中,@1 选项示意第一个字段是自增字段,没有对应更新值表达式留神:这里是数字 1 而不是字母 l完整版脚本内容如下图所示: 4.“动静”主键       “动静”主键咱们了解成通常说的 UUID,示意主键的值是一个不反复的随机数,这种形式比主动增长形式更平安、反复率更低。        咱们以 mysql 数据库为例,将随机生成的四位数字作为主键 empno 的数据,并将数据更新入库。在润乾报表中只须要多一步 run 操作给主键字段赋值,剩下的和惯例更新配置一样。       =employee.run(if(empno==null,~.empno=A1.query(“select round(round(rand(),4)*10000) as xuhao”).xuhao))  // 当 employee 对象中的主键 empno 字段为空的时候,咱们将随机生成的四位数字赋值给主键字段(这里为什么条件是判断为空呢?因为个别自增主键或者 UUID 主键都不容许编辑或者间接设置用户不可见,所以此时新增的记录中主键字段为空。)完整版脚本内容如下图所示:

February 14, 2023 · 1 min · jiezi

关于数据分析:做专家型服务者尚博信助力企业数字化转型跑出加速度-爱分析调研

01 从技术利用到业务重构,数字化市场召唤专家型厂商 企业数字化转型是一个长期且系统性的改革过程。随同着企业从信息化建设转向业务的数字化重构,市场对数字化厂商的能力要求也在降级。晚期的信息化建设次要是从技术视角切入,采纳部分需要驱动、繁多业务逻辑部署的形式,依据企业业务倒退逐渐搭建起一个个IT零碎,例如ERP、CRM、OA等,将企业现有的业务流程从线下迁徙到线上,实现了业务过程的数据化。在数据积攒的根底上,企业对于数据驱动业务的诉求逐步加强,数字化转型成为行业大势所趋。与信息化不同,数字化转型的外围,是技术与业务的深度交互与交融翻新,是从人的教训驱动降级为数据驱动,借助大数据、人工智能、云计算等数字技术实现对业务、流程、组织的全方位、系统化的改革或模式翻新,促成企业经营效率和业务价值晋升。从技术思维转向业务思维,企业数字化转型的我的项目存在业务属性强、需要差别大、架构体系简单等特色,这也就要求作为重要助力方的厂商不再只是提供繁多的技术或产品,而是可能表演数字化专家的角色,基于本身对业务的深刻理解和洞察,为甲方企业数字化转型出谋划策,指引转型新方向,助力企业放慢转型降级步调。然而,市场上很多厂商往往是立足于本身的技术能力,从某项技术或产品登程去寻找相匹配的甲方客户,“拿着锤子找钉子”是普遍现象。这种厂商往往不足真正帮忙甲方企业实现胜利数字化转型的残缺能力。因而,专家型厂商是甲方企业穿梭数字化转型迷雾的要害之一,但也是稀缺能力。具备怎么特质的数字化厂商能力称之为专家?只有具备粗浅业务了解与洞察能力的数字化厂商,才可能更无效放大技术+产品的价值效用,也就是说,专家型厂商须要具备超过技术懂业务的特质。具体来看,业务了解与洞察能力次要体现在以下几个方面: 粗浅洞察与商业模式创新能力:数字化厂商须要粗浅洞察企业所处行业及业务场景中的痛点和需要,造成独特的认知与理念,并可能疾速抓住趋势变动,发明出新的商业模式,赋能甲方企业业务价值晋升。解决方案场景贴合度与定制化能力:面对多行业、多场景下的简单业务需要,数字化厂商须要具备丰盛的我的项目教训和行业know-how,将企业理论需要与技术架构体系进行深度交融,构建出具备深刻业务了解的解决方案。同时,针对不同企业客户在业务流程、性能等方面的个性化需要,厂商须要提供定制化的能力。 数字化转型征询布局能力:数字化转型征询专家通常领有跨行业多视角的前沿洞见、丰盛多元的业务实操教训。厂商须要搭建征询专家团队,提供数字化征询治理的能力,不仅为企业提供业务痛点拆解、转型计划征询、落地施行的全流程服务反对,还可能深度参加到企业的数字化战略规划研究与制订中。基于行业标杆客户实际的教训积攒:标杆客户的数字化转型需要,往往代表了行业各种简单和个性化的利用场景,相应标杆客户对于产品性能要求、技术先进性和性能的要求十分高。对于厂商而言,在服务行业标杆客户数字化转型的同时,也是在一直地积攒行业know-how。因而,行业标杆客户实践经验积淀越多,越可能代表厂商对于大量业务场景具备粗浅的认知与洞察能力,产品技术能力也失去了实际验证。 图1: 专家型数字化厂商的业务理解能力体现 02 “行业数字化专家”尚博信的修炼之路 数字化市场倒退尚处于晚期,但在很多细分市场,供应侧的厂商之间已造成了强烈的竞争,其中有诸多“实力派”厂商暗藏在水面之下。尚博信就是一个典型的代表。尚博信成立于2008年,是一家为大中型企业提供外围业务数字化解决方案的服务商。在成立伊始,尚博信就将本身定位于行业数字化专家,以科技翻新帮忙大中型企业数字化转型倒退,赋能企业多场景、多业务模式的精细化经营。目前,尚博信领有800多人的专业化队伍,覆盖全国的服务支撑体系,曾经为200多家企业成功实践数字化转型降级和重塑商业模式。从能源到消费品批发、汽车、金融,以标杆实际促成专家能力积淀尚博信的专家能力内化于本身倒退历程中,通过一个个标杆我的项目的施行逐渐积淀造成。自2008年成立以来,尚博信经验了行业摸索、行业扩张两个阶段。在2008-2017年间,尚博信深度服务于能源行业大型国央企客户,围绕行业上游油田、炼厂、管道、油库等生产利用场景,以及上游加油加气站、城市燃气等终端销售利用场景,积攒了中石油、中石化、中化、中海油等多个标杆性实际案例,造成了对能源行业简单业务场景的粗浅认知。基于能源行业标杆我的项目实践经验,以及技术架构先进、产品解决方案当先、大型国央企服务教训等劣势,尚博信从2018年进入行业扩张阶段。2018年,尚博信进军电力畛域,围绕充电桩经营、电力交易等场景推出了智慧能源平台相干解决方案。例如,针对国家电网传统充电桩平台存在的零碎拓展性差、迭代慢、保护难等问题,尚博信基于互联网中台化架构,助力实现智慧车联网平台的重构,实现对全国50万+充电桩业务的智能化经营治理。2019年,尚博信将会员经营教训、技术架构引入中免团体大会员我的项目,通过对立会员标识以及积分、等级、权利体系,帮忙中免买通线上线下各渠道会员权利和营销利用,促成营销精细化程度晋升。尔后,尚博信进一步拓展了中国游览团体、中粮、蒙牛等消费品批发行业客户。2020年,尚博信进入汽车行业尤其是新能源汽车畛域,基于丰盛的主机厂一线业务实践经验,打造出汽车数字化营销服一体化解决方案,助力吉利极氪、smart、潍柴能源、阿维塔等汽车品牌重构经营支撑体系。同时,尚博信自2020年开始拓展银行与金融业务板块,一方面,基于数据治理与开掘能力,尚博信利用数字化技术赋能银行批发、同业、信贷、经营治理等业务畛域的翻新和模式改革,实现以数据驱动银行精细化业务管理和价值增长;另一方面,尚博信翻新场景金融单干模式,打造简付加油、车牌付加油等智慧加油领取新场景,助力银行与石油石化销售企业开展跨界营销单干,晋升银行销售业绩。截至目前,尚博信曾经积攒了工商银行、建设银行、安全银行、民生银行、兴业银行等标杆性实际案例。从倒退历程来看,尚博信深耕数字化生产、数字化营销两大业务线,重视技术、产品与行业的深度联合,最早基于能源行业国央企客户需要,围绕生产治理、会员营销等场景打造出标杆性实际案例,并以强影响力实现我的项目施行教训与方法论的跨行业迁徙复用。通过大量的标杆案例施行与know-how积淀,尚博信逐渐成为专家型数字化服务商。继续聚焦劣势业务畛域,整合积淀标准化产品尚博信继续深耕劣势业务畛域,联合本身行业教训与技术能力,在一直的实际中打磨、积淀解决方案。目前,针对能源与公共事业、消费品与批发、汽车与先进制作、银行与金融四大行业畛域,尚博信曾经造成了成熟且齐备的行业解决方案。 图2: 尚博信产品服务布局 例如,面向能源与公共事业畛域积淀了生产调度指挥系统、设施衰弱管理系统、智慧油库平台、智慧能源平台等解决方案;面向汽车与先进制作行业提供了制作工厂生产管控平台、智慧营销平台、销售履约平台、售后经营平台等解决方案。与此同时,尚博信基于数据中台、业务中台等新型技术架构,通过深度外部协同,将各行业不同利用场景下的共性需要与性能进行提炼,打造出可疾速复制推广的外围产品,以“解决方案的产品化”促成本身专家能力的积淀。例如,尚博信的经营决策平台是以数据中台为底层技术架构,通过买通企业原有的业务零碎、控制系统和采集零碎,实现数据的分类收集、荡涤、存储和剖析,并借助于数据仪表盘、数字孪生可视化、调度智慧大屏等多种展示伎俩,构建决策反对、预警督办、联动指挥闭环流程,目前曾经用于撑持炼厂、油库、加油站、电网电动汽车、汽车智慧工厂等生产利用场景,以及会员经营治理等营销场景,赋能企业数据驱动经营与决策。 03 依靠粗浅的行业know-how,尚博信打造数字化专家能力壁垒 基于行业多年、多利用场景下的大型标杆客户我的项目施行,尚博信一直强化本身行业know-how积淀,凭借行业洞察与商业模式创新能力、解决方案场景贴合度高和定制化能力、征询布局能力、行业标杆客户实践经验积攒等劣势,继续打造数字化专家能力壁垒。 具备粗浅的行业洞察与商业模式创新能力 尚博信具备对行业倒退、客户需要的粗浅洞察力,在面对新趋势、新场景、新挑战时,可能疾速联合在过往业务中积淀的教训劣势与独特认知,打造出翻新的商业模式并实战利用,实现从“价值发现”到“价值发明”的进阶。 例如在汽车服务畛域,尚博信团队具备丰盛的主机厂一线业务实践经验,积攒了粗浅的汽车行业know-how及对主机厂营销痛点的洞察,在面对线下渠道销售难度加大、消费者需要个性化等挑战下,尚博信疾速抓住直销模式的新需要,构建出以用户为核心的数字化营销服一体化解决方案,助力主机厂在直销模式上的转型翻新,目前曾经为吉利极氪、smart、阿维塔等汽车品牌实现营销服数字化降级革新。 解决方案场景贴合度高,可能面向多行业、多场景提供定制化能力 尚博信继续深耕能源、消费品批发、汽车、金融等行业,积攒了丰盛的垂直行业教训,并转化为深厚的行业常识储备,在面对不同行业大型客户的多元数字化需要时,可能精准把握客户业务痛点与需要,将产品技术能力与场景深度交融,反对定制化开发,打造出合乎企业个性、个性化业务需要的解决方案。 例如,在中国海油智慧加油站平台搭建我的项目中,尚博信从“业务晋升”和“技术换代”两个维度对客户的业务需要和痛点进行深度分析,联合过往行业实践经验提供了深度开发、定制化的产品服务。并且,针对油品领取、非油品批发、全场景营销、车主服务等加油站利用场景,尚博信通过提供油非一体化销售、无感智慧加油、异业嫁接与生态单干拓展、领取即会员体系、社群会员经营、卡车司机之家服务等性能,满足客户对高质量商品的谋求和对服务、场景体验式的需要,实现价值转化。 组建行业专家团队,具备较强的征询布局能力 尚博信领有专家团队继续钻研行业客户需要,以较强的征询布局能力助力甲方企业从业务策略向数字化策略降级。一方面,尚博信通过组建翻新研究院,会集畛域内泛滥资深行业专家,基于多年的行业积淀和最佳实际积攒,继续深刻摸索新技术在行业中的利用价值,开掘各行业中的翻新需要,以创新性产品与解决方案推动企业数字化转型倒退。 另一方面,尚博信具备较强的征询布局能力,不仅仅是基于客户现有明确需要给出业务征询优化策略,更可能深度参加到甲方数字化策略研究中,基于单方一直的思维碰撞和场景开掘,再进行零碎的优化与迭代,实现与客户价值共生。 例如,在与中免团体最新的合作项目中,尚博信以征询专家身份与中免团体业务部门、IT部门独特开展数字化策略研究,单方就新技术、新场景、新模式如何驱动现有业务增长进行多轮次的探讨,包含像元宇宙技术在会员营销、虚构品牌橱窗、电商经营方面的利用等。通过这种重复研究碰撞模式,尚博信专家团队继续输入对业务场景的粗浅认知与洞察,帮忙中免团体确定将来的数字化策略倒退布局。 积淀多行业标杆客户实践经验 尚博信聚焦中大型客户策略,通过多年行业客户服务,截至目前曾经积攒了大量TOP级标杆客户实践经验,其业务理解能力和产品能力失去了行业内头部企业的认可。 具体来看,能源行业的标杆客户包含中国石油、中国石化、中国海油、国家电网等,消费品与批发行业包含中国游览团体、中免团体、中粮、蒙牛等,汽车与先进制作行业包含领克、吉利极氪、smart等,银行与金融行业包含中国工商银行、中国建设银行、安全银行等。 04 继续强化专家能力劣势,促成转型价值减速开释 作为专家型数字化厂商,将来尚博信仍将围绕数字化营销、数字化生产两大产品线,继续深耕能源与公共事业、消费品与批发、汽车与先进制作、银行与金融四大行业,一直夯实专家能力劣势,为行业企业尤其头部客户提供更好的产品与服务体验,以及更业余的数字化转型征询,助力企业数字化转型降级跑出“加速度”。从行业发展趋势来看,咱们认为,随着企业数字化转型走向深刻,数字化厂商与甲方之间的单干也将进一步深入,厂商的重要性将更加凸显。一方面,厂商将强化本身业务了解与洞察能力,更加器重技术与业务的深度交融,为甲方客户提供基于场景化构建的解决方案;另一方面,厂商不仅仅是解决方案提供方,而将以长期合作伙伴深度参加到企业数字化策略研究与布局落地中,以价值共生模式赋能企业业务增长。

February 10, 2023 · 1 min · jiezi

关于数据分析:数据分析师都要具备以终为始的思考逻辑

职场中,须要的是「解决问题」的能力,对于数据分析师同样如此。 数据分析解决业务问题有一套“标准化流程”:从明确需要、荡涤数据,到剖析起因、提出倡议。对于这大同小异的过程,有的分析师轻车熟路赋能业务,但有的却频频卡壳,或者拿了数据不知从何动手,或者剖析一轮后却被否定。 针对这些问题,咱们须要「以终为始」,使得数据分析的全流程,始终围绕着同一个目标进行:解决业务问题。 什么是「以终为始」?以终为始是一种「逆向思维」,要求从目标登程,倒推现阶段要做的事以终为始是一种「指标治理」,把当下要做的事限度在「指标达成」的框架里以终为始是一条「通关门路」,沿着它向前奔跑不会偏离方向比方我要把「饼干数据分析脑暴会」打造成以乐于分享的社群,这是指标,那如何掂量指标达成?确定评估指标为:每月达人直播分享会数量,即每月都有1个达人进行主题直播分享。 要达成这个指标,须要先思考一个问题:达人为什么会来直播分享?答复:按等价交换准则,达人来分享是帮忙进步社群活跃度,那么达人能取得什么呢?从物质、精力维度划分,或者是金钱、名声。所以社群就须要解决付费、以及听众的问题。 听众的问题,能够量化成社群人数,认为社群笼罩的人数足够多,达人即可取得更高知名度; 对于付费的问题,个别认为更多人违心为优良产品付费,所以该问题能够转为如何做一场优良的分享会。 要进步社群人数能够通过内容创作及多渠道宣传,而为了帮忙达人做优良的分享会,须要把分享会教训积淀成开箱即用工具包,帮忙升高分享门槛的同时确保分享会品质。 至此,咱们为了达成“乐于分享的社群”的指标,倒推至当下要做的事就是创作内容、积攒分享会教训,逆着以上思路便可造成阶段里程碑。这就是以终为始的具象表白。 为什么「以终为始」很必要?数据分析过程中很多存在的问题,都是因为没有「以终为始」引发的: 想要转行数据分析,然而学海茫茫,不知从何学起?「以终为始」:先联合集体倒退布局,明确数据分析畛域的岗位。对标中大厂该岗位的要求,造成学习技能树指标,“循序渐进”即可。 学习过程中,为了学习工具而学习工具,没有艰难也要给本人制作艰难「以终为始」:以解决问题的思路,先简略后简单,先入门后进阶,先实现后完满。在学习过程中,对须要的常识应该有“水平”的把控,某知识点应该学到什么水平?设定里程碑阶段,确保方向正确,能力离指标达成越来越近。 给业务进行数据分析的过程中,没有思路,不晓得从何开始搭框架?「以终为始」:回到此次数据分析的目标,是要解决特定业务场景下的业务问题。没有思路,是否因为没有把对应的业务问题拆透?须要进一步把业务问题依据「业务目标」拆解成多个子问题,能力转成数据问题,能力基于此搭建剖析框架。 「案例」数据部门和产品部门沟通,应后者需要搭建模型评估单品价值,过程中始终在探讨要什么数据、什么算法,探讨逐步往数据、算法自身下来了,效率很低。此时奶茶妹妹提出须要「以终为始」,先让产品部门答复“做这件事的目标”以及“如何评估最终造成的数据模型的作用”这两个问题,围绕着答案,对后面头脑风暴过程中探讨的数据指标进行删减、对算法依据评估指标优化,很快就搭建起了整体框架。数据分析师如何做到「以终为始」?做事前,从业务层面思考,先问为什么:想分明做这件事是要解决什么问题? 学习数据分析常识前,先明确岗位要求,就是思考要达成的数据分析能力能够解决什么样的业务问题?比方是围绕用户的经营,还是针对互联网产品的优化。 小Tips:入门数据分析师沟通数据需要,资深数据分析师沟通业务需要。上述“单品价值模型”的案例中,业务要解决的是库存挤压占用资金老本,心愿通过优化「库存构造」来解决此问题。换成商品经营的语言,就是通过洽购更多高价值的单品、清理低价值单品等形式,进步库存周转率,进步资金利用率。 从数据层面思考,合成指标:搞清楚真正的问题在哪? 能够借用Issue Tree逻辑树和SMART准则工具,对指标进行治理,最终映射到数字空间,转成数据问题。 上述“单品价值模型”的案例中,问题转成了如何计算单品的价值?回到业务需要中,优化库存构造的后果通过「存销比」来掂量,也就是说单品价值的计算公式须要与存销比指标挂钩,换句话说须要通过指标公式判断热销产品。 那如何判断热销产品? 在批发行业,能够套用人货场模型: 人:历史数据中更多人买的商品?还是针对外围用户群的商品货:单价在哪个区间商品?还是不同品类决定了销售状况?场:热销品是否存在节令效应?从执行层面思考,制订做事程序:造成解决问题的步骤框 这一步须要对由业务问题转成的数据问题进行起因剖析。剖析过程中,须要「以终为始」思考最终数据分析的产出模式,也就是说在起因剖析过程中须要围绕着最终的「业务指标」和「产出模式」造成残缺的剖析框架。 上述“单品价值模型”的案例中,问题转成了通过人货场模型找到热销产品的特点,思考到最终的产出是以模型公式的模式,对每个单品的价值进行定义计算,所以在人货场模型的剖析后,须要造成公式:单品价值 = 用户指标×商品指标×周期指标。 结尾如果说什么是数据分析逻辑,我认为「以终为始」就是重要的思考能力,能够帮忙咱们梳理剖析框架的同时,真正解决业务问题。 愿无知者无力,愿无力者前行。 我是@饼干哥哥,继续为您打造数字化时代的剖析能力。

January 8, 2023 · 1 min · jiezi

关于数据分析:数据分析中的SQL如何解决业务问题

本文来自知乎问答。 发问:数据分析人员须要把握sql到什么水平? 请问做一名数据分析人员,在sql方面须要把握到什么水平呢?会增删改查就能够了吗?还是说对于开发的内容也要会?不同阶段会有不同的要求吗?注释: 作为专一数据分析论断/我的项目在业务落地以实现增长的分析师,倡议在开始学习新技能前,先明确利用场景。对症下药能力不枉费致力。 翻译过去就是:先理解与SQL相干的数据分析工作有哪些?有了指标,能力晓得须要筹备什么常识来应答。 按我目前与SQL相干的工作内容,为你提供以下参考: (食用阐明:依据以下场景,抉择须要重点学习的知识点) SQL利用场景及必备常识:(星标依据应用频率标记,而非重要性) 数据查问 ★★★业务场景也就是常说的“提数”。 理论工作场景中,如果向IT提提数需要,个别都须要沟通+排期,所以最有效率的倡议就是本人会从数据库里提数 数据分析师除了本身的剖析工作外,有时(甚至是常常)还须要应酬产品、经营等部门共事的提数需要 必备常识简略查问即最简略的关键字组合SELECT +FROM +WHERE +(BETWEEN /IN) 是SQL查问的地基 此简略查问能够应答局部提数需要,例如经营想查看某段时间订单 多表查问即INNER JOIN、LEFT JOIN 等联结关键字设想中的取数可能是间接在某个表SELECT想要的字段? NO! 实际上为了查问效率,数据会散落到数据库的各个角落,例如想要理解一笔订单状况,信息存在这些表中:订单流水表、订单详情表、商品详情表、门店表、会员表等。 该局部常识的关键在于「明确业务剖析需要→抉择适合的联结形式」 数据更新 ★★☆业务场景即题主所说的“增删改” 该场景之所以仅两星的起因,是理论工作中,数据库运维部门给到咱们数据分析师的数据库账号多半是只读权限,也就无奈去“增删改”; 此外,还有数据管控的起因 所以此场景可能更多在于自建数据库中,如在电脑上新建虚拟机搭建数据库服务器,导入数据后不便进行下一步剖析 必备常识数据库与表的创立、删除和更新该局部知识点关键在于「字段类型的设置」要合乎后续剖析需要,如订单商品数量就要设成数值类型、订单日期设成日期类型等。 (因为见过都设成字符类型的表,所以就简略提一下) 剖析数据 ★★★业务场景该局部堪称是数据分析师的外围工作 面对简单的业务问题,重点在于将其拆解、转译成简略的SQL问题 「案例」例如教育行业中某领导要求你“剖析某课程的成果如何”→ 翻译: 课程成果可通过学生问题反映,即是要计算问题最大值、最小值、学生问题散布 → SQL语句 必备常识汇总剖析即GROUP BY关键字 解决业务问题: 如计算每个课程学生的均匀问题: SELECT avg(问题) FROM 成绩表 GROUP BY 课程简单查问如嵌套子查问、标量子查问、关联子查问 可应答更简单的业务问题: 如找出每个课程最高分的学生 → 须要按课程分组后找到最高问题记录,能够利用关联子查问: SELECT 学生名字 FROM 成绩表 a WHERE 问题 = (SELECT max(问题) FROM 成绩表 b WHERE a.课程=b.课程)窗口函数聚合/排序函数 ( ) OVER (PARTITION BY ..ORDER BY..) ...

January 7, 2023 · 1 min · jiezi

关于数据分析:用于年度复盘与计划的数据分析报告怎么写

又到了年底年初做总结的日子,每个人&部门都要向老板做汇报,其中最重要的模式就是写年度数据报告。 首先咱们要分明写这个货色的目标是什么?大略有3个: 第1,剖析问题,帮忙整个管理层来看往年咱们产生了什么问题,哪些是须要明年去解决的?做一个年度整体的复盘给一些明年的倡议。第2,瞻望预测,是对明年市场的预测,因为领导肯定会对明年的支出有一个预期,那咱们要做的是如何依据这个预期来拆解工作及行动计划?第3,问题打分,总结问题次要是看咱们的绩效是否达成,过来一年做了什么样的数据输入?这些输入最终在业务侧体现了什么样的业绩?前2个须要比拟强的逻辑撑持须要数据,第3个的话要害还是在于怎么把问题写得更丑陋,而后让领导和团队的人看着难受。 ok, 那具体怎么写呢?应该是包含几个局部 第1局部,【打分】年度KPI/OKR数据复盘这部分相当于是整篇报告的摘要,是老板最关怀的中央,须要联合定性和定量的角度: 数据上,年度外围KPI达成多少年度外围我的项目实现得怎么样定义:做得好,还是不好?一般来说,都是好 :)简述关键问题与教训,引入第2局部第2局部,【业务】年度关键问题与成功经验大白话就是去年有哪些做得不好的中央,为什么?有哪些做得好的中央,是因为做对了什么?这部分要做归因,须要很谨严的逻辑,内容可能很多然而老板不肯定爱看所以要合乎金字塔原理: 论断后行成指标体系:下面第1局部是北极星指标,这里第2局部就是第2-3级指标拆分起因的时候合乎MECE准则少即是多,抓住主要矛盾来输入第3局部,【问题】团队达成的业绩之前我分享数据分析师如何定义绩效的时候,说按“功绩”、“苦劳”的纬度来讲做成了什么,这里也能够用上: 留神这里要讲团队有些公司要向董事会汇报,能够适当包装,dddd一些成果不好的中央,加点互联网黑话成果好的中央,使劲放大第4局部,【瞻望】明年绩效指标及重要措施绩效指标不是拍脑袋拍进去的,逻辑同样重要: 跟老板战略目标走,拆解到部门职能能够干啥联合市场趋势剖析,预测指标是否能达成如果按目前停顿无奈达成,须要做什么由此,推演出明年的外围我的项目和外围指标愿无知者无力,愿无力者前行。 我是@饼干哥哥,继续为您打造数字化时代的剖析能力。

January 2, 2023 · 1 min · jiezi

关于数据分析:完整数据分析流程Python中的Pandas如何解决业务问题

开篇作为万金油式的胶水语言,Python简直无所不能,在数据迷信畛域的作用更是不可取代。数据分析硬实力中,Python是一个十分值得投入学习的工具。 这其中,数据分析师用得最多的模块非Pandas莫属,如果你曾经在接触它了,无妨一起来通过残缺的数据分析流程,摸索Pandas是如何解决业务问题的。 数据背景为了能尽量多地应用不同的Pandas函数,我设计了一个古古怪怪然而理论中又很实在的数据,说白了就是比拟多不标准的中央,等着咱们去荡涤。 数据源是改编自一家超市的订单,文末附文件门路。 导入所需模块import pandas as pd数据导入Pandas提供了丰盛的数据IO接口,其中最罕用的是pd.read_excel及pd.read_csv函数。 data = pd.read_excel('文件门路.xlsx', sheet_name='分页名称')data = pd.read_csv('文件门路.csv')从超市数据集中把多页数据别离导入: orders = pd.read_excel('超市数据集.xlsx', sheet_name= '订单表')customers = pd.read_excel('超市数据集.xlsx', sheet_name= '客户表')products = pd.read_excel('超市数据集.xlsx', sheet_name= '产品表')该环节除了导入数据外,还须要对数据有初步的意识,明确有哪些字段,及其定义 这里咱们通过 pd.Series.head() 来查看每个数据表格的字段及示例数据 明确业务问题及剖析思路在业务剖析实战中,在开始剖析之前,须要先明确剖析指标,倒推分析方法、剖析指标,再倒推出所需数据。 这就是「以终为始」的落地思维。 假如业务需要是通过用户分层经营、造成差异化用户经营策略。数据分析师评估后认为可基于RFM用户价值模型对顾客进行分群,并通过不同族群画像特色制订经营策略,比方重要价值用户属于金字塔顶端人群,须要提供高老本、价值感的会员服务;而个别价值用户属于价格敏感型的虔诚顾客,须要通过折扣刺激生产等。 因而,这里的分析方法则是对存量用户进行RFM模型分群,并通过统计各族群数据特色,为业务提供策略倡议。 明确业务需要及分析方法后,咱们能力确定去统计顾客的R、F、M、以及用于画像剖析的客单价等指标,此时能力进入下一步。 特色工程与数据荡涤数据迷信中有句话叫 "Garbage In, Garbage Out",意思是说如果用于剖析的数据品质差、存在许多谬误,那么即便剖析的模型办法再周密简单,都不能变出花来,后果仍是不可用的。 所以也就有了数据科家中80%的工作都是在做数据预处理工作的说法。 特色工程次要利用在机器学习算法模型过程,是为使模型成果最佳而进行的系统工程,包含数据预处理(Data PrePorcessing)、特征提取(Feature Extraction)、特征选择(Feature Selection)以及特色结构(Feature Construction)等问题。 直白地说,能够分成两局部: 数据预处理,能够了解成咱们常说的数据荡涤;特色结构,比方此次构建RFM模型及分组用户画像中,R、F、M、客单价等标签就是其对应的特色。(当然,RFM非机器学习模型,这里是为了便于了解进行的解释。) 数据荡涤什么是数据荡涤?数据荡涤是指找出数据中的「异样值」并「解决」它们,使数据利用层面的论断更贴近实在业务。 异样值: 不标准的数据,如空值、反复数据、无用字段等,须要留神是否存在不合理的值,比方订单数据中存在内部测试订单、有超过200岁年龄的顾客等特地留神数据格式是否正当,否则会影响表格合并报错、聚合统计报错等问题不合乎业务剖析场景的数据,比方要剖析2019-2021年的用户行为,则在此时间段之外的行为都不应该被纳入剖析如何解决: 个别状况下,对于异样值,间接剔除即可但对于数据绝对不多,或该特色比拟重要的状况下,异样值能够通过用平均值代替等更丰盛的形式解决在理解数据荡涤的含意后,咱们便能够开始用Pandas来实操该局部内容。 数据类型先用pd.dtypes来检查数据字段是否正当 发现订单日期、数量是Object(个别即是字符)类型,前面无奈用它们进行运算,须要通过pd.Series.astype()或pd.Series.apply()办法来批改字符类型 orders['订单日期'] = orders['订单日期'].astype('datetime64')orders['数量'] = orders['数量'].apply(int) 另外,对工夫类型的解决也能够通过pd.to_datetime进行: orders['订单日期'] = pd.to_datetime(orders['订单日期'])批改字段名经验丰富的数据分析师发现字段名字也有问题,订单 Id存在空格不便于前面的援用,须要通过pd.rename()来批改字段名 orders = orders.rename(columns={'订单 Id':'订单ID', '客户 Id':'客户ID', '产品 Id':'产品ID'})customers = customers.rename(columns={'客户 Id':'客户ID'})多表连贯把字段名以及数据类型解决好后,就能够用pd.merge将多个表格进行连贯。 ...

January 1, 2023 · 2 min · jiezi

关于数据分析:图计算引擎分析Gemini

作者:京东科技 王军前言Gemini是目前state-of-art的分布式内存图计算引擎,由清华陈文光团队的朱晓伟博士于2016年发表的分布式静态数据剖析引擎。Gemini应用以计算为核心的共享内存图分布式HPC引擎。通过自适应抉择双模式更新(pull/push),实现通信与计算负载平衡[‎1]。图计算钻研的图是数据结构中的图,非图片。理论利用中遇到的图,如社交网络中的好友关系、蛋白质构造、电商等[‎2]等,其特点是数据量大(边多,点多),边遵从指数分布(power-law)[‎7],通常满足所谓的二八定律:20%的顶点关联了80%的边,其中1%的点甚至关联了50%的边。 如何存储大图随着社交媒体、批发电商等业务的倒退。图数据的规模也在急剧增长。如规范测试数据集clueweb-12,生成后的文本数据大小780+GB。单机存储曾经不能满足需要。必须进行图切分。常见的图切分形式有:切边、切点。 切点:又称“以边为核心的切图”,保障边不被切开,一条边在一台机器上被存储一次,被切的点创立多个正本,正本点所在的机器不分明对于此点的相干边。如上图所示,两头点被别离保留三个版本,此点会别离呈现在三台机器上,在做更新时须要更新三次。切边:又称以“顶点为核心的切图”,相比于切点,保障点不被切开。边会被保留两次,作为正本点所在机器能分明感知到此点的相干边。如上图所示信息只进行一次更新。Gemini采纳切边的形式进行存储。定义形象图为G(V,E),Gemini定义了主正本(master)与镜像正本(mirror),计算时是以master为核心进行计算。如下图所示,集群每台机器上仅保留mirror到master的子图拓扑构造,而mirror点并未被理论存储(比方权重值),每台机器负责一部分master存储( )。如下图所示,Gemini将图依照partition算法切分到2个不同的机器。其中 mirror作为逻辑构造,没有为其调配理论存储空间;但每条边被存储了两次。 长处:单机能够残缺获取master的拓扑构造,不须要全局保护节点状态。图存储图的常见存储形式:邻接矩阵、邻接表、十字链表,此处不作具体解释,有趣味可参照[‎3]。| 示意办法 | 邻接矩阵 | 邻接表 | 十字链表 | | 长处 | 存储构造简略,访问速度快,程序遍历边 | 节俭空间,访问速度较快 | 在邻接表根底上进一步,节俭存储空间。 | | 毛病 | 占用空间很大(nn存储空间) | 存储应用指针,随遍历边构造,为提高效率,须要同时存储出边入边数据。 | 示意很简单,大量应用了指针,随机遍历边,拜访慢。 |剖析上表优缺点,可见:上述三种示意形式都不适宜幂律散布的graph存储。压缩矩阵算法图计算问题其实是一个HPC(High Performance Computing)问题,HPC问题个别会从计算机系统构造的角度来进行优化,特地在防止随机内存拜访和缓存的无效利用上。有没有一种既保证拜访效率,又能满足内存的局部性,还能节俭空间的算法呢?压缩矩阵存储。常见的图压缩矩阵算法有三种coordinate list(COO)、Compressed sparse row(CSR)、Compressed sparse column (CSC)算法进行压缩‎8。COO压缩算法COO应用了坐标矩阵实现图存储(row,collumn,value),空间复杂度3|E|;对于邻接矩阵来说,如果图中的边比拟稠密,那么COO的性价比是比拟高。 CSR/CSC压缩算法CSC/CSR都存储了column/row列,用于记录以后行/列与上一个行/列的边数。Index列存储边的所在row/column的index。CSC/CSR是在COO根底上进行了行/列压缩,空间复杂度2|E|+n,理论业务场景中的图,边往往远多于点,所以CSR/CSC绝对COO具备更好压缩比。 长处:存储严密,内存局部性强;毛病:遍历边时,须要依赖上一个点的最初一条边的index,所以只能单线程遍历。压缩矩阵算法无奈实时更新拓扑构造,所以压缩矩阵算法只实用动态或者对数据变动不敏感的场景。| CSC伪代码 | CSR伪代码 | | loc← 0 for vi←0 to colmns for idx ←0 to colmn[i] do //输入到指定行的列 edgevi] ←value[loc] loc← loc+1 end end | loc← 0 for vi←0 to rows for idx ←0 to row[i] do //输入到指定列的行 edge [ index[idx]] [vi] ←value[loc] loc← loc+1 end end |Gemini的图压缩Gemini对 CSC/CSR存储并进行了改良,解释了压缩算法的原理。Gemini在论文中指出,index的存储空间复杂度是O(V),会成为零碎的瓶颈。引出了两种算法:Bitmap Assisted Compressed Sparse Row(bitmap辅助压缩CSR)和Doubly Compressed Sparse Column(双压缩CSC),空间复杂度降到O(|V'|),|V'|为含有入边点的数量。 ...

December 27, 2022 · 2 min · jiezi

关于数据分析:分贝通携手火山引擎数智平台-探寻数智化升级新通路

2022年,面对疫情重复带来的经济波动影响,“活下去”成为了不少企业的首要指标,降本增效已是当下不少企业的对策。 基于此,以推动包含票据报销数字化等在内的费控SaaS行业再一次引起了资本市场的不小关注,近年来费控SaaS企业一直取得新一轮融资,行业融资次数及额度也创下了历史新高。 实际上,费控SaaS并非一个新的风口。2014年,国外报销SaaS厂商Concur以83亿美元的价格被SAP收买后,点燃了国内创业者对费控SaaS的激情。 2015~2016年间,分贝通、易快报、汇联易、费控宝、每刻报销、简洁费控、元年云等一大批新兴费控SaaS品牌纷纷入场。到了2017年,市场上费控SaaS的玩家甚至达到了六、七十家,市场也随之进入白热化阶段。 不过,与大多数产业一样,经验过强烈的竞争过后,市场格局更加清晰。现在,市面上较为闻名的费控SaaS公司仅有7~8家,曾经较2017年费控SaaS炽热期间时数量降落了90%。 也正是在这个过程中,费控SaaS资源日益向头部集中,以分贝通为代表的头部企业实现了规模迅速增长。本文就将以费控SaaS头部企业分贝通的成长视角,一探中国费控SaaS行业的成长之路。 01 间断三年三倍增长 分贝通成立于2016年,彼时其次要致力在打造一站式商旅收入治理。起因在于,对于十分便捷的C端挪动领取,企业收入治理仍然存在费用不通明,财务报销效率低,员工报销体验差、垫资压力大等问题。因而,分贝通冀望可能发明便捷的企业收入治理体验。6年深耕,随着平台能力的减少,最终分贝通成为集商旅、费控和领取为一体的平台。 得益于“费控Saas+交易”的成长模式,在过来三年内,分贝通每年都实现了三倍支出增长,成为了一家累计融资金额近20亿、服务客户超千家的头部企业。 分贝通能获得如此之快的成长,首先在于传统模式的报销流程有太多的“槽点”,其次是,它所在的企业费用治理赛道是一个千亿级别的大市场。 大家应该都有过报销的经验,其繁琐水平不由得让每位打工人为之头疼,稍有不粗疏的中央,就须要推倒重来,消耗了大量的工夫,也制约了企业的运作效率。 同样,对于财务人员,面对大量零散的票据、单据,也不免呈现会计凭证金额录入出错的状况。而一个单据录入谬误往往会导致同批单据都得从新复合,经常让财务人员因为几块钱对不上而“抓狂”。 而分贝通的呈现,则基本扭转了这一现状。 企业员工能够在分贝通app内实现机票、酒店、火车、用车等多场景的高频因公生产,零碎可主动对立结算,免去垫资这一流程,并对接财务零碎凭证疾速入账,极大缩小了员工在琐事上破费的工夫,也让财务人员不用在月末、年末疯狂加班。 现在,无论大企业还是小企业,都须要用数字化来实现降本增效。数字化实现收入的迷信管控,是企业实现降本增效的必备条件,也是费控SaaS得以疾速倒退的外围起因。市场调研机构艾瑞征询数据显示,预计2022国内费控SaaS行业的市场规模将达到39亿元,年复合增长率达75.2%。 02 向全面费控治理降级 目前在美国资本市场上,IPO上市的企业服务SaaS公司多达两百多家,其中许多曾经被市场验证的成熟商业模式给了中国企业服务市场很好的借鉴意义。 比方以美国SaaS巨头Salesforce为例,能够看出生态联盟、产业协同是SaaS厂商发展壮大之后的必由之路。Salesforce在晚期围绕CRM发展壮大之后,便面向产业生态发动了多起收买,如其前后收买的大数据分析平台Tableau、ESB软件Mulesoft用于内部零碎对接,收买Heroku不便开发人员开发和部署应用程序等,均是为了补足其产业生态而做出的。 简略来说,围绕CRM的产品升级和产品矩阵丰盛,是Salesforce成长为巨头的关键因素,而现在这一点也成为了企业服务SaaS行业的一个共识。 同样,对于费控SaaS赛道来说,从繁多的智能报销,向全面费控治理降级,并一直延长平台服务类目,是现在支流费控SaaS企业所抉择的倒退路线。 为此,分贝通逐渐将业务拓展到企业洽购、企业估算治理、电子档案等解决方案,真正成为了整合商旅、费控、领取于一体,定义下一代企业收入治理的平台。 在企业洽购解决方案中,办公洽购聚合了分贝通自营、京东自营、苏宁自营等资源,实现笼罩罕用办公用品洽购40万+SKU,可提供职装品定制、礼赠品定制、企宣品定制、标品及定制品、衍生品定制,并反对顺丰、京东物流、闪送专人权限,实现一键下单、一统流程。 纵观费控SaaS龙头分贝通的倒退历程,从商旅场景切入费控SaaS赛道,再到将场景拓展至贴补、福利、办公洽购以及领取等企业应用场景,分贝通悄悄扭转了企业领取场景的体验。 在三年三倍增长的背地,既有解决传统报销痛点,踏上行业慢车的因素,也同样是分贝通一直拓展能力边界,实现从繁多场景到全场景利用的后果。 03 数据驱动倒退 从一个小公司成长为费控SaaS行业龙头,随着客户量指数级别的递增,分贝通也着手布局数字化,寻求数据驱动倒退的新策略。 在过来,分贝通的数据散落在内部购买的各个系统中,而各个系统之间并不能无效买通,以致了“信息孤岛”的产生,对分贝通的经营和营销带来了肯定妨碍。 为此,分贝通思考引入客户数据平台,更好地赋能分贝通的经营和精准营销。“在抉择客户数据平台时,咱们会着重思考产品性能和文档是否欠缺、底层架构是否具备可扩展性、API是否丰盛等问题。”分贝通数据负责人如此谈到。 最终,分贝通抉择引入火山引擎数智平台旗下的VeCDP和DataFinder,来辅助本身的数据驱动倒退策略。 火山引擎是字节跳动旗下的云服务平台。往年9月,火山引擎公布了数智平台VeDI,全面凋谢了字节跳动数据技术能力,包含数据引擎、数据建设和治理、数据分析利用及解决方案的全链路数据能力,为企业数字化倒退提供新的增长能源。 VeCDP和DataFinder是火山引擎数智平台数据分析应用层的产品。据悉,DataFinder可能帮忙企业轻松实现针对包含小程序、APP等在内的多渠道埋点部署,实时洞察用户全生命周期行为,并实现数据采集和根底剖析。而这些数据还能与其余源自不同零碎中的数据一起流转至VeCDP中,并通过ETL/ELT将多种数据格式进行集成对立,帮忙企业买通多渠道、多设施、多起源的隔膜,集中解析客户ID,并实现包含“去重”等在内的深度数据加工,实现以“人”为核心的标识对立,同时提供品种丰盛的标签款式,最大限度满足企业对市场群体的多维洞察和数据利用。 在引入火山引擎VeCDP之后,分贝通买通了来自线上和线下的多方数据起源,并让外部的信息系统做到数据互通,为实现多场景客户服务打下基础。不仅如此,火山引擎VeCDP还让分贝通在营销和销售层面的客户转化率较以往晋升了60%左右。 在营销端,基于火山引擎VeCDP,分贝通能够通过大数据、AI剖析描绘出客户画像,为其营销策略提供反对,实现目标客户精准投放,效率失去很大晋升;在销售端,基于火山引擎VeCDP,分贝通能够在适合的工夫点提醒销售人员该做哪些事件,防止了重点客户的脱漏,服务质量失去大幅度晋升。 “在我看来,数字化的意义不仅在于工具的应用上,而是对一个企业在思维、策略、办法等维度的全面晋升。”分贝通市场部负责人对征探财经这么谈道。 正如人体的推陈出新,继续一直地用新物质代替旧物质,人才会有生命力,企业也是如此。在数字化蓬勃发展的明天,分贝通始终用最前沿的技术一直对本人的IT架构进行欠缺,并基于此在业务层面一直扩大本人的能力边界,帮忙企业实现多维度降本增效。 往年2月17日,分贝通发表实现1.4亿美元的C+轮融资,估值11.4亿美元,由DST Global领投,D1 Capital Partners、WhaleRock、沙特阿美旗下P7 Ventures、Emergence联结投资,老股东高瓴、Ribbit、斯道资本、Glade Brook和BitRock Capital等超额跟投。本轮融资后,分贝通历史累计融资额近20亿元人民币。 目前,分贝通的企业费控产品已取得了泛滥企业的青眼,其中不乏元气森林、金山办公等出名公司的身影,创始了一个新时代的数字化费用管理模式。也置信分贝通这样的头部企业在一直摸索中,中国企业服务SaaS行业可能找到一条兼顾纵向与横向发展,且能实现盈利可继续的路线。 点击跳转 客户数据平台 VeCDP 增长剖析 DataFinder 理解详情!

December 16, 2022 · 1 min · jiezi

关于数据分析:如何使用YonBuilder实现数据分析

数据分析是一个典型的工作场景,同时也是一个必备的职业技能;无论什么职位,都须要通过数据跟踪业务、发现业务的亮点与短板,精准归因,进而实现业绩晋升。应用 YonBuilder,通过拖拽形式就能轻松实现数据分析。接下来,咱们通过员工信息数据的案例开展介绍。 创立剖析数据 在进行数据分析前,须要创立一个员工信息表,并导入员工数据。 首先新建一个利用,并在利用中新增一个员工信息实体,实体配置如下: 在页面建模中,依据新增的实体创立员工信息表,并选中预览员工信息表,通过模板导入曾经筹备好的数据。 在表格中导入员工信息数据后,咱们能够通过 YonBuilder 的剖析页面对现有数据进行剖析。 剖析卡片 在页面建模中抉择新增页面创立剖析卡片时,要在数据模型中抉择咱们创立的实体来进行数据绑定,这样才能够在生成的剖析页中获取到实体中的字段。 在剖析卡片中,能够通过拖拽轻松实现数据分析配置。进入剖析卡片设计页面,页面左侧的组件栏中集成了剖析图表、表格、地图、文本、时钟等组件,选中组件并将其拖拽到画布上,就能够对组件的数据源以及款式进行调整。 选中画布上的组件后,在页面右侧的数据设置中,将字段拖拽到分类轴以及数值轴中,即可实现对相应组件数据的批改,其中数值轴能够对选中字段进行多种函数计算。 同时,将字段间接拖拽到页面顶部的筛选栏中,能够实现对于筛选条件的配置。有一点须要留神的是,除了根底的数据分析以外,当分类轴中同时有两个及以上字段时,能够实现数据钻取剖析,此时双击第一层级的某一个字段,能够进入到第二层级的数据分析。 在下图中,咱们同时将年龄段以及省份退出到分类轴数据中,并勾选数据钻取选项。当点击年龄段剖析的 20 岁及以下局部时,进入到了第二层级的数据分析,也就是剖析 20 岁及以下员工的省份散布。 在页面设计的下方,通过增加页签,能够同时增加多个剖析卡片进行剖析。 通过上方的拖拽配置,咱们实现的数据分析卡片成果如图,能够对员工的年龄段散布进行统计,并通过条件进行筛选。 仪表板 除了创立剖析卡片以外,咱们还能够通过创立仪表板来创立数据大屏。在页面创立时,同样要在数据绑定中选中创立的员工信息实体。 与剖析卡片相比,仪表板中有更多页面设置的选项,以便对于页面款式进行进一步优化。当初,咱们通过窗格布局来设计一个数据大屏。 对于根底组件的设置,仪表板中与剖析卡片中是统一的,通过拖拽多种剖析图表、批改轴数据并进行排版,能够轻松实现数据大屏搭建。 在 YonBuilder 中通过剖析页面能够轻松实现元数据分析。本篇教程通过导入的形式填充了员工信息数据表,在理论利用中,将零碎中已有的实体数据关联到剖析页面中即可疾速实现对于实体数据的剖析。

November 29, 2022 · 1 min · jiezi

关于数据分析:时间序列分析8大挑战

预测是数据迷信中的一个热门但又艰难的问题。挑战的呈现有几个起因,从非平稳性到噪声、缺失值等等。如何解决这些问题可能是进步预测性能的要害。工夫序列是一系列按工夫排序的值。预测这些数据集的要害是察看时序之间的工夫依赖性,以及过来产生的事件是如何影响将来的。但以下8个起因可能是影响时序预测可靠性(预测性能)的次要起因: 1.非平稳性平稳性是工夫序列中的一个外围概念。如果工夫序列的统计量(比方平均水平)不随工夫变动,则该工夫序列是安稳的,其察看后果不依赖于察看它们的工夫。许多现有的时序预测办法都假如工夫序列是安稳的,但趋势或季节性等因素毁坏了平稳性。转换工夫序列能够缩小这个问题,比方对时序数据进行差分、取对数等等,将非安稳转换为安稳数据,并可通过几种办法测验工夫序列是否安稳,比方单位根测验(ADF)、KPSS-test等。 2. 预测步长过长预测通常被定义为预测工夫序列的下一个值。但提前预测许多值具备重要的理论劣势,它缩小了长期的不确定性,从而可能更好地制订商业作战打算。预测更远的将来必然会减少不确定性,因而,预测更长的时间段变得更加艰难。 3.对常见事件的关注通常,咱们对预测常见状况更加关注,这些是散布的尾部。以能源生产为例,预测用电顶峰对于治理电网的供需至关重要。通常状况下,常见的事件会带来重大的长期结果,典型的例子是股市崩盘,这些事件会导致许多投资者的财务破产。常见的事件可能会影响数据分布,从而使以后的模型过期。对于这些状况以及它们是如何产生的信息很少,因而很难预测它们。有几种办法能够改良极值的预测: 应用老本敏感模型;利用面向极其状况的统计散布;从新采样训练数据的散布。4.额定的依赖关系和维度除了工夫之外,工夫序列通常还有额定的依赖关系。 时空数据是一个常见的例子,每个察看在二维上是相干的,有本人的滞后(工夫依赖性)和左近地位的滞后(空间依赖性)。 时空数据是多元工夫序列的一个非凡实例。这些工夫序列由多个变量示意,额定变量可能蕴含贵重的信息。因而,对它们进行建模对于进步预测性能可能至关重要。 5.变点事物会随着工夫的推移而变动,代表这些事物的工夫序列的数据分布也是如此, 重大变动被称为变点(Change Points)。当它们忽然产生时,这些变动被称为构造断裂。 有时变动点是已知的,比方市场解体或和平暴发,这深刻影响了组织的运作形式。随着工夫的推移,散布曾经扭转了,旧的察看没有以前有用,然而对于新散布的信息又很少。 检测和适应变动对于放弃模型最更新很重要。 6.低信噪比直观地讲,信噪比量化了工夫序列的可预测性。信号是数据的相干局部,也是试图建模和了解的货色。然而,这个信号常常被乐音或看似随机的、不可预测的稳定所覆盖。有时候这种乐音可能是咱们不足畛域常识,不晓得哪些因素影响了数据,或者这些因素很难量化。所以序列的变动看起来比拟随机,典型的例子就是金融数据,低信噪比数据是普遍存在的。 7.噪声和缺失值噪声可能源于数据采集有余。比方噪声、缺失值可能是因为设施故障引起的,传感器故障导致数据失落或者存在烦扰,导致谬误读数。噪声也可能是因为谬误的标签而产生的,当正文者给数据调配了谬误的标签时就会呈现这种状况。适当的预处理步骤能够帮忙加强序列的信号,比方卡尔曼滤波器或指数平滑。 8.小样本量有些时候,工夫序列蕴含大量的观测值,在这种状况下,算法可能没有足够的数据来建设适当的模型。这个问题可能是因为采样频率低造成的。例如,工夫序列只按月或按年观测,或者它们所代表的事物很少产生,比方极其天气事件。在批发行业,还可能会遇到冷启动问题,指的是新推出的产品信息很少的状况。数据的不足可能是因为变点引起的(见上文第5点),如果产生重大变动,历史数据就会过期,须要反映新散布的新数据。数据不足的问题能够通过应用全局预测模型来缓解(Lightgbm YYDS!),这些模型利用许多工夫序列来构建模型。 小结在本文中形容了在时序预测工作中常遇到的8个挑战: 非平稳性:当数据统计量随工夫扭转时;多步预测:对长期预测的需要;极值:对极其事件更关注;额定的依赖:对预测至关重要的额定变量;变点:检测散布的变动;低信噪比:当工夫序列具备低可预测性;乐音:数据中的随机稳定;小样本:当没有足够的数据; 公众号:DS数说 作者:xihuishaw欢送关注我的公众号DS数说,原创技术文章第一工夫推送。 原链接传送门:https://mp.weixin.qq.com/s?__...

November 28, 2022 · 1 min · jiezi

关于数据分析:业务数据分析最佳案例旅游业数据分析⛵

本文应用『城市酒店和度假酒店的预订信息』,对旅游业的倒退现状进行数据分析,蕴含了残缺的数据分析流程:数据读取、数据初览、数据预处理、描述性统计、探索性数据分析、关联剖析、相关性剖析。 作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 本文地址:https://www.showmeai.tech/article-detail/388 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容 在本篇内容中,ShowMeAI将带大家对旅游业,次要是酒店预订需要进行剖析,咱们应用到的数据集蕴含城市酒店和度假酒店的预订信息,包含预订工夫、住宿时长、客人入住的周末或工作日晚数以及可用停车位数量等信息。 咱们本次用到的是 酒店预订数据集,蕴含 119390 位客人,有 32 个特色字段,大家能够通过 ShowMeAI 的百度网盘地址下载。 实战数据集下载(百度网盘):公✦众✦号『ShowMeAI钻研核心』回复『实战』,或者点击 这里 获取本文 [[59]旅游业大数据多维度业务剖析案例](https://www.showmeai.tech/art...) 『酒店预订数据集』 ⭐ ShowMeAI官网GitHub:https://github.com/ShowMeAI-Hub 本文数据分析局部波及的工具库,大家能够参考ShowMeAI制作的工具库速查表和教程进行学习和疾速应用。 数据迷信工具库速查表 | Pandas 速查表 图解数据分析:从入门到精通系列教程 导入工具库# 数据处理&科学计算import pandas as pdimport numpy as np# 数据分析&绘图import matplotlib.pyplot as pltimport seaborn as snsimport plotly.express as pximport plotly.graph_objects as goimport plotly.figure_factory as ffimport warningswarnings.filterwarnings("ignore")# 科学计算from scipy.stats import skew,kurtosisimport pylab as py# 工夫import timeimport datetimefrom datetime import datetimefrom datetime import date 读取数据df = pd.read_csv("hotel_bookings.csv")df.head() ...

November 27, 2022 · 14 min · jiezi

关于数据分析:还在用饼状图来瞧瞧这些炫酷的百分比可视化新图形附代码实现⛵

本文解说9种『炫酷高级』的数据图表,可视化地示意比例或百分比:哑铃图、甜甜圈图、华夫饼图、沉积条形图...附上代码,快快用起来吧! 作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 本文地址:https://www.showmeai.tech/article-detail/339 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容 饼图是用于显示分类数据比例的典型图表,咱们用圆形图形代表整个样本集,把它分为多个切片并显示对应数据与总数相比的比例奉献。饼图在数据可视化中常常应用,因为它直观且后果容易了解。 不过饼图并不是咱们能够应用的惟一抉择,还有一些炫酷高级的图表能够示意比例或百分比,在本篇内容中 ShowMeAI 将给大家讲到另外9个备选可视化图形计划,具备雷同的性能但实现成果不一样。 本篇内容波及的工具库,大家能够参考ShowMeAI制作的工具库速查表和教程进行学习和疾速应用。 图解数据分析:从入门到精通系列教程 数据迷信工具库速查表 | Pandas 速查表 数据迷信工具库速查表 | Seaborn 速查表) 获取数据咱们先导入所需工具库: # 数据分析解决工具库import numpy as npimport pandas as pd# 数据可视化工具库import matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline咱们将以案例的模式给大家解说可视化技巧,本篇的数据咱们将应用爬虫技术爬取获取,咱们对维基百科上显示截至 2020 年煤炭产量超过 500 万吨的国家和地区进行数据爬取和整顿。 # 爬虫与网页解析工具库import requests from bs4 import BeautifulSoupwikiurl='https://en.wikipedia.org/wiki/List_of_countries_by_coal_production'table_class='wikitable sortable jquery-tablesorter'response=requests.get(wikiurl)#status/状态码为200,示意爬取胜利print(response.status_code)咱们应用 BeautifulSoup 工具对爬取到的网页进行解析 # 解析对应的网页元素soup = BeautifulSoup(response.text, 'html.parser')table = soup.find('table',{'class':"wikitable"})# 整顿为dataframe状态df_coalall = pd.read_html(str(table))[0]df_coalall 这里咱们不应用全副国家,咱们抉择欧洲 2020 年煤炭产量的国家。例如俄罗斯、德国、波兰、捷克共和国、乌克兰、罗马尼亚、希腊和保加利亚。 大家也能够批改上面的代码,对国家或年份进行更改。 # 选取国家list_country = ['Russia', 'Germany', 'Poland', 'Czech Republic','Ukraine', 'Romania', 'Greece', 'Bulgaria']# 整顿不同国家的数量df_coalpre = df_coalall[df_coalall['Country'].isin(list_country)]df_coalpre = df_coalpre.iloc[:,0:2]df_coalpre.rename(columns={'2020[1]':'2020'}, inplace=True)df_coalpre.reset_index(drop=True, inplace=True)df_coalpre ...

November 26, 2022 · 4 min · jiezi

关于数据分析:联合方案|Smartbi-携手滴普科技全链路打造敏捷数据分析服务

企业数据化转型过程中,企业数据往往扩散在做个业务零碎中进行贮存治理,为帮忙企业将各个业务零碎中的数据交融对立,实现对立的数据管理,思迈特软件与滴普科技联结公布“麻利数据分析平台到数据利用交融对立计划”,单方将从数据采集、数据集成和数据利用等层面进行基础设施建设,欠缺数据仓库服务能力。 思迈特软件与滴普科技的彼此单干旨在更好地买通数据价值链,为各企业提供更适宜本地化接入的数据根底平台定制服务,更智能地提供个性化的产品和体验。 ● 麻利数据分析平台:通过全流程的数据拉通,重塑业务链+数据流+要害信息管控点,实现对立数据管理、对立数据语义、对立数据服务,建立健全的企业级数据接入规范与标准,推动企业数字化转型。 ● 自助式数据分析:围绕市场、产品、经营外围业务线条,精准赋能业务,实现由数据资产变现,晋升决策治理的数字化和智能化。 该计划以滴普科技产品技术作为底层基础架构,通过对行业内、内部数据进行采集、贮存、计算、整合,并借助Smartbi构建数据分析平台,实现企业业务数据化、数据场景化、决策智能化。计划不仅能够进步企业数据根底平台体系底层的稳定性、高可用性和扩展性,还能够实现数据资产的统一分配、治理、服务和利用,全面晋升企业的产品服务翻新和数字化程度。 *以上优惠政策工夫截止至2022年12月31日,具体政策征询对应品牌厂商销售经理将来,思迈特软件将与各位合作伙伴一起,乘势而上,通过优势互补和技术协同,在单方各自生态圈的加持下,为泛滥行业客户提供更优良的数字化解决方案,实现数字化赋能,进而反哺推动行业的倒退,共赢产业新机遇。对于滴普科技成立于2018年,定位为数据智能服务商。滴普科技以最新的数据智能技术为根底,以数据的业务价值为外围,为客户提供数据智能畛域的大数据根底软件产品与服务。滴普科技的外围产品——实时湖仓平台FastData,全面整合了从数据集成、数据分析再到数据价值实现的残缺链路,帮忙企业建设对立治理、流批一体、湖仓一体的云原生数据智能平台,实现海量数据实时剖析,成为撑持企业数字化转型的外围根底软件设施。

November 25, 2022 · 1 min · jiezi

关于数据分析:异常值检测最佳统计方法实践代码实现⛵

数据集中的异样值,对于数据分布、建模等都有影响。本文解说两大类异样值的检测办法及其Python实现:可视化办法(箱线图&直方图)、统计办法(z分数&四分位距)。 作者:韩信子@ShowMeAI Python3◉技能晋升系列:https://www.showmeai.tech/tutorials/56 数据分析实战系列:https://www.showmeai.tech/tutorials/40 本文地址:https://www.showmeai.tech/article-detail/336 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容 异样值 Q&A异样值是间隔其余数据值太远的数据点,也被称为离群点。它可能是天然产生的,也可能是因为测量不精确、拼写错误或系统故障造成的。异样值也可能呈现在歪斜数据中,这些类型的异样值被认为是天然异样值。 理解异样值检测与剖析的基础知识,请查看 ShowMeAI](https://www.showmeai.tech/) 这篇文章: 图解数据分析 | 数据荡涤与预处理 异样值对散布有什么影响?异样值会影响数据的均值、标准差和四分位数值。如果咱们在去除异样值之前和之后计算这些统计数据,可能会有比拟大的差别。 异样值对机器学习模型有什么影响?如果认为异样值是天然的,不是因为测量谬误产生的 → 应该将其保留在数据集中,并用『标准化』等数据预处理形式解决。如果有一个蕴含大量异样值的大型数据集 → 应该将其保留,不会显著影响后果。如果确定异样值是由测量误差造成的 → 应该将它们从数据集中删除。 去除异样值会带来数据集规模的减小,而且模型的适用性也会限度在输出值的度量范畴内,抛弃天然异样值也可能导致模型不精确。 基于可视化的异样值检测异样值不容易被『肉眼』检测到,但咱们有一些可视化工具能够帮忙实现这项工作。最常见的是箱线图和直方图。咱们这里用 保险数据来做一个解说: 实战数据集下载(百度网盘):公✦众✦号『ShowMeAI钻研核心』回复『实战』,或者点击 这里 获取本文 [[29]基于统计办法的异样值检测代码实战](https://www.showmeai.tech/art...) 『insurance数据集』 ⭐ ShowMeAI官网GitHub:https://github.com/ShowMeAI-Hub 咱们首先导入必要的库并加载数据集。 import numpy as npimport pandas as pdimport seaborn as snsimport statistics#Load dataset:df = pd.read_csv('insurance.csv')df 咱们对变量『年龄』、『体重指数』和『费用』进行异样值检测剖析。 第一种办法是应用箱线图 / Box-Plots 来绘制数据分布: # age, bmi 和 expenses的箱线图绘图sns.boxplot(y="age", data=df)sns.boxplot(y="bmi", data=df)sns.boxplot(y="expenses", data=df) 通过查看箱线图,咱们能够看到变量 age 没有异样值,变量 bmi 在下限中有一些异样值,而变量 expense 在下限中有一系列异样值(表明存在偏态散布)。 ...

November 23, 2022 · 2 min · jiezi

关于数据分析:BI报表到底是什么终于有人讲清楚了

BI报表,是企业依据现有数据进行整合并输入的报表,是BI利用后果的一种罕用的展示模式。BI报表领有丰盛的可视化成果,拖过简略利落拽形式操作,帮忙您轻松自如地实现数据分析、业务数据探查,充沛开掘企业数据价值。 有些人感觉,报表就是BI。其实,报表只是BI的一部分,尽管报表为常见的BI利用后果,但BI囊括的性能远远大于报表。 报表是数据的一种展示工具,是动态的、固化的。这类产品的实质是统计和展示数据,并提供根底的剖析性能(排序、总计、方差等),目标是帮忙用户把握和理解数据,让使用者通过观察企业数据,晓得当下产生了什么事件,着重于短期的运作反对。BI包含数据的采集、治理、存储、剖析、可视化、输入以及利用等各个方面,它是商业智能零碎,辅助企业数字化经营,让数据施展更大的价值。在企业经营的过程中,决策者不仅仅须要晓得产生了什么,还要晓得为什么产生,以及通过已知去推断将来可能会产生什么。 在面向人群方面:报表次要针对IT人员以及业余的报表开发人员。用户须要具备肯定的编程常识,制作一张报表通常须要先由业务人员提出需要,再由IT部门人员取数制作报表。BI次要面向业务人员和管理人员,仅需简略的利落拽就能够生成报表。另外报表制作的过程长,波及的人员较多,须要耗费的人力老本也绝对较多,且因为IT人员不懂业务,业务人员参与度低,制作的报表也很难对业务和决策真正发挥作用。 在性能方面:报表短少交互剖析,个别只出现数据的外表信息,短少和深层开掘。而BI报表工具领有丰盛的图形,能够疾速实现可视化,将后果出现给管理者,为管理者的决策提供反对。并且可能进行摸索式剖析,开掘数据的价值,辅助企业科学决策。 在信息化时代,企业通过根底IT建设产生大量的业务数据,这些数据寄存在不同的零碎中,数据口径不一,须要破费大量工夫进行数据处理,想要从存储于各种商业信息系统中的数据转换成有用的信息,最终帮忙决策者做出更快、更好、更正当的决策,依靠报表工具或BI能够在不同层面上帮忙企业实现这个指标。并且通过BI零碎进行开掘数据,通过智能算法预测为企业提供可预感的业务趋势。进步了企业本身的前瞻性,能力更好地在市场立足。开掘潜在数据,智能预测将来是势在必行的。 市面上常见的报表工具其实很多,例如九数云、Sisense、Tableau、Smartbi等,然而Tableau曾经退出中国市场,后续的服务及技术支持有待商讨。最近有在国企下班的敌人举荐他们单位用的是Smartbi,产品功能强大,技术撑持及售后服务都做得不错,有需要的应该能够去理解试试看。

November 22, 2022 · 1 min · jiezi

关于数据分析:森林野火故事20一眼看穿使用-Panel-和-hvPlot-可视化-⛵

本文解说应用Panel、hvPlot等工具库,简略疾速地制作可交互的数据仪表板,对180万起野火数据进行空间可视化,更直观地对起火起因、火势大小、继续时长进行单维或多维分析。 作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 本文地址:https://www.showmeai.tech/article-detail/335 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容 Panel 是 Python 中一个十分棒的能够用作制作数据仪表板的工具库,基于它能够轻松构建数据可视化看板。 在本篇内容中,ShowMeAI 综合 Python 可视化与出现技能,应用 Panel 制作一个仪表盘看板,能够交互查看美国野火记录的信息。 导入工具库咱们本次须要用到的工具库包含数据库工具、Python 数据处理工具、可视化工具和看板工具,咱们先把这些工具库导入,代码如下: # 数据库import sqlite3# 数据处理import numpy as npimport pandas as pd# 可视化与仪表盘import holoviews as hv import colorcet as ccimport panel as pnfrom holoviews.element.tiles import EsriImageryfrom datashader.utils import lnglat_to_metersimport hvplot.pandashv.extension('bokeh') 数据筹备用于本次可视化的数据集蕴含 1992 年至 2015 年间在美国产生的超过 180 万起野火。美国野火数据集能够在 ShowMeAI 的百度网盘地址下载。 实战数据集下载(百度网盘):公✦众✦号『ShowMeAI钻研核心』回复『实战』,或者点击 这里 获取本文 [[28]基于Panel和hvPlot的可视化交互看板实战案例](https://www.showmeai.tech/art...) 『美国野火 FPA_FOD_20170508.sqlite 数据集』 ⭐ ShowMeAI官网GitHub:https://github.com/ShowMeAI-Hub ...

November 22, 2022 · 2 min · jiezi

关于数据分析:羡慕实时数据看板来看看Python的交互数据分析可视化工具

作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 本文地址:https://www.showmeai.tech/article-detail/320 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容大家都看过十分酷的实时数据看板,能用最直观的形式给到咱们业务数据的信息,如下图所示。 而在 Python 中,咱们也有十分易用的工具,能够产出丑陋的数据分析可视化后果,并反对交互式操作和勾选部分数据深入分析,ShowMeAI在本篇内容中,将给大家解说到 Altair 这样一个功能强大的 Python 交互式数据分析工具,它能产出如下图所示的交互剖析后果: 数据分析实现模板为了让大家在本人的数据上体验 Altair 的剖析后果,咱们上面编写的一个函数模板,用于为数据集中的所有特色生成交互式图表。 具体一点说,咱们心愿它为数值型字段(特色)返回『直方图+散点图』,为类别型特色返回『柱状图+箱线图』,Altair 返回的这些图表后果都是能够交互式操作的。 # 导入工具库import altair as altimport pandas as pd# 忽律数据规模限度alt.data_transformers.enable('default', max_rows=None)# 构建chart函数,它读取数据和字段名称,返回一个交互式图表后果def chart(dataset, column_name, target_var): w = 500 single = alt.selection_single() # 灰度图与柱状图 # 如果是类别型字段,咱们不必分桶 if (column_name in dataset.select_dtypes(include='object').columns.to_list()): a = alt.Chart(dataset).mark_bar().encode( alt.X(column_name + ':N', bin=False), alt.Y('count()'), color = alt.condition(single, alt.value('#4c78a8'), alt.value('lightgray')), tooltip=['count()', alt.Tooltip(column_name, bin=False)] ).add_selection(single).properties(width=w) # 如果是数值型字段,咱们先分桶 else: a = alt.Chart(dataset).mark_bar().encode( alt.X(column_name + ':Q', bin=True), alt.Y('count()'), color = alt.condition(single, alt.value('#4c78a8'), alt.value('lightgray')), tooltip=['count()', alt.Tooltip(column_name, bin=True)] ).add_selection(single).properties(width=w) # 对于类别型字段,咱们构建它和指标字段的一个箱线图表;对于数值型字段,咱们构建它们和指标字段的散点分布图 try: if (column_name in dataset.select_dtypes(include='object').columns.to_list()): b = alt.Chart(dataset).mark_boxplot().encode( #, title="Boxplot of " + column_name alt.X(column_name + ':N'), alt.Y(target_var), color = alt.condition(single, alt.value('#4c78a8'), alt.value('lightgray')), tooltip=[target_var] ).add_selection(single).properties(width=w) else: b = alt.Chart(dataset).mark_point().encode( alt.X(column_name + ':Q'), alt.Y(target_var), color = alt.condition(single, alt.value('#4c78a8'), alt.value('lightgray')), tooltip=[target_var] ).add_selection(single).properties(width=w) except: pass return(a | b)大家能够把它利用在本人的数据上,失去的后果图如下所示(而且它们是能够用鼠标交互操作的)。在上面的内容里,咱们会通知大家如何把后果存储为 html 报告,大家每次关上 html 后果文件,即可进行交互式操作,而无需每次都从新剖析。 ...

November 7, 2022 · 1 min · jiezi

关于数据分析:做分析用什么工具不想再用Excel了

总结一下其它大佬的答复,举荐的产品有题主说被挫伤很深的Excel、一些编程如Python、R、Matlab、一些国内外BI软件如PowerBI、Tableau。 各个产品的优劣势也被总结进去了,这里就不再赘述,大家能够再看看我举荐的Smartbi。Smartbi是一款国产BI,已有10几年的倒退历史,题主所说的报表和dashboard都能够在Smartbi中实现。 报表: 如果想用Smartbi做报表的话,能够试试电子表格,它以“真Excel”为特色,将Excel及WPS表格作为报表设计器。提供丰盛的报表展示款式,囊括分组报表、清单报表、穿插报表、列表报表、多源报表、分片报表等各种类型报表,最大水平满足用户对报表的各种需要,从数据中开掘价值。 Ø晋升效率:从制表人员角度来说,解放反复劳动力、连续传统报表习惯,大幅度晋升效率,有更多的精力能够投入到其它的工作中。 Ø辅助决策:从查看人员角度来说,报表从此以后定时、定期主动数据刷新,保障数据及时性,而且报表数据能够定时推送,达到便捷且无脱漏,更好地辅助决策者及时地做出决策。 Ø集中管理:从报表管理员的角度来说,报表数据起源直连生产数据,确保数据时效性,报表将全副线上化,削减权限的治理与散发,确保安全性且易治理,防止人工篡改、泄露,让更多报表服务更多人员。 仪表盘: 如果想用Smartbi做仪表盘的话,能够试试交互式仪表盘,交互仪表盘能够疾速实现各类图表、有丰盛的图表主题配色、图表联动等交互性能。 题主发的图片,在Smartbi实现成果如下: 还有很多种配色,这里随便列举两种: Smartbi仪表盘反对丰盛图形,从根底的柱图、线图、地图到更高级的桑基图、词云图,都能够通过拖拽立马生成,所见即所得: 除了本人做图形之外,还有更加便捷的形式:应用产品内置的好看的组件模板,这些组件模板款式都曾经提前设置好了,用户只须要替换数据即可: 多种动静交互成果:筛选器、联动、钻取、跳转、高亮显示、表格滚动等等。 相比其它数据分析工具,BI软件是绝对比拟易用、好上手的,同时也号称可能让不同程度的业务人员自助应用~通过多年的积淀,Smartbi学习资源也很丰盛,有在线的帮忙文档和视频教程,常常会举办一些收费的直播分享。在应用过程中有什么疑难也能够到社区征询,有业余的技术支持小姐姐解答~因而如果有报表和仪表盘的需要,Smartbi会是一个很不错的抉择哦!

November 4, 2022 · 1 min · jiezi

关于数据分析:复杂填报逻辑的支持

个别填报表利用场景分为两种,第一、旧数据的保护现有数据存储中已有一些数据,须要人工在页面对数据进行批改保护。第二、新数据的采集。现有数据存储中没有数据,须要人工页面填写录入数据。 简略的数据保护与采集,通过硕迪报表的填报性能很轻松实现。还能够利用导出excel和导入excel形式批量录入数据。简单的数据填报业务需要的反对是硕迪报表的一个特色,能够实现一来多去,多来多去,多来一去等简单数据源之间的读写,而且反对提交填报数据的时候依据业务要求不同数据写入不同指标存储,还能够对提交的数据进行二次计算解决后进行存储。如下图举例说明:从指标表中读取指标名称和填表阐明生成填报表页面,在页面中用户录入数据后,提交到服务器,服务器能够依据提交数据与指定规定判断数据是否非法,非法的数据存入非法数据表,非法的数据存入待调整数据表。在此仅介绍一个例子,在理论业务中因为原有业务很多是通过编码方式实现的,灵便度很高,有更简单的业务逻辑,在硕迪报表中能够通过脚本解决更简单的业务逻辑,从而达到高端用户对灵便度的高要求。

November 3, 2022 · 1 min · jiezi

关于数据分析:有什么好用的多维表格

既然说到多维表格,那咱们就先来遍及一下不同维度表格。 一维表是指表格的每个字段都是事物的属性,而不是具体状态,如字段是商品而不是西瓜、苹果,是所在区域而不是华北、西南;每一条记录都是在一次性产生的。 二维、三维乃至多维表的字段通常蕴含属性的具体状态,如具体个各种的商品销售量、区域销售量等。 多维表的意义就是通过多维(多个变量)的表格统计,用户能够从多个角度去思考问题,通过多个变量的这种变动,能够发现数据之间的关联关系,从而开掘更深刻的信息。 目前在BI区域,多维表格也领有十分重要的位置。已经基于多维数据源来进行多维分析的BI工具也火过一时,然而随着大数据量的倒退,越来越多的企业冀望能有基于关系数据源、更加轻量级的、并能动静及时剖析数据的多维分析工具。 明天我给大家举荐的是广州思迈特软件有限公司(简称:思迈特软件)自助研发的一站式BI大数据分析平台Smartbi。 思迈特软件在国内BI畛域处于领先地位,产品广泛应用于金融、制作、批发、政府、医疗等60+行业,取得4000+行业头部客户认可。思迈特软件在高端市场相对当先,2021世界500强中的中国企业,50%抉择了Smartbi,2021世界500强中的国内银行,80%抉择Smartbi。 Smartbi是一个全能型产品,提供的性能包含数据采集接入、数据ETL解决、数据建模、指标治理、数据存储、数据分析和展示、数据挖掘和决策等。Smartbi产品提供了笼罩所有剖析场景的性能,但用户也是能够依据提须要对性能进行抉择和自由组合。 Smartbi剖析工具集中的性能——透视剖析,就提供多维报表的能力。 基于业务主题,无需构建多维模型透视剖析基于业务主题来进行构建,无需创立多维模型。业务主题屏蔽底层物理模型的复杂性和多样性,通过虚构语义层将简单的数据要害转换为业务剖析可认知和应用的模型。 相似Excel透视表,简略易用“类Excel透视表”的设计,简略的勾选拖拽操作间接抉择任何字段作为输入字段或筛选条件。 多种多维分析伎俩,轻松数据探查通过自由组合维度、汇总计算、切片、焦点项、钻取、排序等轻松实现数据探查。 多种常见性能,满足剖析需要提供丰盛的图形类型如柱图、饼图、双Y联结图等,实现动静图形展示 通过跳转查看明细数据,在关联报表之间传递参数实现剖析流反对预警,可依据场景设置多种告警条件和告警款式 反对多种导出类型,如:TXT、CSV、PDF、Doc、Xlsx、数据分析包等。 多种工夫智能计算,便捷生成在表格上或是度量区反对一键生成同期、后期、期初期末、日均、累计值、增长值等工夫智能计算,无需简单计算。 反对超大数据量的查问性能,秒级响应通过抽取数据性能把透视剖析数据抽取到高速缓存库中,当透视剖析进行刷新等操作时,数据会从缓存库中读取,能够进步刷新报表的速度,实现亿级数据,秒级响应。 具体的介绍请参考:https://www.smartbi.com.cn/gn...

November 2, 2022 · 1 min · jiezi

关于数据分析:web-报表工具-有什么好推荐开源的以及收费的

接触数据分析,到深刻参加企业数字化转型和数据行业倡议,已将近8年多,对数据分析、报表工具还是有些集体教训。我从集体的教训角度,和大家说说我用过哪些web报表工具。 首先是开源的web报表:BIRT ProjectBIRT是基于Eclipse的报表零碎,很多老代码工作者,都有应用过,能够说是一个非常风行的开源报表开发工具。领有和Dreamweaver个别的操作界面,能够像画table一样画报表,生成图片,导出Excel,html分页样样齐全,款式和script设置简略。 PentahoPentaho是一个比拟风行的开源BI软件,让人比拟熟知或者应用多的是Pentaho Report Designer性能,它是一款所见即所得的开源报表设计工具。在做报表的时候,特地是业务应用人员,能够很不便的利落拽和设置各种常见报表的控件,还能够不便的反对应用设置报表的数据起源。在报表的设计过程中,用户能够随时预览报表的后果,实现所见即所得的能力。 DataVisionDataVision 是一款和水晶报表比拟相似的开源报表工具。通过它能够应用一个拖放的 GUI设计报告并从应用程序中运行、查看和打印报告,或者将报告导出为 HTML、XML、PDF、LaTeX2e、DocBook或以制表符或逗号分隔的文本文件,这些文件又能够用于生成 PDF、文本、HTML、PostScript 格局的报告。 而后是免费的web报表:水晶报表CrystalReportCrystalReports(水晶报表)是SAP公司的商业报表工具,次要用于设计及产生报表。水晶报表也在行业内也是比拟风行和弱小的报表零碎,不仅有着弱小的报表的性能外。我感觉它最大的特点是和很多常见的开发工具集成和接口。做过报表开发的小伙伴,肯定会对水晶报表弱小高效的集成能力记忆粗浅。 润乾报表润乾报表晚期有我的项目上应用,总体来说在报表方面的性能还是较为弱小的,特地是当初价格非常优惠,官网声称1W一套。润乾报表是纯 HTML 模式的 OLAP 剖析性能,能够较好的在 B/S 架构下的利用,反对常见的报表能力,比方多源分片:数据起源多个数据表或数据库,在报表中以多分片模式出现;解冻表头:报表上表头和左表头解冻,不便用户查看; 能够依据剖析后果数据生成统计图;反对统计图上的钻取等操作,反对报表中的超链接钻取、右键菜单、弹出窗口等。 Smartbi报表最近应用最多的是国产BI代表之一的Smartbi,也是我集体极力推荐的。Smartbi是由广州思迈特软件有限公司自主研发的商业智能BI产品,它采取的是现代化BI的架构,在国内深耕多年,对国内的剖析需要有更多落地的性能,全面笼罩企业在数据化经营不同阶段的倒退需要。 Smartbi是全面而全能型的剖析解决方案,这里着重介绍近期应用的Smartbi的报表能力。目前Smartbi包含两种电子表格:Excel电子表格和Web电子表格。Smartbi电子表格是一款间接基于Excel开发进去的报表工具,齐全连续Excel自身直观的界面,以及杰出的计算性能和图表能力。用户只需在Excel上装置Smartbi插件,就能够间接基于Excel开发报表,而后将实现的报表一键公布到Web端。应用Smartbi电子表格可能简略、高效、智能、疾速搭建企业级Web报表可视化平台,从此Web报表更丰盛、更灵便,升高企业报表开发门槛。 如果用户冀望有一个能在Web浏览器实现所有的设计、制作、保留、浏览报表的纯Web报表工具,则能够抉择Smartbi的Web电子表格。它是一款纯前端类Excel的在线表格,采纳B/S的开发模式,用户无需装置插件,在浏览器端就能够实现各种报表的设计,从而解决轻量级的简单报表设计需要。同时Web电子表格反对各种Excel公式函数和Smartbi零碎函数等,也反对间接复制Excel模板,一键替换数据,实现报表的高效开发。 各种开源和免费的报表工具应用过的不少,总的来说,如果是集体应用学习,能够去用用下面说的这些开源的web报表。如果是企业级的BI我的项目,还是举荐应用免费的web报表,毕竟这些报表在理论的我的项目中有充沛的产品验证,产品能力有保障,同时产品应用前的培训,应用中的问题解答,应用后的产品保护等,有厂商的撑持,能够确保数据我的项目顺利进行。

November 1, 2022 · 1 min · jiezi

关于数据分析:如何提升研发效能我们先从指标谈起

“研发效力”一词近几年在国内外都十分热门,企业都心愿通过晋升研发团队的效力,疾速响应市场的变动。管理学之父德鲁克曾说过“没有度量,就没有治理”。所以企业要从治理的角度去看这些指标,粗浅意识研发效力,并通过指标来设定改良方向和掂量改良成果。 本文咱们将从一个企业级产品研发经理的角度登程,联合 Kyligence 的实际,探讨影响研发效力最外围的四大因素:技术架构、研发流程、指标体系、数字化工具,心愿对大家有所启发,也欢送大家在评论区和咱们互动。 Kyligence 致力于打造下一代企业级智能多维数据库,曾经服务了包含建设银行、浦发银行、UBS 瑞银团体、MetLife 美国大都会团体等国内外泛滥行业的头部企业。 家喻户晓,企业客户对产品的稳定性、安全性、可用性的要求是十分高的。Kyligence 研发团队始终通过优化技术架构、外部流程、制订指标体系和采纳数字化工具,一直寻求外部研发效力的晋升,从而为客户提供更稳固、高质量的产品和服务。 1. 先进的技术架构——所有工作的基石不同规模、不同阶段的研发团队,须要匹配不同的技术架构。随着 Kyligence 业务拓展和团队规模的扩充,迭代瓶颈日益显著,架构层面的优化势在必行。 Kyligence 研发团队在畛域模型、微服务化、配置管理、可视化监控、多环境隔离等层面投入较多资源优化。同时,通过残缺的功能测试、多平台兼容性测试、性能测试、自动化回归测试等加强品质验收规范,一直晋升零碎鲁棒性。 此外,借助高效的 DevOps 流程自动化链条,通过继续集成、继续交付来提质增效,记录过程埋点,将整个开发、测试、运维的各阶段数字化,收集指标,再一直反馈给技术团队,推动技术架构的进化。通过这些改良措施,推动技术架构像生命体一样,一直的成熟演变,承载产品走的更远更麻利。 2. 标准的研发流程——保障效率和品质企业客户的业务场景简单,对产品的品质要求很高。特地是金融客户,每月投产窗口固定。当呈现问题时,如果不能做到麻利修复,就会造成业务影响的周期较长。因此,咱们在研发流程上花了很多功夫进行优化,制订了产研测合作标准,从需要进入研发流程到实现开发和上线。以往的瀑布式交付、残缺的迭代大略须要以月为单位;当初可按需要去交付,一个需要一个迭代,3 周就能够实现交付,并且可实现各个微服务 Scrum 并行交付,进步了迭代效率。品质层面,咱们在研发流程上标准了 Dev Design Review、Code Review、Test Case Review、User Acceptance 等环节节点,多视角补充用户场景和边界状况,在晋升自动化测试覆盖率及效率的同时防止回归,保障了交付的品质。 图中信息仅供参考 3. 可信的指标数据——治理、追踪、改良的抓手“指标” 是数字化时代的治理语言,是治理改良的抓手,指标体系的建设不是为了刷指标,而是为了效力晋升、能力晋升、业务晋升,目标是透过指标数据看到背地的问题。Kyligence 制订了一套研发效力指标体系,数据起源自 Jira、Github 等零碎,在日常工作中按月或按天进行指标监控,以可信数据驱动改良。如下是 Kyligence 制订的局部研发效率和质量指标。 图中信息仅供参考 4. 数字化管理工具——晋升人效、决策闭环Kyligence 研发和 Devops 团队应用了一站式云端指标中台—— Kyligence Zen 来对研发效力指标进行对立治理和剖析: 对立治理指标:便于查问、监测和协同,大大降低沟通和人为出错的可能性;进步自动化程度:确保指标数据稳固、实在、可信;多平台复用指标:复用指标数据上游集成,为决策闭环提供良好基础。(1)通过指标目录和指标治理,治理协同 在 Kyligence Zen 中,用户能够通过界面或低代码(YAML)形式自助实现研发效力指标定义,定义实现后一键公布,即刻显示指标数据,口径清晰易懂,实现研发过程的可观测性。公布后的指标既能对立治理,也能够轻松地在组织内共享、保护。此外,借助于 Kyligence Zen 独创的指标治理与指标对齐性能,使得组织可能从管理者视角,将企业治理合成为相干指标,并继续追踪进度、辨认危险,进一步驱动数字化决策。 图中所示为模仿数据 (2)提供指标数据直连和自动化能力,升高可信数据的获取和运维老本 可信的指标数据、可交互的应用体验是数据辅助决策的前置要求。咱们通过 ETL 将 Jira 等零碎数据清理整合后搁置在 Amazon S3 上,定时更新,再借助 Kyligence Zen 直连 S3 的能力,来获取数据、定义指标。Jira 的数据量绝对较大,为了达到可交互的剖析体验,咱们通过 Kyligence Zen 指标自动化能力,界面开启指标 Cache,一键获取减速体验。Kyligence Zen 的指标自动化能力 Smart Cache,依靠了 Kyligence 专利的 AI 加强引擎,动静提取最新的指标表、维度等信息,疾速生成举荐模型,并触发构建,极大升高指标计算的运维老本。 ...

October 28, 2022 · 1 min · jiezi

关于数据分析:以指标驱动业务决策Kyligence-亮相-Gartner-IT-SymposiumXpo™-峰会

拜访 https://zen-cn.kyligence.io/?...,体验一站式云端指标中台 Kyligence Zen 10 月 17 日—20 日, Gartner IT Symposium/Xpo™ 2022 峰会在美国奥兰多顺利召开。作为寰球当先的数据分析与治理厂商,Kyligence 缺席本次峰会并发表“Kyligence Zen: The One-Stop-Shop Metrics Platform”主题演讲,介绍了 Kyligence 以指标驱动业务和治理指标的先进理念,并分享了在指标中台的翻新技术产品和成功实践积攒。 Gartner IT Symposium/Xpo™ 2022 峰会被视为是信息技术畛域的风向标,是寰球最重要的首席信息官和 IT 高管团聚。这一系列峰会致力于重塑 CIO 的领导力、技术和业务策略,本届峰会探讨了数字业务、将来工作、数据分析和人工智能、网络安全等话题,分享了这些将塑造将来 IT 和业务的相干技术、洞察和趋势。 往年 9 月,Gartner 公布《指标中台翻新洞察报告》(Innovation Insight: Metrics Stores)。Kyligence 胜利入选指标中台畛域的代表厂商。在本次峰会上,Kyligence 联结创始人兼 CEO 韩卿联合指标治理发展趋势,向数千名参会观众分享了前沿洞察以及一站式云端指标中台产品 Kyligence Zen 的实际成绩。他提到,指标中台需要产生次要是源于数据的治理和服务模式发生变化,这对企业有三大考验。 首先,数据的管理模式从集中式转变为分布式。整个数据仓库构建模式从“Collect”(把所有数据收集起来)变成“Connect”(所有数据有机地连接起来),这对企业的根底数据架构是一重考验。 其次,数据的应用对象从多数的决策者和专家,曾经转变到一线业务人员和一般工作者。当非技术或者剖析岗位的职场人须要用数据指标疾速给出决策领导,企业须要找到适合的产品升高企业数据应用的门槛,满足企业用数需要。 最初,实现业务策略曾经成为企业数字化转型的首要目标。指标是企业最外围、最重要的数据资产,企业须要用全面、精确、可信的数据指标进行决策,晋升对未知问题的事后洞察。 在 Gartner 近期公布的《2022 中国数据管理最酷厂商》(Cool Vendors in Data Management, China) 中,Kyligence 被认为是为数不多的能同时在中国及国内市场提供数据与剖析服务的中国供应商之一,目前服务了来自各行业、不同类型的客户群体。基于在指标中台服务的成功实践,Kyligence 推出了以外围 OLAP 能力打造的一站式云端指标中台 Kyligence Zen,为企业提供整合的、轻量级的、开箱即用的指标中台服务,助力业务用户聚焦指标,实现疾速的数据洞察和口头决策。 ...

October 24, 2022 · 1 min · jiezi

关于数据分析:Sina-Weibo-WeChat-Kyligence-当选-Gartner-2022-中国数据管理-Cool-Vendor

拜访Kyligence Zen 官网 ,体验一站式云端指标中台 Kyligence Zen往年 9 月,寰球权威的技术钻研与征询公司 Gartner 公布《2022 中国数据管理最酷厂商》(Cool Vendors in Data Management, China)。企业级智能多维数据库厂商 Kyligence 凭借在数据管理畛域的技术创新、产品研发、行业实际等劣势,胜利入选中国数据管理畛域最酷厂商。 Cool Vendors 是 Gartner 最具影响力的钻研报告之一。入选 Cool Vendors 的公司是可能提供新鲜翻新技术服务的供应商,其所提供的技术服务有着重要价值,极有可能会对市场和业务倒退产生重大影响甚至扭转供应商格局。 在过来15年的大数据演变趋势下,中国企业始终踊跃致力于数据湖和数据仓库等数据与剖析基础设施的建设,通常采纳以下两种门路: 技术驱动的集中式门路:最后人们往往将大数据等同于 Hadoop,所以许多企业都基于 Hadoop 生态构建集中式的数据与剖析平台,以便高效地存储和解决海量数据。业务驱动的分散式门路:业务部门或子公司有权针对各自的用例、投资端到端的数据与剖析解决方案,以便疾速实现业务的投资回报。人才、流程和技术由各个部门或子公司负责。 当数字化倒退到现阶段,企业冀望基于数据与剖析投资发明更高的商业价值时,上述两种门路都会带来各自的问题。如果缺失适当的架构设计,技术驱动型门路通常会造成繁多的数据沼泽,影响业务敏捷性;而技术绝对扩散的业务驱动门路,则会引发孤立的基础设施环境和涣散式数据治理(参见下图)。 由业务驱动的数据与剖析我的项目确实能够带来疾速的商业回报,但如果缺失企业层面的对立治理,人才、流程和技术方面的差别无疑将催生难以治理的数据孤岛。因而,近年来大量中国企业都在加大数据与剖析治理畛域的资金投入。同时,日益简单的商业环境也要求企业的数据架构和治理准则可能疾速跟上模式变动。 Gartner 在报告中评估道,Kyligence 是为数不多的能同时在中国及国内市场提供数据与剖析服务的中国供应商之一,目前服务了来自各行业、不同类型的客户群体。为了更好地服务中国市场,Kyligence 提供了私有云、公有云及本地等多种部署计划,同时致力于通过各项服务的组合提供更好的国产化代替计划。 多年来,Kyligence 服务了金融、批发、互联网等行业的当先企业,积攒了丰盛的指标中台建设和实践经验。Kyligence 近期推出了一站式云端指标中台 Kyligence Zen,Gartner 在报告中倡议,关注指标逻辑治理、数据分析畛域的当先企业应思考选用 Kyligence Zen,来解决在指标治理、剖析和利用方面的痛点。 目前,Kyligence Zen 以指标治理、指标目录、指标自动化、API 集成四大外围能力,为企业提供整合的、轻量级的、开箱即用的指标中台服务,助力业务用户聚焦指标及治理,实现疾速的数据洞察和口头决策。 Kyligence Zen(预览版)现已开启试用,欢迎您拜访 Kyligence Zen 官网 申请试用。对于 Kyligence上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 开创团队于 2016 年开办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 加强的高性能剖析引擎、对立 SQL 服务接口、业务语义层等性能,Kyligence 提供老本最优的多维数据分析能力,撑持企业商务智能(BI)剖析、灵便查问和互联网级数据服务等多类利用场景,助力企业构建更牢靠的指标体系,开释业务自助剖析后劲。 ...

October 21, 2022 · 1 min · jiezi

关于数据分析:没错在-Excel-中也能对海量数据进行明细钻取啦

今年年初,Kylin 社区公布了 MDX for Kylin,越来越多小伙伴开始在多个场景应用。本文将率领大家看看 MDX for Kylin 如何疾速玩转海量数据的明细钻取!欢送大家拜访最新用户手册。 一、场景介绍数据分析师在进行数据分析过程中,察看到与预期不符的度量值的时候,可能会进一步进行下钻查看相干明细,探索与预期不符的起因,从而实现从“发现景象”到“找到起因”的过程。 如下图,某公司的财务人员想查看以后所有订单中局部国家地区消费者的营收状况,能够通过 Excel 疾速实现目标。 图. 应用 Excel 对小规模数据集进行明细下钻 财务人员在取得了最终的订单业绩汇总后,可能会进一步检索业绩的具体数据。比方,财务发现以后 “JORDAN” 地区的消费者整体业绩不合乎预期,能够通过双击“ JORDAN”地区的用户业绩数值,失去对于“JORDAN”地区的消费者数据,或者能够通过对该地区生产用户的定向营销以促成销售业绩。 从下面的演示咱们能看到,面对大量的数据,应用 Excel 即可满足需要。然而如果数据量达到肯定规模,比方到百万千万级别,Excel 就变得十分迟缓,甚至无奈解决。这时候用户又该如何不便地实现明细数据下钻呢? 二、用 Excel 轻松玩转海量数据为了能让 Excel 实现海量数据的剖析,玩转明细钻取,咱们须要将大数据工具与 Excel 连贯应用。 MDX for Kylin 是由 Kyligence 奉献、应用 Apache Kylin 作为数据源的 MDX 查问引擎。MDX for Kylin 的应用体验靠近 Microsoft SSAS,能够集成多种数据分析工具,包含了 Microsoft Excel 等,能够为大数据分析场景下提供更极致的体验。 MDX for Kylin 底层引擎 Kylin 可响应超大数据规模的指标查问,下钻的明细如果是超大的数据量也不在话下。 请追随本文的介绍,来看看下 MDX for Kylin 如何疾速玩转海量数据的明细钻取吧。 以下假如用户曾经装置好最新 Apache Kylin 4.0.2 版本。对于 Apache Kylin 更多的装置部署详情,请参考 Apache Kylin 官网文档。 ...

October 20, 2022 · 2 min · jiezi

关于数据分析:Smartbi联合三大战略伙伴打造一体化解决方案附最新优惠政策

企业数智化转型是一项浩瀚的系统工程,如何欠缺本身产品能力,满足客户更多、更简单的业务诉求,成为数字化服务厂商的重要内容。 作为深耕大数据BI畛域十余年的优良厂商,思迈特软件始终践行翻新的倒退法令,深知决胜企业数字化转型下半场的重要伎俩必然是须要业内的数据服务商通力合作,能力将数据转化为企业新的生产因素,继续地为客户发明价值。为此,思迈特软件与滴普科技、明道云、金智维(排名不分前后)三家战略伙伴联结携手,推出“麻利数据分析平台到数据利用交融对立”、“业务剖析一体化”、“一体化采集展现”为外围的三大联结解决方案,通过全新的单干模式撑持企业数字化转型。 一、Smartbi X 滴普科技:麻利数据分析平台到数据利用交融对立计划在数据智能时代,企业服务市场越来越重视客户数据价值。 数据湖和数据仓库在应答大数据时代的挑战时,体现各有利弊。而随着数据体量增大、共享成为常态化、数据安全隐衷愈发受器重等内外部环境变动,数据治理和对立经营管控是数据根底平台建设的重要组成部分。 为了能无效突破数据湖与数仓间的壁垒,使得割裂数据交融对立,缩小数据分析中的搬迁,实现对立的数据管理。思迈特软件与滴普科技联结公布“麻利数据分析平台到数据利用交融对立计划”,单方将从数据采集、数据集成和数据利用等层面进行基础设施建设,欠缺数据仓库服务能力。 思迈特软件与滴普科技的彼此单干旨在更好地买通数据价值链,为各企业提供更适宜本地化接入的数据根底平台定制服务,更智能地提供个性化的产品和体验。 麻利数据分析平台:通过全流程的数据拉通,重塑业务链+数据流+要害信息管控点,实现对立数据管理、对立数据语义、对立数据服务,建立健全的企业级数据接入规范与标准,推动企业数字化转型; 自助式数据分析:围绕市场、产品、经营外围业务线条,精准赋能业务,实现由数据资产变现,晋升决策治理的数字化和智能化。 该计划以滴普科技产品技术作为底层基础架构,通过对行业内、内部数据进行采集、贮存、计算、整合,并借助Smartbi构建数据分析平台,实现企业业务数据化、数据场景化、决策智能化。该计划不仅能够进步企业数据根底平台体系底层的稳定性、高可用性和扩展性,还能够实现全行数据资产的统一分配、治理、服务和利用,全面晋升企业的产品服务翻新和数字化程度。 对于滴普科技:成立于2018年,定位为数据智能服务商。滴普科技以最新的数据智能技术为根底,以数据的业务价值为外围,为客户提供数据智能畛域的大数据根底软件产品与服务。滴普科技的外围产品——实时湖仓平台FastData,全面整合了从数据集成、数据分析再到数据价值实现的残缺链路,帮忙企业建设对立治理、流批一体、湖仓一体的云原生数据智能平台,实现海量数据实时剖析,成为撑持企业数字化转型的外围根底软件设施。 二、Smartbi X 明道云:业务剖析一体化联结解决方案随着数字化转型放慢,数据规模继续收缩,数据利用场景继续扩大,企业须要进行大量面向业务、实时和智能决策的摸索式自助式剖析,须要解决超大规模的多源异构和实时数据。 在数据生产端,企业通常在ERP、CRM、OA等业务利用生产数据,在数据利用端,企业将数据借助BI工具进行转入剖析,让数据为企业发明价值,同时数据也能够反过来对业务流程进行数据化和智能化革新。 明道云善于构建企业信息化的业务利用,是用来生产数据的;而思迈特软件专一企业的数据化和智能化,是剖析数据的。为此,思迈特软件与明道云联结公布“业务剖析一体化联结解决方案”,联合单方产品劣势,买通数据生产到生产的价值链,为用户提供更高效灵便的数据服务计划。 建设业务剖析一体化平台,不仅有助于反对前端业务的疾速迭代、跨零碎的相互协作,还有利于数据分析利用能力的晋升,实现了数据驱动业务的跨越式倒退。思迈特软件与明道云的携手,将施展出国产信创数据环境的兼容性、可控性、安全性等服务方面的劣势,满足泛滥企业根底软件转型的需要,为企业数字化生态建设迈出要害一步。 对于明道云:明道云作为零代码企业应用搭建平台,凭借快活通简的产品能力,让企业的业务人员和IT人员能够通过利落拽疾速搭建个性化业务利用,实现“数据生产”端的数字化体系建设。用户不须要代码开发就可能搭建出用户体验上佳的销售、经营、人事、洽购等外围业务利用,买通企业外部数据,也可能通过API和Webhook对接其余内部零碎。明道云的自动化工作流还能够实现审批、填写等管制流程和业务自动化。 三、Smartbi X 金智维:一体化采集展现解决方案 随着自动化在业务流程中的浸透,企业对RPA的需要也逐步在广度、深度上增强,同时企业心愿通过BI、AI的力量重塑IT的价值或者更高的生产力。金智维RPA软件机器人(K-RPA)由Server、Robot、Control三个程序组成,采纳三层架构,系统核心引擎采纳高效C++语言开发,重视低资源开销。通过部署RPA机器人,帮忙企业进行全面的智能化治理,更加零碎和全面地保障业务流程运行的安全性、稳定性、连续性。 与此同时,在数据分析、BI建设的层面,思迈特软件则具备相当丰盛的教训与胜利案例,至今胜利服务了工信部、国家电网、华为等4000+家头部企业。产品、业务上的人造分割,奠定了思迈特软件与金智维深厚的单干根底。正因如此,思迈特软件携手RPA金融行业领导者金智维联结公布“一体化采集展现联结解决方案”。 该计划以“RPA+AI+BI”为根底,将Smartbi的产品能力嵌入到RPA的自动化流程中,利用RPA机器人代替人工对数据进行采集,并汇总输入到BI上,BI将采集到的数据进行指标剖析,再将剖析后果出现PC端和挪动端。 金智维RPA机器人和Smartbi的BI平台产品能力相结合,突破企业区域各部门、各层级间存在的数据壁垒,解决企业基层办公“手”不够用的问题,实现智能数据采集、剖析到利用的一体化解决方案,助力企业整合数据资源,进步业务人员工作效率,真正施展数据效力。 对于金智维:珠海金智维信息科技有限公司是一家专一于提供企业级RPA平台的人工智能公司,以“RPA+AI+大数据”为核心技术,打造“RPA+X”产品矩阵,为企业、组织提供一站式数字员工整体解决方案。 四、强强联合,致力提供最优计划企业的数字化建设是一个长期艰巨的过程,将来的企业并不能单打独斗,面对数据智能畛域越来越简单的用户需要,思迈特软件保持以用户为外围,放弃凋谢容纳的态度,在营销、产品、业务等方面为搭档提供反对,独特为用户提供更好的产品和服务。 具体到口头,咱们不仅要推动产品翻新与技术升级,助力各行各业降级,更要以用户价值为依归,融入产品及服务之中。为此,思迈特软件联结滴普科技、明道云、金智维联合推出以下优惠政策: *以上优惠政策工夫截止至2022年12月31日,具体政策征询对应品牌厂商销售经理。 将来,思迈特软件将与各位合作伙伴一起,乘势而上,通过优势互补和技术协同,在单方各自生态圈的加持下,为泛滥行业客户提供更优良的数字化解决方案,实现数字化赋能,进而反哺推动行业的倒退,共赢产业新机遇。

October 19, 2022 · 1 min · jiezi

关于数据分析:思迈特软件入选2022-Gartner-ABI领域客户之声高分获评卓越表现者

近日,寰球权威信息技术钻研与咨询机构 Gartner 公布了剖析和商业智能平台畛域 2022 Gartner® Peer Insights™ “Voice of the Customer” 报告。 思迈特软件凭借优良的用户体验,入选2022 Gartner ABI畛域“客户之声”,荣获“卓越表现者”名称,客户总体评分达到 4.7 分(满分5分),在所有入选企业中位列第一,取得评分用户100%举荐志愿;并且是亚太地区惟一入选“客户之选”象限的中国BI厂商。 (Gartner“客户之声”亚太地区视图) (Gartner“客户之声”综合视图) Gartner® Peer Insights™ 是一个面向寰球的专门针对企业级软件的客户评审和评级平台,Peer Insights 上的点评汇聚了寰球客户对各类企业级产品与服务体验的多维度评估,代表着用户的声音,且更具参考价值。能够说,此次入选意味着Smartbi领有过硬的产品技术能力和丰盛的实践经验,而这些来自用户的必定,是对Smartbi最好的认可。 一、Smartbi获用户鼎力认可,用户举荐志愿达100% 本次报告展现了来自寰球的金融、制作、医疗、教育等多个行业的客户在产品性能、部署运维、服务反对等多个维度上对Smartbi产品及服务的综合评估后果。从实在的用户评估里,寰球客户纷纷对Smartbi给予了高度的认可,并违心举荐同行业客户尝试应用Smartbi,使得 Smartbi成为货真价实的“卓越表现者” (Strong Performer)。 1、“不便实用的数据分析平台” 2、“低学习老本报告工具” 3、“零碎操作简略,平台安全系数高” 4、“BI产品的优质抉择” 5、优质的服务/弱小的专业知识/良好的产品性能 Smartbi作为国内当先的一站式商业智能与大数据分析平台服务商,满足不同阶段用户在企业级报表、数据可视化剖析、自助摸索剖析、数据挖掘建模、AI 智能剖析等方面的大数据分析需要,用数据赋能业务,挖掘出真正的数据价值。 始终以来,Smartbi一直加强用户体验和实现业务价值两个方面,致力于为用户提供更实用、更智能的产品,让业务人员能够更好地发明业务价值。特地是往年推出的Smartbi V10.5,不仅进一步晋升数据分析的智能性和易用性,还能让BI能够在企业内扩大到更多的用户,晋升BI利用的广度,使得用户体验全面降级,更取得泛滥客户的统一好评,这也正是Smartbi取得用户100%举荐志愿的实力证实。 ### 二、十余年保持技术创新,智能BI产品引领倒退客户的信赖源于思迈特软件在BI畛域的不断创新与继续当先。 始终以来,Smartbi顺应潮流紧跟用户需要,在BI畛域继续投入了十多年,从产品性能、性能优化到业务场景、服务状态降级等,一直以行业高标准要求本人。 Smartbi 粗浅剖析企业经营过程中的痛点,通过丰盛的落地利用教训,以技术赋能形式,帮忙用户突破信息孤岛无效整合数据,建设起迷信的数据评估体系辅助领导层决策,并且提供麻利开发的能力,能够疾速响应业务和管理层的数据需要,还能在业务运行过程中提供主动的业务监控和预警,最终帮忙企业实现数字化经营。同时,思迈特软件始终在加强数据管理、数据挖掘建模和自然语言剖析上一直加大投入力度,推动AI+BI技术的交融翻新。 家喻户晓,智能BI畛域不仅技术门槛极高,对产品的可靠性、稳定性要求极高,还须要提供良好的部署体验和售后服务,甚至针对不同行业对于BI的差异化需要也需满足。像金融行业对于数据强一致性就有着严苛的要求,而Smartbi继续迭代产品、加强技术创新能力,多年来帮忙企业实现获客增收、危险防控、产品翻新、生态共建等场景的利用,博得80%世界500强国内银行的宽泛认可。 在长期服务于金融、制作等头部企业的过程中,思迈特软件积攒了丰盛的教训,极大地晋升了本身的服务能力,其中就包含工信部、国家电网、交通银行、华为、万达团体等。现在,思迈特软件又把这些教训和能力,传递到更宽泛的客户群体,包含大量的腰部企业和为数众多的中小企业。 目前,思迈特软件曾经取得超4000家头部客户的反对与信赖,涵盖金融、制作、政府、地产等各个行业。在虚浮钻研产品的十多年中,可能博得用户的“必定之声”,是对Smartbi的最高认可和嘉奖。将来,思迈特软件将继续聚焦产品能力与用户体验,更无效地帮忙用户开掘数据价值,减速企业用户数字化转型与降级。

October 19, 2022 · 1 min · jiezi

关于数据分析:有没有不写SQL的大屏的工具推荐

硕迪数据分析系统BQL主动生成SQL展现BQL来源于Business Query Language ,是一种业务查询语言。是北京硕迪制信科技有限公司依据以往统计分析案例研发的一种语言。特点是通过可视化界面对业务语言进行查问、聚合、排序等操作,通过BQL引擎转换为数据库可执行的SQL,以简略快捷的形式来实现图表的制作。BQL模块不便不会编写sql的业务人员自助查问关系型数据库,非主题建模,单个数据库一次建模即可。 1、登录到硕迪数据分析系统,点击仪表板》新建仪表板。2、进入设计页面,拖动左侧BQL组件,拖至右侧空白处。3、点击组件左上角齿轮,进入组件设置。4、左侧抉择已创立好的数据源(此数据源须要通过建模之后来应用,如何建模请看楼主其余文章。)5、选中数据源之后,会显示所有表。咱们依据所须要的数据和图表来进行点击即可。所需的数据拖至右侧绝对应的地位,抉择好适合的图表,点击预览就会展示进去一个模块,当然图表的格局和色彩都是能够扭转的。6、点击右上角查看SQL便可查看自定生成的SQL。只须要业务人员便能够生成一个炫酷的大屏展现页面。 大屏展现:

October 18, 2022 · 1 min · jiezi

关于数据分析:行业案例|打造智慧银行家提升业务团队精益化经营管理水平

掌上银行智慧经营项目在该银行的落地实现了业务团队和 IT 团队的双赢。从业务团队端,减速了从数据指标取得业务洞察的过程,拓展了挪动展业场景,实现线上线下全流程经营治理;从 IT 团队端,造成了以数据驱动业务的模式,通过数字化的指标、过程、团队剖析,赋能销售管理模式变革。 1. 企业简介这家当先商业银行以“理解的市场,相熟的客户”为准入准则,保持“门当户对”的经营策略,认为客户提供多元化金融服务为指标,打造“公司银行、批发公司、集体银行、金融市场、信用卡、票据业务、投资银行、资产托管、资产治理”等十二大利润核心,初步造成多元化的业务增长模式和良好的品牌形象。 该当先商业银行建立科技就是第一生产力的理念,一直加大科技零碎建设投入力度,已在同类银行中建设起肯定劣势。这家银行以业务驱动为着力点,继续深入利用零碎建设,逐渐构建面向业务、面向服务、面向客户的“三位一体”利用零碎体系,打造科技零碎六大平台,为银行久远倒退提供松软的科技撑持。 2. 我的项目背景2.1 行业背景这家当先商业银行打算通过构建批发金融掌上经营剖析 App,来实现对集体经营部的赋能。为此,集体经营部冀望从经营和治理两个角度来进行批发银行业务的剖析,实现数据驱动决策,晋升业务团队精益化经营及管理水平。 实现全行精益化经营: 新客营销获取:买通线上掌上银行、线下营业网点,助力私域流量营销获新;拓展挪动业务:标准化治理场景赋能,联合数据落实打穿,从而推动数字化经营;客户经营保护:以场景用例驱动客户分群、分层,盘活存量,动静经营。实现全行精细化治理: 业务指标治理:以标准化商机漏斗+行为剖析+业务溯源,实现过程精细化治理;团队指标治理:贯彻统一经营视角,将指标层层合成传播,实时检视追踪;团队过程治理:反对业务离柜离行,现场进件转化,晋升人员展业效率。2.2 公司现状和痛点该当先商业银行现有 IT 架构下,难以较好地撑持上述集体经营部的冀望,存在着理论的痛点。次要体现在传统的架构面临数据链路流程长、开发成本高、运维难度大、性能较低等挑战。 灵活性较差:采纳自上而下的开发流程,往往两头代理数据两头表与业务需要强耦合,无奈应答业务多变的需要调整;交付周期长:通过工程师开发大量的脚本代码来反对,从业务需要剖析开始,再到调整代码、测试和公布,少则1周,多则1月;并发反对弱:传统架构中用的 RDBMS 存储聚合数据,当数据量增长或业务人员拜访激增时,无奈为业务人员提供良好的操作体验;运维老本高:开发人员除了要关注业务需要实现脚本代码技术外,还须要深刻理解底层存储、网关设计、流量负载等优化工作。3. Kyligence 利用场景 + 解决方案这家当先商业银行冀望通过我的项目建设,借助掌上银行 APP 等挪动技术,实现翻新笼罩银行批发业务场景的智慧银行。除了解决现有 IT 架构中理论的痛点外,更需高效赋能业务人员,从而实现串联全业务场景流程的精益化经营治理。 基于上述需要,该当先商业银行后期进行了深刻的调研和技术选型,在和 Kyligence 进行屡次、深度的业务沟通和技术交换后,最终抉择了 Kyligence 的产品及解决方案。该计划通过 Kyligence 的 AI 智能举荐,构建准确索引晋升查问性能;通过分布式程度扩大架构,平衡负载撑持高并发的流量。 从技术方面看,Kyligence 智能多维数据库解决了之前架构的痛点,提供了: 对立数据服务计划:内置模型资产、AI 加强、聚合索引,可能疾速响应业务需要变动;标准化的开发流程:更利于团队间协同工作,极大缩短了业务需要的交付周期;聚合索引及横向扩大:无效升高查问响应工夫、进步并发性能力,最终为掌上银行智慧经营 APP 的业务人员提供良好的应用体验;全方位的运维治理监控:确保平台一旦有问题便能疾速定位和解决,保障平台稳固运行。从业务方面看,该平台陆续失去这家银行高低各层级业务人员的良好反馈,次要体现在如下方面: 业务战报:给各分行的业务经理提供各个本人的业绩状态查看,可精密到天或是工作范畴段;晨夕汇报:给各分行的部门领导提供 T+1 的业绩战报数据,用于晨会工作汇报与总结;穿透式剖析:各业务经理可治理各自名下的业务人员信息,能下钻客户具体的统计数据信息;客群经营:各业务经理可依据本身需要,筛选服务指标的客户群体进行营销治理。4.播种的成绩这家当先商业银行的掌上银行智慧经营项目目前推广到了 400 多个网点,笼罩约 6000 个行内业务人员,在性能和性能上均达到甚至冲破了最后的预期: 赋能批发业务数字化经营,实现穿透式治理与经营剖析:批发业务用户全面数据赋能,反对从管理层汇总数据层层下钻至网点、员工级等明细数据,实现数据口径统一的穿透式治理与经营剖析;90% 以上的查问响应工夫小于 1 秒,给予业务人员良好的操作体验;实现批流数据交融查问,网点数据时效性缩短至小时级,业务人员可查看近小时的数据。掌上银行智慧经营项目在该银行的落地实现了业务团队和 IT 团队的双赢。从业务团队端,减速了从数据指标取得业务洞察的过程,拓展了挪动展业场景,实现线上线下全流程经营治理;从 IT 团队端,造成了以数据驱动业务的模式,通过数字化的指标、过程、团队剖析,赋能销售管理模式变革。 对于 Kyligence上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 开创团队于 2016 年开办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 加强的高性能剖析引擎、对立 SQL 服务接口、业务语义层等性能,Kyligence 提供老本最优的多维数据分析能力,撑持企业商务智能(BI)剖析、灵便查问和互联网级数据服务等多类利用场景,助力企业构建更牢靠的指标体系,开释业务自助剖析后劲。 ...

October 13, 2022 · 1 min · jiezi

关于数据分析:数据解码技能提升Smartbi助力长沙烟草找到新路子

让数据会“谈话”能“干活”,为客户挖掘出更深层的数据价值,是Smartbi始终以来助力企业数字化转型的指标和方向。大数据时代,每个迷信的决策离不开数据的撑持,数字化精益治理是各行业晋升本身经营治理的必然选择。数字化转型的成色如何,场景落地利用便是“试金石”。作为国家经济畛域重要产业,更须要大数据作为撑持,提供迷信的决策依据,以数字化转型降级赋能,更加直观地感知市场、服务客户。长沙烟草深知这一情理,踊跃利用大数据技术进行全方位、全角度、全链条革新,以数据为外围驱动因素,推动产业数字化,被动拥抱数字蓝海。 01基于Smartbi发展数据利用大赛,数据利用场景点燃业务技能“新引擎”让数据谈话、用数据决策,已成为企业数字化经营的一种新模式,然而仅有全局布局而没有让企业全员落实纯属夸夸其谈。业务人员数字化思维和数据分析能力,更将成为企业外围竞争力的要害因素。始终以来,长沙烟草聚焦终端外围需要,就地取材发展营销数字化转型工作,强化终端数据品质治理,开掘终端数据价值,赋能批发终端向智慧终端转型。不仅在业务经营治理流程上构建数字化建设,还继续对内造就数据文化氛围,晋升全员的数字化能力。就在近期,长沙烟草便以“BI无极限,数字赢将来”为主题,使用Smartbi商业智能软件,聚焦营销痛点难点,面向批发客户和营销人员,以晋升全市零碎营销数据利用程度,推动终端销售数据采集品质晋升为指标,将比赛作为载体,以赛促学,共同进步, 晋升两支职业化队伍数据分析能力。 以上仅局部大赛现场图通过这次大赛,借助Smartbi搭建了一个造就数字化人才的交流平台,促成全员把握全面的数据分析思维与办法,晋升内部人员的数字化能力,同时营造出外部数据分析的气氛,激发批发客户和营销人员数据利用的翻新生机。此外,长沙烟草围绕营销数字化转型发展了屡次流动,并将Smartbi数据利用大赛为契机,围绕企业策略发展数据工作,与客户实现独特成长。本次产品赋能流动取得长沙烟草全员的高度认可,Smartbi不仅能为长沙烟草的数字化翻新倒退提供了强有力撑持,同时也为行业的数字化倒退的摸索提供新思路、新办法。 正是因为,数据分析思维的互相碰撞、Smartbi产品的加成反应带来了企业数据文化的改革,也将助推长沙烟草实现数字化经营治理产生一系列的连锁反应。这所有,得益于Smartbi与长沙烟草翻新摸索的数字化实际。 02 Smartbi继续赋能客户,让数据用到实处,让服务走进心里平台搭得好不好,“戏”唱得精不精彩,客户和消费者才是最好的“评委”。家喻户晓,思迈特软件作为行业当先的国产BI厂商,在践行数据价值的这条路上,始终用本人的形式深耕大数据BI畛域,一直打磨技术,晋升服务质量,致力打造更实用、更智能、也更适宜用户的产品。作为智能BI的领导者,Smartbi紧密结合业务场景,一直进行产品功能完善,提供面向用户全场景的一站式大数据分析平台,从加强数据管理,到数据挖掘建模,再到自然语言剖析,目前Smartbi已迭代降级到10.5版本,将BI和AI实现进一步交融翻新,晋升了数据分析的智能性和易用性,解决用户在数据分析中遇到的挑战。通过十余年的倒退与实打实的行业教训,思迈特软件未然成为行业的佼佼者,但车驶向何方,还得靠本身在大数据浪潮中,一直的去扭转调整方向,晋升整体团队的战斗力,而精益求精的服务态度就是Smartbi最好的信号灯。思迈特软件在打造产品技术的同时,也高度重视服务力的晋升,并紧紧围绕客户的需要变动,一直适时欠缺和晋升产品的服务体系,次要聚焦在三个层面的产品和服务: 一是梳理积淀不同行业大数据解决方案的办法体系,以客户需要为核心提供定制化的落地计划,偏差咨询服务;二是撑持上述办法体系的Smartbi一站式大数据分析平台,可能满足企业全场景的数据分析需要;三是我的项目制订推广过程中的专家服务,现场领导构建我的项目流程体系,要害业务用户的需要疏导和培训,帮助进行业务层面的宣传推广,帮忙客户营造数据分析文化。始终以来,思迈特软件在产品技术与客户胜利方面做了大量的致力,不断加强对长期客户价值的深耕与护航。比方,助力重庆银行摘得“IDC中国金融行业技术利用场景FinTech冲破奖”和爱剖析"银行数字化最佳实际奖";联结英大人寿打造“数据之家”自助剖析平台,荣获“IDC金融行业利用场景翻新冲破奖”;助力泰康保险斩获“2022IDC中国金融行业技术利用场景翻新动摇者”;助力福建邮储荣膺“《金融保险报》的优良案例奖”等等。除此之外,为了更好地服务宽广用户,思迈特软件在技术、市场和生态等方面也做了更多的摸索与尝试。Smartbi还上线了麦粉社区,为用户提供一个周到、及时的服务平台,也让思迈特软件更好地聆听用户的声音,打造更加合乎用户需要的产品。将来,思迈特软件将继续迭代产品与服务,叠加本身的品牌能力、技术能力以及产品能力,用牢靠的技术和贴心的服务开掘数据价值,为千行百业提供源源不断的数字化能源。

October 12, 2022 · 1 min · jiezi

关于数据分析:高颜值超实用这套财务分析模版自带BUFF加成

财务部门作为企业外围资源与数据的重点部门,始终被公认为企业数字化转型的突破口。企业的洽购、生产、销售、市场、人力,每个环节都离不开财务的反映和调控,企业经营治理过程中须要决策,决策须要数据,财务就是提供决策数据,基于数据驱动决策,缩小不确定性,这是财务的实质。同时,财务部门对老本构造、支出起源、资金流向、企业经营情况的透彻了解,能力驱动财务数据赋能业务增长。想要从传统的“账房学生”降级为“数字神经系统”,财务管理还须要逐渐实现以下几点变动: 如何通过数字化伎俩实现全面实时监管企业的经营倒退状况?如何降低成本费用、扩充企业收益?如何更无效地扩充流动资金,升高现金老本?如何无效评估与管制投资危险,进步投资收益,管制资产与负债?如何正当调配和应用收益,通过财务绩效实现企业的无效评估?为此,Smartbi搭建财务综合剖析模板,联合大数据分析平台的技术支持,实现初步的数据挖掘能力,通过可视化和多角度的交互剖析能力进步数据决策,实现业务赋能和企业业务增长。在财务综合剖析模版上,企业能够依据本人的需要自定义财务报表,用数据表格和图表等丰盛的模式展现数据分析后果,满足精细化剖析需要。从财务综合剖析、财务资金剖析、决策分析、危险预警等多个维度登程,帮忙企业及时发现财务危险,精准调整经营策略,实现数字化财务管理。 01.财务综合剖析,提供全面支出数据反对财务综合剖析展现了企业最外围的总体数据,为营销决策提供全面的支出数据反对。模板通过指标卡实时统计支出、营业总成本、利润、毛利润、利润增长率等指标的数据。通过地图、双Y联结图、横条图等可视化图形从区域支出、主营业务支出、净利润、征税、银行账号余额、资产负债等维度进行剖析。 02.财务比率剖析,晋升财务决策效率企业个别须要通过一些指标来剖析企业经营倒退状况。通过雷达图能更直观地看清楚企业成长能力、盈利能力、经营能力和偿债能力,还能点击联动查看不同指标的具体数据,并且配合着资产负债报表、利润表、现金流量表等明细报表,综合剖析公司经营情况,及时发现问题,并提出解决方案。此外,还能通过指标卡模式进行绝对值定量分析及趋势剖析、占比排名剖析等,及时把握公司总体的财务状况,晋升财务管理程度及财务决策效率。 03.财务状况剖析,及时评估偿债及盈利能力财务状况剖析次要是指对公司资产、负债等各方面进行剖析评估,通过剖析企业的资产构造、债权构造、变现能力、偿债能力、资本保值能力和现金流量,以理解企业财务状况的好坏。如果企业资产负债率过大,企业杠杆程度过高,那阐明企业资不抵债,现金流容易解体。如果资产负债率过低,也就阐明资产还很多,没有多少负债,现金流十分充分。那就阐明企业有很多资金还“躺”在账本上,并没有很好地利用起来,没能更好地让资金发明价值,这就可能导致企业生机不太高,整个盈利能力没有充分发挥出作用。 财务状况还要看资产与资产收益,次要是对于企业的盈利能力和赚钱能力。在资产与资产收益剖析表里能够看到总资产、净资产的收益率状况,每个月度的变动、各子公司的具体情况,从而判断整个公司的资产是否能真正发明更多的价值。通过对上述指标的剖析,可对企业及其子公司的偿债能力和盈利能力进行评估。 04.资金剖析,实时理解各资金状况资金剖析次要从资金存量剖析、投融资剖析、现金流量剖析三个维度登程。资金存量剖析:通过看板能够实时看到企业账户的资金是否能维持到下个月,对于企业的欠款,账上的资金是否足够还债。此外,还能够实时理解各个子公司的账户余额趋势,现金流状况等。 投融资剖析:在投融资剖析上,能够看到融资金额占比、融资到账金额剖析等状况。 现金流量剖析:现金流就像企业的血液,现金流有余那阐明企业经营情况是有问题的,如果现金流短缺,阐明企业还很有生机,咱们能够通过现金流来剖析企业整体经营情况。 05.财务预警剖析,提前干涉财务危险Z- Score 模型能够评估一个公司的财务状况,通过剖析总资产、总负债、支出、营运资金、息税前利润、所有者权利等指标,在Z- Score模型上剖析财务危险,如果Z- Score分数达到肯定水平,那可能存在肯定的危险,须要及时进行干涉,避免出现更大的危机。 在大数据和全球化的倒退态势下,市场瞬息万变,企业经营风险也日益激增。财务把控着企业的经济命脉,为了晋升应答不确定环境的应变能力,企业须要放慢财务转型,通过数字化建设,突破传统低效、高耗的财务管理模式,加强企业竞争力。像Smartbi这样的一站式企业大数据分析平台可能大大降低数据分析的复杂度,与现有的业务零碎无缝对接,买通数据孤岛,通过简略高效的操作形式实现数据可视化剖析,帮忙企业做的每项决策都有科学依据,走的每一步都成竹在胸。

October 12, 2022 · 1 min · jiezi

关于数据分析:拓客神器使用msray精准采集手机号邮箱等

企业在客户拓展上否遇到以下痛点1:客户资源少 海量信息碎片化,企业查问成果差,无奈批量找到优质潜在客户,销售状况不如预期 2:获客老本高 业务竞争愈发强烈、流量越来越贵、推广成果不现实,导致获客老本越来越高 3:一线销售效率低 一线销售人员每天破费大量工夫寻找客户,而网上信息泥沙俱下,工作投入产出比低 4:业绩增长不稳固 短少迷信业余的获客形式,难以继续获取精准优质客户,客户资源不稳固,业绩时好时坏 如何解决:msray反对的性能:**1:关键词全网采集2:url全网采集3:联系方式全网采集** 咱们要应用迷信,疾速的形式去获取海量的数据节俭人工成本,从而更快的,更精准的倒退咱们的客户群体。 应用msray依据咱们提供的关键词疾速采集全网指标客户,保证数据的实在,精准,无效。 相似于上图的网页展现的模式,都是在全网公开的数据接下来咱们就实际操作一下:1:明确咱们要采集的行业关键词,例如:食品厂,机械厂,家具,等... 2:依据行业关键词采集到全网的相干url地址 3:依据URL网址采集网页中蕴含的联系方式,手机号,邮箱,微信等~ 1:采集行业url这里已食品厂为例测试应用: 1-1:筹备关键词食品厂食品公司衰弱食品食品店食品百货1-2:依据关键词采集相干网址创立工作 查看后果示例: 2:依据咱们采集到的网址提取联系方式导入咱们采集的url到手机号采集软件外面 采集后果预览: 咱们能够整体导出后果,也能够独自导出咱们须要的字段 比方:独自导出手机号,或者邮箱 整体的成果展现 邮箱展现: 失去数据后处理:这里咱们能够利用采集到相干的手机号,邮箱等联系方式,间接进行电话营销、短信营销也能够进行微信营销。 也能够依据本人的业务须要进行下一步解决。 微信营销办法:咱们能够应用同步软件,把咱们采集到的手机号同步到手机上,而后再微信上关上通过通讯录获取好友,这样咱们就能够获取到指标客户的微信联系方式了。

October 6, 2022 · 1 min · jiezi

关于数据分析:从新零售物流到广告搞定指标中台就这么简单

近期,Kyligence 公布了一站式云端指标中台 Kyligence Zen。该 SaaS 产品基于 Kyligence 外围 OLAP 能力打造,提供整合的、轻量级的、开箱即用的指标中台服务,助力企业聚焦指标及治理。明天,咱们将分享 Kyligence Zen 在新批发、物流及广告等场景的利用,欢送大家点击 Kyligence Zen 官网 开启试用! 1. 新批发复购剖析,简略 3 步抓住回头客无论是互联网还是新批发行业,获客老本都越来越高,此场景基于金牌流量经营 RFM 模型推导与复购相干的外围指标,并以此开展剖析。从指标后果来看,该公司2018 年度的复购率相比 2015 年出现增长趋势;从月份来看,年底的沉闷用户数和用户复购率都有肯定减少。新批发企业的用户经营部门能够联合报表的剖析后果,进一步调整和制订无效的经营策略。 欢送点击下方链接浏览全文 新批发复购剖析,简略 3 步抓住回头客 2. 快递保卫战:找出北极星指标、锁定优质供应商物流配送是保障电商失常运行的要害,但因为各种因素的影响,快递不免变成“慢递”。本文通过一组实在数据,演示如何通过 30 分钟简略的数据分析获取决策洞察,实现 13.65% 的物流准点率晋升。 欢送点击下方链接浏览全文 快递保卫战:找出北极星指标、锁定优质供应商 3. 多平台推广时如何找到高价值广告投放平台?“咱们都晓得有一半广告费在节约,然而没人晓得是哪一半”。但这句话将止于 Kyligence Zen,借助 Kyligence Zen 一站式指标中台,咱们实现了从不同维度(如落地转化率)比照各广告平台的广告营销成果,疾速找出高质量和不现实的广告投放渠道,从而为后续的广告推广打算提供数据参考,晋升收益率。 欢送点击下方链接浏览全文 多平台推广时如何找到高价值广告投放平台 4. 通过图形化界面,两步创立一个指标零 SQL、Yaml 根底,是不是数据分析就和我无缘了?No,No,No,Kyligence Zen 提供了十分敌对的图形界面,仅须要两步就能够实现指标的创立,后续还会推出系列文章,介绍如何对两个指标进行加减乘除以及如何计算同比、环比,敬请期待! 欢送点击下方链接浏览全文 通过图形化界面,两步创立一个指标 5. 20 元获客估算背地的业务价值是?Kyligence Zen 不仅管指标,还管指标,是不是听下来有些形象?不焦急,通过一个简略的广告获客估算,让咱们来看看为什么须要这个指标?以及如何促成往年公司业绩的达成吧! 欢送点击下方链接浏览全文 20 元获客估算背地的业务价值 对于 Kyligence上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 开创团队于 2016 年开办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 加强的高性能剖析引擎、对立 SQL 服务接口、业务语义层等性能,Kyligence 提供老本最优的多维数据分析能力,撑持企业商务智能(BI)剖析、灵便查问和互联网级数据服务等多类利用场景,助力企业构建更牢靠的指标体系,开释业务自助剖析后劲。 ...

September 29, 2022 · 1 min · jiezi

关于数据分析:Smartbi携手中新赛克达成战略合作生态构建再上新高度

思迈特软件与南京中新赛克科技有限责任公司(以下简称“中新赛克”)签订策略单干协定,正式达成策略合作伙伴关系。 单方将在产品技术、服务体系、单干资源等方面进行优势互补和深度交融,携手推动大数据BI建设在全国的倒退,开掘更多利用场景,落地解决方案,全面推动企业数字化、智能化降级。本期嘉宾: 1►数字化平台是企业实现转型降级的刚需 成立于2007年的中新赛克,是一家基于“数据通讯技术、移动网技术、软硬件开发技术”积攒的信息网络安全与数据应用领域整体解决方案提供商。 随着时代改革,企业数字化需要从基础架构到精细化经营,企业迎来了高速倒退的契机。企业中CEO需能实时把握企业经营情况,进步企业应答不确定危险的能力;CFO须要让企业升高各项经营老本,进步经营效率;而CIO则须要负责一直通过技术改革,进步企业经营效率,施展数据价值。 “我认为建设以数据为外围的数字化平台是企业实现数字化转型的一个刚需。所以,企业数字化转型最重要的是在于构建数字化平台,建设企业数据规范,同时突破企业数据壁垒,实现企业内外部数据、线上线下数据的交融,构建起企业对立的数据资产,这样能力助力企业实现数字化转型的指标。”卢总如是说道。 作为行业引领者,中新赛克率先布局大数据畛域,始终以来致力于畛域大数据平台产品的构建与研发。通过十多年的摸索,数字化和智能化曾经贯通中新赛克的外围业务流。 2►布局大数据,中新赛克数字化策略降级 以后,数字化进入全面浸透和深度交融的新阶段。 中新赛克通过发力大数据产品化及科技驱动,打造了全渠道的产品矩阵。面向B端市场,中新赛克通过大数据服务,帮忙行业客户实现生产、经营、决策全流程数字化降级。 基于本身实际,中新赛克OceanMind海睿思团队从2016年进入行业深水区进行学习实际,目前已实现60+数字化建设项目,聚焦涵盖政府、制造业、能源、修建、科技研发、医院的七大行业,领有了丰盛的大型数字化转型我的项目教训。 尽管数字化时代倒退迅猛,但不可否认的是,企业数字化倒退之路依然面临诸多困难。在多年服务企业大数据我的项目建设的实践经验中,卢总总结了企业数字化转型的三个重要点: 在数据管理层面,对企业积淀数据资源进行盘点、联接和标准治理,将来自不同渠道、构造各异的数据转化为可变现的数据资产; 在数据分析层面,引入数据分析工具简化数据的开掘剖析及可视化过程,缩短数据驱动决策的工夫,帮忙企业灵活运用数据; 在数据利用层面,在治理和剖析的根底上,数据驱动的最终目标是利用数据,围绕场景将数据变现,为企业带来理论效益增长,衰弱洞察和数据化流程治理,笼罩企业内容的方方面面,让业务零碎、组织都能充沛参加公司业务,实现质效双升。 3►与思迈特软件携手单干,成为中新赛克的新策略助推器 目前,各行业客户对于大数据服务的需要将变得更加复杂化和个性化。 在这样的背景下,中新赛克要进一步疾速地做大做强,是离不开和各种合作伙伴独特携手并进。为此,思迈特软件与中新赛克联手开展在大数据BI畛域的全面单干,单方整合各自资源,独特搭建和欠缺整个云端的产业生态。 抉择是双向的,在竞争强烈的大数据市场,中新赛克抉择思迈特软件的理由是什么? “ 对于单方的单干,卢总谈到,“Smartbi在大数据BI畛域非常业余,本身销售市场端知名度和产品覆盖度都很高,十分理解市场客户的信息化需要,有着可信赖的产品和不同凡响的市场劣势。本次单方的策略单干,能够充分运用彼此之间的行业长处,提供更残缺的企业数字化转型行业解决方案,为客户产生更好的产品和服务,更好的推动行业倒退和生态凋敝。” 能够预感,单方的强强联合也不会止步于此。将来,思迈特软件和中新赛克还将围绕产品解决方案、服务反对、市场营销等发展深度单干,助推数字化新策略的落地和腾飞,为客户的数字化转型大业构筑最巩固的基石。单方分工合作,独特到达客户,让咱们独特期待!

September 28, 2022 · 1 min · jiezi

关于数据分析:如何在国庆抓住收益红利这家酒店集团最佳实践值得一看

随着疫情一直重复,酒店行业在守住平安、衰弱红线的同时,踊跃拥抱新技术、经营数字化能力赋能酒店治理早已成为行业的共识。尤其近两年来,行业进入数字化减速发展期,通过技术赋能、数据赋能、收益治理赋能等多维度,晋升酒店经营效力,打造新型酒店经营模式,是行业倒退的必然趋势。 国庆假期邻近,在家憋久的出行爱好者及差旅入住需要也逐渐展露爆发势头,一些敏锐的酒店防患未然,早已利用数字化技术和思维,实现数据监控及治理,冲刺抓住国庆假期的收益红利。 比方某酒店团体,其定位是以高中端商务/度假酒店为主,领有20多家投资控股酒店,现有投资治理的酒店客房数超5000间套。通过建设数据中心治理平台,提前部署了国庆假期各项服务指标体系,实时监控各业务部门状况,充沛为迎接国庆长假做好了筹备。 过来,该酒店团体也因分公司多,业务范围广等现状,在企业数字化转型过程中面临很大的挑战——既要实现团体的对立管控,也要便当不同业务板块的多元化倒退。 特地是在数据分析及应用过程中上,次要面临4大问题: 各部门数据扩散在各个业务零碎上,零碎割裂造成数据孤岛;各酒店对业务数据指标治理形式不一样,业务数据尚未造成统一口径,不足精细化治理及对立的指标体系;领导难以及时精确无效监控业务部门的工作成绩和酒店经营状况;传统的业务报表模式比拟繁多,偏日常统计分析,依附手工整理演绎业务报表,工作量大且低效。为了解决上述问题,该酒店团体联结Smartbi基于现有的业务体系建设数据中心平台,心愿通过数据中心将业务数据集中化治理,并且实现报表自动化、数据自主剖析、业务主题驾驶舱等,从不同层面全方位剖析并展示最新最精确的数据,进一步开掘数据背地的价值。 01.买通异构零碎,实现业务数据交融 原先,各部门的数据扩散在各个业务零碎上,没有造成对立共享的数据资源池,技术人员在做数据分析时,须要对接不同等业务零碎和部门,沟通门槛高,且费时费力。 当初依靠Smartbi数据中心平台,借助ETL把企业散落在各个系统中的数据集中起来,通过对立治理业务及数据,突破了原有烟囱式零碎建设形式造成的数据孤岛场面,极大晋升了数据共享水平,同时,还有助于及时发现业务经营中的问题和危险。 02.搭建对立的指标体系,造成规范的管理模式 现在,数字化的典型特色是以数据为驱动,通过数据分析来为企业的业务决策提供反对,数据的有效性和可用性,成为企业数字化转型成败的关键因素。而该酒店集团化的模式下,面临着酒店数据分类和指标不统一的问题,导致各个酒店统计数据口径差别很大,数据的互相矛盾也影响决策层的判断。 为此,该酒店团体基于不同的业务场景在数字核心平台上进行建模,能够对立要害指标的业务口径及统计口径。例如在财务部门,能够对立各酒店应收、各酒店经营利润、各酒店支出构造、各酒店餐饮老本、各酒店经营费用等财务剖析指标,通过清晰且惟一的指标治理,防止多个数据后果影响判断和决策。 03.搭建多主题治理驾驶舱,无效监控酒店经营情况 该酒店原先的业务零碎,只能反对导出Excel表,并且做一些十分繁多的数据分析,对于业务部门负责人和决策层来说,并不能联合历史数据从而零碎且全面地理解某项业务的经营成绩,也不能及时发现问题。 该酒店基于标准化的数据指标体系,围绕酒店的外围业务,在数据中心平台建设笼罩市场 、财务、洽购、收益、人力等多个业务主题等治理驾驶舱,所有的业务数据都能够进行可视化展现,帮忙领导层及时无效地监控各个业务部门的工作成绩和酒店经营情况。 图:财务管驾舱 图:市场管驾舱 图:收益管驾舱 相较于传统图表与数据图表,业务主题驾驶舱能够突破数据孤岛,通过可视化的数据出现形式,及时展现出暗藏在庞杂数据背地的深度价值,帮忙企业管理决策晋升到一个新的高度。 04.搭建100+自动化报表,多维度剖析业务数据 原先的报表零碎只能依附手工导出再做剖析,每月月底或年底做数据总结剖析的时候,一个个传统报表着实耗费一线人员的工夫和精力。当初,围绕着各个业务部门的数据分析需要,在数据中心里搭建了笼罩支出剖析、客房体现剖析、餐饮剖析等100多张固定格局报表,颗粒度剖析每个业务部门的数据指标,并且通过大屏展现各项指标的内容,帮忙业务人员及时响应市场变动。 比如说,业务人员每天都要制作支出报表估算比照剖析,以前可能须要耗费2个小时,当初只需关上零碎,一键刷新即可失去最新的报表数据及剖析报告,极大地提高了业务部门产出报表的效率,进步生产力。而且,每次的经营报表都会主动推动到手机上,管理者能够在手机上间接查看,对于常常出差的人来说大有裨益。 ▎解决方案价值 1、搭建数据经营剖析治理平台,有助于各层级管理人员紧紧围绕部门策略、部门指标开展工作,对工作中的轻重缓急有了更清晰意识。 2、通过市场部、财务部等部门的业务管理驾驶舱,帮忙管理层疾速聚焦业务重点,无效监控各业务部门的工作成绩和企业的经营情况,从而制订有针对性的策略工作。 3、全面整合各业务数据,对立数据口径,搭建对立的数据平台,建设残缺的数据资产,让历史数据和实时数据为业务所用,充沛开掘数据价值。 4、通过100+报表的建设,极大地提高了业务部门产出报表的效率,升高人工成本,由数据辅助业务,为各业务人员赋能,晋升业务价值,为团体带来更大的效益。 综合来看,该酒店团体无效地融入一些大数据技术,有利于实现对服务工作的数据预测,并且可能在较大水平上保障预测的精准性,有利于实现对客户的个性化服务,进而晋升客户的体验成果,实现酒店利益的最大化。 酒店的管理工作最要害的就是,既要为客户提供优质的服务,又要使服务具备时效性。酒店智慧化治理,能够无效缩小酒店资金的耗费,无效地使用数字网络技术,还能为客户提供精准、个性化的服务,满足不同客户的需要。 疫情影响下的酒店治理的确面临微小挑战,这也倒逼企业必须尽快拥抱新技术,用最简略的形式展现最间接的后果,用最高效的监控领导最精准的服务调整,轻松把握内外部状态的变换,精准发展营销策略调整。Smartbi酒店数据经营治理计划让酒店解脱单纯依附教训揣测的无奈地步,重塑后疫情时代酒店治理逻辑,进而晋升收益目标,这将无疑也是进步酒店外围竞争力的要害。

September 28, 2022 · 1 min · jiezi

关于数据分析:炫酷版世界大学分析不用熬夜做报表无需代码4步就能学会

后疫情时代,各国入境政策逐步放宽,2022年已有四成留学生返回留学国家持续学业;另一方面,国内多地颁布吸引留学生的政策,例如上海人社局公布留学生落户新政“世界前50院校的留学生全职到沪工作后可间接申办落户”等等。 基于内外利好政策的刺激,2022年留学市场继续炽热。当然,留学要思考诸多因素,如地理位置、教学质量、费用差别、就业机会等等。其中,院校的综合排名是十分重要的因素,它在肯定水平上影响了寰球企业对毕业生的认可水平。 说到院校排名,目前较权威的评比榜单有QS世界大学排名、泰晤士高等教育世界大学排名等,不少准留学生在申校时会参考这些排名榜单。 恰逢一年留学申请季,为了帮忙大家理解世界大学学科排名的状况、更好地进行择校择科抉择,小麦从网上下载了近5年QS世界大学和学科排名的数据,教大家疾速搭建一个兼具剖析性和好看性的世界大学排名仪表盘。话不多说,先上成品给大家看看~ 如上图仪表盘内容包含:01 指标信息概览通过指标卡展现要害指标,让读者对世界大学排名有一个根底的意识。02 世界大学地理分布通过世界地图展现各国世界大学上榜数量散布,并直观体现各国TOP排名。03 学校抉择剖析通过图表下钻、联动、跳转等操作,层层交互,逐渐聚焦学校详情。04 学科抉择剖析通过图表下钻、联动、跳转等操作,层层交互,逐渐聚焦学科详情。 在做仪表盘之前,咱们先基于下载好的数据,应用数据模型做数据筹备工作。Smartbi数据模型是领有弱小计算能力的一体化多维建模工具,可能满足不同用户在不同场景下的数据筹备需要。 图:世界大学数据模型 图:世界大学排名指标维度对应表 世界大学数据模型创立好后,咱们能够基于它来进行仪表盘的制作。 内容设计为了让剖析更顺畅,咱们能够先应用脑图简略列举出剖析内容的纲要,而后依据内容布局页面布局、划分板块、抉择图形和对应的展现数据。 页面布局01 进行板块划分依据设计好的内容,能够大抵布局画布的版面设计,尽可能地将同一个剖析主题的内容放在一个区域,使得仪表盘表白出的信息更清晰、更有条理性。 02 抉择布局形式Smartbi交互仪表盘反对自适应布局和自在布局,小麦将抉择灵便度更高的自在布局。 03 抉择仪表盘主题Smartbi交互仪表盘内置多种主题格调,能够一键对立配色。下图,小麦抉择了“壮丽深色”的仪表盘主题。 图:仪表盘主题组件设计 01 指标信息概览大部分人在看到一个仪表盘时,会首先留神顶部概览的信息,小麦抉择在顶部区域应用指标卡组件展现一些指标数据,可能让用户疾速对本次剖析的排名榜单有根底的认知。在下图的指标卡中,咱们间接从组件模板中进行复制粘贴,再替换数据起源就能够实现。 这些组件都是横向排布,咱们能够应用组合对齐性能,疾速实现多组件精准布局,省心省力。 02 世界大学地理分布既然数据来源于寰球,当然少不了地图组件了!地图能够直观地展现寰球各国数据的差别,从寰球地图上能够大抵判断:美国、中国、澳大利亚、英国、德国的优质学校数量较多。 在此基础上,为了更清晰的展示各国世界大学排名状况,新增一个降序排列的柱图,同时应用工夫疾速计算,比拟与以后值与同期值的差别。 03 学校抉择剖析为了可能更便捷地抉择学校,这里咱们应用钻取、联动、跳转等操作,通过层层交互,剖析范畴由大到小,从学校在大洲排名状况最终聚焦到指标学校具体信息。 择校之初,通过横条图展现各大洲上榜的学校数量,单击柱子能够下钻查看该大洲下国家的状况;初步确定指标大洲或国家后,咱们同步联动下方表格筛选出对应的世界大学列表。 锁定目标大学后,接着点击表格中大学名称,即可弹窗展现对应大学的具体数据。以北京大学为例,在弹出的详细信息中,咱们能够看北大的雇主名誉、学术名誉评分都较高,但近3年来兴许受到疫情的影响,因而留学生比例有所降落。 Smartbi交互仪表盘是高度交互性的可视化摸索剖析性能,它不仅反对联动、钻取、跳转等多种交互方式,且配置非常简单。 04 学科抉择剖析“选学校还是选业余?”是每年求学季都会引起热议的话题,小麦也不会放过这块的剖析内容。学科的剖析思路和主题“学校抉择剖析”相似,应用联动、跳转等交互能力,剖析范畴由大到小,最终聚焦到某个学科上。 视觉优化实现设计后,为了进一步晋升整个仪表盘的可读性和好看性,咱们还须要对整个仪表盘的视觉进行优化。为此,小麦总结了一部法典,可能高效进行图表、布局、配色、内容的优化,大家快快到麦粉社区下载学习吧! 纸上得来终觉浅,绝知此事要躬行。看到这里的小伙伴是不是曾经蠢蠢欲动,也想要本人尝试呢?小麦曾经为你们筹备好数据模型了,小伙伴们只须要登录官网体验核心,即可查看示例仪表盘,并且应用同款世界大学剖析的数据模型做剖析啦~

September 21, 2022 · 1 min · jiezi

关于数据分析:从-OLAP-到指标中台-SaaS关键指标赋能业务管理

近日,Kyligence 秋季线上论坛胜利举办,Kyligence 联结创始人兼 CEO 韩卿发表了题为《从 OLAP 到指标中台 SaaS,Kyligence Zen 公布预览版》的演讲,分享了 OLAP 平台到指标中台 SaaS 的演变,并公布了 Kyligence Zen 预览版和进行 Live Demo 展现,欢送拜访 链接 收费试用。 1. 为什么要做指标中台?当初,越来越多企业和用户开始关注到指标和指标治理,回归到应用数据的实质,而不是只关怀某个开源我的项目或者技术。在过来几十年里,整个数据的架构产生了很大的变动,从一体机时代的数据仓库,以 Hadoop 为外围的数据湖,到 Snowflake、Databricks 等云上数据仓库,再到湖仓一体化等。这些中心化的模式都是通过简单的 ETL 工具,利用 Data Pipeline 把数据会集并清理,而后提供给业务人员应用。 明天咱们身处 SaaS 时代,整个的行业架构曾经呈现了新的趋势,逐步造成去中心化的剖析模式,最近以 Data Mesh 为外围的概念更是引发了行业热议。业务部门心愿可能更被动、自主地应用数据,而不再是交由一个中心化的团队,否则这个中心化的团队就很可能成为瓶颈,甚至妨碍。 在过来的几年里,Kyligence 在指标中台的方向上有十分多的实际和胜利案例,安全银行、UBS、长安汽车、Appzen、Strikingly 等客户在这方面都有十分多的积攒。Kyligence 智能多维数据库,实质上就是一个受治理的数据集市,治理的就是相应的维度和指标。 这里分享一个安全银行的潘多拉平台的案例,Kyligence 帮忙安全银行治理着超过 1.4 万多个指标、5000 多个沉闷的用户,大大降低了数据应用的开发成本和周期。业务人员能够自助创立各种各样的剖析指标,而 IT 只须要关怀一些原子指标即可。这不仅促成了安全银行在数据文化上的建设,也使得数据可能更大范畴、更大规模地撑持所有人进行决策。 基于过来服务泛滥客户的实际,咱们发现指标中台是一个十分好的方向,Kyligence 心愿能够把这种能力提供给更多客户,真正为业务用户设计,更加聚焦在指标为外围的方向上,以整合的、轻量级的、开箱即用的能力,将一些轻量级的 BI,甚至是轻量级的数据仓库、轻量级的 ELT,提供给广大客户。 为什么是 SaaS 产品? 首先,在 SaaS 的时代,问题和痛点也应该用 SaaS 的形式解决。尤其是现在许多互联网及其他公司,都在一直地应用 SaaS 的服务。而这些 SaaS 服务背地产生的数据,使得整个数据的割裂水平越来越重大。在这个过程中,曾经不能应用传统的数据仓库模式,把数据会集起来进行建模,而后做报表给到业务用户。企业心愿用更加麻利的形式,为业务用户提供数据分析和决策的能力。 ...

September 20, 2022 · 1 min · jiezi

关于数据分析:从生产到销售借助数据驱动将月饼送往千家万户

金秋送爽桂飘香,从8月开始,各大餐饮食品行业就开始为中秋节的月饼销售繁忙。中秋节作为中国传统大节日,也是餐饮食品行业年度要害战斗之一,无疑也肩负着该行业下半年“回血”的重任。  中秋佳节,赏一轮明月,品一口香茗,一枚小小的月饼同样寄托着人们对阖家团圆的美妙向往。回顾生产、销售月饼的形式几经更迭,从酒店手工制作,到OEM、ODM代加工,再到多家酒店团体自主建设食品加工厂。为备战销售淡季的前50天,许多月饼制作工厂还专门招聘了比平时多三倍的工人,但产品销量依然供不应求。 那么,这些月饼是如何从生产车间到销售千家万户?在数据的驱动下实现翻倍增长? 一枚月饼|摸索餐饮食品业的数字化翻新虽说民以食为天,但餐饮食品业向来都是竞争红海。 在这个“内卷”极为重大的行业里,每家餐饮食品企业都能感触到来自同业的微小压力。像老字号餐饮食品企业都是依附口碑相传,但当已经的金字招牌辉煌淡去,如何能力更好地缓解餐饮食品业务的不稳定性,从餐饮食品业的竞争红海中找到破局之道?这成了每个餐饮食品企业必须思考的课题。 作为像茅台一样的“社交货币”,目前月饼已占据了不少餐饮食品企业营收的近半壁江山,月饼业务也将是企业所选取的第二曲线赛道。 一枚月饼的“诞生”,须要经验产品研发、原材料甄选、生产管控、包装设计、产品销售等简单的流程。从原材料到加工厂,从加工厂到家庭餐桌,月饼从生产到销售等因素都能够被数据化,每一个环节都将依附数据实现精细化的经营治理。 现在,月饼生产、销售拼的是大数据、大生产、大治理,利用大数据对月饼产、销、管进行迷信调度是市场竞争的法宝之一。通过与思迈特软件单干搭建的一站式数据分析平台,以数字化撑持全业务链条协同贯通。业务人员每天都会对这些进行数据监控,一旦某些品类、种类的月饼在市场供需呈现缓和,企业马上就能够监测到并进行大批量生产投放市场。  企业能够将线下门店销售、线上商城、电商后盾等的批发数据整合在Smartbi数据分析平台中,提前剖析不同地区门店今年的销售数据,计算和预测往年的客户需要,绘制客户画像,制订生产打算。通过选材与洽购,企业也会去监控原料配比、产品质量、包装规格等,再批量生产月饼。 数据贯通餐饮食品企业经营、生产、销售等全生命周期,Smartbi给客户提供一站式的大数据分析平台,笼罩数据接入、计算加工、存储、剖析利用、预测和决策全流程,打造多场景的数字化生态体系,在餐饮食品行业的红海中实现行业解围。 数据驱动业务Smartbi赋能餐饮生产、销售、治理一体化 只管餐饮食品行业进行第二曲线的赛道抉择时找到了月饼赛道,但并不意味着就此美中不足。在对餐饮食品节奏和效率提出更高要求的明天,数据的滞后性将会是致命的。 目前,尽管很多餐饮食品企业早已具备数字化转型的意识,并积攒了全流程中大量有价值的数据正等待开发。但仍存在配置了产品销售、团体治理等多套业务零碎,数据分析伎俩仍旧是传统的人工剖析等诸多痛点,导致餐饮食品企业管理工具碎片化,无奈造成连锁经营闭环体系、更无奈造成继续优化的体系。 思迈特软件帮忙连锁餐企借力一站式大数据分析平台,可能全面采集并整合线下门店与线上渠道的多样化数据信息,生成包含销售、经营、治理等板块在内的全景数据分析报表,让数据“活起来”,为经营服务造成残缺闭环,真正地施展数据的价值,实现业绩的持续增长。 01针对产品经营层面餐饮食品经营剖析在Smartbi数据大屏的加持下,所有季节性产品销售业务数据都事无巨细地失去了清晰出现。餐饮食品企业能够剖析各渠道不同品种月饼的销售状况及不同年份的变化趋势,以此依据节假日倒计时及时调整生产打算,便可准确直击消费者需要、进而实现产品服务及经营策略的更优调整。  各渠道产品统计分析通过剖析销售、生产、库存及同期比照等要害数指标,把握并监控月饼整体的销售状态,为市场营销以及生产、库存等工作提供参考。   除此之外,企业能够统计月饼票券的流转状况,以此调整饼券的发放状况,并凭售出的月饼券数量提前制订生产打算,缩小库存,升高经营风险。  在经营数字化的根底上,月饼票销售回收的数据主动采集和剖析提供撑持,上游消费者的偏好变动也能够在数字化的根底上传导至上游原材料进行“反向”定制,实现采集、剖析、决策的闭环链路。 02针对连锁门店销售层面Smartbi将连锁经营治理通过数据驱动实现线下连锁门店治理标准化的执行落地,管理者能够实时剖析门店不同品种月饼的销售占比、业绩增长以及营运效率,对于异样数据,通过联动、下钻等性能进行层层追踪,能够进步决策效率。   企业能够剖析本月不同类别月饼销售及指标实现状况,通过门店数据分析的比照能够晓得同比销售趋势,理论销售与打算的差距,剖析后果还能够通过日报、周报、月报的模式进行出现,为企业的门店治理提供更精准的方向。  03针对企业治理层面团体营业经营剖析对于企业外部来说,数字化治理能够买通前后端数据,精准量化经营过程中的销售、盈利、损耗等指标,优化治理流程,辅助企业疾速决策。通过各支出类型、各产品销售状况及公司销售状况进行剖析,以把握团体的经营状况,便于及时调整各公司/产品的经营策略。  整体费用剖析通过费用类型、费用相干方等数据,剖析公司整体费用状况及同比增长状况, 及时发现异常费用,反映费用收入整体状况,管理者可能直观理解销售费用变动趋势,对特定业务类型和报销类型进行管控。   数字化对于餐饮食品连锁企业而言,不是优化和改良,而是一场反动。从餐饮到月饼,不少餐饮企业在走出了一条循序渐进的产业链拓展之路的同时,一直拓宽业务边界,让企业得以从群鲨环伺的餐饮食品红海中脱身,贯通企业营销、生产、销售、经营等全生命周期,打造一个数字化生态体系。

September 18, 2022 · 1 min · jiezi

关于数据分析:现代数据栈如何降低数据平台的复杂度

DataFun 主办的 DataFunSummit 2022:古代数据栈技术峰会将于9月17日9:00-16:10线上举办。届时,来自 Byzer 社区 PMC / Kyligence 技术合伙人祝海林将于 10:30-11:15 的自助剖析与决策论坛分享“Byzer:一门面向 Data+AI 的云原生语言”;Kyligence 资深技术布道师宗正将于 11:15-12:00 的数据建模与数据流调度论坛分享“Kyligence Zen 智能指标中台和指标自动化”。本次峰会将全程直播,欢送大家扫码入群收看。 ✦✦ 欢送大家扫码参会 更多精彩议程如下 对于 Kyligence上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 开创团队于 2016 年开办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 加强的高性能剖析引擎、对立 SQL 服务接口、业务语义层等性能,Kyligence 提供老本最优的多维数据分析能力,撑持企业商务智能(BI)剖析、灵便查问和互联网级数据服务等多类利用场景,助力企业构建更牢靠的指标体系,开释业务自助剖析后劲。 Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制作、批发等行业客户,包含建设银行、浦发银行、招商银行、安全银行、宁波银行、太平洋保险、中国银联、上汽、Costa、UBS、MetLife 等寰球知名企业,并和微软、亚马逊、华为、Tableau 等技术领导者达成寰球合作伙伴关系。目前公司曾经在上海、北京、深圳、厦门、武汉及美国的硅谷、纽约、西雅图等开设分公司或办事机构。

September 16, 2022 · 1 min · jiezi

关于数据分析:聚焦指标及管理Kyligence-发布指标中台-SaaS-产品-Zen

9 月 15 日,Kyligence 2022 秋季线上论坛胜利召开。本次论坛以“极简云上剖析,开释数据价值”为主题,向业界重点介绍了一站式云端指标中台 Kyligence Zen。该 SaaS 产品基于 Kyligence 外围 OLAP 能力打造,为企业提供整合的、轻量级的、开箱即用的指标中台服务,助力业务用户聚焦指标,实现疾速的数据洞察和口头决策。同时,云原生智能多维数据库 Kyligence Cloud 推出新个性,助力企业简化数据湖上的多维数据分析。 从 OLAP 到指标中台,帮忙业务用户关注指标的治理和利用Kyligence 联结创始人兼 CEO 韩卿示意,SaaS 时代带来了更激烈的数据割裂,企业数据的管理模式曾经从集中式演变成分布式,传统的数据仓库、 数据湖模式已不再适应 SaaS 时代。企业须要更加轻量、麻利、智能的 SaaS 产品,帮忙业务用户关注指标的治理和利用,撑持业务进行决策和口头。 指标是企业最外围、最重要的数据资产。数据分析的实质就是找到正确的指标并从中发现洞察,及时做出决策。但在理论场景中,企业要想从原始数据走到业务洞察,须要通过简单且业余的加工链路。指标中台为业务用户设计,无需思考底层技术细节,分析师可聚焦在有价值的指标上,人人都可实现自动化、个性化的指标生产,真正开释分析师和工程师的生产力。 Kyligence Zen 一站式云端指标中台,是基于 Kyligence 外围 OLAP 能力打造的 SaaS 产品。多年来,Kyligence 服务了金融、批发、互联网等行业的当先企业,积攒了丰盛的指标中台建设和实践经验,Kyligence Zen 将为更宽泛的用户提供开箱即用的指标中台能力。演讲中,韩卿通过 Live Demo 演示了 Kyligence Zen 如何帮忙企业疾速建设指标体系,以晋升企业云老本管控的效率。 Kyligence Zen:一站式云端指标中台(SaaS)Kyligence 合伙人兼副总裁李栋介绍,Kyligence Zen 是处于数据层和应用层之间的指标中台,能够对立治理所有业务指标,主动实现数据加工、指标计算等过程,企业能够在不同利用中实现指标的复用,造成以指标为外围的共同语言,进步协同治理的效率。 Kyligence Zen 产品架构图 指标治理是 Kyligence Zen 的外围性能之一,用户可创立 Goals(指标),并通过多层级的指标构造来治理指标,造成指标体系,实现治理的可观测性,实现从数据到管理决策的闭环。 以智能多维数据库技术为底层撑持,Kyligence Zen 反对 Smart Cache 主动实现指标计算与加工;主动举荐高价值指标,减速业务洞察;主动清理低价值指标数据,开释存储资源。 Kyligence Zen 提供标准化的 RestAPI,反对灵便对接多种数据利用。开发者可通过 Metrics API 对接其余利用,如在飞书或 Slack 中进行指标预警的音讯推送;对于简略场景,用户也可间接应用内置仪表盘,实现一站式闭环。 ...

September 15, 2022 · 1 min · jiezi

关于数据分析:如何设计企业级数据埋点采集方案

1.前言埋点设计文档面向开发的埋点需要说明书,目标是让开发了解须要在什么状况下做哪些埋点采集,以及具体须要的属性参数类型、取值,确保采集的准确性和欠缺性。为实现整体指标体系,数据产品落地、应用,须要对开发进行埋点方案设计,利于日后对立治理,批改,保护。保障口径对立,可追溯,易了解。 埋点设计作为数据建设的重要组成的局部,间接影响到后续的数据利用品质和数据回溯,而咱们在日常中是不是常常会碰到如下问题: 作为一个入职一家新公司的数据产品(分析师),面对环境中的几百个事件,或者 afsdfgfhtr 无任何标注的属性名,茫然手足无措,不知所以然,而后任留下的文档也是似有若无,询问身边的老员工则众口不一,之前埋点的研发也到职了,罗唆我就从新埋点吧…… 作为一个经营人员,流动策动写好了,流动页面做好了,哈哈,到了大展身手的时候啦,想详细分析不同人群的数据反馈。忽然发现很多属性信息没有,不足以细分,好的,什么也不必干了…… 作为一个产品人员,新版本上线后,想详细分析新版本上线后的数据变动。心田 os:还好之前提了埋点的需要,不像下面那个经营没有数据能够查。几分钟后……等等,为什么这个数据和后盾业务数据很不一样…… 作为公司的业务人员,据说公司新上了一个数据产品零碎,而我前一阵子才学习了一些数据分析基础知识,心田:我也要不断进步。关上零碎……几分钟后,分析模型懂,事件涵义懂,属性涵义懂,就是不晓得这里传值的 afsdfgfhtr,123,456……都是什么意思呀…… …… 通过下面的情景再现,所以大家意识到了吧,负责埋点设计的咱们,不仅仅是一个工具人,如果底层建设不好,就会造成大量的资源节约和工夫老本,以及自身数据可用价值性大大降低。作为一个埋点设计的人员要给咱们本人,还有给外部,尤其给管理人员,正确建立起看待埋点建设的态度,这是一个零碎的工程,只有埋点要做到定义分明可回溯、业务变动可迭代、重要需要可笼罩等,才能够防止前期返工、缩小不必要的工夫老本节约,提高效率,进步数据准确度,进步数据使用率。 那么问题来了,如何做好埋点设计的兼顾,做好这个工程项目的治理呢?可分为以下三个局部: 埋点我的项目布局埋点设计方案埋点数据推广应用2. 埋点我的项目布局一个公司内不仅仅有火山引擎的增长剖析的数据产品,还会有业务数据库、机器学习平台、bi 零碎等各种数据系统,而增长剖析的数据产品须要承接什么样的需要,怎么买通各个数据产品之间的连贯,是一开始最须要思考的问题。 因而初期咱们可设定: 增长剖析数据产品:次要承接行为数据和局部和行为相干的业务数据(例如领取、注册、实名认证等)的需要。 确立惟一用户的标识 id,保障各数据系统传输 id-mapping 老本不高。 2.1 建设标准化流程埋点建设的阶段咱们分为两个重要的阶段。 初建设,0-1。初期从 0 开始建设埋点体系。 长期迭代,1-N。曾经有一些埋点体系,从原来的根底上进行迭代建设。 倡议流程如下: 初期建设,0-1 长期迭代,1-N2.2 确认各角色责任人以上不论是初期建设或者长期迭代,总共角色分为以下几种。 注意事项: 埋点需要源于业务需要,为避免浪费数据资源,不能为了埋点而埋点,切莫一味谋求多而全。对于角色安顿同一人可同时负责需要评审方与埋点设计方案方,其余角色不倡议有人员重合。需求方通常为产品、经营、数据分析等应用数据业务方,埋点设计与需要评审方通常为数据分析师、数据产品等数据中台建设者。 在埋点验收之前减少业务验收环节,是思考局部测试人员不能精确了解业务需要,或者有脱漏,为保障埋点合乎业务人员预期,如果在此环节,需求方或者埋点设计方发现不对,可在上线前及时调整。 2.3 治理小技巧流程化治理如果有需要管理系统最好,例如。如果没有为了保障可追溯以及各部门人员了解统一,要制订严格的文档标准,对于需要提出的日期、背景形容、提出人、评审意见、评审人、埋点设计方案、埋点设计人、开发人员、测试人员等都要进行具体记录。 定期进行清理,例如对近半年没有数据接入的事件或者近半年没有被查问的事件,经业务确认后,可进行暗藏或者停用治理。 3.首次埋点设计步骤埋点设计可参考上述步骤进行设计,步骤具体注意事项如下: 3.1 明确用户标识3.1.1 用户标识底层逻辑火山引擎增长剖析应用 device_id、user_unique_id、ssid 三种 id 标识设施和用户。 3.2 明确是否开启全埋点+预置事件计划3.2.1 预置事件采集预置事件接入根底SDK可默认主动采集,依照具体需要,抉择接入对应端的SDK。 3.2.2 全埋点采集事件全埋点事件接入根底SDK可抉择开启或者不开启,须要留神的是,全埋点长处是采集便当,节约投入老本,毛病是耗费事件量大,且只满足个别的根底PV,UV采集指标需要,利用范畴窄,请审慎开启。如不明确是否开启,可征询相干服务反对人员。 bav2b_page 全埋点页面拜访,仅开启全埋点后上报 bav2b_click 全埋点元素点击,仅开启全埋点后上报 开启、不开启形式详见各个端SDK接入文档、下图为IOS SDK开启形式示例。 3.3 设计自定义埋点计划如果想要深入分析业务,造成数据驱动,肯定是须要在预置事件的根底上,补充更多的自定义代码埋点。自定义埋点的灵活性、自主性、应用性更高。设计埋点人员应依据业务外围诉求,造成事件设计文档,交付给研发团队进行数据接入。 自定义埋点计划示例: 事件表-自定埋点设计因素: (1)序号每个事件一个固定编号,编号惟一且不可批改,不便文档查阅、回溯,进行治理。 (2)事件名称每个形象的行为事件,一个中文名、一个英文名,中英文必须是一一对应关系,不能够反复,代表涵义统一。 对于事件英文的命名,防止混淆不堪,需采纳对立标准进行命名。倡议规定有-- 可采纳下划线辨别-regist_submit, 或者驼峰命名辨别registSubmit(由一个或多个单词连结在一起,第一个单词以小写字母开始,从第二个单词开始当前的每个单词的首字母都采纳大写字母)。采纳动词_名词或者名词_动词进行对立。如果有多条业务线,可在事件前加业务线名称的标识,例如 a_regist_submit.大小写敏感,如果传了 Name,就不倡议传 name。自定义事件英文名不得以 $ 结尾。 ...

September 15, 2022 · 1 min · jiezi

关于数据分析:行业案例|长安汽车质量管理数据分析实践

引入 Kyligence Enterprise 解决了以后长安大数据平台的有余,在大规模数据场景下,满足高并发亚秒级多维查问的性能要求,防止以后 Vertica 和 Impala 多维查问性能有余的问题;其次,基于免编程拖拽式模型开发,升高数据开发门槛,晋升数据开发效率,使得数据开发麻利化;第三,实现了平台对立、数据对立、数据服务对立,使得大数据平台能力图谱中的重要一环得以欠缺。——长安汽车 大数据技术副总工程师 王颖异1. 我的项目背景品质治理是生产制作企业的“命根子”,是企业生产和治理的基石、经济效益的源泉。以后中国经济正在由高速增长阶段转向高质量倒退阶段,作为中国汽车制作龙头企业,长安汽车公布并实施了《六西格玛治理2025推动布局》,同时论述了智能制作背景下品质技术倒退瞻望,智能化品质治理要害挑战是数据买通,基于大数据的简单多阶段过程要害品质个性辨认,以及高维、高频品质个性过程品质管制。 2. 行业现状和痛点长安汽车品质治理经验了多个倒退阶段,从质量检验阶段到品质管制阶段,再到全面品质治理阶段,现在在经济转向高质量倒退、智能制作全面转型背景下,长安汽车全面实施六西格玛品质治理。 六西格玛治理办法是一种继续的流程设计和优化技术,以靠近 6 零瑕疵(0.00034%出错率,瑕疵指任何客户不称心的事件)的全面品质治理为企业长期谋求,带动品质大幅提高、老本大幅度降低,最终实现财务功效的晋升与企业竞争力的冲破。 六西格玛是一种高度重视数据,根据数字、数据进行决策的治理办法,强调“用数据谈话” “根据数据进行决策” “改良一个过程所须要的所有信息,都蕴含在数据中”。绝对于其余方法论,其重点强调: 专门统计工具:提供品质尺度(指标)、有清晰缺点定义(维度),用精确、可确定的数据进行决策;迷信改良办法:蕴含 DMAIC 和 DMADV 两种,长期一直循环执行;非凡组织架构:相似传统武术分级,蕴含“黑带”、“绿带”等,领导和贯彻全员参加施行。这三个方面给企业在应用数据方面提出了较高挑战,包含: 数据规模往往微小:用全面、精确、可确定的数据进行决策,蕴含所有用户和所有产品的全量数据,而非采样数据;以及笼罩企业所有简单多阶段过程和多种业务角度;高可用稳固的数据服务:以 6 零瑕疵为企业长期谋求,改良办法周期性(天、周、月)不间断循环执行,过程长达数年之久,这要求数据服务长期处于稳固可用状态;高并发数据分析查问:品质是企业全体人员的责任,对产品设计、生产制作、应用售后全过程无效,六西格玛通过非凡组织增强全员贯彻实施,大型企业每天日常参加人员可达数万之多,这要求 QPS 高达数百甚至数千的高并发查问能力。长安汽车 Impala/Vertica 旧计划,日间业务顶峰常见查问大于数分钟,有过半数工夫超时失败,影响了六西格玛工作推动。长安汽车通过 DDM 数据接口服务项目多方比照后,引入 Kyligence 产品作为数仓对立数据服务后盾撑持,也对 DDM 架构进行了一次降级。 3. Kyligence 利用场景 + 解决方案长安汽车依据业务建模和数据建模制订了长安品质评估剖析体系,Kyligence 为其提供对立数据模型服务,满足大规模实施六西格玛管理所要面临的数据规模微小、长时间高可用稳固服务、高并发低延时剖析查问等要求。 长安汽车、福特汽车、美国出名行业资讯公司等通过多年汽车制作业务建模和数据建模实际,联结制订了长安品质评估剖析体系,涵盖了: 广义品质领域:千车培修频次 R/1000、单车培修费用 CPU 等指标狭义品质领域:顾客满意度 CS、客户埋怨问题数 TGW/1000 等指标整体品质领域:百车问题数 PP100 指标 3.1 培修数据模型服务 采集三包问题数据,经维修站培修后产生培修记录,维修站将记录计入长安汽车经销商管理系统 CA-DMS,经销售公司审核通过后, 数据进入长安汽车品质晋升零碎 CA-CQIS,再通过 Hive 将数据刷新至 Kyligence 培修数据模型,提供广义品质领域的千车培修频次 R/1000、单车培修费用 CPU 等指标。 3.2 网络调研数据模型服务 ...

September 5, 2022 · 1 min · jiezi

关于数据分析:Smartbi携手元曜软件迎发展时代变局筑数字金融底座能力

迈入数字化新倒退阶段,思迈特软件携手广州元曜软件有限公司 “共成长・同倒退”,一起为客户提供优异产品和服务,一直贴近客户业务,关上更大的机会空间,从而可能晋升整个数字生态的竞争力。公司简介:广州元曜软件有限公司(以下简称 “元曜软件”)成立于 2011 年,专一为大型企业及机构提供商业智能利用、大数据平台和数据治理服务,以及相干畛域的解决方案、系统集成、我的项目施行和咨询服务。公司总部位于广州,并在北京、深圳、上海、长沙、西安及香港设立分支机构,可能无效撑持全国范畴的我的项目开发和施行服务。其客户群体遍布金融、运营商、能源、地产等行业,已胜利服务深交所、民生银行、迈瑞、招商团体(包含银行、基金等)、中广核、中国人寿等客户,并博得统一认可和赞美。 本期嘉宾: 一、趁势而为,迎难而上随着市场对数字化的接受度越来越高,从资本看好到技术凋敝,所有仿佛都在朝着更好的方向前行。企业数字化改革对于晋升客户体验、经营效率、流程治理等方面的成果非常显著,特地是在金融行业,数字化转型倒退不是新命题,而是被赋予了新的时代外延。 近年来,金融机构在经营策略上更为关注客户的经营服务、严控业务经营老本、减速数据治理、晋升技术能力、强化危险防控。因而对于软件服务商来说,企业减速数字化转型降级既是时机也是挑战。对此,元曜软件深有感触。 “随着金融行业对数字化转型的器重,金融客户对 IT 的投入一直加大,每年有将近 20% 的增幅,同时也逐步加大对复合型数字化人才的造就力度。作为数字化服务提供商,咱们同样迎来倒退的新机会。为此,咱们如何洞察客户需要,找准技术与业务联合的落脚点,帮忙客户转化数据价值,是现阶段值得思考的问题。” 田总谈到,“近年来很多银行踊跃地设立金融科技子公司,他们能用成熟的机制承载银行数字化的倒退模式。此外,局部互联网金融公司脱胎于外部简单业务的互联网大厂,他们则具备更为显著的资金供应、生态搭建、人才培养等方面的劣势。如何在强烈的市场竞争中走出翻新之路,这对于咱们来说确实是一个挑战。” 面对诸多的时机与挑战,思迈特软件与元曜软件的强强联手,恰好能在当下为金融行业开辟一片新天地。 二、始于技术,忠于服务在企业数字化转型的新阶段,想在大数据服务市场上杀出重围并不简略。随着行业数字化转型的减速降级,越来越多的我的项目需要开始出现复杂化、多样化需要。对于元曜软件而言,十余年来施展本身在大数据畛域积攒的数据能力及经营教训,逐步造成了自主研发、先进成熟的产品体系,领有丰盛的现场施行和开发教训。元曜软件深知本身劣势所在,也更明确与优良的合作伙伴携手,能力走得更远、更快。 思迈特软件作为行业当先的国产 BI 软件,不仅在产品技术上具备突出的劣势,而且依据现有业务的倒退方向和不同行业客户的需要,已建设起本身的生态圈,为客户提供有竞争力、平安可信赖的产品、解决方案与服务。通过思迈特软件产品技术以及其生态圈的能力叠加元曜软件在行业上的劣势、落地教训,单方优势互补,这也正是促成元曜软件与思迈特软件开展单干的起因。 在谈及与思迈特软件的单干与其余企业有何不同时,田总从企业文化、产品翻新和技术服务三个维度进行了分析。其一,基于地缘劣势,单方的文化理念不约而同,而且 Smartbi 对合作伙伴的充沛反对与坦诚交换,单方的单干十分融洽,“同频共振度” 极高;其二,思迈特软件产品具备高成长性和创新性,产品更新迭代快,满足客户多样化需要,将来发力将势不可挡;其三,思迈特软件具备优异的产品研发和技术服务反对能力,从产品销售、技术支持到售后服务等各个方面,整个团队响应速度快、效率高。田总在访谈中也提到,“比照其余厂商,高效是咱们对于 Smartbi 的一个主观的评估。” 思迈特软件文化和技术上的劣势,能够说是元曜软件抉择合作伙伴的起因。之后,元曜软件可能动摇地成为 Smartbi 长期合作伙伴,则是忠于其为代理商提供的优质服务体验。 三、深度交融,聚势谋远如果要用常说的 “天时地利人和” 概括元曜软件和思迈特软件的单干倒退,乘上数字化转型时代浪潮,便是 “地利”,单方公司总部均在广州,是源自地缘劣势的 “天时”。“人和” 则是单方单干开释出弱小的生态协同势能。 “在产品层面,思迈特软件与咱们的互补性十分强;在计划层面,咱们也更心愿能够和思迈特软件造成更深度的单干,将两个产品的整合变得更加的顺畅和高效,在单方自有的产品计划上合力打造出面向客户多样化需要的一体化解决方案;在客户层面,咱们心愿基于单方笼罩的不同客户群体,实现资源共享,造成互惠共利的生态单干场面”,田总谈到,目前思迈特软件与元曜软件在产品技术、解决方案、营销获客等维度多重联创,单方在各行业畛域的单干功效也十分显著。 特地在金融畛域,元曜软件携手思迈特软件,基于数据中台理念,独特打造残缺的数据资产和数据中台解决方案,在金融零碎根底上实现多源数据的整合,全面施展数据资产的利用价值,助力金融行业数字化转型。 就单方单干而言,无论是从打造高质量技术产品,还是提供多样且灵便的解决方案,其外围都是为客户提供了更优质的数字化服务。而成熟的解决方案与国内行业当先的产品技术,成为了元曜软件与思迈特软件单干的犀利武器,将来单方在各行业畛域继续发力,在强烈的市场竞争中突围而出,迅速关上企业数字化转型的新场面,挖掘更多的可能。 行业数字化转型虽波澜壮阔,但转型之路并不平坦,面向未来,元曜软件与思迈特软件的携手共创,将结出一颗又一颗的硕果,帮忙更多企业减速数字化转型的价值落地,共建更凋敝的单干生态。

September 3, 2022 · 1 min · jiezi

关于数据分析:开课吧数据分析高薪培养计划精英班30期

download:开课吧数据分析高薪造就打算精英班30期部署ELK+Kafka+Filebeat日志收集剖析零碎1.环境规划日志零碎架构nginx--->filebeat--->kafka--->logstash--->elasticsearch--->kibana 2.部署elasticsearch集群2.1.配置es-1节点 1.下载elasticsearch7.6[root@elk-1 ~]# wget https://mirrors.huaweicloud.com/elasticsearch/7.6.0/elasticsearch-7.6.0-x86_64.rpm[root@elk-1 ~/soft]# rpm -ivh elasticsearch-7.6.0-x86_64.rpm 2.编辑配置文件,配置集群模式[root@elk-1 ~]# vim /etc/elasticsearch/elasticsearch.ymlcluster.name: elk-applicationnode.name: elk-1path.data: /data/elasticsearchpath.logs: /var/log/elasticsearchbootstrap.memory_lock: truenetwork.host: 192.168.81.210,127.0.0.1http.port: 9200cluster.initial_master_nodes: ["elk-1"]discovery.zen.ping.unicast.hosts: ["192.168.81.210","192.168.81.220","192.168.81.230"]discovery.zen.fd.ping_timeout: 120sdiscovery.zen.fd.ping_retries: 6discovery.zen.fd.ping_interval: 30shttp.cors.enabled: truehttp.cors.allow-origin: "*"3.创立数据目录[root@elk-1 ~]# mkdir /data/elasticsearch/ -p[root@elk-1 ~]# chown -R elasticsearch.elasticsearch /data/elasticsearch/4.配置内存锁定[root@elk-1 ~]# mkdir /etc/systemd/system/elasticsearch.service.d/[root@elk-1 ~]# vim /etc/systemd/system/elasticsearch.service.d/override.conf[Service]LimitMEMLOCK=infinity5.启动elasticsearch[root@elk-1 ~]# systemctl daemon-reload [root@elk-1 ~]# systemctl start elasticsearch[root@elk-1 ~]# systemctl enable elasticsearch复制代码2.2.配置es-2节点只是配置文件中node.name和network.host不同,其余操作形式统一 [root@elk-2 ~]# vim /etc/elasticsearch/elasticsearch.ymlcluster.name: elk-applicationnode.name: elk-2path.data: /data/elasticsearchpath.logs: /var/log/elasticsearchbootstrap.memory_lock: truenetwork.host: 192.168.81.220,127.0.0.1http.port: 9200cluster.initial_master_nodes: ["elk-1"]discovery.zen.ping.unicast.hosts: ["192.168.81.210","192.168.81.220","192.168.81.230"]discovery.zen.fd.ping_timeout: 120sdiscovery.zen.fd.ping_retries: 6discovery.zen.fd.ping_interval: 30shttp.cors.enabled: truehttp.cors.allow-origin: "*"复制代码2.3.配置es-3节点只是配置文件中node.name和network.host不同,其余操作形式统一 ...

September 1, 2022 · 3 min · jiezi

关于数据分析:汽车制造企业如何最大化数据资产价值

近几年,人工智能、大数据、云计算等新兴技术深刻影响着汽车和出行畛域。随着汽车行业的数字化转型正式进入快车道,车企收集的车辆数据也呈爆炸式的增长,如何利用数据获取洞察,一直晋升经营能力和服务水平,同时又能无效降低成本、提高质量和生产效率,未然成为各大车企数字化降级的方向。 目前国内不少汽车企业依靠于 Hadoop 生态,如 HDFS、MapReduce、Hive、Spark、HBase 等,搭建自有的 DMP 数据管理平台,实现数据源的收集与治理,通过数据加工与剖析,再对接 BI 利用实现自助式查问与剖析,进而撑持企业各类数字化场景利用,如渠道网络管理、售后等,最终助力企业在智能制作和车联网畛域整体策略的落地。随着汽车行业数字化转型的减速和数据规模的扩充,需剖析的数据量也成 TB 甚至 PB 级增长,随之而来的以下问题亟需解决: 数据资产的复用差:在进行数据模型资产开发时,大多数模型资产通过脚本或代码实现,难以积淀可视化、易复用的数据模型资产;业务响应周期长:传统开发模式下,技术门槛要求较高,且以固定化需要开发为主,单个主题的开发周期根本须要一周甚至更久方可交付业务方应用,从理论角度讲,应答需要的敏捷性不高;数据时效性较差:当即席剖析的细分主题宽表数据量较大(千万行级以上)时,个别做法是 DMP 平台不直连 BI 工具,采纳 BI 工具的数据提取形式对绝对固定组合进行预减速进而撑持剖析利用。但从中台提取数据(如 Tableau Hyper/TDE)再加载至 BI server,可能须要几十分钟甚至更久,非分布式架构的资源抢占状况也时有发生,无奈稳固保障出数效率;数据查问响应慢:随着数据量减少,当要剖析的数据量达到千万级甚至更大时(如:车辆 VIN 码级别剖析),因底层数据根底平台架构大多采纳 MPP,前端 BI 难以应答业务用户高并发拜访模式下即席查问的响应需要;数据安全性低:因为车联网应用服务的实现须要收集各类信息,包含可能的敏感信息(如门路布局、行驶轨迹等)。传统解决方案只反对到我的项目/表级别的权限管制,而对行/列级(单元格级)权限难以较好地布防管控力度。如何实现更准确的数据安全策略,也逐渐成为各大车企关注的重点之一。因而,只管车企外部有丰盛的数据资源,但这些数据是否麻利积淀成数据资产,以及对车企上游业务利用及翻新赋能,成为了各汽车厂商寻求数字化降级或转型之路的重要组成部分。 目前,在泛滥车企的大数据利用体系中,Kyligence 已成为重要的数据分析引擎底座,正与各车企独特解决大数据在利用、治理和平安等难题。在提供海量数据分析的高性能、高并发要害能力的同时,Kyligence 还能满足对立数据服务、积淀多维模型资产、精密安全策略等平台级要求。另外,从应用层角度讲,Kyligence 与 Tableau 等支流 BI 平台无缝集成,可在 BI 工具轻松直连 Kyligence 进行灵便业务剖析及摸索(非数据提取形式),大大晋升了数据分析的敏捷性。 Kyligence 智能多维数据库赋能数字化利用(以 Tableau 为例) Kyligence 智能多维数据库赋能各大车企进行数据资产价值开掘: 加强数据资产的可复用性:Kyligence 产品帮忙企业实现低门槛、可视化积淀数据模型资产,反对定义标准化的指标口径定义,可为业务提供对立受治理、可复用的数据利用集市;缩短数据交付周期:Kyligence 可视化的模型开发方式,大大降低数据建模人员模型设计门槛,同时减速模型的开发速度,单主题开发交付周期将能从周缩短到天,较大水平晋升数据需要交付的敏捷性;高性能灵便剖析能力:Kyligence 反对无缝集成 Tableau 等支流 BI 工具。在 Kyligence 积淀数据模型后,开发人员可通过 Tableau 等 BI 工具直连形式即席剖析海量数据,查问响应时效力从分钟级晋升至亚秒级,大大加强业务洞察对市场变动的敏锐度,对及时调整市场经营策略等有较大促成成果;单元格级别权限管控:Kyligence 反对行/列级数据权限管制,能够极大限度地适配各企业不同粒度的数据安全管控要求。Kyligence 致力于打造下一代企业级智能多维数据库,无效帮忙企业简化多维数据分析、缩短数据资产的开发流程,开释业务自助剖析后劲。目前 Kyligence 曾经和国内的多家车企建设了大数据平台的生态单干关系,为多家企业提供了老本最优的多维数据分析能力,帮忙车企更好地撑持 BI 剖析、灵便查问和车联网级数据服务等多类利用场景。 ...

August 30, 2022 · 1 min · jiezi

关于数据分析:Kyligence-亮相-Gartner-2022-数据与分析峰会解锁数据智能新潜力

8 月 22 日— 8 月 24 日,Gartner 2022 数据与剖析峰会 (Gartner Data & Analytics Summit) 在美国奥兰多顺利召开。作为寰球当先的数据分析与治理厂商,Kyligence 缺席本次峰会并发表《从数据集市到对立指标中台:世界出名银行实际》的主题演讲,从实在案例和场景登程,展示了 Kyligence 在指标治理与服务方面的技术创新能力和实践经验。 Gartner 数据与剖析峰会聚焦寰球数据与剖析畛域的前沿趋势,会集泛滥 CDO(首席数据官)、CAO(首席剖析官)、数据分析师以及业务领导者等,针对建设数据分析与管理策略、扭转组织工具、造就企业数据文化与素养等议题展开讨论,获取相干重要征询倡议。此前,Kyligence 已间断屡次入选 Gartner《中国 ICT 技术成熟度曲线报告》《数据管理技术成熟度曲线报告》《服务自助式剖析的语义层钻研报告》等。 面对爆炸式增长的数据,如何构建对立的数据分析和治理平台,将数据积淀为有价值的资产,成为企业数字化转型中的要害。Kyligence 在现场分享中提到,企业在数据分析和治理畛域正面临着业务挑战、信赖缺失、剖析效率低、开发投入大等痛点,借助机器学习和人工智能等技术,Kyligence 打造了更简略、高效、低成本的企业级智能多维数据库产品,助力企业解决上述挑战,发明更多业务价值。 此前,Gartner 公布了 2022 年数据和剖析趋势,提出激发企业生机和多样性、加强人员能力和决策,以及信赖的制度化三大主题。据 Gartner 预测,数据分析驱动的决策,将逐步转为决策驱动的数据分析,而数据分析则依赖于可信的数据。指标间接反映了企业经营情况,指标中台以一个平台对立治理所有业务指标,为企业决策提供可信的数据撑持。 Kyligence 现已服务金融、批发、互联网等多个行业的当先企业落地指标中台。以金融行业为例,Kyligence 助力安全银行实现了全生命周期的指标自动化构建和治理,显著晋升了数据开发效率,对数据进行了无效治理,帮忙业务更简略、便捷地进行数据分析和业务洞察,并对行内其余依赖数据的零碎提供中台撑持。 Kyligence Zen 产品架构图 基于在指标中台、OLAP 等方面丰盛的技术积攒和实践经验, Kyligence 往年推出了智能指标驱动的治理和决策平台 Kyligence Zen。该产品基于 Kyligence 外围 OLAP 能力打造,利用 AI 加强引擎和预计算技术劣势,提供指标目录、指标自动化、API 集成等性能,助力企业构建指标体系,实现指标驱动的治理与决策,以数据驱动业务倒退和效率晋升。 参会观众在 Kyligence 展台驻留,与工作人员具体交谈 数据分析与治理关系着业务策略的制订与倒退方向,是企业数字化转型的重中之重。Kyligence 将保持打造下一代企业级智能多维数据库,助力寰球企业构建更牢靠的指标体系,开释业务自助剖析后劲,升高用户应用数据的门槛,为数字化转型提供继续、强劲的能源。 对于 Kyligence上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 开创团队于 2016 年开办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 加强的高性能剖析引擎、对立 SQL 服务接口、业务语义层等性能,Kyligence 提供老本最优的多维数据分析能力,撑持企业商务智能(BI)剖析、灵便查问和互联网级数据服务等多类利用场景,助力企业构建更牢靠的指标体系,开释业务自助剖析后劲。 ...

August 29, 2022 · 1 min · jiezi

关于数据分析:常见数据分析场景一留存分析

趁着不忙,整顿下工作中常常剖析的场景!而后数据分析最重要的一点是搞清楚剖析的场景和数据概念。求小程序用户留存相干指标数据需要背景:某个品牌有一款小程序,为了减少用户粘性和忠诚度,小程序会定期举办一些线上流动(H5页面嵌入在小程序中),在产品上也会印发流动二维码,用户通过扫描产品身上的二维码或则老用户分享的二维码进入小程序,用户进入小程序的形式称为不同的渠道需要:剖析 2021年,首次在不同渠道和流动登陆的人数,30天/90天的二访人数、登陆天数和次数 概念留神点:"2021年的首次登陆人数" 以及"首次在2021年登陆的人数":前者是指该用户在2021年通过某个渠道或流动进行了2021年第一次登陆的人数,后者是在前者的根底上多了一个条件,即在2021年之前没有登陆过,须要加上新用户的筛选过滤条件;"首次登陆"的概念,因为表格中列出了一些渠道和流动的枚举,需明确“首次登陆”是这些渠道和范畴内的首次登陆,还是2021年所有流动和渠道的首次登陆,若是明确范畴内的首次登陆,须要做一些渠道和流动的筛选,不然举个极其的状况:若用户在2021年的首次登陆全副来自于一个不在需要范畴内的渠道或流动,则这张表格上的数据将全副为0;工夫字段抉择:小程序的事件曾经做了埋码,需明确这里要用的是“事件产生的工夫”,有些采集程序会衍生出其它裁减的工夫字段,例如SDK发包的工夫,服务器记录事件产生的工夫,服务器记录的工夫因一些故障在极其状况下可能会和事件产生工夫相去甚远;首次登陆如何用sql实现?对用户分组,用开窗函数对事件产生工夫进行升序排列,从排序为1的那条事件记录中判断登陆的渠道和流动。 首次登陆人数实现代码select c.appid, count(0)from ( select a.openid, a.appid from ( select openid, appid, date, row_number() over( partition by openid order by time asc ) as num --依据工夫排序 from coke.jice_events_new where substring(trim(date), 1, 4) = '2021' --范畴圈选,在这些流动中的首次登陆 and appid in (1982,1923,1944,1964,1974,2009,2002,2010,1936,1959,1986,1989,1992,1958,1965,1960,1988,1980 ) ) a/*若是找首次在2021年登陆的人,在2020年没有登陆过,能够做个关联过滤left join ( select openid from coke.jice_events_new where substring(trim(date), 1, 4) = '2020' group by openid ) b on a.openid = b.openid where b.openid is null*/ where a.num = 1 group by a.openid, a.appid ) cgroup by c.appid分利用维度:回访人数及回放登陆天数实现代码select e.appid, count(0)from ( select c.appid, d.date, c.openid from ( select a.openid, a.date, a.appid from ( select openid, appid, date, row_number() over( partition by openid order by time asc ) as num from coke.jice_events_new where substring(trim(date), 1, 4) = '2021' and appid in (1982,1923,1944,1964,1974,2009,2002,2010,1936,1959,1986,1989,1992,1958,1965,1960,1988,1980 ) ) a where a.num = 1 group by a.openid, a.date, a.appid ) c join coke.jice_events_new d on c.openid = d.openid and c.appid = d.appid and trim(d.event)='applaunch' --登陆事件能够加上,缩小数据量,进步sql效率 where--日期范畴,首次登陆后30天内再次登陆 d.date > c.date and date_add(d.date, 0) <= date_add(c.date, 30) group by c.appid, d.date,--若计算登陆天数,一天登陆屡次算一次,则须要将登陆日期退出分组 c.openid ) egroup by e.appid以上的留存是利用维度的,能够间接分组计算(由appid辨别),然而若向查看一个利用不同的渠道留存状况(渠道是由 媒体、广告位以及起源场景多个参数组成的且条件简单),若对每个渠道独自用条件筛选计算,计算工作的数量会依据渠道的数量间接翻倍;原本一个数据处理工作能够搞定,却要反复建多个工作,区别只是筛选了不同渠道的条件;解决办法:可先对表记录进行渠道条件判断,并将渠道赋值给长期表的新增字段,再进行渠道关联某利用各渠道在2021年首次登陆后30天内回访人数代码实现,渠道的回访人数是指在2021年的首次登陆归属于该渠道,且在30天内再次回访该渠道select e.label, count(0)from ( select c.openid, c.label from ( select a.openid, a.date, a.label from ( select openid, case when ( trim(md) = '' or md is null ) and trim(ct) in ('1011', '1012', '1013') then 'scg' when trim(md) = 'Others_Other' and trim(pl) in ('SMS2', 'SMS', 'SMS1', 'SMS4') then 'SMS' when trim(md) = 'Others_WeChat' and trim(pl) in ( 'KOPlus_Banner_HPKV', 'KOPlus_Banner_R', 'KOPlus_Banner_M', 'KOPlus_Subscription', 'KOPlus_KV_HP', 'MealPlatformbanner' ) then 'KO+' when ( ( ( trim(md) = '' or md is null ) and trim(pl) = 'friend_share' ) or ( trim(md) = 'origin' and trim(pl) = 'friend_share' ) or ( trim(md) = 'Others_WeChat' and trim(pl) = 'ccns_share_poster' ) or trim(md) = 'WEIXIN' ) then 'sharing' when ( trim(md) in('Others_Weibo', 'WEIBO', 'Other') or ( trim(md) = 'Others_WeChat' and trim(pl) <> 'ccns_share_poster' ) or ( trim(md) = 'Others_Other' and trim(pl) like 'dccc%' ) or ( trim(md) = 'Others_Other' and trim(pl) = 'wxpyq' ) ) then 'social media' when trim(md) in('OOH', 'Store', 'Others_Store') then 'offline posters' when ( trim(md) like 'Ads%' or trim(md) = 'Others_OOH' or ( trim(md) = 'Others_Other' and trim(pl) in ('video', 'MI_OTT') ) ) then 'digital ads' when trim(md) in ('Bottle', 'Others_Bottle') then 'bottle' else 'others' end as label, appid, date, row_number() over( partition by openid order by time asc ) as num from coke.jice_events_new where substring(trim(date), 1, 4) = '2021' and appid = 1789 ) a where a.num = 1 ) c join ( select openid, case when ( trim(md) = '' or md is null ) and trim(ct) in ('1011', '1012', '1013') then 'scg' when trim(md) = 'Others_Other' and trim(pl) in ('SMS2', 'SMS', 'SMS1', 'SMS4') then 'SMS' when trim(md) = 'Others_WeChat' and trim(pl) in ( 'KOPlus_Banner_HPKV', 'KOPlus_Banner_R', 'KOPlus_Banner_M', 'KOPlus_Subscription', 'KOPlus_KV_HP', 'MealPlatformbanner' ) then 'KO+' when ( ( ( trim(md) = '' or md is null ) and trim(pl) = 'friend_share' ) or ( trim(md) = 'origin' and trim(pl) = 'friend_share' ) or ( trim(md) = 'Others_WeChat' and trim(pl) = 'ccns_share_poster' ) or trim(md) = 'WEIXIN' ) then 'sharing' when ( trim(md) in('Others_Weibo', 'WEIBO', 'Other') or ( trim(md) = 'Others_WeChat' and trim(pl) <> 'ccns_share_poster' ) or ( trim(md) = 'Others_Other' and trim(pl) like 'dccc%' ) or ( trim(md) = 'Others_Other' and trim(pl) = 'wxpyq' ) ) then 'social media' when trim(md) in('OOH', 'Store', 'Others_Store') then 'offline posters' when ( trim(md) like 'Ads%' or trim(md) = 'Others_OOH' or ( trim(md) = 'Others_Other' and trim(pl) in ('video', 'MI_OTT') ) ) then 'digital ads' when trim(md) in ('Bottle', 'Others_Bottle') then 'bottle' else 'others' end as label, --另存一个标签字段用于关联 date from coke.jice_events_new where appid = 1789 and trim(event) = 'applaunch' and substring(trim(date), 1, 4) > '2020' ) d on c.openid = d.openid and c.label = d.label where d.date > c.date and date_add(d.date, 0) <= date_add(c.date, 30) group by c.openid, c.label ) egroup by e.label剖析利用可通过数据直观的看出不同流动和渠道的留存率,能够借用高留存的渠道进行扩大新用户,复用高留存的流动亮点和模式。 ...

August 25, 2022 · 3 min · jiezi

关于数据分析:Hive开窗函数的应用场景

开窗函数分为两类:聚合开窗函数和排序开窗函数,有时候一组数组只返回一组值是不能满足咱们的数据分析需要的,咱们须要晓得某个学科的前几名详细信息、最近一次下单的用户订单详情、下过n次单的用户等等,这个时候开窗函数就能够派上用场了。如果没有开窗函数的话,则须要通过简单的关联查问能力获取对应的详细信息。聚合函数和聚合开窗函数的区别如下:SQL 规范容许将所有聚合函数用作开窗函数,用OVER 关键字辨别开窗函数和聚合函数,例如sum()over(partition by field )聚合函数每组只返回一个值,开窗函数每组可返回多个值,这里的值指的是每个分组的行信息 聚合开窗函数理论利用举例下单累计金额达到3000元的用户历史订单详情,并且依照用户的订单工夫降序,以便查看用户的购买状况 select * from (select sale_order_id, order_code, customer_id, order_create_time, actual_sales_amount, sum(actual_sales_amount)over(partition by customer_id) as grand_total from cdp_order_model where channel='cdp_order_sale_01' ) a where a.grand_total > 3000 order by a.customer_id,a.order_create_time desc单笔最高金额达到某个规范的用户历史订单详情 select * from (select sale_order_id, order_code, customer_id, order_create_time, actual_sales_amount, max(actual_sales_amount)over(partition by customer_id) as max_order_amount from cdp_order_model where channel='cdp_order_sale_01' ) a where a.max_order_amount > 10000 order by a.customer_id,a.order_create_time desc最常见的排序开窗函数有三种:row_number() over(partition by filed2 order by filed2),对雷同的值不进行辨别,排序从1到n名次间断rank() over(partition by filed2 order by filed2),相等的值排名雷同,但若有相等的值,则序号从1到n不间断,如果有两个人都排在第3名,则没有第4名dense_rank() over(partition by filed2 order by filed2),对相等的值排名雷同,但序号从1到n间断,如果有两个人都排在第一名,则排在第2名(假如仅有1个第二名)的人是第3集体 ...

August 25, 2022 · 1 min · jiezi

关于数据分析:Smartbi-数据模型以自助为理念带来-敏捷建模-的新思路

B客户是一家大型金融企业,数据仓库建设曾经成熟,且是通过大宽表来实现数据集市,这样进行数据分析更加的便捷高校。然而因为宽表模式的限度,很多需要只能通过技术人员来实现,且解决起来不灵便、不麻利: 1.增删剖析字段不不便。客户的业务需要是灵便多变的,因而有增删剖析字段的需要很失常,然而因为宽表构造的限度,解决起来不不便、不灵便。 2.数据反复收缩口径不一。面对业务人员的剖析需要,技术人员往往构建各种宽表来满足,需要与日俱增,多个宽表之间就会呈现数据反复、数据越来越多收缩变大,而且同一个字段有可能在不同宽表中存在各种口径不一的问题。 3.关联计算时数据量大性能慢。宽表之间可能须要关联计算,数据量大会性能慢。 4.业务手工Excel数据和宽表关联混合析不不便。业务用户局部手工数据存储在本地Excel,此时就须要宽表和Excel数据关联混合剖析,然而在实际操作中,两者的关联混合剖析非常不不便。首先业务须要定期提供内部的Excel数据给技术,而后技术再导入到数据库中,最初再和宽表关联解决,效率十分低下。 因而,客户冀望能实现自助麻利建模,突破宽表模式的限度。 受限于技术,传统“数据集市”不麻利。“业务提数据分析需要,IT来解决实现”这种传统建模的形式响应不快,解决不灵便,须要较长时间。 因而,Smarbi带来了“麻利建模”的新思路:现代化BI是以自助麻利为理念,即不仅数据分析操作更加麻利,建模操作也更加简略麻利。Smartbi数据模型有更加动静的Cube模式、简略疾速的建模操作,同时,让用户能更疾速地响应需要、更敏捷地进行数据建模等。 1、数据模型麻利建模,增删字段不便。通过拖拽、勾选等简略操作就能够疾速生成度量、维度档次等信息,比方能够一键生成工夫维、设置天文维间接实现地图下钻等; 2、数据模型联合指标治理能够对立治理指标和维度,同时统一口径,打造自增长指标体系,积淀数据资产。 3、数据模型反对超大表关联,通过抽取数据到应用分布式内存计算技术的高速缓存库中,晋升查问速率。 4、数据模型整合多种数据集类型,融合线上线下数据,面向不同应用的用户提供多种查问伎俩,包含:表、即席查问、SQL、内部文件、存储过程等。

August 18, 2022 · 1 min · jiezi

关于数据分析:Smartbi融入多维建模能力满足一站式BI需求

数据集市是以 Cube 立方体的形式来帮忙用户进行剖析决策,它满足了一些人和部门的特定需要,以多角度的形式进行存储定义。 基于数据集市进行数据分析,使用户可能从多种维度、多种数据综合度剖析查问数据,从而深刻地理解数据中的信息和法则,因而数据集市在 BI 建设中必不可少。 Smartbi 产品借助数据模型不仅加强了 “麻利建模” 的能力,还实现数据集市的构建。它能满足不同用户需要场景的数据筹备,以 “维度”“度量” 的形式敏捷地构建多维模型,打造出实用性和易用性俱佳的 “数据引擎”,全面晋升数据筹备工作的效率! A 客户刚接触 BI 平台建设,还未有欠缺的数据集市,目前他们也想构建数据集市以便进行数据分析。然而市面上的 BI 工具比拟繁多,没有方法将数据集市和 BI 工具集成一个产品。此外,其余 BI 厂商虽有数据集性能来为数据展示服务,然而因为数据集自身扩散、凌乱等问题,难以承当 “麻利建模” 的使命。 客户冀望:一个产品满足实现数据接入解决、建模麻利构建、数据分析分享等需要“数据集市” 必不可少,却位于 BI 软件之外。 数据模型让 “多维建模” 能力融入 BI 产品,用户无论是否曾经搭建 ODS 或是数仓,只需应用 Smartbi,都能够麻利建模实现数据集市,从而使得 Smartbi 成为领有麻利模型构建能力的一站式大数据分析产品,能够实现数据连贯、解决、建模、剖析、分享等全流程性能。 在通过数据模型性能进行多维模型的构建之前,咱们能够间接导入 Excel 文件数据或连贯业务库,数据模型同时领有弱小而对立的计算能力,反对 ETL 高级查问等性能解决数据,能满足各种简单的二次计算需要。最初,实现的数据模型能够间接进行报表、仪表盘等的创立。

August 18, 2022 · 1 min · jiezi

关于数据分析:字节跳动嵌入式数据分析最佳实践

更多技术交换、求职机会,欢送关注字节跳动数据平台微信公众号,回复【1】进入官网交换群商业智能 (BI) 曾经宽泛被利用到用户理论业务过程中,如果BI作为独立利用平台利用,那么用户在日常应用业务零碎(比方CRM/ERP/OA等)时,就须要常常切换不同零碎,繁冗登录过程与利用零碎的切换,会导致业务思考的中断,升高效率。这不利于BI在企业内做推广,也难实现IT利用治理平台的对立。 因而将低门槛数据分析操作性能,和已实现的看板后果间接搁置在业务零碎程序的UI中,就会保障业务用户数据洞察的连续性和可用性。 该篇文章以字节跳动外部利用的实操案例,来实现如下业务场景。 业务场景案例一张小明同学心愿在本人的经营平台上接入BI的可视化剖析能力,可能在经营平台上通过点击、拖拽等页面交互方式便能够疾速生成可视化图形,获取数据洞见。通过调研后决定集成Datawind平台,将本人的数据源通过数据筹备导入到Datawind中作为数据集,并在经营平台上嵌入该数据集的可视化查问页面。之后能够间接在经营平台上间接做数据拖拽剖析,极大地提高了数据分析效率。 案例二王小红同学想要建设经营数据看板并分享给不同的地区经理,心愿不同的地区经理只看到本地区数据。并且这些数据看板能够集成到地区经理最罕用的CRM零碎之中。小红发现Datawind可能满足制作数据看板的诉求,并且Datawind的行权限、自定义筛选器也能满足平台对数据权限管制的须要,也能够疾速集成到本人的CRM零碎中,最初决定应用嵌入Datawind仪表盘的形式搭建经营数据看板。 案例三李小华同学须要对海量的商品交易记录进行查问。他心愿应用这样一款查问工具:具备对海量明细数据的查问能力、反对丰盛的筛选操作、可能配置表格和单元格款式、必要时能够对表格列的字段公式进行改写。确认Datawind满足需要后,李小华在Datawind上建设了明细数据报表并将其嵌入到商品交易管理系统中,让每个相干经营同学都能疾速查问取得想要的数据后果。 Iframe集成计划为了最方便快捷实现集成,能够通过Iframe的形式对接,操作形式如下。概述 该操作须要开发人员实现,次要操作步骤如下所示: Step 1. 取得指标仪表盘/图表的URL链接Step 2. 链接批改Step 3. 生成代码 该开发人员倡议在须要操作的我的项目中赋予我的项目管理员权限,实现后再依据理论状况赋予权限。 Step 1.取得指标仪表盘/图表的URL链接1. 间接在产品中取得(1)仪表盘/图表图表进入到仪表盘预览状态点击需嵌入图表右侧,抉择「嵌出图表」显示「复制胜利」,之后能够鼠标右键复制,或者键盘crtl+V即可仪表盘进入到仪表盘预览状态点击需嵌入图表右侧,抉择「嵌出仪表盘」显示「复制胜利」,之后能够鼠标右键复制,或者键盘crtl+V即可。 (2)大屏如图在列表页抉择查看,关上之后复制浏览器URL即可 2. 自行拼接抉择自行拼接,则依照如下形式进行,划下划线内容是变量,在如下参数详解要解释的,其余为固定内容 仪表盘$HOST/#/external/dashboard/$DASHBOARD_ID?appId=$APP_ID&inline=true比方: https://console.volcengine.com/bi#/external/dashboard/47610?appId=1010681&inline=true挪动端仪表盘$HOST-h5/dashboard/?appId=$APP_ID&id=$DASHBOARD_ID&inline=true比方: https://console.volcengine.com/bi-h5/dashboard/?appId=1010681&id=47610&inline=true留神:挪动端链接只能挪动端设施拜访,如果该链接在PC端关上,则默认跳转为PC端链接 图表$HOST/#/external/dashboard/$DASHBOARD_ID/$REPORT_ID?appId=$APP_ID&inline=true比方: https://console.volcengine.com/bi#/external/dashboard/47610/305962?appId=1010681&inline=true可视化查问$HOST/#/dataQuery?appId=$APP_ID&inline=true比方: https://console.volcengine.com/bi#/dataQuery?appId=1010681&inline=true大屏$HOST/vScreen/preview?appId=$APP_ID&id=$VSCREEN_ID&resizeMode=auto比方: https://console.volcengine.com/bi#/vScreen/preview?appId=1010681&id=11&resizeMode=auto参数详解: $HOSTSaaS环境设置为https://console.volcengine.co...私有化部署环境替换为产品部署的域名$HOST-h5挪动端的域名SaaS环境设置为https://console.volcengine.co...私有化部署环境替换为产品挪动端部署的域名$APP_ID我的项目id。在我的项目下任意关上地址均可取得,如图所示,任意关上一个我的项目下的链接,URL如下所示,app_Id值为1010681https://console.volcengine.com/bi#/dashboard/47610?appId=1010681plaintext$DASHBOARD_ID在列表页面关上须要外嵌的仪表盘,取得浏览器的URL链接如下,则dashboardId值为47610https://console.volcengine.com/bi#/dataQuery?appId=1010681&id=98850742&rid=306828&sid=22569$REPORT_ID图表id,标识惟一的图表。可视化查问页面URL的 rid 示意图表id。在如下可视化查问链接中,reportId值为306828https://console.volcengine.com/bi#/dataQuery?appId=1010681&id=98850742&rid=306828&sid=22569$VSCREEN_ID大屏id。在如下仪表盘链接中,vscreenId值为4750https://poc.volces.com/bi#/vScreen/4750?resizeMode=autoStep2.退出个性,批改链接在iframe的url中传入 feature 参数来配置通用个性,以下是该个性的解释阐明,能够依据理论状况抉择须要的个性。 { "dashboard": { // --- 仪表盘模块个性 --- "showHeader": true, // 显示Header "showFavor": true, // 显示珍藏 "showOwner": true, // 显示owner "actions": [ // 仪表盘操作,数组类型 "refresh", // 刷新 "fullscreen", // 全屏 "share", // 分享 "subscribe", // 订阅 "snapshot", // 书签 "auth", // 受权 "edit", // 编辑 "setAsDefaultDashboard", // 设为默认仪表盘 "exportImage", // 导出图片 "embed", // 嵌出 "accessStatistics" // 拜访统计 ], "report": { // --- 仪表盘图表个性 --- "showHeader": true, // 显示header "actions": [ // 仪表盘图表操作,数组类型 "imgExport", // 导出图片 "excelExport", // 导出excel "pivotExport", // 导出透视表 "copyToDashboard", // 复制图表 "embed", // 嵌出图表 "createMonitor" // 新建监控 ], }, "sheet": { // --- 仪表盘sheet个性 --- "tabPosition": "top" // tab页显示地位,可选top/left }, }}个性阐明Step3.生成代码根据上述取得的信息来拼接代码,比方以取得的仪表盘链接举例: ...

August 17, 2022 · 1 min · jiezi

关于数据分析:新零售进阶|从人货场到北极星指标

文末可收费下载 Kyligence Zen 批发场景数据集 + 行业指标模版 1. 数据分析仍深刻影响零售业如果提到对数据分析需要最多的行业有哪些?零售业肯定占有一席之地。 批发企业广泛具备丰盛的数据积攒和大量须要通过数据分析给出优化倡议的场景,例如:客单价是如何影响整体营业额的、沉闷用户数是否在其中起到正向作用等等,数据分析已成为零售业日常改善经营的次要判断根据。 因为过来几年疫情的冲击,线下的实体批发禁受了继续的客源和老本压力;而与此同时,疫情期间以社区批发和社群团购为代表的新零售业态则失去了很大的倒退。在疫情向稳和常态化防控的局势下,越来越多的商家冀望通过传播有温度的社区型服务来稳步晋升营业额,在这一指标下: 局部商家关注商品组合的调整,选择性地扩充生活必需品如米面粮油的占比以进步客单价;有些商家则致力于开发私域用户,并推出匹配其行为特色的促销流动以进一步坚固沉闷客户数。然而这些零散的形式尚未串出一条主线,而不同动作在追赶业务指标的过程中如何协同跟踪成果也是商家广泛关注的焦点,这样的新零售业态迫切需要更具指导性的数据分析和指标体系来驱动治理和业务指标。 因为篇幅无限,本文将以社区批发和社群团购为代表的新零售业态为例,分享如何从一个简化的 “北极星指标” 体系登程,进行指标的设定和拆解,再从指标治理的角度来追踪设定的 “北极星指标” 和拆解后关联指标的执行状况,以上下对齐、统一口径的指标来驱动治理和业务指标。 2. 新零售业和北极星指标传统零售业的数据分析实质上离不开 “人 - 货 - 场” 这一模型,“人 - 货 - 场” 从不同角度对零售业做了数据指标和剖析维度的提炼,横向的完整性上有了充沛开展: 零售业 “人 - 货 - 场” 数据分析模型 但在各个指标中,哪些指标是主体的业务指标,指标间又是如何产生关联的,自顶向下的分级关系具体是什么等,“人 - 货 - 场” 模型还不足纵向上的深度和必要的合成,这也就是前文所提到的 —— 如果没有串出一条领导业务前行的主线,对于零售商家来说仍会感觉一头雾水。 而新批发更强调用户体验的突出意义,之前提到的各种形式,无论是进步客单价还是坚固沉闷客户数,都是以用户为核心尝试推广精准营销,而这更须要对业务指标的聚焦和在纵深上对于各项指标关联性的思考,这也是越来越多的新批发企业抉择 “北极星指标” 来切入数据分析的原因。 “北极星指标” 是指在以后阶段与业务 / 策略相干的相对外围指标,一旦确立就像北极星一样闪耀在地面,指引团队向同一个方向迈进。 北极星即便在暗夜中仍可引领前行方向 不同行业有不同的 “北极星指标” 参考体系,即便在同一行业也会依据业务指标的不同而设置齐全不同的 “北极星指标”。例如,餐饮业会抉择客户满意度或翻台率,而连锁便利店则会更关注销量或毛利率等。这里咱们会看到很要害的一点:“北极星指标” 是与业务指标强相干的。 顶层设计 - 业务指标要明确体现在指标剖析中。然而在落地的过程中,通常的数据分析平台在展现报表或者监控指标时很难体现出业务指标,更谈不上对于治理的驱动意义。 进一步的挑战在于:当明确了 “北极星指标” 后,企业又该如何达成设定的指标,或者晋升过程中的可控水平呢?不难想到,咱们须要对确定的单个要害指标进行拆解、把指标细分,关联到具体的多个指标上,从而更不便地调配到不同部门或不同角色的人员来执行和跟踪。 指标拆解是 “北极星指标” 发挥作用的重要前提,而拆解后关联的这些指标要具备参考价值、成为可信指标,就必须保持一致的设计口径。 细项拆解 - 口径统一是可信指标的前提。然而在指标拆解的过程中,往往会遇到上下级甚至同一级的指标在各个部门或扩散的数据加工链路上对于指标名称、统计口径或计算方法的不统一,这会很大水平上升高指标的可信度,影响决策应用。 ...

August 17, 2022 · 2 min · jiezi

关于数据分析:数据透视表上线如何在纯前端实现这个强大的数据分析功能

在Office三大办公套件中,Excel可能是性能最多、最难精通的那一款了。从日常的表格录入到简单的业务数据统计分析,Excel好像一位表面平平无奇,实力却深不可测的武林高手。纯熟应用Excel往往能在日常工作中取得事倍功半的成果,而这里所谓的“纯熟”除了相熟大量公式、图表绘制等操作外,还要把握一项十分重要的个性——数据透视表。 所谓数据透视表,就是将原始的明细数据表中波及的各组关联数据进行分类汇总的产物。用户能够依照不同的组合形式对原始数据进行解决。例如上面这样的销售业绩原始数据: 咱们想要晓得几位销售人员各自销售了多少汽车、销售额又是几何,就能够应用数据透视表来剖析: 从上表中能够分明地看到几位销售人员各个季度都卖了多少车、销售额多少、每个品牌卖掉多少……等信息,并且透视表中蕴含哪些字段都是随便抉择的。例如咱们只想统计各季度的销量和销售额: 这里就略过了售车品牌信息,对应的字段抉择设置为: 咱们还能够点开每个字段,抉择须要显示的子内容,例如只看1-3季度的业绩,或者只看某位销售人员的业绩,等等。 由此可见,数据透视表是一种不便地对原始数据进行按需可视化解决的工具,在日常工作中用处十分宽泛。当工作场景中存在揉合了大量信息的原始数据表时,就能够应用数据透视表来疾速取得有意义的数据洞察后果,为业务提供有价值的信息。 你的前端为何须要数据透视表?在过来,少数企业人员应用数据透视表的惟一渠道就是Excel。因为Office办公套件长期垄断企业办公市场,大部分行政和业务人员只会接触Excel一种数据分析工具,Excel自身的性能也足够弱小,市场上就很难有其余工具的立足之地。 但随着数字化大潮汹涌而来,数字化转型成为简直所有企业都要面对的时机和挑战。疫情暴发后,居家办公的衰亡又对传统办公软件环境发动了新的冲击。明天的企业IT、业务和行政人员往往须要在多种软件环境中切换,解决比过来高出一个甚至几个数量级的海量数据,在办公室、地铁、宾馆、家中随时都可能须要解决业务申请。在这样的场景中,数据分析的需要开始随处可见、随时呈现,单凭Excel或者相似的大型单体软件曾经远远不能应答新时代的简单挑战。 仍以上述业务数据为例,这家汽车销售企业的业务总监可能会在外部的业绩治理App上回顾本年数据,须要在App中应用数据透视表性能;人事人员统计奖金信息时,须要登入企业后盾治理网站查看业务数据,并在Web页面上获取业绩排名;高管筹备年度报告时,试图在报告中集成动静的透视表组件,不便现场展现……所有这些需要都很难应用Excel这样的单体软件实现,更多状况下适宜采纳嵌入办法,将透视表性能嵌入对应的前端利用中实现。 随着此类需要迅速增长,市面上开始呈现一站式的解决方案,不便企业和软件开发者将传统上由Excel实现的性能集成到各类利用和页面中。咱们明天的配角——SpreadJS就是其中的佼佼者。SpreadJS是由葡萄城开发的,基于HTML5的纯前端表格控件,兼容450种以上的Excel公式,具备“高性能、跨平台、与 Excel 高度兼容”的产品个性,备受华为、明源云、远光软件等知名企业青眼,被中国软件行业协会认定为“中国优良软件产品”。在2020年公布的SpreadJS 14.0版本中引入了弱小的数据透视表性能,满足了企业在泛滥场景集成数据分析深度能力的需要,也为前端软件开发者大大加重了累赘。 在前端集成数据透视表:简要教程应用SpreadJS,要建设一个如图所示的前端嵌入式数据透视表是非常简单的: 上图中的PivotLayout工作簿是数据透视表的页面,DataSource是原始数据页面,图右侧的面板就是SpreadJS生成的数据透视面板,用户能够在这里调整所需的字段,从而扭转左侧数据透视表的展现信息。 在数据透视表中,存在四个区域: Filters: 控制数据透视表的数据范畴。Columns: 控制数据透视表的列散布。Rows: 控制数据透视表的行散布。Values: 控制数据透视表的计算数据和计算方法。输出以下代码即可创立数据透视外表板: let panel = new GC.Spread.Pivot.PivotPanel("myPivotPanel", myPivotTable, document.getElementById("panel"));用户必须为"panel"元素设置宽和高 。 GC.Spread.Pivot.PivotPanel结构函数参数如下: 以下是应用规范JS代码嵌入数据透视表的app.js文件: window.onload = function () { var spread = new GC.Spread.Sheets.Workbook(_getElementById('ss'), { sheetCount: 2 }); initSpread(spread); var pivotLayoutSheet = spread.getSheet(0); initPivotTable(pivotLayoutSheet);};function initSpread(spread) { spread.suspendPaint(); let sheet = spread.getSheet(1); sheet.name("DataSource"); sheet.setRowCount(117); sheet.setColumnWidth(0, 120); sheet.getCell(-1, 0).formatter("YYYY-mm-DD"); sheet.getRange(-1,4,0,2).formatter("$ #,##0"); sheet.setArray(0, 0, pivotSales); let table = sheet.tables.add('tableSales', 0, 0, 117, 6); for(let i=2;i<=117;i++) { sheet.setFormula(i-1,5,'=D'+i+'*E'+i) } table.style(GC.Spread.Sheets.Tables.TableThemes["none"]); let sheet0 = spread.getSheet(0); sheet0.name("PivotLayout"); spread.resumePaint();}function initPivotTable(sheet) { let myPivotTable = sheet.pivotTables.add("myPivotTable", "tableSales", 1, 1, GC.Spread.Pivot.PivotTableLayoutType.outline, GC.Spread.Pivot.PivotTableThemes.light8); myPivotTable.suspendLayout(); myPivotTable.options.showRowHeader = true; myPivotTable.options.showColumnHeader = true; myPivotTable.add("salesperson", "Salesperson", GC.Spread.Pivot.PivotTableFieldType.rowField); myPivotTable.add("car", "Cars", GC.Spread.Pivot.PivotTableFieldType.rowField); myPivotTable.add("date", "Date", GC.Spread.Pivot.PivotTableFieldType.columnField);let groupInfo = { originFieldName: "date", dateGroups: [{ by: GC.Pivot.DateGroupType.quarters }] }; myPivotTable.group(groupInfo); myPivotTable.add("total", "Totals", GC.Spread.Pivot.PivotTableFieldType.valueField, GC.Pivot.SubtotalType.sum); var panel = new GC.Spread.Pivot.PivotPanel("myPivotPanel", myPivotTable, document.getElementById("panel")); panel.sectionVisibility(GC.Spread.Pivot.PivotPanelSection.fields + GC.Spread.Pivot.PivotPanelSection.area); myPivotTable.resumeLayout(); myPivotTable.autoFitColumn();}function _getElementById(id) { return document.getElementById(id);}对应的html页面中退出的插件代码: ...

August 17, 2022 · 2 min · jiezi

关于数据分析:上榜中国大数据企业50强思迈特软件再夺多项荣誉

近日,由中国电子信息产业倒退研究院领导,赛迪传媒、大数据产业生态联盟、《软件和集成电路》杂志社主办的2022(第七届)大数据产业生态大会圆满闭幕,会上重磅公布了“中国大数据企业50强”榜单。思迈特软件凭借当先的技术劣势与丰盛的计划落地教训,从2000余家参评企业中怀才不遇,荣登“中国大数据企业50强”。 作为大数据产业生态大会的重要内容,“中国大数据企业50强”榜单备受业内关注。该榜单笼罩了中国大数据产业生态链上的各个重要环节,最终评比出的是各个细分畛域具备行业代表性、技术前瞻性的企业,这也是国内深具业余度和含金量的大数据畛域奖项。毫无疑问,“中国大数据企业50强”将成为中国数字经济国家策略建设的中坚力量。此次荣登榜单,充分体现了思迈特软件作为大数据畛域领航者的实力。 思迈特软件入选中国大数据企业50强思迈特软件在商业智能畛域深耕多年,领有深度的行业认知与丰盛的实践经验,深刻理解企业对数据分析及智能决策的需要,可能从客户需要登程为企业打造最合适的数字化经营解决方案。随着数据在企业经营决策中的价值越来越大, BI行将从之前的商业决策辅助工具,转变成数字化时代的商业决策外围工具。在这个过程中,对BI工具的能力要求也会一直深入。作为国内当先的BI服务商,思迈特软件在智能BI上做了很多踊跃的摸索,开创性地将NLA(自然语言剖析)与BI相结合,并建设了业界当先的指标管理体系。彻底改革了传统BI事后制作报表且须要学习计算机语言的数据分析形式,让用户通过发问,即可疾速取得正确的剖析后果,极大升高用户的数据分析门槛,让剖析像对话一样天然晦涩。与此同时,思迈特软件依据过来十余年对行业发展趋势的继续思考,对客户共性需要的总结提炼, 产品也愈发丰盛和成熟起来,并以前所未有的普适性满足更多行业以及不同规模企业的需要。目前,思迈特软件已服务超4000+行业头部客户,笼罩行业包含金融、制作、批发、医疗、高校等60+行业畛域,典型客户包含工信部、华为、国家电网、交通银行、万达团体、泰康团体等。 也正因为这些外围劣势,思迈特软件同时间断多年入选“中国大数据企业投资价值百强榜”,成为最具投资价值的中国BI企业。 Smartbi入选中国大数据企业投资价值百强榜共建新业态,入选大数据产业图谱自2016年以来,大数据产业生态联盟间断5年面向市场公开公布白皮书,旨在以数据为驱动,助推传统企业实现数字化转型降级。会上,由大数据产业生态联盟联结《软件和集成电路》杂志社、工信部赛迪智库、赛迪参谋共同完成的《2022中国大数据产业生态地图暨中国大数据产业倒退白皮书》正式公布,思迈特软件在中国大数据产业生态地图数据分析与可视化服务板块中强势露出。对于思迈特软件而言,这是一次实力的认可,也再一次激励着思迈特软件与大数据畛域搭档,独特劈画中国大数据产业生态的新格局、新业态、新模式。 Smartbi入选大数据产业生态图谱(点击“浏览原文”收费获取完整版白皮书)携手产业合作伙伴,打造国产BI生态圈在以后简单的国际形势下,国家正在鼎力推动政府、国防、军工、金融、交通等要害畛域的信息化产品国产化过程,并出台了多项政策来保障国产化真正落到实处。不仅是数据库、服务器等外围IT设施,在应用软件层,BI作为数据化决策治理平台,在政企组织的数字化布局中也扮演着越来越重要的角色。目前思迈特软件已与华为、阿里云、新华三、深服气、星环科技等支流国产软硬件厂商开展单干,别离在操作系统、数据库、云平台、服务器、中间件上进行产品互相适配、兼容性测试与优化工作,并获得了相互认证证书。在业务生态单干方面,思迈特软件是目前国内在渠道业务走得最快、最动摇,且很早就把渠道回升为策略层级的公司。公司自提出渠道策略起,与搭档分享市场机会、共享市场利润、独特促成行业倒退,还为合作伙伴提供包含销售培训、技术培训、招标反对、联结护航、品牌推广、人员招聘等一系列反对,帮忙各合作伙伴扩充在市场中的影响力,实现单方共赢倒退。将来,思迈特软件也会继续增强大数据技术的研发,并以更加凋谢和共赢的生态单干新模式,助力我国产业数字化转型降级。

August 12, 2022 · 1 min · jiezi

关于数据分析:Kyligence-连续三年入选-Gartner-增强数据分析推荐厂商

近日,寰球权威的技术钻研与征询公司 Gartner 公布《2022年中国 ICT 技术成熟度曲线报告》(Hype Cycle for ICT in China, 2022),Kyligence 凭借技术创新和产品劣势,间断三年入选加强数据分析举荐厂商 (Augmented Data and Analytics Sample Vendor)。 技术成熟度曲线是 Gartner 为企业提供的评估新技术成熟度的典型工具,次要用来跟踪技术的成熟度和将来后劲,是 Gartner 市场关注度最高、最受认可的报告之一。 Gartner 认为,加强数据分析基于机器学习 (ML) 和人工智能 (AI) 技术,提供在对立平台上的自动化数据管理和剖析能力,缩小了因为适度依赖 IT 开发所带来的低效和口径偏差等问题,帮忙业务用户实现自助的数据洞察和无效的业务决策。 近年来,在数字化转型的浪潮下,企业纷纷向数据驱动决策转型。Kyligence 对加强剖析继续投入,通过 AI 加强引擎从外围业务查问中辨认要害特色和模式,智能生成对数据模型、索引的优化倡议,并提供高性能、高并发的数据服务以撑持各种数据分析场景,充沛开释业务自助剖析后劲。Kyligence 不仅间断三年入选 Gartner 加强数据分析举荐厂商,同时还在 Gartner 公布的《SaaS 型剖析和商业智能平台的解决方案比照报告》 (Solution Comparison for SaaS Analytics and Business Intelligence Platforms, 2022) 中被列为参考规范之一。 在《SaaS 型剖析和商业智能平台的解决方案比照报告》中,Gartner 从不同的角度比照了三家寰球支流商业智能(BI)厂商的解决方案,在“与语义层/数据虚拟化的对接性”这一项中,将可能与 Kyligence 等厂商对接列为重要的产品能力,表白了对 Kyligence 语义层能力的必定。Kyligence 对立语义层提供对立受治理的数据集市,为企业构建对立共享的业务语义模型,把简单的数据映射为业务语言,业务人员无需关怀底层技术即可轻松进行数据分析。 此前,Kyligence 曾入选 Gartner《2022 数据管理技术成熟度曲线报告》。间断多年入选 Gartner 报告,也再次证实 Kyligence 在数据分析与治理畛域的弱小实力和领先地位。将来,Kyligence 将持续施展在加强剖析和语义层上的劣势,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP),一直升高用户应用数据的门槛,助力寰球客户的数字化转型。 ...

August 12, 2022 · 1 min · jiezi

关于数据分析:看看你离世界一流大厂有多远3道Google最新SQL面试题-⛵

作者:韩信子@ShowMeAI 数据分析◉技能晋升系列:https://www.showmeai.tech/tutorials/33 AI 面试题库系列:https://www.showmeai.tech/tutorials/48 本文地址:https://www.showmeai.tech/article-detail/297 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容上面是最新的 3 道 Google SQL 面试题和参考答案。这些题目面向的 Google 职位包含:数据迷信 家、数据分析师、商业智能 工程师、数据工程师和商业分析师。 ShowMeAI 制作了快捷即查即用的 SQL 速查表手册,大家能够在下述地位取得: 编程语言速查表 | SQL 速查表 面试题 1:墨西哥和美国第三顶峰 问题: 请实现1个 SQL 来找出每个国家第三高的山名,并按 ASC 程序对国家/地区排序。 Table: mountains+---------------------+------+-------------+|name |height|country |+---------------------+------+-------------+|Denalli |20310 |United States||Saint Elias |18008 |United States||Foraker |17402 |United States||Pico de Orizab |18491 |Mexico ||Popocatépetl |17820 |Mexico ||Iztaccihuatl |17160 |Mexico |+---------------------+------+-------------+参考答案: SELECT "country", "name"FROM (SELECT "country", "name", Rank() OVER ( partition BY "country" ORDER BY "height" DESC) AS "rank" FROM mountains) AS mWHERE "rank" = 3ORDER BY country ASC 面试题 2:用 latest_event 查找以后关上的页数 ...

August 9, 2022 · 3 min · jiezi

关于数据分析:再见-Excel你好-Python-Spreadsheets-⛵

作者:韩信子@ShowMeAI 数据分析◉技能晋升系列:https://www.showmeai.tech/tutorials/33 数据分析实战系列:https://www.showmeai.tech/tutorials/40 本文地址:https://www.showmeai.tech/article-detail/294 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容Excel是大家最罕用的数据分析工具之一,借助它能够便捷地实现数据清理、统计计算、数据分析(数据透视图)和图表出现等。 然而!大家有没有用 Excel 解决过大一些的数据(比方几十上百万行的数据表),Excel 就会变得十分慢,甚至间接解体。 辛辛苦苦做一半的工作很有可能要重做!那就不只是 Excel 解体了,咱们也得一边解体一边加班赶 deadline。 在本篇文中,ShowMeAI 将给大家介绍到 Python 中十分好用的交互式表格工具,它们的功能性和应用便捷度和 Excel 相当,同时有很好的内存优化,非常适合解决大文件表格。 工具1:Mito Mito 是 Python 中的电子表格,它同时领有 Excel 电子表格的简略易用性和 Python 的弱小性能。咱们能够像应用 Excel 一样应用 Mito,并且在咱们执行每个操作之后,Mito 将主动生成与每个操作对应的 Python 代码。 Mito 官网文档Mito GithubMito 应用示例 应用 Mito 工具库,咱们首先须要装置 Python 和 Jupyter Notebook 或 Jupyter Lab, 而后咱们通过终端或命令行运行以下命令来装置 Mito。 python -m pip install mitoinstallerpython -m mitoinstaller install上面咱们来演示一下,如何在 Mito 中实现咱们在 Excel 中的操作,如读取文件、创立列、数据透视表、可视化等。 Mito:文件读取Excel 默认对文件行数有限度。在内存足够时,Excel 能够关上数百万行的文件,然而只显示前 1048576 行。感兴趣的话能够测试下这个数据~同样在内存短缺的状况下,Mito 关上文件的大小没有限度。来看具体操作! ...

August 9, 2022 · 2 min · jiezi

关于数据分析:2022了你还不会『低代码』数据科学也能玩转LowCode啦-⛵

作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 机器学习实战系列:https://www.showmeai.tech/tutorials/41 本文地址:https://www.showmeai.tech/article-detail/286 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容低代码开发,顾名思义,指的是软件开发过程中只须要编写大量代码就够了。与传统开发方式相比,低代码大幅缩小了编写代码的工作量,这使其具备了更快的速度、更短的开发工夫与更低的老本。 无代码 / 低代码机器学习平台(和库)的衰亡,减速了代码开发速度。借助于这些平台和框架,数据科学家们在沉重的摸索钻研和大量的编程工作之间,获得更好的均衡。 在本篇内容中,ShowMeAI 给大家总结了最值得学习&应用 Python 低代码机器学习库,笼罩数据迷信最热门的几大方向——数据分析&简略开掘、机器学习、深度学习。 数据分析&简略开掘 D-TaleD-Tale 是一个易于应用的低代码 Python 库,通过将 Flask 编写的后端与 React 编写的前端相结合,与 Jupyter Notebook 无缝集成,能够查看和剖析 Pandas 状态的数据,包含 DataFrame、Series、MultiIndex、DatetimeIndex 和 RangeIndex。 D-Tale 是 SAS 到 Python 转换的产物,最后是基于 SAS 的 perl 脚本包装器,当初是基于 Pandas 数据结构的轻量级 Web 客户端。 大家能够在D-Tale的官网 Github 查看它的具体教程和用法,也能够返回 在线平台 操作体验。 AutoViz对于低代码摸索式数据分析工作,AutoViz 是 Python 中另一个不错的抉择。在性能方面,它只需编写一行代码即可应用 AutoViz 实现任何数据集的主动可视化。 AutoViz 可能联合工作确定哪些特色是最重要的,而后通过仅应用那些主动抉择的元素来绘制和出现信息。而且AutoViz速度极快,可视化能够在几秒钟内实现。 大家能够查看官网 AutoViz 示例 Jupyter Notebook 进行学习。 ...

August 9, 2022 · 1 min · jiezi

关于数据分析:一键自动化数据分析快来看看-2022-年最受欢迎的-Python-宝藏工具库-⛵

作者:韩信子@ShowMeAI 数据分析◉技能晋升系列:http://www.showmeai.tech/tutorials/33 数据分析实战系列:http://www.showmeai.tech/tutorials/40 本文地址:http://www.showmeai.tech/article-detail/284 申明:版权所有,转载请分割平台与作者并注明出处 珍藏ShowMeAI查看更多精彩内容理论工作中,咱们往往依靠于业务数据分析制订业务策略。这个过程须要频繁地进行数据分析和开掘,发现模式法则。对于算法工程师而言,一个无效的 AI 算法零碎落地,不仅仅是模型这么简略——数据才是最底层的驱动。 典型的『机器学习工作流程』蕴含 6 个关键步骤,其中『探索性数据分析(Exploratory Data Analysis, EDA) 』是至关重要的一步。 定义问题数据采集和 ETL探索性数据分析数据筹备建模(模型训练和抉择)部署和监控Wiki: In statistics, exploratory data analysis is an approach of analyzing data sets to summarize their main characteristics, often using statistical graphics and other data visualization methods. A statistical model can be used or not, but primarily EDA is for seeing what the data can tell us beyond the formal modeling and thereby contrasts traditional hypothesis testing.探索性数据分析,通常应用统计图形等数据可视化办法,摸索数据的构造和法则,总结数据次要特色的办法。这一过程通常蕴含细碎的解决步骤和剖析操作。 ...

August 5, 2022 · 2 min · jiezi

关于数据分析:行业案例|世界-500-强险企如何建设指标驱动的经营分析系统

2021年是引入 Kyligence 引擎能力的元年,咱们聚焦于平台的搭建集成和局部重点利用的落地,很好的实现了指标。在单方我的项目组成员的共同努力下,咱们实现了平台建设、集成对接、投产保障、人员培训等各项筹备工作;演绎出了 Kyligence Enterprise 在咱们公司的应用标准和最佳实际;实现了多个利用的上线;保障了个人业务数据分析我的项目胜利汇报,取得业务团队的信赖与统一好评。援用—— 世界 500 强保险企业1. 行业现状及痛点随着宏观经济、行业、市场及客户需要的一直变动,叠加疫情因素,保险代理人规模自 2019 年冲上 912 万人高位后便进入上行通道,以往粗放的“人海战术”难以为继。财产保险尤其是车险,综合老本率长期居高不下,2021 年上半年财产险全行业的车险综合老本率一度高达 99.9%。对于保险企业而言,建设以指标为外围的经营剖析零碎、以数据驱动业务增长成了数字化转型的要害。指标对于领导经营决策至关重要,Kyligence 服务的这家保险企业晚期就自建了指标平台,指标是从经营全景视角,来对立指标治理、对立定义口径、对立数据服务等,其指标平台底层引擎最后基于 Druid 创立,但随着指标平台的多轮迭代,逐步衍生出以下问题: 指标定制化开发,大量反复工作:指标定义须要与业务重复沟通后,再由数据开发团队进行定制化开发;每个指标烟囱式开发,定制化配置,开发组之间存在大量反复;非标准 SQL:Druid 对表关联反对度较低,对于维度模型查问不敌对,减少了开发难度;反对场景无限,运维老本高:数据集市为了满足查问性能要求须要加工宽表,产生大量两头表,前期运维老本高;不反对高基维维度的退出,无奈反对准确去重场景。2. Kyligence 利用场景 + 解决方案2021年,这家企业抉择 Kyligence 智能多维数据库产品及解决方案,建设以指标外围的经营剖析零碎,服务了多个业务场景,以数据驱动业务增长。 利用场景 1: 业务实现自助式剖析 保险企业为管制和优化老本、进步人效,业务员老本剖析等工作必不可少。该险企现有业绩奉献的业务人员就有上万人,他们隶属于不同的组织机构,从不同起源为企业带来保费支出。以往,业务分析师是通过「人工取数 + Excel 制作报表」的形式进行数据分析并向领导层汇报。大抵确定剖析思路后,须要进行以下工作: 数据分析师须要和数据开发工程师进行往返的大量沟通;数据开发工程师进行人工取数;数据分析师应用 Excel 进行报表的制作。然而,该形式效率较低,并存在以下痛点: 分析师常因沟通和期待取数而被打断剖析思路;受限于 Excel 数据处理能力以及取数周期,剖析时不得不对维度做裁剪,只能看到小局部数据,难以在大数据集上进行多维分析和展现;数据分析汇报展现成果差强人意,无奈实现自助剖析。因而,该企业心愿在业务员老本剖析等场景实现: 基于海量数据的交互查问:该险企年均保单数量超几十亿,分析师冀望能够在数百亿的数据上做疾速剖析,放弃剖析思路的连贯;同时心愿在实现剖析后间接基于此数据做成灵便报表,供汇报应用;进行多维度的穿插剖析:在汇报数据分析后果时,常由总到分进行阐明,要求剖析工具能够反对产品、队伍类型、机构等多维度组合下的灵便切片、切块、下钻等剖析能力;进行灵便的数据处理:人员归属、类别归属等需依据不同报表目标进行调整,分析师心愿能够自助实现。 采纳 Kyligence 产品及解决方案后,该产险企业可能实现整合老本剖析所需维度和度量数据,在 Kyligence 上落地为多维模型,从而实现从产品、队伍、机构、业务起源等多个维度对百亿级保单的明细数据进行自助剖析,并实现报表制作,晋升业务剖析决策效率: 整合数据模型:整合各方数据,失去一个蕴含有产品、队伍、机构及工夫等要害剖析视角的多维星型模型,提供更丰盛的剖析角度;极简智能建模:通过 Kyligence 接入数据,疾速可视化建模,开发全程无代码,大幅缩短需要交付周期;借助 Kyligence AI 加强引擎,智能减速要害查问,无需繁琐的模型设计优化;BI 直连剖析:借助 Kyligence Enterprise 的 Model as View 性能,剖析用户无需在 BI 工具上反复建模,可间接对维度、度量执行拖拽剖析,并反对在 BI 工具中进行二次计算加工出业务起源。利用场景 2: 指标中台架构优化 ...

August 4, 2022 · 1 min · jiezi

关于数据分析:企业云成本管控你真的做对了吗

文末可收费下载 Kyligence Zen 云老本指标模板+样例数据 现在,越来越多企业抉择将利用迁徙至云原生架构。但据 2021 年 CNCF FinOps Kubernetes Report 调研报告显示,迁徙至 Kubernetes 平台后,68% 的受访者示意所在企业计算资源老本有所增加,36% 的受访者示意老本飙升超过 20%。 初创公司 Milkie Way 在对 Firebase 和 Cloud Run 进行内部测试期间,一不小心在几个小时里就在云上烧掉了 72,000 美元(如下图所示),差点导致这家公司破产。 https://blog.tomilkieway.com/... ConvertKit 是倒退最快的全功能电子邮件服务提供商 (ESP) 之一,其官网有一篇长文《2021年,ConvertKit 在 AWS 上破费超 1 百万美金》,具体列出了 2021 年 CovertKit 在 AWS 上的破费,并思考下一步优化云老本的措施。 不难看出,即便是资源利用率更高、更为灵便的云原生架构,企业也存在以下的痛点: 云老本迅速增长,治理具备滞后性:对于管理者而言,最头痛的事之一就是云老本在无形中迅速增长。如果老本的监控和治理不善,IT 人员的某个误操作,就可能会给公司带来经济损失。不少员工领有权限,云上资源管理难:企业内很多员工都有应用云资源的权限,治理难度大,因为不理解规定而导致资源节约的状况并不少见,而公司往往只会象征性惩办一下,损失的金额只能默默“认栽”。1. 一套残缺的云老本监控和管理体系如何构建?Kyligence 为泛滥云上客户提供了数据分析与治理的服务,同时外部也有云平台上进行开发、测试的需要。接下来咱们将以 Kyligence 为例,分享企业如何利用 Kyligence Zen 以要害业务指标治理和追踪相关性指标,帮忙组织对齐治理指标,实现云老本全方位可监测。 企业要治理好云上老本,首先要构建欠缺的老本监控和管理体系。业内代表性的做法是,依据事先布局、事中监控和预先评估三个阶段,别离制订各自阶段的规定。Kyligence 也遵循了这个流程: 事先布局:基于用处进行云资源的审批和布局;事中监控:对所有云资源的应用状况进行继续的监控;预先评估:对所有云账单数据建设一套指标体系,定期对指标进行治理和剖析。剖析的论断又会进一步反馈到后续的云资源布局当中。为了节俭云上资源,企业须要实现云老本的全方位监控。在 Kyligence 企业的云老本管控实际中,有以下几个次要角色: Kyligence 应用了智能指标驱动的治理和决策平台——Kyligence Zen 来对云账单数据进行评估和剖析。 1.1 提供指标目录,解决指标统计口径不统一的问题 Tom 能够在界面中通过交互方式自助实现指标定义,也能够应用低代码的入口来创立高级指标。另外,定义实现的指标能够一键公布,不便 Tom 在组织内公布、共享、保护,指标口径清晰易了解,加强数据信赖。随着组织的倒退和增长,指标目录反对灵便的指标扩大和指标治理。 ...

August 2, 2022 · 1 min · jiezi

关于数据分析:金融大数据这么火你真的知道它出圈背后的真相吗

“数据为王”的时代,金融大数据被誉为“金矿”,其价值已成为共识。近年来,数据成为金融业的话题之王,大数据平台曾经站在了一个新的节点,金融机构越来越依赖客户服务、翻新产品和外部治理“数字”。 尤其是传统征信行业,常常存在“覆盖面无限,审计周期长,信息采集面无限”期待毛病,而这正是AI,大数据、云计算等新技术优化,重塑服务链的发力点。 在金融企业和非金融企业中,大数据不仅扭转了传统的数字经营模式,而且为金融机构带来了新的数据价值,包含这四个方面。 1、 数据品质的兼容性:通过大数据“量”改良了数据分析“质”的宽容度。过来,金融机构在数据获取方面有很高的门槛,剖析数据的伎俩和能力绝对无限。大数据时代,“全量思维”能够取得更有多元、有价值的数据。 2、数据使用的关联性:从“动态”走向“继续”,咱们能够通过继续的增量数据来优化剖析后果。 3、数据分析的老本:数据处理的老本降落,然而数据中蕴含大量存在的商机。尽管每个商机自身带来的商业价值可能并不可观,然而累积起来就会实现质的飞跃。 4、数据价值的转化:实现数据价值的高效转化,不仅能为金融机构提供新动力,从数据到价值的转化与机构的整体转型相辅相成,“内嵌式改革”由此而生。 那么,金融大数据到底应该怎么做呢? 现在,金融机构特地喜爱用思迈特软件的产品来做报表、数据可视化剖析等,从数据接入、筹备到剖析再到利用,通过一个平台就能够间接搞定。 从国内金融数字化转型局势看,Smartbi在金融大数据方面还是极具劣势,去年国内有超过百分之八十的银行都应用过它的产品,还有不少银行都称誉它。而且在多年的积攒下,本人造成了一套欠缺的解决方案,不仅产品易用性高、性能实用、性能超强、安全性高,而且还能集成其余零碎,用起来也更便捷,不必放心新零碎不会应用。  

July 29, 2022 · 1 min · jiezi

关于数据分析:构建数据工程师能力模型完结无密

download:构建数据工程师能力模型完结无密如何实现可插拔配置?我又又又又被吐槽了,随之而来,我的消息推送平台开源我的项目Austin又又又又更新啦,迭代自己的我的项目多是一件美事啊。01、可插拔我的我的项目逐渐成型了之后,有挺多小伙伴吐槽过我的我的项目太重了,依赖的中间件有点多。在最开始的那一版需要强依赖MySQL/Redis/Kafka/Apollo(我的项目启动就需要部署这些中间件),弱依赖prometheus/graylog/flink/xxl-job(想要有完整的我的项目体验,就需要把这些给部署起来)。 MySQL是没有人吐槽的,数据库这种货色,可能说是后端必须的了。Redis临时还没人吐槽,毕竟用的还是太多了,也没有什么弱小的竞品。Apollo常常被吐槽能不能换成Nacos。Kafka时而有人吐槽,想要反对RabbitMQ、RocketMQ。 我以前存在个观点:在公司里中间件是不会轻易替换的,现在我的代码已经实现了一种姿势,感觉没多大必要反对多种中间件实现,你想换就自己动手改改嘛,又不难。「“Apollo太重啦,Apollo不好用!快点反对Nacos!”」「“反对RocketMQ好不好啊”」「“能不能反对RabbitMQ?”」对我来说并不是啥大理由,我还是感觉Apollo挺好用,足够成熟稳固,同理Kafka亦是如此。不过当我被吐槽多了,总会怀疑自己是不是做得不够好,也会跟身边的大佬探讨探讨,有没有必要反对一些功能。思来想去,我变了,我又懂了为了让消息推送平台Austin易上手,我首先把Apollo做成弱依赖,可能通过配置抉择读本地文件还是读配置核心(Apollo)。其实当咱们使用Apollo时,即便Apollo挂了,Apollo本身就有很强的容灾能力(自带本地文件)其次,我把Kafka做成弱依赖,可能通过配置抉择用Guava的eventbus还是走分布式消息队列(Kafka),后续可能还会反对RocketMQ/RabbitMQ,感兴趣的也可能在我的代码基础上实现一把,蹭个pull request也很香的。一方面是升高使用门槛而做的,另一方面是可能对具体实现进行可插拔,这是开源我的项目所需要的。我认为如果是公司级生产环境线上的我的项目,对这块更多考虑的是异构容灾(而非可插拔)。于是乎,现在消息推送平台Austin默认的强依赖只剩下了MySQL和Redis,其余中间件的都是弱依赖,要做到可插拔我是借助配置去实例化不同的中间件。当我的配置austin-mq-pipeline=eventbus时,我就不去实例化Kafka相干的消费者和消费者,转而去初始化eventBus的消费者和消费者,那天然接口下的实现类就是为eventbus的 02、(彩蛋)KAFKA反对TAG过滤我的股东们是能间接用我的近程服务的:Kafka的Topic是共享的,Group消费者也是共享的,在不修改的前提下,间接使用会带来一个问题。当同时有两个或以上的股东在本地启动了Austin,那就会争抢生产这个Topic(相当于一个消费者组里起了多个消费者),导致在测试下发的时候可能收不到自己调试的消息(被别的股东抢去了)。要解决这个问题我第一工夫的想法很简略:不同的股东使用不同的group(相当于每个股东都会有独立的消费者组),那不就完事了嘛?正好我的groupId生成是依赖渠道的code,改掉code就完事咯。 但这还是有问题的:每个股东有独立的消费者组,意味着每个股东能生产整个topic的所有消息,这又意味着股东会接受到其余股东的测试消息(明明只想要自己测试的消息,却来了一条其他人发的)。要解决这个问题,除了给每个股东一个独立的topic,那就是根据tag过滤啦。在Kafka实现这种成果,挺简略的:在发送的时候,把tag写进Kafka的头部,在生产前把非自身tag的消息过滤掉就完事了。 03、总结从开始写这个我的项目到现在还一直在迭代,这个过程受到了不少的吐槽。这种吐槽大多数是正向的,毕竟有人吐槽那才说明我这个我的项目是真的有人在用的,有人在看的。最近有个想法:把这个零碎做成是线上的,可能由各大开发者在推送消息的时候调用我的接口,做成这样肯定会很有意义,面临的挑战和需要也会更多。那我就一直可能迭代,在这过程中肯定我还能学到很多以前所不知道的货色。这次我用@ConditionAlOnProperties这个注解来实现可插拔的配置,但其实如果是提供二方库的形式的话,使用SPI的姿势会更加斯文。

July 25, 2022 · 1 min · jiezi

关于数据分析:数据分析实战训练营8期拉钩教育

download:数据分析实战训练营8期-拉钩教育Spring Boot+Vue3 动静菜单实现思路梳理对于 Spring Boot + Vue3 的动静菜单,松哥之前已经写了两篇文章了,这两篇文章次要是从代码上和大家分析动静菜单最终的实现形式,然而还是有小伙伴感觉没太看明确,感觉不足一个纲要挈领的思路,所以,明天松哥再整一篇文章和大家再来捋一捋这个问题,心愿这篇文章能让小伙伴们彻底搞明显这个问题。 整体思路首先咱们来看整体思路。有父有子:像系统管理那种,既有父菜单,又有子菜单。只有一个一级菜单,这种又细分为三种情况 一般的菜单,点击之后在左边主页面打开某个功能页面。一个超链接,但不是外链,是一个在以后零碎中打开的内部网页,点击之后,会在左边的主页面中新开一个选项卡,这个选项卡中浮现的是一个内部网页(本质上是通过 iframe 标签引入的一个内部网页)。一个超链接,并且还是一个外链,点击之后,间接在阅读器中打开一个新的选项卡,新的选项卡中展示一个内部链接。 四种菜单对应的 JSON 格局别离如下: 有父有子: { "name": "Monitor","path": "/monitor","hidden": false,"redirect": "noRedirect","component": "Layout","alwaysShow": true,"meta": { "title": "系统监控", "icon": "monitor", "noCache": false, "link": null},"children": [{ "name": "Online", "path": "online", "hidden": false, "component": "monitor/online/index", "meta": { "title": "在线用户", "icon": "online", "noCache": false, "link": null }}, { "name": "Job", "path": "job", "hidden": false, "component": "monitor/job/index", "meta": { "title": "定时工作", "icon": "job", "noCache": false, "link": null }}]}复制代码 ...

July 22, 2022 · 5 min · jiezi

关于数据分析:活动报名|揭露-Apache-Doris-数据湖分析技术内幕稀土开发者大会免费报名中

数据库与操作系统、中间件组成了根底软件的三驾马车,是企业 IT 零碎必不可少的核心技术。从上世纪 60 年代诞生至今,不论是互联网行业还是银行、电信、制作等传统行业,都依赖着数据库技术的演进。 目前业务品种繁多、数据存量大,老本居高不下、业务增速快,诉求一直变动等问题,都对数据库底层技术能力提出了更高的要求,如何设计一个面向未来的、云原生化的数据库系统?数据湖技术带来了怎么的新个性?海量数据如何疾速剖析利用? 这些问题都有依赖于工程师们的巧思妙手。 2022 年 7 月 22 日-7 月 23 日 稀土掘金技术社区将举办主题为「激发万有引力,掘金技术将来」的稀土开发者大会。在《新一代云原生数据库》专题上,来自 SelectDB、Intel、美团、字节跳动、Google 等企业的外围业务专家将缺席演讲,从本身多年从事数据库畛域的贵重教训登程,一起探讨云原生时代的数据库翻新与实际。 其中来自 SelectDB 的高级软件研发专家李继炳,将为宽广开发者带来主题为《Apache Doris 的数据湖剖析技术与利用实际》的分享。 演讲详情演讲主题《Apache Doris 的数据湖剖析技术与利用实际》 演讲嘉宾:李继炳,SelectDB 高级软件研发专家、Apache Doris Contributor 次要从事 Apache Doris 查问层优化和数据湖相干研发工作,具备超过 10 年的大数据系统和数据库内核畛域的设计与研发教训。曾任百度大数据部高级研发工程师,负责 Apache Doris 元数据模块的设计与开发。后退出 AWS,负责 AWS S3 EB 级数据迁徙服务的设计与实现。 演讲简介Apache Doris 是一款基于 MPP 架构的开源剖析型数据库。依靠其弱小的并行处理能力和高性能算子,能够在海量数据集上提供亚秒级的交互式查问体验。而近年来,随着数据湖技术飞速发展,越来越多的企业开始依靠数据湖技术构建其根底数据的存储架构,并利用数据湖提供的批流一体,事务隔离和数据更新能力,积淀了大量企业数据。 本次分享中将介绍如何基于 Apache Doris 对数据湖中的数据进行疾速剖析,以及 Doris 在多源数据联邦查问方面的性能和停顿。 演讲纲要:Apache Doris 简介及外围性能一览Apache Doris 数据湖剖析技术底细基于 Apache Doris 构建对立的多源数据分析系统Apache Doris 社区及将来布局听众收益:帮忙听众理解 Apache Doris 的数据湖剖析技术细节。帮忙听众疾速构建高效的查问剖析体系。我要报名本届开发者大会正在收费报名中,辨认「海报二维码」即可报名加入! ...

July 20, 2022 · 1 min · jiezi

关于数据分析:CSDN-Meetup-回顾-丨从数据湖到指标中台提升数据分析-ROI

近日,Kyligence 合伙人兼副总裁李栋受邀缺席 CSDN 云原生系列在线峰会。在第 13 期 “ 古代数据栈峰会 ”上,李栋从指标中台的趋势和背景登程,围绕指标中台的实在案例,对 Kyligence 实现指标中台的过程及晋升数据分析 ROI 的教训进行了具体分享。 1. 什么是“指标中台”指标是掂量事物的规范,数据分析的要害就是找到正确指标并取得洞察,并发展经营决策。指标中台(Metrics Store)是当下风行的技术之一。 在传统的数据分析场景中,往往会把数据对立接入到一个数据平台,例如数据湖、数据仓库等技术。通过一系列 ETL 开发后,将数据对接到上游的 BI 或自研的数据利用,数据分析师或业务用户通过查看报表和数据利用来查看指标数据,并对指标进行洞察剖析和开展业务决策。 这种状况下,所有业务指标扩散存储在各个 BI 报表或利用零碎当中,当指标数、用户数越来越多时,数据管理和指标治理会产生很大的凌乱。例如指标在不同报表中呈现同义不同名、同名不同义、数据口径不统一、工夫对不齐等难题,极大升高了业务用户对数据的信念。 指标中台的呈现,旨在通过一个平台对立治理所有业务指标,以及指标背地的数据。指标中台不仅能够解决后面提到的技术挑战,赋能业务人员更自助、更有信念地应用数据,还能帮忙 IT 团队发明更高业务价值。 2. 影响数据分析 ROI 的阻碍国内某一线互联网企业,早年开始数字化建设,并搭建了数据湖来汇总存储各个起源的数据。依照传统的形式,所有的源表(ODS表)落到数据湖上后,业务用户无奈间接应用这些源表,须要通过 ETL 开发宽表和聚合表能力被上游业务应用。 这就带来了两方面的问题: 宽表爆炸:最后仅有 5.7 k 张 ODS 表,却收缩至近百万张宽表和聚合表,给数据存储和数据管理带来极大累赘;此外,每个宽表都须要 ETL 开发和管理工作,对计算资源和治理复杂度也是很大挑战;难以使用:这么多的宽表和数据表,用户在应用时很难疾速定位须要剖析的指标存在哪张表上,数据应用的效率很低。由此可见,影响数据分析 ROI 的阻碍次要是: 指标口径不统一:数据量很大,但短少信赖;“浑浊”的数据湖——宽表爆炸,数据存储和ETL工作冗余;IT 老本&时效性—— IT 老本和开发效率随数据量和用户量增长而难以管制。3. 通过指标中台解决上述挑战传统在数据湖中加工和剖析指标的形式,是通过 ETL 为每个指标开发宽表和聚合表(如下图所示)。尽管很多指标背地的数据是能够复用的,但因为需要来自不同业务部门,短少数据共享,最终只能反复开发,生成大量冗余的宽表和聚合表。 应用指标中台后,所有的数据指标被对立治理,并造成指标体系,如根底指标、衍生指标等。如果不同的指标背地对应的数据模型是同一个,那么指标的加工和计算过程是能够复用的。如果是同一份数据按不同口径服务不同业务,则通过衍生指标灵便响应业务需要,既能满足业务多变的需要,又能防止数据冗余导致的宽表爆炸。 由此可见,在指标中台里“指标”成为数据和业务交互的主体,通过对“指标”的标准化,造成数据开发和治理的标准化。 下图展现的是某银行企业应用指标中台前的情况。银行业务人员须要对用户的消费行为进行剖析,从交付指标到取得相干数据,通常须要 12 个工作日甚至更长时间。数据开发效率低、需要交付周期极长。 咱们来看看该银行应用指标中台后的状况。如下图所示,指标中台容许非技术人员自助治理衍生指标,并通过拖拽现成指标的形式创立仪表板,端到端交付工夫缩小 50%,从需要到开发,流程轻松省时、企业人效大幅晋升。 4. 指标中台的能力 从技术角度来讲,指标中台的能力次要展示在四个方面。 指标目录:对立治理所有业务指标口径从数据湖的表开始定义指标,包含根底指标和衍生指标,并将所有指标治理在一个平台中,实现业务指标的对立治理。指标自动化:以指标治理数据,打消宽表操作依据指标定义的逻辑对底层数据进行加工、预计算,并依据指标所在的数据模型进行合并,打消宽表爆炸。若是指标很少被拜访或是不再被拜访,能够主动清理指标数据的预计算后果。此外,零碎也会智能地向用户举荐罕用的或关联度高的指标,晋升找指标的效率。指标治理:用指标治理指标,造成指标体系治理指标的目标是帮忙企业实现业务指标治理的目标,因而通过治理指标的形式治理指标,造成指标体系,可帮忙企业更好地达成指标。API 集成:构建数据利用,统一生产指标数据当指标和指标实现定义,零碎须要一个进口。通过规范的指标 API ,让用户轻松构建数据利用,为利用提供统一的数据起源,打消指标割裂和数据孤岛。5. Kyligence 指标中台产品实际Kyligence 基于指标中台实践经验和 OLAP 根底能力,上线了智能指标驱动的治理和决策平台 Kyligence Zen。在本次演讲中,李栋以批发订单剖析场景为例,演示了该产品的次要性能。 ...

July 20, 2022 · 1 min · jiezi

关于数据分析:京东物流-×-StarRocks-打造服务分析一体化平台Udata

作者:张栋,京东物流团体数据专家 京东团体 2007 年开始自建物流,2017 年 4 月正式成立京东物流团体,2021 年 5 月,京东物流于香港联交所主板上市。京东物流是中国当先的技术驱动的供应链解决方案及物流服务商,以“技术驱动,引领寰球高效流通和可继续倒退”为使命,致力于成为寰球最值得信赖的供应链基础设施服务商。 基于5G、人工智能、大数据、云计算及物联网等底层技术,京东物流曾经构建了一套全面的智能物流零碎,实现服务自动化、经营数字化及决策智能化。截至 2021 年 12 月 31 日,京东物流在全国共经营 43 座“亚洲一号”大型智能仓库。到 2021 年,京东物流曾经领有及正在申请的技术专利和计算机软件版权超过 5500 项。 京东物流在经营数字化及决策智能化过程中,实时化经营剖析的业务需要越来越多,原有平台架构中的数据孤岛、查问性能低、运维难度大、开发效率低等问题日益凸显。在此背景下,京东物流基于 StarRocks 的联邦查问计划打造了 Udata 对立查问引擎,高效解决了数据服务与数据分析的泛滥痛点,大大降低了开发运维老本,解决了查问引擎不对立和数据孤岛,让剖析和服务不再宰割。 原有数据利用的痛点数据服务与数据分析场景是数据利用的两个大方向,数据工作从业者有可能会遇到以下问题: 数据服务烟囱式开发模式:每来一个需要开发一个数据服务,数据服务无奈复用,难以平台化,技术上无奈积攒。 服务保护难度大:当开发了大量数据服务后,前期保护是大问题。尤其是 618、双 11 大促期间,在没有对立的运维监控、限流降级、业务容灾计划的状况下,一个人保护上百个数据服务是很苦楚的,也造成了很大的安全隐患。业务需求量大:数据开发的同学经常会被大量反复干燥的数据服务开发解放,大量工夫投入在业务数据服务开发中。数据分析找数据难:用户难以找到本人所想,即使找到名称相近的指标或数据,因为指标定义不明确、不对立,也无奈间接应用。用数据难:因为目前数据分布在各个系统中,用户无奈用一个零碎满足所有的数据需要。特地是一线经营人员,要通过从各个系统导出大量 Excel 表格的形式做数据分析,费时费力,同时也造成数据安全隐患。查问慢:用传统的 OLAP 引擎,用户跑 SQL 往往须要几分钟才出后果,大大降低了剖析人员的效率。查问引擎不对立:零碎可能有多种查问引擎组成,每一种查问引擎都有本人的 DSL,增大了用户的学习老本,同时须要跨多数据源查问也是一件很不不便的事。异构查问引擎带来的另一个问题是造成了数据孤岛,各零碎间的数据之间无奈互相关联。数据实时更新:传统离线T+1形式数据更新曾经无奈满足当今的实时化经营的业务诉求,这就要求零碎须要达到秒级别的提早。除了以上问题,数据服务和数据分析系统也无奈对立,剖析产生的数据后果往往是离线的,须要额定开发数据服务,无奈疾速转化为线上服务赋能内部零碎,使得剖析和服务之间难以疾速造成闭环。而且在以往数据加工过程中存储往往只思考了过后的需要,当后续需要场景扩大,最后的存储引擎可能不实用,导致一份数据针对不同的场景要存储到不同的存储引擎,带来数据一致性隐患和老本节约问题。 基于 StarRocks 的数据服务剖析一体化实际基于以上业务痛点,京东物流经营数据产品团队研发了服务剖析一体化平台——Udata,Udata 零碎是以 StarRocks 引擎为技术根底实现的。Udata 把数据指标生成的过程形象进去,用配置的形式低代码化生成数据服务,大大降低了开发复杂性和难度,让非研发同学也能够依据本人的需要配置和公布数据服务。指标的开发工夫由之前的一两天缩短为 30 分钟,大大解放了研发力。 平台化的指标管理体系和数据地图的性能,让用户更加直观和不便地查找与保护指标,同时也让指标复用变成可能。在数据分析方面,咱们用基于 StarRocks 的联邦查问计划打造了 Udata 对立查问引擎,解决了查问引擎不对立和数据孤岛问题。 同时 StarRocks 提供了强悍的数据查问性能,无论是大宽表还是多表关联查问性能都非常杰出。StarRocks 提供数据实时摄入的能力和多种实时数据模型,能够很好反对数据实时更新场景。Udata 零碎把剖析和服务联合在一起,让剖析和服务不再是宰割的两个过程,用户剖析出有价值的数据后能够立刻生成对应的数据服务,让服务剖析疾速闭环。 革新前的数据流程架构: 实时数据由 JDQ (京东日志音讯队列,相似 Apache Kafka)和 JMQ 导入 Apache Flink 做实时数据加工,加工后数据写入 ClickHouse 和 ElasticSearch,为数据服务和数据分析提供 OLAP 查问服务。离线数据由 Apache Spark 做个数仓层级加工,APP 层数据会同步至 MySQL 或 ClickHouse 做OLAP查问。此架构中,在数据服务和数据分析是两个分隔的局部,剖析工具因为要跨多数据源和不同的查询语言做数据分析比拟艰难的,数据服务也是烟囱式开发。 ...

July 20, 2022 · 3 min · jiezi

关于数据分析:思迈特软件Smartbi完成C轮融资新一代智能BI引领者倍受青睐

2022年7月20日,思迈特软件Smartbi发表实现C轮融资,持续领跑国内商业智能BI畛域,本轮融资由光大控股旗下广州光控穗港澳青年创业基金独家投资。本次融资将帮忙思迈特软件进一步扩充在商业智能BI畛域的当先劣势,着力晋升产品外围竞争力,增强渠道建设与生态单干。此前,思迈特软件曾先后取得来自价值资本、方广资本的A轮投资,高成资本、琥珀资本的B轮投资及明略科技的B+轮投资。 一、以客户为本,成为国内BI畛域的领跑者思迈特软件成立于2011年,是一家当先的商业智能BI和大数据分析产品服务商,致力于为企业客户提供一站式商业智能解决方案。产品矩阵笼罩传统BI、自助BI、智能BI三个不同的BI倒退阶段,满足客户在企业级报表、数据可视化剖析、自助摸索剖析、数据挖掘建模、AI 智能剖析等大数据分析需要,通过多年的我的项目教训积攒,造成各个行业的业务模板,帮忙企业降本增收和实现数据资产变现。 思迈特软件间断多年入选“Gartner加强剖析代表厂商”,并在2022年入选“ Gartner中国剖析平台代表性厂商”,作为纯BI工具畛域的惟一代表,间断多年上榜“Gartner中国AI守业公司代表厂商”;同时凭借在金融行业的技术积攒和行业实际,入选“IDC中国FinTech 50强”榜单;作为工信部“重点实验室成员单位”,思迈特软件牵头制订《商业智能与大数据分析软件个人规范》。迄今为止,思迈特软件已斩获国家、政府、行业、权威机构颁发的数百项资质荣誉,并胜利笼罩金融、制作、政府、教育、地产等行业畛域,为4000+头部客户提供数字化转型和降级服务,典型客户包含工信部、国家电网、华为、中国人民银行、万达团体、泰康团体等。 二、夯实产研技术,打造极致产品体验通过10余年的研发,思迈特软件的一站式大数据分析平台已历经屡次迭代。与上一轮融资相比,思迈特软件在产品层面的最大变动在于Smartbi V10.5版本的公布,新版本新增/优化了80+性能,不仅持续夯实数据模型、自助ETL等数据筹备性能,还新增了“对话式剖析”和“指标治理”两大亮点性能,同时还精密打磨“交互仪表盘”和“机器学习”等性能,大大提高了产品的易用性、好看性、安全性和智能性。 01 对话式剖析——剖析后果随思而行、即问即答Smartbi对话式剖析针对决策者、企业管理者,以业务思维和业务术语,在PC端和手机端通过自然语言输出的形式疾速展现出想要洞察的数据,实现剖析后果随思而行,即问即答! 对话式剖析是基于自然语言剖析(简称NLA)技术实现,NLA率先由思迈特软件提出,并取得多项国家发明专利。对话式剖析通过BI和NLA的创新性联合,极大升高了剖析门槛,让BI更加智能。 02 交互仪表盘——高度交互的可视化剖析Smartbi V10.5版本持续打磨交互仪表盘。通过新组件、新模板、精准布局、疾速计算、智能问答等新性能让仪表盘或大屏制作更好看更高效! 交互仪表盘通过全自助式可视化制作,所见即所得,同时提供海量炫酷好看的组件&大屏模板疾速复用,还能通过语音操控大屏,实现关上、切换参数等操作,彻底解放双手,让汇报工作更加智能便捷! 03 指标治理——打造自增长指标体系随着国家大数据策略与企业数字化转型的驱动,指标的作用越来越重要。Smartbi指标治理提供一站式指标治理服务,它通过一个平台笼罩了指标治理从定义、建模、调度、公布、展现的全过程,同时突破“业务提需要,IT做需要”传统模式,通过业务深度参加构建自增长数据指标体系,实现技术和业务的最佳协同,促成数据资产积淀。 04 机器学习—实现企业数据的预测性剖析 Smartbi提供数据挖掘性能,内置大量机器学习经典算法,一站式实现数据预处理、特色工程、模型训练、模型预测与评估,无效开掘企业大数据中隐含的、未知的、对决策有潜在价值的关系、模式和趋势,实现企业数据的预测性剖析!  数据挖掘能够通过拖拽的形式灵便地建设模型,还反对Auto ML,通过向导式配置可主动疾速生成试验,升高门槛;模型部署还反对并行计算,随时扩大,海量数据处理不是问题。  图:Auto ML向导式主动生成试验 三、开释数据新价值,欠缺BI生态赋能机制“企业数字化转型长路漫漫,市场竞争变动电闪雷鸣,打造大数据BI行业共享生态是咱们将来独特要走的路。”思迈特软件CEO吴华夫谈到。 思迈特软件在专一于产品研发的同时,也深信唯有良好的行业生态能力反对BI的久远倒退。思迈特软件的生态体系波及渠道生态、用户生态、可信生态三个模块。 在渠道生态方面,思迈特软件将进一步倒退产品交融搭档、区域搭档、专属行业搭档,在研发、商务、市场等多个畛域开展全面单干,通过渠道单干,全面晋升生态整体竞争力,为客户提供更全面、更优质的产品和服务。 在用户生态方面,思迈特软件上线了麦粉社区,为用户提供一个周到、及时的服务平台,也让思迈特软件更好地聆听用户的声音,打造更加合乎用户需要的产品。同时为了不便用户可能迅速上手应用Smartbi产品,思迈特软件倾力打造了BI学习平台—麦学堂,进一步升高BI学习门槛。 在可信生态方面,思迈特软件保持自主研发与翻新,致力晋升产品技术与服务质量,还助推BI国产化,与华为、阿里云、深服气、新华三、达梦、麒麟软件、人大金仓等信创合作伙伴通力合作,独特打造可信生态体系,独特为政企及信创八大行业的最终用户数字化转型保驾护航。除此之外,思迈特软件还踊跃践行着国家信创策略,未然成为我国信创产业的中坚力量,并在市场测验中取得高度肯定。咱们不仅成为国家工信部软件交融利用与测试验证重点实验室成员单位,还胜利入库信创产品资源池,入选广州市信创优良解决方案等等。 四、再获资本青眼,共赢BI市场春天广州光控穗港澳青年创业基金由光大控股联手多家广州金融平台于2020年发动设立,光大控股母基金团队负责投资治理,绕新一代信息技术、生产、医疗衰弱及先进制作畛域进行重点布局,反对穗港澳台青年守业。此次广州光控穗港澳青年创业基金布局应用软件国产代替畛域,投资思迈特软件,将全力支持思迈特软件进一步增强和扩充公司在智能BI方面当先的技术劣势,助力企业疾速成长,为中国企业数字化、智能化转型赋能。 光大控股母基金是光大控股旗下股权母基金管理机构,政府疏导基金市场化运作和翻新创投资源聚合平台。近年来,光大控股母基金业务持续增长,基金治理规模已超过200亿元人民币。依靠于光大控股业余跨境投资平台、弱小的资金实力与丰盛的资产治理教训,光大控股母基金参股红杉资本、经纬创投、高瓴资本、华登国内等出名管理机构设立的股权投资基金,对科美诊断(688468.SH)、微泰医疗(2235.HK)、京东物流(2618.HK)、瑞科生物(2179.HK)、上海微电子等高成长性企业进行间接投资,通过多策略、全方位的资产配置为投资人带来稳固可控的收益回报。 投资人点评:对于本轮投资,光大控股母基金董事总经理张琤指出,商业智能BI和大数据分析市场在政策利好下,将迎来两大重要时机——软件国产化、单干国际化,咱们动摇看好这个赛道的高成长性和微小后劲。思迈特软件的外围团队在企业数字化畛域有超过20年的研发教训,产品矩阵笼罩传统BI、自助BI、智能BI三个不同的BI倒退阶段,满足企业在不同场景下的BI需要。还服务了泛滥五百强企业,曾经成为国内BI畛域的领军企业。广州光控穗港澳青年创业基金投资思迈特软件,同时也是贯彻落实反对穗港澳青年守业的重要动作,咱们期待与思迈特软件携手,独特推动商业智能BI和大数据分析市场疾速倒退。 对于本轮融资的后续倒退策略,思迈特软件CEO吴华夫示意:“思迈特软件将持续投入到产品研发,将技术创新转化为产业降级动能,让BI真正实现‘普惠化’,并走向千行百业。”

July 20, 2022 · 1 min · jiezi

关于数据分析:NLA自然语言分析实现数据分析零门槛

在以后数字时代,常常会遇到这样难堪的状况:会数据分析的人不懂业务,而懂业务的人却不会数据分析。而NLA自然语言剖析的推出,将升高业务人员数据分析的门槛,只需动动嘴巴就能取得数据分析后果。 NLA自然语言剖析是什么?以前如同没有听过。NLA自然语言剖析是Smartbi近期提出的新概念。自然语言剖析(Natural Language Analysis, 简称NLA) ,是一种让人能够利用自然语言进行数据可视化剖析的技术,NLA将自然语言解决技术和商业智能畛域数据建模、数据可视化等技术联合在一起,从而实现利用自然语言进行商业剖析的目标。 NLA自然语言剖析让业务人员只需动动嘴皮子就能取得数据分析后果是怎么一回事呢?因为NLA自然语言剖析技术能够利用于Smartbi的对话式剖析、语音管制大屏、仪表盘-智能问答等性能上。Smartbi的对话式剖析让业务人员只需动动嘴巴就能取得数据分析后果变成事实。 置信业务人员都有这样的同感吧?我恨我不会数据分析,每次都要求IT小哥帮帮我,IT小哥说,你等我排个期。好不容易等到IT小哥有档期了。在跟IT小哥讲述业务需要的时候,感觉两个人不在一个频道,IT小哥get不到我的意思。这是业务人员做数据分析时的通病。往往一个数据分析需要的实现,破费最多工夫的不是取数、分析阶段,而是后期的需要沟通阶段。在这种模式下,业务的数据分析需要总是在无尽的排期和期待中。另外,业务部门详述其需要后,技术部门还须要评估计划,再安顿打算进行开发,再接着测试、公布上线。这个过程下来,工夫周期比拟长,无奈及时发现业务问题,辅助业务决策。 但采纳Smartbi NLA的对话式剖析当前,业务人员能够以业务的思维和术语通过自然语言输出问句,即可主动把数据查问进去,还能依据多轮对话摸索产生的起因,实现“想什么,问什么”、“问什么,显什么”的成果,让用户免去学习操作的过程,真正实现剖析零门槛,进步了剖析效率。通过这种形式,业务人员能够自助地去获取和剖析数据,可能及时无效地获取所需的信息,最大限度地利用这些信息,使数据真正服务于企业,让数据价值无效变现。 Smartbi NLA能够做到真正赋能公司外部整体业务人员,进步数据分析效率。

July 1, 2022 · 1 min · jiezi

关于数据分析:亿信华辰地产企业数字化转型想要把握时代机遇

随着近年物联网、人工智能、区块链等新技术的倒退,寰球数字化浪潮已催生出了数字 经济时代,而在房地产行业自进入白银时代以来,竞争日趋激烈,泛滥房地产企业都面 临着提质增效、转型改革的挑战,并开始思考如何在治理环节中使用数字化新技术晋升治理效益,而产业互联和智慧科技带来的降级迭代,给房地产企业提供了全新的倒退时机。 目前当先房地产企业曾经在积极探索数字化转型,通过在策略层面从新定位治理信息技术的价值,对组织架构、管理模式、工作形式、零碎平台等进行改革和翻新,构建新期间的企业外围竞争力,实现企业战略目标。可预感智慧化、数字化将成为房地产行业将来倒退重要方向。以后地产行业数字化转型窘境 地产行业的数字化转型,整体其实是落后于其余行业的。同时,房企之间的数字化程度,差距也很大。 1、数字化起步较晚、水平较低 作为典型的传统行业,地产重资源、重线下,其信息化倒退绝对较晚,信息系统建设绝对滞后。尽管通过十多年的演变,大部分企业的外围业务流程已根本实现线上化,但局部业务环节仍然存在手工账簿、线下数据,各个环节数据的流转同步不畅,整体还尚未达到“数据可用”的阶段。 同时因为后期不足统一规划,信息化零碎间数据未联通、数据口径不对立、数据填报品质差、零碎利用体验差。加之海量的无序数据沉积,数据收集整理工作量大,这些都给数据治理工作带来了不小的麻烦。 2、不足顶层设计,数据孤岛林立 目前,大多房企在之前治理及信息化建设中因为不足必要的顶层设计,没有做好相应布局,各个业务口独立设计,并未从企业层面横向拉通部门、拉通流程、拉通数据。 同时,地产的行业个性导致其比拟关注繁多我的项目经营,房企广泛以区域和分公司的模式来治理资源,最终导致信息化建设过程中造成了各种维度的数据孤岛。不同我的项目、不同部门、不同区域的治理需要、剖析需要、利用需要等各不相同,跨组织的数据融通较难,极大限度了企业级的资源优化。 3、企业高层对数字化了解和领导力有余 过来20多年,地产行业依附较低的数字化水平,实现了急速的倒退成长,也导致不少房企老板&高层未能及时意识到数字化转型的重要性和必要性,以致企业对数字化的投入有余、企业数字化气氛不够、数字化管理制度和流程不标准、业务部门领导对数字化的参加和领导力有余等问题,限度了房企数字化转型。 4、地产行业特殊性,齐全数字化难度大 地产行业有其本身的特殊性:条线多、周期长、资金大、协同多,十分重视线下的个体化服务,尤其是二手房畛域一繁多议的事实,表明整个行业的服务基本上还是以定制服务为主。 一方面这是一个家庭的大宗投资,不可能齐全依附互联网实现全副交易过程。无论是新房还是二手房,线下服务都是其中最重要的一个组成部分;另一方面,针对单个购房者提供的线下服务,是无比简单且无奈标准化的。想实现地产交易行为数字化,还须要思考到围绕地产交易所产生的服务的数字化,以及相应所有治理和业务模型的数字化,而这对于重视线下个性化服务的地产行业来说,正是难点所在。 企业数字化转型想要把握时代时机、制胜市场,须要思考几个层面的问题。 策略引领:企业需诊断以后业务模式并摸索将来的数字化倒退策略。地产商基于外部评估状况和内部状况,包含市场倒退、竞争对手动向、客户冀望、科技进步及政策变动,制订企业愿景和指标。确保数字化转型间接取得来自企业高层的反对,并从董事会层面制订。随后,明确定位数字化在企业指标中的角色,并设计数字化赋能的业务模式。 业务设计:面向数字化策略,企业需从“点-线-面”定义并整合业务体系,确定如何定位产品和服务,为客户提供何种价值主张,如何通过多渠道的客户互动提供个性化的解决方案。从业务单元和单个业务线“点”,需思考如何调整现有的业务,以夯实数据根底,并利用数据赋能;从业务线的协同“线”,需思考如何通过买通的数据和零碎进行更好的业务协同,发明新的价值;从打造生态体系的“面”,企业需思考面向客户提供如何的产品和服务组合,引入何种内部资源,并沟通各方利益,进行跨组织的调整,以造成生态闭环。 能力打造:基于业务设计,判断通过何种形式进行能力打造,是通过自建、寻找合作伙伴、还是收 购进行建设。依据所作出的决定,打造满足要求的经营体系和模式,设计可操作的业务流程。通过 肯定的制度建设确保经营体系和业务流程的持久性。 施行撑持:企业建设技术体系、人才体系和风控体系,并通过肯定的组织管控保障数字化转型的施行。从技术的角度,企业须要建设数据和零碎根底,并打造全面的框架,需涵盖数据、技术、接口的相关性和互联性,确保不同生态体系的协同配合。从人才的角度,搭建能够长期撑持数字化倒退的人才队伍,并通过凋谢、通明的沟通,建设数字文化和与数字化转型相匹配的麻利组织。从风控的角度,需建设欠缺的风控体系,以确保数据资产和客户隐衷的妥善保存,保障数字化零碎的稳固运行。从组织管控角度,需建设明确的管控流程,为数字化转型的设计和施行工作进行领导,例如建设数字化转型管控、投资和决策委员会,对公司的重大数字化投资进行决策和施行过程监督。 基于数字中台构建地产数字化解决方案 联合时代地产行业的现状,亿信华辰为其量身定制了一套残缺的线上数据管控体系,包含数据治理与数据资产治理两大版块,分阶段、有打算地推动团体数字化转型建设。整个我的项目分为五个阶段实现: 一:资产盘点、正文补充 实现团体多个零碎/模块中的原始数据资产盘点,从源零碎、数据平台、数据利用零碎等通过元数据、数据规范、数据模型等工具落地数据现状,通过数据品质管理工具实现数据品质评估和量化,理解团体目前总体数据规模和散布状况。同时,基于盘点后果,欠缺资产信息,查漏补缺实现正文补充,无效帮忙理解数据含意及资产业务意义。最终实现团体从不理解数据现状到理解数据现状的转变,为团体后续数据治理、资产治理、数据安全工作有序发展奠定了根底。 二:元数据管理 元数据管理次要分为三步走: 1、元数据模型设计,包含业务数据元数据、指标元数据、数据服务元数据、数据规范元数据、数据品质元数据、调度元数据等,为元数据采集提供执行范畴,为资产分类和数据安全的实现提前做好布局。 2、依据数据资产治理须要,制订元数据管理方法,包含元数据管理的制度、保护更新流程、岗位角色等,解决盘点和正文工作中发现的问题。数据库资源申请,需要变更对立走线上化流程,有迹可循。为将来团体信息化建设提供指引及标准,为资产自动化分类及资产共享打下良好基础。 3、依据元模型波及和数据资产治理平台产品需要,制订元数据采集和接入计划并落地施行。通过元数据管理,疾速理清了团体数据资源,不便理解数据的前因后果,构建数据地图,也为团体的数据规范建设和数据品质提供了根底撑持,从源头上保障了数据的高质量和完整性、可用性。 最终,实现了撑持团体各类外围业务零碎的元数据自动化采集,共波及多个零碎/模块,对应多个数据库以及工具。线上化、及时、全量的元数据查问,改善了因不欠缺的数据信息导致数据资产不可用的状况。信息部门也可对立在线上监控团体各零碎的数据资产信息的完整性,及时发现短少的信息并反馈给开发人员补充。同时团体跨部门、跨零碎的已开发数据信息也有对立平台可查问,缩小反复开发,晋升信息获取效率。 三:落地数据规范体系 建设数据规范体系,导入我的项目类、客户类、人员组织类、合作伙伴类(供应商)的数据规范近千条,根底类数据规范百余个;同时,实现了人力资源管理系统、EBS电子商务套件,财务管理的规范落地映射;并通过线下收集整理几百条我的项目数据主题质检规定,以及多条内部数据主题质检规定,实现质检规定平台落地。最终,通过规范的建设,保障了团体、各子公司数据的一致性、完整性、有效性、规范性、开放性和共享性治理,为数据质量检查和数据安全治理提供了规范根据。同时,也进步了数据精度和数据利用率,让数据在各业务场景均能实现更好地共享,施展更大的价值,以数据赋能业务,领导业务决策。 四:数据品质全流程搭建测试 实现从定义质检规定、到建设质检计划、到质检后果剖析、再到问题整改的数据品质治理全流程搭建测试,全流程全方位保障数据品质。最终,缩小了以往依附人工和零散的脚本校验数据品质的情况,大幅晋升数据品质管控效率。品质评估、质量检验、品质整改与品质报告等品质管理工作环节的全流程搭建整合也让团体造成了残缺的数据品质治理闭环。 五:构建数据资产治理平台和可视化大屏 打造数据资产治理平台门户,实现了数据分类自动化和数据资产可视化,制订了数据分类保护计划,保障分类的准确性和实时性。 思考到业务的认知和拓展性,亿信华辰从数据起源、团体智能全景、数据利用场景三个维度综合思考,构建了整套数据分类目录。同时对存量数据分类后,针对没有数据、数据量少的目录进行了合并、删除等调整工作,确保目录落地性强。针对有二义性的数据,依照板块、类型提炼了多种规定明确分类,为后续人工核检及日常保护提供执行根据。建设可视化大屏,将枯燥无味的数据转化成更加通俗易懂的图形语言,帮忙人们了解和消化,让企业数据资产全景展示更直观。其中,数据资产散布大屏面向管理层,可直观清晰地展示资产散布状况及数据现状;数据规模及经营监控大屏面向数据管理人员,让数据在各模块的运行状况高深莫测,实现他们对数仓运行状况及时监控。同时,落地数据安全分级管控,获取权限外数据须要通过审批前方可失去,在保障企业数据资产平安的同时,也使得数据资产的使用更加有章法,且有迹可循。 总结而言,地产行业进入转型期,企业或被动或被动地面临转变,有机会通过数字化、资本运作、进入衍生畛域等不同模式实现竞争劣势。而抉择数字化,须要企业明确商业模式的转变要求,同时在经营模式和组织管控上进行调整,以整合多方资源,久远布局,在充斥挑战的数字化之路上,摸索出适宜本人的倒退路线。 以上内容均来自《数据治理精选案例集》,局部目录如下,此书笼罩13个行业数据治理策略深度拆解,60+政企数据治理标杆案例,300+利用场景全面笼罩,1000+一线项目管理教训,助您破解数据治理难题。登录亿信华辰官网,增加客服企业微信,回复“案例集”即可收费支付纸质版。时代中国作为地产行业里绝对先锋和前沿的数字化践行企业,在亿信华辰的助力下,制订分步上线步骤,并联合大数据、数据治理、商业智能剖析等技术手段,搭建适宜本人的数字化转型路线,迈出了数字化转型的要害一步。

June 27, 2022 · 1 min · jiezi

关于数据分析:富集分析一概述

(全文约6600字) 1. 富集剖析1.1. 富集剖析概念富集剖析富集剖析,实质上是对数据的散布测验,如果散布集中在某个区域,则认为富集。 罕用的散布测验办法有卡方测验、Fisher准确测验以及KS测验等办法。 生物信息学畛域的富集剖析在 背景基因集(N) 下取得 一组特定基因集(S) ,S可能是基因列表,表白图谱,基因芯片等模式。在事后构建好基因正文数据库(例如GO,KEGG等)已对背景基因集(N)依据生物性能或过程进行分类的前提下,通过统计学算法找出有那些显著区别于背景基因集(N)的类别(生物组成/性能/过程),或者找出这组特定基因集间在生物组成/性能/过程的共性,通过聚类后去除冗余失去基因富集后果的过程,即为富集剖析。 罕用数据其中,背景基因集(N) 经常是一个物种的基因组正文基因总和。一组特定基因集(S) 经常是差别表白基因集(differentially expressed genes, DEGs)。事后构建好基因正文数据库罕用GO或KEGG数据库。常见的统计学算法包含ORA,FCS,PT,NT四种。理论利用通常会应用其余剖析的后果作为特定基因集(S),做基因富集剖析来查看这些基因集是否次要集中在某些类别,这些类别代表的性能是否与表型或者进化事件有关联。比方: 比拟转录组剖析失去的差别表白基因集;比拟基因组剖析中失去的某物种特有的基因集;基因家族膨胀扩张剖析失去的基因组中显著扩张/膨胀的基因集;基因组共线性剖析中在全基因组复制事件左近的Ks值的基因集等各种剖析失去的基因集;1.2. 富集剖析的算法富集剖析算法通过倒退,常见的有四类: <img src="https://www.sciengine.com/figures/figures-29603243e0234a3cb08e1f7155debca6-picobject1.png"/> <p align="center">Figure 1. 富集剖析四类算法图片起源:paper:Progress in Gene Functional Enrichment Analysis</p> 1.2.1. 过表白剖析(Over Representation Analysis, ORA)过表白剖析(ORA)概念过表白剖析(ORA)是对背景基因集(N)和特定基因集(S)依照已知的基因功能或通路等分组,并鉴定特定基因集(S)在哪些组蕴含比背景基因集(N)比例更多的基因(适度表白,over-represented,即富集enriched)或更少的基因(表白有余,under-represented)的一种统计学办法。 ORA是呈现最早,最罕用,有欠缺的统计学实践根底的办法。ORA重点在于通过基因集组成的比例来判断富集水平。 过表白剖析的散布测验ORA类办法用的是离散散布的测验(Fisher准确测验,根据超几何散布的原理)。 超几何散布有很多材料可参考,比方:https://www.jianshu.com/p/13f... 过表白剖析(ORA)的局限性ORA应用的统计办法(例如超几何散布,二项分布,卡方散布)只思考差异基因数量,疏忽了差别水平(不同表白程度),,须要人为设置阈值,没有一个设置规定,阈值设置有主观性。通过一刀切的人为规定的阈值,找出差别最显著的单个基因,而疏忽其余基因,比方差别小但变动方向统一的基因集,往往后者比前者更重要。利用的统计学假如每个基因互相独立,然而就生物体自身而言,疏忽了基因间外部的简单的相互作用,并且每个基因在不同的生物学过程中施展的作用大小不一样,等同对待后果可能会不精确。假如每条通路都独立其余通路。过表白剖析(ORA)的实际操作须要四组数据:背景基因集(N):经常是一个物种的基因组正文基因总和特定基因集(S):经常是差别表白基因集(differentially expressed genes, DEGs)背景基因集的分类信息:经常通过正文数据库(GO,KEGG等)和背景基因集取得特定基因集的分类信息:经常通过正文数据库(GO,KEGG等)和特定基因集取得通过四组数据取得基因数量的2×2列联表,再利用fisher准确测验或超几何散布失去p值。认为设置一个显著性阈值,高于阈值的即为富集基因。 1.2.2. 性能分类打分(Functional Class Scoring,FCS)1.2.2.1. 性能分类打分(FCS)性能分类打分(FCS)概念和改良性能分类打分(FCS)与ORA相比进行了根本假如的扭转,除了思考单个基因的显著变动外,还思考微效基因的叠加成果。 代表是基因集富集剖析(Gene Set Enrichment Analysis, GSEA) FCS剖析的三个步骤计算单个基因表白程度的统计值,采纳如掂量差异基因的ANOVA、Q-statistic、t测验、Z-score、信噪比,进行打分或排序,或者间接应用排序好的基因表白谱同一通路上所有基因的表白程度统计值进行整合,会集成单个通路程度的分数或统计值,采纳基因程度统计的和、均值或中位数,Wilcoxon rank sum, Maxmean statistic, Kolmogorov-Smirnov statistic对通路程度的显著性进行评估:利用重抽样(bootstrap)的统计学办法性能分类打分(FCS)的劣势(与ORA相比)不须要人为规定的阈值来一刀切显著性FCS思考同一通路中基因表白的协调变动,即思考微效基因的叠加成果。通过思考基因表白的协调变动,FCS 办法解释了通路中基因之间的依赖性性能分类打分(FCS)的限度与 ORA 相似,FCS 独立剖析每个通路。一个基因能够在多个通路中发挥作用,这意味着这些通路能够穿插和重叠。许多 FCS 办法应用基因表白的变动来对给定通路中的基因进行排序,并抛弃进一步剖析的变动。例如,假如通路中的两个基因 A 和 B 别离产生 2 倍和 20 倍的变动。只有它们与通路中的其余基因相比具备雷同的各自等级,大多数 FCS 办法都会平等地看待它们。1.2.2.2. 基因富集剖析(gene set enrichment analysis, GSEA)基因富集剖析(GSEA)是FCS算法中最罕用的一种。 ...

June 26, 2022 · 2 min · jiezi

关于数据分析:IDC亿信华辰位居中国数据治理解决方案市场份额第一

2022年6月17日,国内权威市场钻研公司IDC公布《中国数据治理市场份额,2021报告》,报告钻研了数据治理行业现状、数据治理市场格局等状况,给出了中国数据治理市场全景图。亿信华辰作为数据治理解决方案厂商,位居2021年中国数据治理解决方案市场份额第一。 报告认为,中国数据治理市场通过几十年的倒退,市场需求曾经产生了重大转变。过来是面向单个数仓或者BI进行数据治理,单个主数据管理、元数据管理、数据集成工具组件就能满足需要。明天,企业外部的数据架构越来越简单,要做好数据治理须要工程化的解决方案。 据IDC报告,中国数据治理解决方案市场2021年规模达26.6亿元,预计2022年的市场规模增长将远高于2021年的年度增长。亿信华辰为数据治理解决方案次要供应商,2021年市场份额位居第一。亿信华辰可能成为数据治理外围玩家,并且位居中国数据治理解决方案市场份额第一,到底凭什么?1、筑牢产品地基,提供强力撑持亿信华辰十年磨一剑,自主研发出国内少有的一体化数据治理平台——睿治,荣获DAMA数据治理优良产品奖、星河奖优良大数据产品奖等多个重磅奖项。睿治蕴含数据集成、数据交换、实时计算存储、主数据、数据规范、数据品质、元数据、数据资产、数据生命周期和数据安全十大产品模块,可依据用户的个性化需要,独立或任意组合应用,疾速满足各类不同的数据治理场景。充分考虑到数据治理高复杂性的特点,睿治数据治理平台一直交融AI新技术,力求通过智能化治理来简化数据治理施行过程,比方智能举荐映射规范、问题数据智能修复等,大大地解放技术人员,帮忙企业实现更高效的数据治理,远离“数据黑洞”。2、打造全域计划,提供个性化数据管理亿信华辰踊跃聚焦于如何将成熟的技术计划与企业理论状况联合,以元数据管理、主数据管理、数据品质治理、数据资产治理、数据共享替换等数据治理产品和解决方案,帮忙各行业客户建设智能化的数据治理体系,实现全流程环节的数据治理,激发数据因素后劲。基于我的项目积淀,亿信华辰重磅公布数据治理全域解决方案,蕴含大数据治理解决方案、大数据资产治理计划、主数据管理计划、数据标准化及品质管控计划、数据资产盘点计划、指标体系建设计划、数据仓库及商业智能解决方案、仓湖一体化大数据中心建设计划等,隔靴搔痒满足不同场景,推动政企数字化转型。【计划详情】3、一体化业余流程,创品质服务作为数据治理畛域的领航者,亿信华辰造成了一整套从战略规划,到组织流程,再到落地施行的数据治理方法论。通过欠缺的数据治理能力框架以及数据治理对立流程、数据治理成熟度评估模型等,为客户提供优质的过程领导,大大缩短交付周期。历时16年,亿信华辰打造大数据精锐团队,服务于11000多家客户,具备丰盛实践经验,深度理解数据治理的需要和重难点;提供从征询、施行、利用、运维的一体化服务,我的项目成功率远超同行。4、步履不停,为行业添砖加瓦亿信华辰不仅在数据治理产品研发上致力钻研,也踊跃推动产学研深度交融,退出中国信息通信研究院、大数据技术标准推动委员会、全国信标委大数据规范工作组等国家行业性组织,参加国家各类规范及行业白皮书的编制和探讨,已深度参加编撰《数据治理工具图谱钻研报告》、《数据资产治理实际白皮书》、《大数据标准化白皮书》等。亿信华辰在助推大数据及数据治理行业倒退方面步履不停,围绕行业峰会、常识手册及人才培养等多层次、多样化地为行业倒退添砖加瓦。间断3年举办数据治理峰会,搭建行业交流平台;基于方法论和实际,行业独家首发《数据治理常识图谱》、《数据治理精选案例集》等知识性书籍;成为DAMA数据管理常识体系培训基地,助力企业科技进步及人才培养。16年来,亿信华辰大数据业务布局覆盖全国,面向政企数字化转型,提供丰盛的产品、技术、服务全域解决方案。能够说,没有一个又一个我的项目的摸爬滚打,一个又一个场景的深刻开掘,天然也没磨砺不出明天亿信华辰的综合能力。亿信华辰基于体系化的数据治理产品、日益完善的方法论和最佳实际,将来将更动摇地助力政企用户在数字化转型的路上乘风破浪、踏数而行。

June 23, 2022 · 1 min · jiezi

关于数据分析:上数据驱动大局观安全感smardaten王任康三大热词谈无代码软件生态

由smardaten发动的专业知识分享栏目,旨在向行业传递和分享smardaten的前沿技术与最新动静,推动基于无代码的智能软件工程的全面落地。 2011年,硅谷驰名风险投资人Marc Andreessen提出:软件正在吞噬整个世界(Software is eating the world)。 十几年来,人们看到了软件驱动社会经济的改革成绩,也开始思考,软件的将来之路通向何处。 落到执行层,跟敲代码相比,尽快解决问题被列为优先级。企业数字化转型趋势、高端技术人才稀缺和降本增效需要增长的多重影响下,人们开始定义:软件的将来属于「无代码」。 那么,当咱们议论「无代码」的时候,咱们在谈些什么? 日前,数睿数据首席架构师王任康,以数据驱动、大局观、安全感为关键词,聊了聊无代码软件行业的现状。 以下为采访实录。 谈实质:「数据」定义软件 Q: 无代码和低代码的本质区别在哪里? 无代码跟低代码的外围区别是前端的人。 低代码的前端还是程序员,无代码却不是了。人的不同决定了组织构造的差别。以smardaten的软件工厂为例,它的组织分工曾经发生变化,前端大都是非计算机专业的产品经理,多数的技术精英负责算法,这使老本和治理形式产生扭转,也符合了数字化转型的实质,也就是人的数字化转型。 低代码之路肯定会越走越窄。在面对简单场景时,外表看低代码更灵便,但代码口子一开,代码越积越多,不仅架构会腐烂,还会造成低代码平台逐步被旁路直至沦亡。smardaten极致地谋求无码化是从久远倒退思考,反逼本人,让本人更弱小,能力有更大的生存空间。 从软件的状态来看,无代码不是零代码,咱们平台自身是代码开发,不论是通用组件还是畛域组件都须要代码开发,但软件拆卸过程是无码化的,最重要的是,生产的软件自身是无码化的,是一个数据包,而不是生成一堆代码,否则必然会走上低代码之路。 Q: 数据驱动跟无代码是“人造”联合在一起吗? 在我看来,两者是必然要联合在一起的。想要实现无代码,少不了数据思维。外围是通过无代码简便的开发模式,实现低代码能力开发进去的简单利用。 Q: 软件行业都在谈数据驱动,smardaten的特点在哪里? 国内大部分做无代码、低代码的公司,标榜本人能适应的畛域,以轻利用、快利用为主。但对于一些非常复杂的,不是表单加流程的业务场景,就没有方法了。 数据驱动自身,咱们定义的不仅是在软件的利用构建,这个仅停留在软件的开发阶段。咱们定义的数据驱动,对应的是软件工程全过程,从需要剖析、利用设计、利用构建到测试运维,是全生命周期。 咱们是把整个软件工程所有的过程数据、后果数据等,都作为数据进行积淀。再通过这些数据,利用AI的能力,构建知识库,自动化进行利用的全生命周期构建。 smardaten的数据驱动,加强了需要剖析的准确性,升高了设计门槛,减速了软件构建,晋升了交互界面配置的无代码化,也放慢了业务逻辑的开发效率。 数据驱动晋升了需要剖析的准确性。比方需要分析阶段的问卷、需要形容、性能需要、外围页面等等,这些都是数据。积淀后,在特定的阶段,能够间接应用,帮忙剖析人员疾速剖析,同步也升高了剖析人员行业背景常识、沟通技巧的门槛等,甚至能够跟客户间接开聊。 数据驱动软件构建,它有三个步骤。 第一个步骤是建模,畛域模型怎么建。实质上说是数据驱动,然而所有的软件底层都是数据模型。咱们底层也要建畛域模型,只不过咱们的建设,第一不是靠行业畛域的专家,也不是靠抽象的表单拖拽,而是把两者联合,通过业务人员拖出表单或者页面,而后做主动交融建模的算法。他只有关怀界面和逻辑,最初的模型咱们依照最优的建模思路去做优化调整,相当于通过表单驱动的模式配出来的利用,却具备模型驱动通过专家构建的底层模型。 咱们也能够利用样例数据或者说已有的业务数据,通过实体辨认的算法关系发现的算法,主动构建畛域模型。 第二个步骤,咱们通过积淀好的畛域模型数据,帮忙举荐出客户须要的模型。 第三个步骤,把模型做成知识库。客户提出他的需要,咱们会帮他主动生成甚至是跨畛域的模型。 数据怎么驱动交互界面配置的无代码? 业务的利用界面,传统上只能通过人去拖。在界面的配置下面,咱们也是同样分了三个阶段。 首先肯定是数据驱动。还没有积淀数据的时候,怎么让用户更好地驱动开发界面?咱们能够应用图像识别技术生成交互界面,或者一些需要形容的文档数据,通过自然语言解决,把它变成交互的界面。也能够通过剖析后期构建的畛域模型数据,主动生成界面等。 当我的项目有了肯定积攒,界面自身也会积淀数据,造成款式库、组件库,进而积淀为知识库,能够通过算法主动生成须要的交互界面。 数据驱动业务逻辑开发也是一样的思路。 smardaten使技术与业务得以拆散。通过数据定义业务,底层技术将业务转化成技术语言,相当于DSL。DSL与理论的技术又没有过密的关系,因为实质是数据定义,因而两者只是在经营阶段存在关系,也就是从紧耦合中把业务和技术形象进去。不会因为技术的升级换代而更改业务,也就能够防止使技术成为业务的累赘,实现业务的稳固与灵便,高速换胎得以实现。 Q: 数据驱动将数据表、实体关系、逻辑流程等都看作是数据。这个规范是数睿数据本人定义的,还是采纳晚期UML的规范,只是把它零代码化了? 是数睿数据本人定义的一套规范。 UML的形式太细,太繁琐,没有流行起来,是有起因的。数睿数据做企业级无代码平台,更多是将外围、罕用的货色做形象,颗粒度绝对粗一些,开箱即可用,不便开发人员疾速上手。 Q: 数睿数据在smardaten的开发中,是如何把多环节的逻辑、展示等高度形象为数字的?有成熟的方法论吗? 无代码并不代表所有的场景都能基于平台「天生」反对。 咱们的无代码是面向利用构建人员的无码化。 那碰到不满足的状况怎么办? 第一种状况,是看无奈满足的需要是否是通用场景,如果是,平台会做一个通用的模型。做完当前,用户不必写代码就能间接应用。 第二种,针对行业特定场景,通过二开以插件的形式去满足,就不须要做任何形象了,后盾通过Restful API满足,前台相似。 插件的话,咱们不会限度它的具体语言,JS、react-view等都能够,只有能实现要害的接口,比方数据接口、款式接口、交互等。 Q: 数据驱动对客户有什么显著的价值吗? 数睿数据的数据驱动对应的是整个软件工程的全过程,从需要剖析、利用详设、利用构建到测试运维,全生命周期都是通过数据进行驱动。 对于客户的价值也能够对应分为三个阶段。 首先是应用现有的数据,晋升开发效率。 第二阶段,是能够帮忙客户进行行业数据的积淀,包含软件数据、需要数据等等。软件工程全生命周期的数据积淀后,基于举荐算法能够半自动化生成利用,进而晋升效率和效力。 第三阶段,以知识库的模式,实现全自动。人参加的水平越来越低。 对于「大局观」、「安全感」的解读将在下期出现,不见不散。

June 14, 2022 · 1 min · jiezi

关于数据分析:两组数据量相对大时如何高效进行比对

前言前阵子我的项目因业务须要,要对接兄弟部门的用户数据,因为兄弟部门并不提供增量用户数据接口,每次只能从兄弟部门那边同步全量用户数据。全量的用户数据大略有几万条。因为是全量数据,因而咱们这边要做数据比对(注: 用户username是惟一),如果同步过去的数据,咱们这边没有,就要做插入操作,如果咱们这边曾经有,就要做更新操作。本文就来聊聊当数据量绝对大时,如何进行比照 比对逻辑因用户username是惟一的,因而咱们能够利用用户username来进行比对匹配 比对实现1、计划一:两层嵌套循环比对即: 将接口的全量数据和咱们数据库的全量数据进行循环比对 示例 @Override public void compareAndSave(List<User> users, List<MockUser> mockUsers) { List<User> addUsers = new ArrayList<>(); List<User> updateUsers = new ArrayList<>(); for (MockUser mockUser : mockUsers) { for (User user : users) { if(mockUser.getUsername().equals(user.getUsername())){ int id = user.getId(); BeanUtils.copyProperties(mockUser,user); user.setId(id); updateUsers.add(user); }else{ User newUser = new User(); BeanUtils.copyProperties(mockUser,newUser); addUsers.add(newUser); } } } }用这种办法,我在测试环境压了30万条数据,比对数据等了大略20分钟后,间接OOM 2、计划二:应用布隆过滤器即: 比对开始前,先将咱们这边的数据压入布隆过滤器,而后通过布隆过滤器来断定接口数据 示例 @Override public void compareAndSave(List<User> users,List<MockUser> mockUsers){ List<User> addUsers = new ArrayList<>(); List<User> updateUsers = new ArrayList<>(); BloomFilter<String> bloomFilter = getUserNameBloomFilter(users); for (MockUser mockUser : mockUsers) { boolean isExist = bloomFilter.mightContain(mockUser.getUsername()); //更新 if(isExist){ User user = originUserMap.get(mockUser.getUsername()); int id = user.getId(); BeanUtils.copyProperties(mockUser,user); user.setId(id); updateUsers.add(user); }else{ User user = new User(); BeanUtils.copyProperties(mockUser,user); addUsers.add(user); } } }用这种办法,我在测试环境压了30万条数据,比对耗时1秒左右 ...

June 14, 2022 · 1 min · jiezi

关于数据分析:智慧之城如何构建数据根基打造数据治理新样本亿信华辰

看这座“智慧之城”如何构建数据根基,打造数据治理新样本自国家发改委将河北A市纳入国家数字经济翻新倒退试验布局以来,A市着力强化数字经济翻新因素的高效配置,放慢推动新一代信息技术的交融利用,着力进步数字化治理程度,实现城市治理网络化、数字化、智能化,确保从源头上防止零碎壁垒、数据孤岛。 一座“智慧之城”正在悄悄崛起,而智慧的前提,离不开数据治理。数据治理,迎难而上 建设智慧城市、发展数据治理,是社会治理现代化的重要内容和主观要求,政务数据治理也是政务大数据利用中的关键环节和技术保障。近年来,A市踊跃进行数字化建设, 打造数字经济倒退治理体系,但倒退过程中不可避免地遇到了数据管理存在的一些问题。 1、一数多源在数据共享时呈现一数多源的状况,从而导致有需要的单位或部门,无奈很好的定位获取数据源。 2、短少根底、主题目录短少人口、法人等根底目录,并无奈直观地定位到某一类主题或畛域内进行数据资源的检索。 3、数据元不规范各零碎代码各自不同,造成零碎间信息无奈间接关联和共享,减少信息替换和辨认难度。 面对这些问题,A市有着强烈的数据治理需要,心愿推动政府数据的互联凋谢共享,放慢政府信息资源整合,打消信息孤岛,进步政府决策的精准度和智能化程度,改善政府服务质量。 技术+业务,并行不悖 针对上述痛点和冀望,A市急需打造数据治理平台,实现整座城市的数据的汇聚、治理、共享、替换及开发利用;并使用大数据、通过数据赋能,晋升城市的现代化治理程度。 技术架构 此我的项目总体将散布在各委办局业务零碎中的数据抽取集成到云上,通过设计良好的数据架构、良好的ETL解决能力、作业调度以及正当的数据治理体系,晋升云上数据综合治理的能力,可能更好地满足城市计算引擎高效应用数据的要求,短期实现通过良好的数据化治理能力撑持危险业务的发展,长期实现以城市计算引擎撑持的智慧政务治理的长远目标。△A市数据治理平台数据架构 设计数据分层架构:包含模型标准、数据存储策略、数据流向等,正当加工、存储、治理和应用数据; 设计ETL架构:设计ETL开发标准;通过ETL工具和数据加工解决工作将散布在各委办局业务零碎中的数据荡涤转换并存储到云上进行集中管理; 设计作业调度架构:通过作业调度设计,实现从各业务零碎数据到云上集中数据存储区的数据抽取加工; 设计云上的数据治理体系:笼罩数据治理框架、数据规范、数据品质、元数据等建设内容;通过数据治理工作,将云上集成的各委办局数据进行规范化治理,为城市计算引擎提供良好、易用、精确的数据。△A市数据治理平台施行路线图 业务赋能 A市搭建数据治理平台,切实施展了三大作用:一是作为信息化平台数据层,服务所有业务零碎,撑持所有政府利用在块数据平台上成长、倒退;二是确定对立的数据规范和数据资源目录,保证数据的资产化以及数据的可流动、可替换、可共享; 三是实现政务数据的交融与治理,为智慧城市利用提供撑持。 1、构建全量数据资源目录:以构建A市通明的全量数据资源目录为指标,梳理新区数据资源,造成统一标准、对立治理和对立服务的数据资源目录体系。 2、高铁站数据治理:通过建设高铁枢纽大数据平台实现A市高铁站综合交通枢纽的市政通廊、交通场站、商业区、设施区等所产生的全域数据的规范化、常态化采集与汇聚治理,反对数据资源全生命周期的存储与经营治理。建设体系化、标准化的数据共享替换服务,具备与数据平台、该市高铁站相干业务信息系统及铁路部门相干业务信息平台的数据共享替换能力,晋升数据撑持能力和数据服务能力,打造对立的高铁枢纽数据基底。 3、绿博园数据治理:通过汇聚、交融A市东部展园区域环境数据、各业务零碎数据和AI赋能,并基于园区区域的海量时空数据,搭建一体化、并行化的高效的时空数据挖掘模型,获取暗藏在时空大数据下的常识,为园区的治理问题提供一站式政务服务解决方案,为园区管控平台、智能管理体系、智能服务体系、智能营销体系等相干利用零碎提供数据撑持和AI赋能。 正是做好了数据治理的撑持工作,A市将来可进行跨部门、跨畛域、跨区域的即时数据处理和数据交融利用翻新。当然这个成绩得益于亿信华辰睿治数据治理平台的助力,其元数据管理、数据规范治理、数据品质治理、数据集成治理、主数据管理、数据交换治理、实时大数据管理、数据资产治理、数据安全治理、数据生命周期治理十大产品模块,买通数据治理全过程,帮忙客户建设起合乎本身特色的数据架构和数据治理体系,构建扎实的数据根基,赋能业务利用场景,实现数字化转型。

June 12, 2022 · 1 min · jiezi

关于数据分析:数据分析实战训练营8期拉钩教育

download:数据分析实战训练营8期-拉钩教育ArrayList 的工作原理ArrayList has 是一个外部的一般数组,它充当数据存储。在大多数情况下,咱们不指定列表的确切大小。然而外部数组必须有一些大小!它的确如此。 它的默认大小是 10 。 public static void main(String[] args) { ArrayList<Car> cars = new ArrayList<>();}复制代码首先,让咱们看看增加新元素是什么样的。首要任务是查看 外部数组在外部数组中是否有足够的空间, 以及是否可能再放一个元素。如果有空间,则将新元素增加到列表的开端。当咱们说“到最初”时,咱们并不是指数组中的最初一个地位(那会很奇怪)。咱们指的是最初一个以后元素之后的地位。它的索引将是 cars.size() 。咱们的列表目前是空的 ( cars.size() == 0 )。因此,新元素将被增加到地位 0。 ArrayList<Car> cars = new ArrayList<>();Car ferrari = new Car("Ferrari 360 Spider");cars.add(ferrari);复制代码这很明显。如果咱们在两头插入会发生什么,即在其余元素之间? public static void main(String[] args) { ArrayList<Car> cars = new ArrayList<>(); Car ferrari = new Car("Ferrari 360 Spider"); Car bugatti = new Car("Bugatti Veyron"); Car lambo = new Car("Lamborghini Diablo"); Car ford = new Car("Ford Modneo"); ...

June 9, 2022 · 1 min · jiezi

关于数据分析:2022爱分析-隐私计算厂商全景报告-爱分析报告

报告编委 张扬 爱剖析 合伙人&首席分析师 洪逸群 爱剖析 高级分析师 孟晨静 爱剖析 分析师 目录 1.钻研范畴定义 \2. 厂商全景地图 \3. 市场定义与厂商评估 \4. 入选厂商列表 1. 钻研范畴定义 钻研范畴 隐衷计算,又称隐衷爱护计算(Privacy-Preserving Computation),是指基于一套交融密码学、信息论、分布式计算、平安硬件、数据迷信等多学科技术,能对处于加密或非通明状态的数据进行计算的技术体系。常见隐衷计算技术包含了多方平安计算、联邦学习、可信执行环境、同态加密、差分隐衷等,通过利用隐衷计算技术,企业用户能在提供数据隐衷爱护的前提下,实现数据在流通共享中的“可用不可见”。 在本报告中,爱剖析将隐衷计算市场分为应用层、平台层和算力层。其中,应用层是指针对金融、政务、医疗、批发、电信、交通等各行业业务场景提供的蕴含隐衷计算产品和服务的利用解决方案;平台层是指用于撑持构建利用解决方案的平台型产品,即隐衷计算平台;算力层是指针对隐衷计算性能晋升提供的各类算力解决方案,包含算法优化、硬件加速等。 综合思考企业关注度、行业落地停顿等因素,爱剖析在本次钻研中选取了应用层的金融隐衷计算解决方案、政府与公共服务隐衷计算解决方案、医疗隐衷计算解决方案,以及平台层的隐衷计算平台,共4个特定市场,进行重点钻研。 本报告面向企业和政务机构决策层,以及大数据与人工智能部门、科技翻新部门、各业务部门负责人,通过对各特定市场的需要定义和代表厂商的能力解读,为各行业企业和政务机构的隐衷计算利用布局与厂商选型提供参考。 图 1: 隐衷计算市场全景地图 厂商入选规范 本次入选报告的厂商需同时合乎以下条件: 厂商的产品服务满足各市场定义的厂商能力要求;近一年厂商具备肯定数量以上的付费客户(参考第3章各市场定义局部);近一年厂商在特定市场的支出达到指标要求(参考第3章各市场定义局部)。2.厂商全景地图 爱剖析基于对甲方企业和典型厂商的调研以及桌面钻研,遴选出在隐衷计算市场中具备成熟解决方案和落地能力的入选厂商。 3. 市场定义与厂商评估 爱剖析对本次隐衷计算我的项目重点钻研的特定市场定义如下。同时,针对参加此次报告的局部代表厂商,爱剖析撰写了厂商能力评估。 3.1 金融隐衷计算解决方案 定义: 金融隐衷计算解决方案是指面向银行、保险、证券等金融机构的数据流通场景,实现用户数据可用不可见的隐衷计算产品和服务,次要利用于精准营销、联结风控、反欺诈、合规认证、金融监管等场景。 终端用户: 银行、保险、证券等金融机构的大数据部门,科技翻新部门,风控、营销、信贷、信用卡核心、资管等业务部门 外围需要: 随着银行等金融机构全面拥抱互联网和数字化转型,数据曾经成为撑持其产品服务翻新的外围因素。只管凭借宽泛的客户根底,金融机构曾经积攒了海量的用户数据,但这些数据往往存在数据维度繁多的问题。为了提供更精准、更多元的金融产品和服务,金融机构须要从内部引入更多的用户行为、场景等数据,从而丰盛数据维度,延长利用场景。以往受政策、观点、技术等因素限度,机构之间的数据安全共享难以冲破,而隐衷计算技术可能在保障数据隐衷的前提下,实现数据在机构间平安地流通、共享和利用,正被金融机构宽泛关注并开始采纳。金融机构对隐衷计算解决方案的外围需要包含: 能在类型多样,且个性化程度较高的场景中利用隐衷计算技术。金融畛域数据类型丰盛,相应地,隐衷计算的利用场景也十分多样,并且每家金融机构对于隐衷计算利用都存在肯定的个性化需要,因而金融机构须要利用多种隐衷计算技术,并能以灵便的形式对不同技术计划进行交融。此外,在一些罕用场景,如匿踪查问、隐衷求交中还须要能疾速应用标准化的解决方案。在对实时性要求较高的场景中具备较强的端到端性能。金融机构的一些业务场景,如信贷审批、交易监控等,须要以很低的时延取得计算结果,以保障客户服务品质,并疾速辨认危险、升高损失。因而,在此类实时场景中,金融机构须要隐衷计算解决方案具备较强的端到端性能。通过引入第三方数据源和业余机构的建模咨询服务,在特定场景中晋升模型成果。金融机构利用隐衷计算的基本在于晋升产品服务的业务收益,而实现这一指标的要害是在业务场景中构建更无效的模型,因而,金融机构一方面须要引入适合的第三方数据,丰盛样本数据的数据维度,另一方面须要引入业余机构的建模咨询服务,在数据、算法的抉择、模型训练、隐衷计算工具应用等方面提供业余的领导,从而晋升模型成果。隐衷计算解决方案能以较低的老本进行疾速部署和与原系统集成。一方面,金融机构心愿隐衷计算利用能疾速落地并产生成果,因而须要解决方案能以便捷和疾速的形式进行部署;另一方面,金融机构通常曾经建设了较简单的业务和IT零碎,因而须要隐衷计算解决方案能在对原零碎革新尽量小的前提下,与原系统集成。满足平安合规要求。金融数据的敏感性,加上监管机构对于金融数据安全的多重要求,使得金融机构对于隐衷计算解决方案在数据安全爱护、零碎环境、计算流程的可解释性等方面有较高的安全性要求,并要求供应商的产品通过权威测评机构的平安规范测评。厂商能力要求: 具备多方平安计算、联邦学习等多种隐衷计算技术能力,并能以较灵便的形式为用户提供服务。一方面,厂商须要提供丰盛的加密算法的算子库和联邦学习算法组件,容许用户自定义组合实现针对特定利用场景的隐衷计算利用,兼顾安全性、性能、精度的不同需要。另一方面,厂商须要提供可间接调用的匿踪查问、隐衷求交等利用解决方案,满足金融用户在跨机构数据合作中宽泛的数据对齐、ID交融的需要。在实时业务场景中晋升端到端的性能。因为在实时计算中网络提早是目前会影响端到端性能的次要因素,因而厂商须要着重对通信效率进行优化,如通过优化流程编排、任务调度,进步算子并行度等形式晋升多节点间的通信效率,从而晋升性能。可能链接较丰盛的第三方数据资源。厂商须要建设较宽泛的数据资源生态,具备运营商、领取、互联网、政务等畛域的数据资源链接能力,为金融机构提供更多的用户行为、场景等数据。此外,厂商还须要与其它厂商建设互通互联协定,不便金融机构跨平台调用第三方数据。提供业余的建模咨询服务。厂商相干团队须要具备金融畛域丰盛的从业教训,可能为金融机构在模型构建中提供罕用的算法,并在数据、算法的抉择、模型训练、隐衷计算工具应用等方面提供业余倡议,为金融机构实现更好的模型成果。能疾速部署和集成隐衷计算解决方案。在解决方案部署方面,厂商须要提供麻利化的部署和交付形式,如平台采纳云原生架构,反对容器化的交付形式;以SDK或API的形式提供隐衷计算能力,反对用户疾速构建隐衷计算利用;在与原系统集成方面,厂商须要提供组件化和接口化服务撑持金融机构在隐衷计算平台与原零碎之间做数据与模型的传输与对接,缩小对原零碎的革新。隐衷计算解决方案具备较高的安全性。厂商须要通过提供欠缺的数据加密技术、欠缺平台零碎的安全性设计等形式进步解决方案的安全性;并须要反对算法流程可视化,以及反对接入第三方流量审计工具对数据用处进行验证等形式进步解决方案的可解释性和可信度。同时,厂商的产品需取得权威测评机构的平安规范测试。入选规范: 1.合乎金融隐衷计算解决方案的厂商能力要求; 2.近一年在该市场服务客户数3家以上; 3.近一年该市场相干服务收入规模在200万元以上。 代表厂商评估: (注:以下代表厂商评估均按厂商简称首字音序排序) 洞见科技厂商介绍: 洞见科技是由中国最大的信用产业团体“中诚信”孵化、网信事业国家队“中电科”投资的当先的专精型隐衷计算技术服务商,专一于为政务、金融、通信等行业客户提供隐衷计算技术平台建设以及面向场景的数据智能服务。公司核心成员来自中诚信、大型银行、保险公司以及人工智能企业,具备丰盛的行业常识和服务教训。 产品服务介绍: 洞见科技的外围软件产品洞见数智联邦平台(InsightOne)是其自主研发的金融级隐衷计算平台,领有面向场景的“MPC+FL”交融引擎、可监管的分布式信赖架构、全计算链路隐衷平安爱护、深刻场景的专业化算法、无可信第三方联邦学习、区块链增信隐衷计算、多方平安图计算与图联邦学习、跨平台互联互通容器等核心技术。通过匿踪查问、隐衷求交、汇合运算、联结统计与联结建模等性能矩阵的构建,为用户提供信贷风控、精准营销、保险精算、资管评级、债指编制等金融场景应用服务。此外,在InsightOne软件服务根底上,洞见还研发了交融计算、网络、存储等硬件资源的隐衷计算高性能信创一体机产品InsightStation,可能满足金融与政企客户自主可控、开箱即用的需要。 厂商评估: 洞见科技的隐衷计算产品与服务在平台的通用性与安全性、面向金融行业用户的场景服务能力、对金融机构业务成果晋升水平,以及跨平台协同等方面具备劣势。 洞见科技的隐衷计算平台InsightOne具备较高的通用性与灵活性。InsightOne平台采纳面向计算场景的交融引擎架构,将多方平安计算、联邦学习等算法拆分为细化的算子,并联合差分隐衷、同态加密、零常识证实等技术,用户能够依据需要对底层的算子进行灵便组合,交融多种技术并舍短取长,造成针对特定需要的计算过程,从而满足客户在不同计算场景中对于性能、性能、平安、计算精度等方面不同的需要。 针对金融行业用户的需要,洞见科技具备包含数据链接和业务建模在内的场景服务能力。对于有多方数据交融利用需要的用户,洞见科技在政府、运营商、电力、互联网、征信等大量合规数据领有方部署了隐衷计算节点,具备较丰盛的数据资源链接能力,联合隐衷计算技术,可能为上游的金融行业用户继续赋能。同时,洞见科技基于其长期在金融畛域的技术和服务积攒,也为用户提供业务建模与咨询服务,在其InsightOne平台上内置了几十种银行、保险、证券、资管等行业罕用的算法,能更好地供场景利用建模应用。例如,洞见科技为渤海银行搭建隐衷计算平台,并基于平台能力更平安地将行内信用卡用户体现数据与内部运营商、电商等多方数据联结,发展信用卡账单分期营销模型构建,服务于行方差异化营销策略制订,晋升用户体验。 InsightOne平台能在对金融机构原有零碎很小革新的状况下良好兼容用户原有的技术栈。一方面,通过分布式引擎将隐衷计算算法模型与金融机构原有的风控、营销等业务场景模型做了深度优化与交融;另一方面,通过组件化和接口化服务,在隐衷计算平台与用户原有各类零碎之间做数据与模型的传输与对接。因而,InsightOne平台能在不扭转用户原有零碎应用习惯的根底上,最大水平地兼容不同技术栈。 洞见科技也积极探索跨平台互联互通能力。在技术创新方面,洞见科技研发了“资源容器+算法容器+原语容器”的三层容器技术,即为客户提供一个像“插线板”一样的隐衷计算底座,实现不同厂商的算法插件的兼容和互通,突破了不同隐衷计算厂商的“计算孤岛”;在规范制订方面,洞见科技踊跃牵头和参加了IEEE、CCSA、TC601、TC260等机构制订的隐衷计算跨平台互联互通系列技术标准;在利用实际方面,洞见科技与蚂蚁团体、锘崴科技实现了业界首次多方异构隐衷计算平台之间齐全对等的算法协定互通,还在招商银行总行的牵头下,落地了国内首个大型股份制商业银行互联互通平台建设。 在产品安全性方面,InsightOne平台通过了中国信通院多方平安计算和联邦学习性能、性能、平安、区块链辅助等隐衷计算全系列产品测评,以及国家金融科技测评核心多方平安计算和联邦学习金融利用双项评测。其独立自研的无可信第三方联邦计算框架,通过对等网络之间的交互学习和分布式学习,解决了开源联邦计算框架中存在的依赖第三方参数算子和密钥散发等危险问题。 典型客户: 招商银行、北京银行、华夏银行、渤海银行、中国人寿 ...

June 9, 2022 · 2 min · jiezi

关于数据分析:几种常见采样方法及原理

原文地址 mp.weixin.qq.com不均衡数据集是指类别散布重大偏斜的数据集,例如少数类与少数类的样本比例为 1:100 或 1:1000。 训练集中的这种偏差会影响许多机器学习算法,甚至导致齐全疏忽少数类,容易导致模型过拟合,泛化能力差。 所以,针对类别散布不平衡的数据集,个别会采取采样的形式,使得类别散布绝对平衡,晋升模型泛化能力。 上面介绍几种常见的采样办法及其原理,均是基于imbalanced-learn的实现: 1、奢侈随机采样随机采样: 随机过采样:从少数类中随机抉择示例,并进行替换,而后将它们增加到训练数据集中;随机欠采样:从少数类中随机抉择示例,并将它们从训练数据集中删除;奢侈重采样,对数据没有任何假如,也没有应用启发式办法。所以,易于实现且执行速度快,这对于十分大和简单的数据集来说是ok的。 需注意的是,对类散布的更改仅实用于训练数据集,目标是优化模型的拟合;重采样不适用于评估模型性能的测试集。 2、随机过采样这种技术对于受偏态散布影响并且给定类的多个反复示例会影响模型拟合的机器学习算法十分无效。 这可能包含迭代学习系数的算法,例如应用随机梯度降落的人工神经网络,它还可能影响寻求数据良好拆分的模型,例如反对向量机和决策树。 调整指标类散布可能很有用,但在某些状况下,为重大不均衡的数据集寻求均衡散布(因为它会准确复制少数类示例),可能会导致受影响的算法适度拟合少数类,从而导致泛化误差减少。最好在过采样后监控训练和测试数据集的性能,并将后果与原始数据集上的雷同算法进行比拟。 # define oversampling strategy oversample = RandomOverSampler(sampling_strategy='minority') 指定一个浮点值,指定转换数据集中少数类与少数类示例的比率。比方,对于二元分类问题,假如对少数类进行过采样,以使大多数类的示例数量缩小一半,如果少数类有 1,000 个示例,而少数类有 100 个,则转换后的数据集将有 500 个少数类的示例。 # define oversampling strategy oversample = RandomOverSampler(sampling_strategy=0.5) # fit and apply the transform X_over, y_over = oversample.fit_resample(X, y) 残缺示例:应用3个反复的 10 折穿插验证进行评估,并在每1折内别离对训练数据集执行过采样 # example of evaluating a decision tree with random oversamplingfrom numpy import mean from sklearn.datasets import make_classification from sklearn.model_selection import cross_val_score from sklearn.model_selection import RepeatedStratifiedKFold from sklearn.tree import DecisionTreeClassifier from imblearn.pipeline import Pipeline from imblearn.over_sampling import RandomOverSampler # define dataset X, y = make_classification(n_samples=10000, weights=[0.99], flip_y=0) # define pipeline steps = [('over', RandomOverSampler()), ('model', DecisionTreeClassifier())] pipeline = Pipeline(steps=steps) # evaluate pipeline cv = RepeatedStratifiedKFold(n_splits=10, n_repeats=3, random_state=1) scores = cross_val_score(pipeline, X, y, scoring='f1_micro', cv=cv, n_jobs=-1) score = mean(scores) print('F1 Score: %.3f' % score) 3、随机欠采样随机欠采样波及从少数类中随机抉择示例,并从训练集中删除。 ...

June 9, 2022 · 6 min · jiezi

关于数据分析:如何做一个老板都在夸的数据可视化设计这些原则不能错过

不论是互联网、传统产业、经济、卫生、服务等各个领域,数据可视化都扮演着重要的角色。 通过可视化的形式显示数据,能够更好地了解信息。要从大量的材料和材料中找到关联并不容易,但图片和图表却能在短短几秒钟之内提供相干的资讯。一眼就能看到,并能提供所须要的材料。 数据可视化那么好用,那如何做一个老板都忍不住夸夸的数据可视化设计? 这些准则可少不了。 1、显示必要的数据 读者只能通过浏览材料来了解你想要传播的观点、论点或故事。然而,这并不是说你要把所有的材料都显示进去,而是要强调那些对于表白观点来说很重要的材料。对于图表设计师来说,最大的挑战就是要确定要展现多少数据,并且如何最好地显示这些数据。 上面的图片是Smartbi银行大屏中的区域新不良率散布状况。该图中的点位为新不良余额和新不良率。留神,图表中没有任何货色,只有新不良数据。没有国家边界,没有路线,没有城市标记,没有湖,没有河流,然而,读者还是能辨认出是中国。 咱们不用总是把所有材料都显示进去。有时,如果一个图表显示了太多的数据,那么就很难判断哪个是最重要的。 2、所有从简 数据可视化是为了告诉使用者,而不是为了让使用者承受多余的资讯。咱们要把重点放在视觉核心,把那些繁冗、系统的资讯变成容易了解、有意义的资讯。请牢记,越是简洁的语言,使用者就会更容易了解。应用太多的因素可视化实际上会毁坏最终的后果,并且会导致数据的偏差。数据可视化的劣势在于提供大量的数据。如果你的视觉效果很差,你就得回头看看你的数据显示方式是不正确的,还是含有过多的信息。 3、应用适合的工具 在制作图形时,有很多工具能够应用。重要的是依据你想要表白的内容,找到最合适的工具用来制作可视化的图形。 思迈特公司通过十余年的倒退,目前己处于国内领先地位,Smartbi产品在金融与电信(银行、保险、证券、电信)、能源与制造业(电力、汽车、制药等)、政府及公共事业单位(教育、税务、工商、财政、气象、卫生、疆土、社保等)和商业与地产(航空、领取、传媒、物流、批发、地产等)泛滥行业取得4000多家当先客户认可。在国内排名前10的银行,有9家抉择了Smartbi。产品广泛应用于领导驾驶舱、KPI监控看板、财务剖析、销售剖析、市场剖析、生产剖析、供应链剖析、危险剖析、品质剖析、客户细分、精准营销等治理畛域。

June 2, 2022 · 1 min · jiezi

关于数据分析:NLA自然语言分析让数据分析更智能

近些年来,随着技术的久远倒退,泛滥企业面临转型,企业对 BI的需要越来越大,越来越多地采纳了更灵便、更智能的 BI工具,以缩小剖析的难度,并可能迅速地进行数据分析与钻研。NLA自然语言剖析便是适应数据分析大环境而诞生的一项性能,为用户提供更加智能便捷的数据分析。 在大数据时代到来的明天,如何无效地利用信息资源显得尤为重要。在传统的利用中,数据往往被贮存在一个数据库中,而无关的人则须要编写一个查问语句来进行数据的查问。然而,因为数据的检索办法不不便,特地是在没有相干材料的状况下,很难进行查问。 NLA自然语言剖析是由思迈特软件Smartbi推出的一项符合智能BI的新性能,随着V10.5版本公布,并且取得了多项专栏。在产品能力上, Smartbi与企业理论状况密切相关,不断改进其产品的性能,从数据加强、数据挖掘、建模、自然语言剖析等多个方面,为客户提供全方位、全方位的大数据分析服务,为用户解决数据分析难题。 Smartbi自然语言解析技术的创造使数据检索在自然语言根底上得以实现。只有在语音或键盘上输出一条信息后,“AI智能小麦”就会将输出的自然语言转换成一种语言的元模型,而后利用麦田的常识提取算法,将其转换成一种能够被机器了解的语言。最初,利用 Smartbi预设的查问引擎与绘图引擎,可能迅速、准确地查找出使用者所需的查问后果,并能主动产生图形输入,并将查问后果与 Smartbi联合起来,并进行进一步的剖析。与传统的数据检索办法相比,采纳自然语言进行数据检索更加不便、快捷。 在技术创新上, Smartbi始终当先于业界,开发了 NLA自然语言剖析零碎,并引入了自然语言查问、常识图谱、举荐算法以及机器问答等人工智能技术,使其更智能、更易于应用。 Smartbi一直强化数据建模能力,将业务知识与数据模型相分割,将数据模型与指标治理相结合,既能够缩小建模费用,又能够与反馈机制相结合,造成闭环,从而进步了查问的精确性。 对话式剖析性能的推出,能够让使用者从商业角度思考问题,用自然语言输出问题,在 PC和挪动终端上,将须要的信息迅速出现进去,并在问答中显示出剖析的后果,从而晋升了剖析的效率,使数据分析更加智能化。 Smartbi同时也为客户提供数据预处理,机器学习算法利用,模型训练,评估,部署,服务公布的全生命周期。 想理解更多对于自然语言剖析NLA的产品性能,能够登录Smartbi官网理解,现个人版还反对长期收费试用~

June 2, 2022 · 1 min · jiezi

关于数据分析:九章云极DataCanvas公司荣获鑫智奖第四届金融数据智能优秀解决方案

数据智能驱动业务倒退,九章云极DataCanvas公司助力金融科技4.0时代近日,由金科翻新社举办的“鑫智奖·第四届金融数据智能优良解决方案评比”流动正式揭晓。九章云极DataCanvas公司凭借自主研发的DataCanvas APS主动机器学习平台为金融行业的泛滥数智化场景利用荣获“营销翻新优良解决方案”。 图片起源:金科翻新社 在北京软件和信息服务业协会、寰球金融专业人士协会的大力支持下,“鑫智奖·金融数据智能优良解决方案评比”流动已间断胜利举办四届,评比致力于在金融行业从线上化、数字化到数智化过程中,挑选出合乎金融行业本身需要,具备先进性、可借鉴性的优良解决方案。本届评比历时4个月,邀请来自中国人民银行以及银行、保险、证券、基金等金融机构的54位评审专家,为参评解决方案在“完整性、创新性、实用性、技术先进性、不可代替、扩展性以及服务能力和对行业的推动作用”等方面进行评判,评比出的“第四届金融数据智能优良解决方案”为各金融机构数据智能产品和解决方案选型过程中在技术趋势、利用方向和典型场景等方面的决策提供有价值的借鉴和参考。 图片起源:金科翻新社 “十四五”期间,我国金融科技翻新倒退态势减速造成,建设数字金融已成为国家级策略,人工智能、大数据、区块链等新一代数字技术在金融畛域利用日益深入。作为AI根底软件供应商,九章云极DataCanvas公司为政府和企业客户提供具备低应用门槛的主动机器学习平台。平台领有多种自动化AI能力,采纳白盒算子库并反对“三位一体”的建模形式,能够满足用户各部门不同人员对于模型构建,数据分析,模型生产化的协同开发,使用独有的“四库”技术冲破企业级常识融和瓶颈,实现从数据接入到模型部署上线的全流程自动化建模,帮忙政府和企业麻利疾速的构建模型利用。 为促成金融与科技更深度交融,推动金融行业数智化降级,九章云极DataCanvas公司基于端到端的金融解决方案,帮忙客户搭建全行级主动机器学习平台,使模型开发和利用与智能营销、智能风控、智能经营等场景高度联合,满足面向团队的麻利、自主建模需要,无效实现政府和企业生产效率的优化,推动业务倒退,晋升企业商业价值的增长。 随着金融科技迈向以数据为根底的机器认知的4.0时代,数据智能成为驱动业务倒退、重塑业务状态、影响市场格局的要害因素。在金融科技4.0时代,九章云极DataCanvas公司将继续使用前沿的AI技术为政府和企业实现数智化降级提供翻新产品和业余的技术服务,一直摸索数据智能的实际与利用,助力金融行业实现数智化降级的指标。

June 1, 2022 · 1 min · jiezi

关于数据分析:利用NBI可视化influxDB时序数据库构建物联网大数据分析平台

什么是时序数据库 先来介绍什么是时序数据。时序数据是基于工夫的一系列的数据。在有工夫的坐标中将这些数据点连成线,往过来看能够做成多纬度报表,揭示其趋势性、规律性、异样性;往将来看能够做大数据分析,机器学习,实现预测和预警。时序数据库就是寄存时序数据的数据库,并且须要反对时序数据的疾速写入、长久化、多纬度的聚合查问等基本功能。 比照传统数据库仅仅记录了数据的以后值,时序数据库则记录了所有的历史数据。同时时序数据的查问也总是会带上工夫作为过滤条件。时序数据库的场景 所有有时序数据产生,并且须要展示其历史趋势、周期法则、异样性的,进一步对将来做出预测剖析的,都是时序数据库适宜的场景。 在工业物联网环境监控方向,因为工业下面的要求,须要将工况数据存储起来。举例客户每个厂区具备20000个监测点,500毫秒一个采集周期,一共20个厂区。这样算起来一年将产生惊人的26万亿个数据点。假如每个点50Byte,数据总量将达1P(如果每台服务器10T的硬盘,那么总共须要100多台服务器)。这些数据不只是要实时生成,写入存储;还要反对疾速查问,做可视化的展现,帮忙管理者剖析决策;并且也可能用来做大数据分析,发现深层次的问题,帮忙企业节能减排,减少效益。最终客户采纳了influxDB时序数据库计划,帮忙他解决了难题。 在互联网场景中,也有大量的时序数据产生。举个例子,为了保障用户的应用体验,将用户的每次网络卡顿、网络提早都会记录到百度天工的时序数据库。由时序数据库间接生成报表以供技术产品做剖析,尽早的发现、解决问题,保障用户的应用体验。 什么是InfluxDB InfluxDB是一个由InfluxData开发的开源时序型数据。它由Go写成,着力于高性能地查问与存储时序型数据。InfluxDB被广泛应用于存储系统的监控数据,IoT行业的实时数据等场景。Influxdb要害个性 反对相似SQL的查问语法2.提供了Http Api间接拜访 3.存储超过10亿级别的工夫序列数据 4.灵便的数据保留策略,能够定义到Database级别(只保留最热的数据) 5.内置治理接口和CMD 6.飞个别速度的聚合查问 7.按不同时间段进行聚合查问 8.内置继续查问性能,定时计算指定时间段的数据,插入到指定表中,能够了解为定时归集数据 程度扩大,反对集群模式计划介绍:技术架构:NBI可视化平台介绍: NBI大数据可视化剖析平台作为新一代自助式、摸索式剖析工具,在产品设计理念上始终从用户的角度登程,始终围绕简略、易用,强调交互剖析为目标的新型产品。咱们将数据分析的各环节(数据筹备、自服务数据建模、摸索式剖析、权限管控)融入到零碎当中,让企业有序的、平安的治理数据和剖析数据。产品特点:案例展现: 在线体验:http://www.easydatavis.com

June 1, 2022 · 1 min · jiezi