关于大数据:星环科技创始人孙元浩数据连接一切开启融合数据云时代

51次阅读

共计 2678 个字符,预计需要花费 7 分钟才能阅读完成。

4 月 19 日,星环科技 2022 秋季新品公布周在线上隆重开启。开幕式中,星环科技 CEO 孙元浩做主题演讲,带大家走入“交融数据云时代“。

数据分析模式的历史变迁

星环科技成立的 2013 年,数据分析模式是以 Data Hub 数据枢纽的模式来进行;

2017 年星环科技提出大数据 3.0 概念,辨别于使用离散工具的数据平台,大数据 3.0 时代的最显著特色为一站式数据平台,同时能够笼罩数据全生命周期的解决。星环科技的一站式平台把数据湖、数据仓库、数据集市一体化,提供一套数据工具集 Transwap studio 解决数据的各个阶段;

2018 年星环科技提出数据云的概念,在这个阶段大数据技术和云、AI 技术交融,具备对立的资源管理技术,利用容器化技术,对外弹性提供数据库作为服务,利用为数据而生,数据更重,利用较轻,星环科技数据云产品当先业界一代;

2020 年,星环科技提出多模型数据平台,利用对立语言、计算、存储、资源重构大数据软件栈,在一个平台上反对十种数据模型,无效升高数据开发和运维的难度,极大晋升用户开发效率。随着多种数据模型交融在一起,拜访语言产生了革命性的变动,SQL 语言拓展、延长到不同构造数据下面,可能用同样的语言拜访不同数据结构,对立的多模平台,能够撑持更多新利用的产生。

同年星环科技提出联邦数据云概念,针对多数据中心、跨国数据中心而言,在资源层、数据层、计算层、机器学习层联邦化。部署构造也从早年间的星型构造,倒退为雪花型。

进入 2022 年,咱们来到了交融数据云的时代。交融数据云是指在按数据域组织的分布式数据云的技术架构根底上进行兼顾治理、协同经营、服务交融以造成可协同统一,自由组合,灵便部署的一种新型数据分析模式。数据能够如血液个别,以平安、可信的形式即时流动到适合的中央,流给须要的人。

交融数据云时代的特色

交融数据云是以网格构造进行部署,它次要具备流动、凋谢、轻量、统管四大特点,即以数据的实时流动取代以往准实时和离线的批量解决;以数据的共享和凋谢激发数据作为生产力的最大价值;以轻量化的数据分析利用部署模式取代以往重复简短的开发过程;以横跨多种部署构造、IaaS 层及物理资源的统管形式突破各数据平台及底层物理资源的治理壁垒。

流动:数据只有流动能力产生价值,数据流动的速度越快,产生的价值越大。交融数据云以数据被动流动的形式取代了以往数据被动被采集入湖的形式(只能做到准实时或离线剖析加工),将数据分析的效率大大晋升。数据的流动须要建设在平安可信的根底之上,再即时地流动到适合的中央,流给须要的人。

凋谢:作为生产因素的数据,只有凋谢和共享能力使得价值最大化。数据的交易和流通已成为推动生产力的重要因素。

轻量:剖析变得越来越轻量化,对于按需生成和随时部署的需要也在不断扩大。因而须要有对立的语言和利用开发方式,即时、按需地产生剖析利用。

统管:交融数据云须要横跨企业边缘端、公有云、私有云、混合云,同时笼罩传统数据库和古代数据平台架构。对于企业而言,交融数据云可能横跨和统管不同的部署构造、IaaS 层或物理资源,第一工夫调动底层资源承接下层的数据利用。

对于交融数据云而言,数据将被存储于多模型的数据库中,并且以网络结构的形式部署和流动。数据域可独立或两两组合成交融数据域,具备部署、模型、剖析、智能等多维属性,通过互联管控实现协同工作,数据流动。网格构造是数据流动的根底,代表了云边端等多种部署维度以及数据业务化过程中的价值转换维度所构建网格构造,数据在各数据域间的流动带动了数据价值的活跃度。企业能够依据云边端等数据资源环境、时序 / 对象 / 图片 / 文档 / 图数据等企业数据模型、湖仓集等存储构造建设三维平面的数据域,并造成企业级的网格构造,为数据的流通发明合规的门路和价值发明的前提根底。在交融数据云下的数据,可能在不同的数据平台间即时流动,数据流从低到高,为企业不断涌现数据价值,而从高到低,又为企业的剖析利用部署,提供了应需而生的响应速度。

数据连贯所有,星环科技以引领行业技术倒退和助力各行各业数字化转型为使命,冀望通过数据全生命周期的根底软件与服务,为企业搭建数字化转型的数字底座,保障数据的平安和顺畅流通;以自研技术和产品踊跃落地 IT 基础设施的国产化代替,满足用户多方面数据智能需要,助力各行各业企业数字化转型。

对开源或国外产品的代替

数据连贯所有,星环科技以引领行业技术倒退和助力各行各业数字化转型为使命,冀望通过数据全生命周期的根底软件与服务,为企业搭建数字化转型的数字底座,保障数据的平安和顺畅流通;以自研技术和产品踊跃落地 IT 基础设施的国产化代替,满足用户多方面数据智能需要,助力各行各业企业数字化转型。

星环科技的自主研发比例在大幅度晋升,性能更优,速度更快,性能更弱小,并且开始更多的代替国外产品。

大数据平台方面,星环科技早就实现了诸多代替 CDH 的案例,包含 cloudera 和 Hortoworks 合并后的 Cloudera Data Platform 和 Cloudera Data cloud,星环科技的产品可能提供更多模型反对,提供对立接口和更好的 SQL 兼容性。

分布式数据库方面,星环科技产品能够兼容 Oracle、Teratada、DB2,整合了 Cypher 语言,并用容器化技术实现更好的租户隔离,激进来讲性能晋升 2 -10 倍。星环科技 KunDB 在 OLAP 场景、MySQL 的利用场景中曾经可能取代 MySQL 和 Oracle,ArgoDB 取代 Oracle、DB2 和 Teradata 建设数据仓库,并在多个用户中残缺代替了 Teradata。

图剖析方面,星环科技图数据库库 StellarDB 在中信证券等客户中,取代开源的或者商用版的 Neo4j,StellarDB 能够解决更大规模的图数据。

搜索引擎方面,齐全自研的 Scope 搜索引擎能够代替 Elasticsearch,通过比拟,Scope 集群规模能够达到几百个节点,远远大于 Elasticsearch 的几十个节点数量。

数据迷信方面,Sophon Base 机器学习建模工具,能够取代 SaaS、SPS 等统计分析软件,Sophon Base 次要特点是在 MLops 把整个机器学习流程进行优化了,从特色工程到模拟训练、模型上线、模型评估到改良,有一套残缺的工具集。星环科技提供了更多的分布式机器学习的算法和框架,也用更凋谢的态度,激励大家尝试应用星环的一系列技术软件。因而星环科技此次推出了轻量化的 TDH 社区版,收费供高校和科研机构不便地应用大数据技术。

更多产品内容,请登录星环科技官网 https://www.transwarp.cn/ 点击查看

正文完
 0