StarRocks始终放弃着比拟快的更新节奏,根本放弃2-3周进行一次版本迭代。
援用
上面咱们来介绍一下2021年3-4月,StarRocks-1.12 ~ 1.14 最新版本的次要性能:
FlinkConnector|Flink数据高速导入,可保障不丢不重
通过Flink+StarRocks的形式构建实时数仓是以后业界支流计划,StarRocks提供了规范的Mysql协定接口,因而Flink程序能够间接用JDBC读取StarRocks中的数据,然而如何在保障高性能导入的状况下同时确保数据不丢不重是很多用户碰到的难题。咱们公布了StarRocks-Flink-connector能够让大家不便高效的实现Flink写入StarRocks,TPS能够达到80万/s。
参考文档:
http://doc.starrocks.com/2166258
Hive表面|无需导入间接进行数仓减速
在传统的T+1离线报表场景中,很多用户曾经累计了大量的Hive报表数据,然而因为性能问题,很多利用场景都心愿可能减速报表性能。如果要做数据迁徙可能因为报表数量很多,数据量宏大而难以迁徙。
StarRocks的Hive表面给用户提供了一种不须要数据导入而间接进行数仓查问减速的伎俩,能够替换Hive/Impala/Presto等查问引擎,取得数倍的性能晋升。以后版本仅反对Parquet格局数据。
参考文档:
http://doc.starrocks.com/2146...
Array和String数据类型|更丰盛的类型反对
StarRocks-1.12版本开始反对了新的数据的类型:Array和String,Array类型是多值列的一种,能够反对嵌套的数组构造,这个性能能够宽泛的应用在人群圈选、A/B Test等场景。String类型能够不便其余数据库表schema的迁徙,不须要显示指定varchar()的最大长度,以后最大长度为65533字节,后续会裁减长度限度。
参考文档:
http://doc.starrocks.com/2146878
Export优化|晋升导出性能,优化导出格局
Export性能能够将数据从StarRocks导出到HDFS和S3。优化前,Export导出的scaner只能单线程读取,优化后FE能够启动多个线程并发导出,从而实现性能数倍晋升,并且数据导出后的格局能够不便的用Hive表进行加载,同时能够查问导出工作的状态,每次数据导出能够保障原子性,如果导出事务失败会主动清理数据。
参见文档:
http://doc.starrocks.com/2146007
其余优化
- 优化BE启动速度优化,缩小不必要的查看。
- 内存应用优化,防止Insert into等场景的OOM。
- Set global语义优化,1.13版本当前Set global能够对以后session失效。
- GroupingSets算子性能晋升,GroupingSets是SQL03规范的个性,能够对多列group by + union的场景进行优化。
更多详情能够参考StarRocks官网论坛的Release Notes,也欢送大家增加咱们客服的微信号StarRocks-1,提出您贵重的意见。