关于开源:报名开源之夏与-StarRocks-一起畅游代码的海洋

53次阅读

共计 2602 个字符,预计需要花费 7 分钟才能阅读完成。

开源之夏是由中科院软件所“开源软件供应链点亮打算”发动并长期反对的一项暑期开源流动,旨在激励在校学生积极参与开源软件的开发保护,造就和挖掘更多优良的开发者,促成优良开源软件社区的蓬勃发展,助力开源软件供应链建设。

2023 年,开源之夏与 133 家优良开源社区严密单干,胜利为本届流动上线 594 个我的项目工作,我的项目涵盖了操作系统、编译器、人工智能、大数据、数据库、云原生、RISC-V 等泛滥热门畛域,波及技术标签 110 多个。

数据库作为古代软件系统的外围组成部分,扮演着存储、治理和解决数据的重要角色。理解数据库的原理和技术,把握数据库治理和优化的办法,对于从事软件开发、数据分析和零碎架构等畛域的学生和专业人士来说,都具备极大的价值和必要性。

作为一款高性能剖析型数据库,StarRocks 社区在本次流动中提供了 3 个我的项目供同学们认领,别离涵盖根底难度和进阶难度,适宜不同阶段的同学进行实战练习!通过参加 StarRocks 社区的我的项目,你将深刻理解最前沿的数据库技术倒退动静,零距离体验顶级开源我的项目,并通过社区导师的急躁领导和理论我的项目参加经验,造就良好的编码习惯和能力,实质性晋升本身的业余能力,为将来的职业生涯奠定坚实基础。

参加开源之夏的同学们将取得丰富的回报。除了开源之夏的结项证书,你还有机会博得最高 12000 元的结项奖金。作为 StarRocks 社区的一员,你还将播种专属的社区周边礼品。

退出咱们,一起开启数据库技术的微妙之旅吧!期待与你相约 StarRocks 社区!🚀🌟

报名工夫 :4 月 29 日 至 6 月 3 日 15:00 UTC+8

报名形式 :扫描上方「海报左侧二维码」报名或复制链接到浏览器关上:https://summer-ospp.ac.cn/org/orgdetail/fbddcc44-29d8-407b-ab…

报名指南及注意事项 :开源之夏学生报名官网布告

报名要求 :本流动面向年满 18 周岁在校学生 StarRocks

社区简介

StarRocks 是一款高性能剖析型数据仓库,应用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既反对从各类实时和离线的数据源高效导入数据,也反对间接剖析数据湖上各种格局的数据。
StarRocks 兼容 MySQL 协定,可应用 MySQL 客户端和罕用 BI 工具对接。同时 StarRocks 具备程度扩大,高可用、高牢靠、易运维等个性。广泛应用于实时数仓、OLAP 报表、数据湖剖析等场景。

截至 2022 年底,StarRocks 已被寰球超过 200 家市值 70 亿人民币以上的头部企业采纳,开源社区汇集 200 多位贡献者,近万社群用户。目前 StarRocks 在 GitHub 星数已超 4400 个,是《2022 开源大数据热力报告》中热力值增速第一的我的项目。StarRocks 也是寰球顶级基金会 Linux Foundation 旗下的开源我的项目。

开源协定 :Apache License 2.0

社区邮箱 :community@starrocks.com

官网地址 :https://www.starrocks.io/

社区我的项目主仓库 :https://github.com/StarRocks/starrocks

导师介绍

StarRocks 开源之夏 2023 工作详情

工作一(根底难度)反对 StarRocks Kettle Connector

我的项目简介 :Kettle 是一款开源的 ETL 工具,采纳 Java 编写,能够在 Windows、Linux、Unix 上运行,反对低代码、拖拽形式开发 ETL 数据管道,可对接包含传统数据库、文件、大数据平台、接口、流数据等数据源。本我的项目为 StarRocks 反对 Kettle connector,反对通过 Kettle 将数据写入到 StarRocks。

我的项目产出要求 :实现 StarRocks Kettle Connector,并奉献到开源社区

我的项目技术要求 :相熟 Java 语言,理解数据库基本操作

导师 :李鹏飞 lipengfei@starrocks.com

工作二(根底难度)在 StarRocks 中实现 ORC Chunk Writer

我的项目简述:
ORC 文件格式是 Hadoop 生态圈中的一种列式存储格局,用于升高 Hadoop 数据存储空间和减速 Hive 查问速度,也是以后 OLAP 零碎中最罕用的列存格局之一。和 Parquet 相似,ORC 并不是一个单纯的列式存储格局,而是依据行组宰割整个表,在每一个行组内进行按列存储。StarRocks 以后曾经实现对 ORC 文件的读取性能,可能失常拜访其余数据源的 ORC 数据文件。本我的项目思考在 StarRocks 中实现 ORC Chunk Writer,反对将 StarRocks 的 chunk 数据写入到 ORC 文件当中。

我的项目产出要求:
在 StarRocks 上实现 ORC Chunk Writer,并奉献到开源社区

我的项目技术要求:

相熟 C ++ 语言,有肯定的数据库根底

导师: 杨关锁 yangguansuo@starrocks.com

工作三(进阶难度)用 JIT 减速 StarRocks 表达式执行

我的项目简述:
Just-in-Time (JIT) compilation 技术广泛应用于古代的数据库系统中。它是将用户输出的表达式、查问、存储过程等现场编译成二进制代码再执行,相比解释执行的形式,运行效率要高得多。尤其是对于计算密集型查问、或频繁重复使用的计算过程,使用代码生成技术能达到数十倍的性能晋升。StarRocks 的执行引擎次要是采纳向量化技术减速,如何将向量化和 JIT 联合是一件值得钻研的课题。本次实际次要是用 JIT 优化 StarRocks 向量化执行引擎的表达式计算。

我的项目产出要求:
用 LLVM 来实现表达式的 JIT 优化,并奉献到开源社区

我的项目技术要求:
有肯定的 C++ 和 数据库执行引擎的根底

导师 :方祝和 fangzhuhe@starrocks.com

欢送各位同学报名参 StarRocks 我的项目,与宽广的 StarRocks 社区搭档们携手共建极速对立的湖仓剖析新范式!

无论是技术上的疑难还是我的项目中的挑战,如果你遇到任何问题,别放心!点击下方链接退出“开源之夏 2023 x StarRocks 流动群”,咱们将为你提供最大水平的帮忙和领导。https://842372.ma3you.cn/articles/OdX21k6/

正文完
 0