敬爱的社区小伙伴们,2021 年 12 月 21 日,冬至,咱们很快乐地发表 MLSQL 正式更名为 Byzer。Byzer 将秉持 MLSQL 低成本落地 Data + AI 的技术初衷,并交融更加凋谢且多元的语言及产品能力,打造更加欠缺的新一代开源语言生态。与此同时,全新的 Byzer 开源社区正式成立,社区官网(https://www.byzer.org) 曾经上线,欢送大家拜访。
全新的 Byzer 以及 Byzer 开源社区
Byzer 这一名称源于中国现代神兽「白泽」,其能语言,通万物之情,知鬼神之事。咱们心愿 Byzer 能够像神兽白泽一样,让数据说「人」话。
Byzer 是一门联合了申明式编程和命令式编程的混合编程语言,其低代码且类 SQL 的编程逻辑配合内置算法及插件的加持,能帮忙数据工作者们高效买通数据链路,实现数据的荡涤转换,并疾速地进行机器学习相干的训练及预测。Byzer 语言的关键词如下:
- 万物皆表(Everything is a table)
- 类 SQL 语法(SQL-like Language)
- 内置算法和插件(Built-in Algorithms and Plugins)
- 可定制,简略,弱小(Customizable, Simple and Powerful)
Byzer 社区次要围绕 Byzer 语言来打造面向 Data + AI 畛域的开源生态,旨在帮忙用户以低成本和高效率的形式落地数据平台和实现 AI 工程化,开释数据分析师、工程师以及运维人员的生产力。目前 Byzer 社区内的我的项目均采纳 Apache License V2 发行,容许所有社区参与者在该协定下进行自在应用。
咱们为什么须要 Byzer
随着大数据、人工智能、云计算等技术的迅速倒退,云基础设施、根底软件、算法模型等都逐步欠缺和成熟,业界对数据平台的效率诉求越来越高,低效的跨平台数据运行逐步成为工程师落地数据平台和实现 AI 工程化的痛点。然而,无论是从更换基础设施动手,还是换上更易用的框架,又或是招聘更优良的研发人才,都无奈做到大幅度的效率晋升。
咱们置信只有在编程语言层面进行变革,能力从根本上进步数据平台落地和 AI 工程化的效率。Byzer 作为一门低代码的开源编程语言,能够在语言层面将数据处理链路、AI 工程中的简单操作以及权限管控进行形象,同时升高编程语言的学习老本和上手老本,从而帮忙企业真正将效率晋升上来。
Byzer 语言设计理念
在形象业务能力的时候,数据的解决和流转承载着信息传递的外围工作,而数据的载体往往就是二维数据表或多维数据表,SQL 语言其实就是形象在二维数据表上的各种数据操作。Byzer 语言的外围设计是万物皆表(Everything is a table),咱们心愿用户能够非常容易地将任何实体对象通过 Byzer 来形象成二维表,从而可能基于表来进行数据处理或模型训练等进一步操作。
申明式交融命令式的语言设计,SQL-like 语法简略又灵便
在语言设计层面,Byzer 采纳了申明式编程设计,应用类 SQL 的语法,开发者更容易学习和应用。然而申明式设计又不足一些灵活性,无奈满足一些很简单的编程需要,所以 Byzer 在申明式设计的根底上又联合了命令式编程设计来对 SQL-like 的语法进行扩大。
云原生设计,充分利用云上算力和低成本的存储
在云基础设施日趋成熟的明天,无论是根底软件还是下层利用,用户都非常关注可扩展性,Byzer 在 Day1 的设计就是云原生设计,不仅可能利用云上低成本的存储,同时原生分布式引擎(Spark 引擎和可插拔 Ray 引擎)的设计,能够让 Byzer 充分利用云上算力。
一套语言,一个引擎,笼罩 Data + AI 的能力,开箱即用
企业在落地数据平台或者 AI 工程时,往往面临着选型难的问题,对于数据工程师来讲,更是须要理解、学习、开发和保护整个数据处理链路中的各个组件,上手老本和保护老本都很高。Byzer 心愿可能提供一套语言、一个引擎,就能笼罩整个数据链路,同时能够提供各种算法、模型训练等开箱即用的能力。
Byzer 在 12 月 15 日正式公布了 Byzer 2.2.0 版本,欢送大家试用和反馈。
IDE 反对 – Byzer Notebook
Byzer 作为一门语言,须要可能反对 IDE 或者文本编辑器,实现诸如代码高亮,代码提醒,运行等能力。目前比拟风行的形式是实现 LSP(Language Server Protocol),各类支流编辑器或者 IDE 就能够基于 LSP 的协定来实现相干的性能。Byzer 实现了 LSP 协定并提供了 code suggest API,用户能够自行开发相干的编辑器插件来反对 Byzer 开发。
Byzer Notebook 是由 Kyligence 开发并奉献到社区的一个基于 Byzer 的 Web IDE。具备以下次要个性:
- 领有弱小的交互编译能力,反对代码高亮、代码提醒等性能;
- 提供稳固牢靠的数据工程能力,反对多数据源的表进表出和 AI 模型的训练与公布;
- 反对 Notebook 和 Workflow 的模式给用户提供低代码、交互式编程的能力。
除了 Byzer Notebook 外,社区还开发了 Byzer 语言的 VSCode 插件,用户在 VSCode 中就能够编写运行 Byzer 代码了。
Byzer Notebook 在 12 月 15 日正式公布了 Byzer Notebook 1.0.0 版本,欢送大家试用和反馈。
真挚邀请您共建社区
Byzer 社区作为一个新兴的开源社区,十分欢送大家来参加和奉献。目前 Byzer 曾经取得了不少生产客户,数据团队选用 Byzer 后仅需大量的开发人员就能够撑持整个数据平台,详情能够关注 Byzer 社区的 Meetup 流动以及官网公众号等渠道。
除了代码奉献外,社区也欢送其余模式的参加,比方提 Feature Request、奉献文档、视频教学、编写博客,负责讲师,以及帮助社区 Meetup 流动等,更多详情能够看如何奉献 Byzer 社区,期待和大家一起共建一个 Geek 且充斥想象力的社区!
Github:https://github.com/byzer-org
官网:https://www.byzer.org
文档:https://docs.byzer.org