关于apache:译文-深度剖析-Pulsar-Functions
原文作者 Sanjeev Kulkarni,翻译 Sijia@StreamNative,如需转载,请后盾留言。英文链接:https://streamnative.io/blog/... 对于 Apache PulsarApache Pulsar 是 Apache 软件基金会顶级我的项目,是下一代云原生分布式音讯流平台,集音讯、存储、轻量化函数式计算为一体,采纳计算与存储拆散架构设计,反对多租户、长久化存储、多机房跨区域数据复制,具备强一致性、高吞吐、低延时及高可扩展性等流数据存储个性。GitHub 地址:http://github.com/apache/pulsar/ Pulsar Functions 是开源数据技术框架 Apache Pulsar 为轻量级计算提供的内置流处理器。在 2020 年 Pulsar Summit 会议上,我发表了一次对于 Pulsar Functions 的演讲。本文将深刻探讨 Functions 的架构和实现细节。 Pulsar Functions 简介Pulsar Functions 是 Pulsar 音讯零碎的外围计算根底构造。应用 Pulsar Functions,无需部署独自的零碎(如 Apache Storm、Apache Heron),即可基于单条音讯创立简单的解决逻辑,简化事件流并引入无服务架构。 轻量级计算 function 从一个或多个 Pulsar topic 生产音讯,将用户提供的解决逻辑利用于每条音讯,并公布计算结果到其余 topic。因为不须要内部解决零碎,Pulsar Functions 不仅使利用程序开发更便捷,还简化了故障排除操作,加重了运维累赘。 另外,开发人员能够间接应用 Pulsar Functions 的 API。理解 Java 语言的程序员能够间接应用 Java SDK 编写 function。示例如下: import java.util.function.Function; public class ExclamationFunction implements Function<String, String> @Override public String apply(String input) { return input + "!"; }}Pulsar Functions 旨在借助简略的 API 和执行框架解决常见的流应用场景(如过滤、路由、裁减),而不是替换重量级流解决引擎(如 Spark、Flink)。 ...