背景

咱们最近在做新业务的技术选型，其中波及到了对消息中间件的抉择；联合咱们的理论状况心愿它能满足以下几个要求：

敌对的云原生反对：因为当初的主力语言是 Go，同时在运维上可能足够简略。
官网反对多种语言的 SDK：还有一些 Python、Java 相干的代码须要保护。
最好是有一些不便好用的个性，比方：延时音讯、死信队列、多租户等。

当然还有一些程度扩容、吞吐量、低提早这些个性就不必多说了，简直所有成熟的消息中间件都能满足这些要求。

基于以上的筛选条件，Pulsar 进入了咱们的视线。

作为 Apache 下的顶级我的项目，以上个性都能很好的反对。

上面咱们来它有什么过人之处。

架构

从官网的架构图中能够看出 Pulsar 次要有以下组件组成：

Broker 无状态组件，能够程度扩大，次要用于生产者、消费者连贯；与 Kafka 的 broker 相似，但没有数据存储性能，因而扩大更加轻松。
BookKeeper 集群：次要用于数据的长久化存储。
Zookeeper 用于存储 broker 与 BookKeeper 的元数据。

整体一看仿佛比 Kafka 所依赖的组件还多，这样的确会提供零碎的复杂性；但同样的益处也很显著。

Pulsar 的存储于计算是拆散的，当须要扩容时会非常简单，间接新增 broker 即可，没有其余的心智累赘。

当存储成为瓶颈时也只须要扩容 BookKeeper，不须要人为的做重均衡，BookKeeper 会主动负载。

同样的操作，Kafka 就要简单的多了。

个性

多租户

多租户也是一个刚需性能，能够在同一个集群中对不同业务、团队的数据进行隔离。

persistent://core/order/create-order

以这个 topic 名称为例，在 core 这个租户下有一个 order 的 namespace，最终才是 create-order 的 topic 名称。

在理论应用中租户个别是依照业务团队进行划分，namespace 则是以后团队下的不同业务；这样便能够很清晰的对 topic 进行治理。

通常有比照才会有挫伤，在没有多租户的消息中间件中是如何解决这类问题的呢：

罗唆不分这么细，所有业务线混着用，当团队较小时可能问题不大；一旦业务减少，治理起来会十分麻烦。
本人在 topic 之前做一层形象，但其实实质上也是在实现多租户。
各个业务团队各自保护本人的集群，这样当然也能解决问题，但运维复杂度天然也就进步了。

以上就很直观的看出多租户的重要性了。

Function 函数计算

Pulsar 还反对轻量级的函数计算，例如须要对某些音讯进行数据荡涤、转换，而后再公布到另一个 topic 中。

这类需要就能够编写一个简略的函数，Pulsar 提供了 SDK 能够不便的对数据进行解决，最初应用官网工具公布到 broker 中。

在这之前这类简略的需要可能也须要本人解决流解决引擎。

利用

除此之外的下层利用，比方生产者、消费者这类概念与应用大家都差不多。

比方 Pulsar 反对四种生产模式：

Exclusive：独占模式，同时只有一个消费者能够启动并生产数据；通过 SubscriptionName 表明是同一个消费者），适用范围较小。
Failover 故障转移模式：在独占模式根底之上能够同时启动多个 consumer，一旦一个 consumer 挂掉之后其余的能够疾速顶上，但也只有一个 consumer 能够生产；局部场景可用。
Shared 共享模式：能够有 N 个消费者同时运行，音讯依照 round-robin 轮询投递到每个 consumer 中；当某个 consumer 宕机没有 ack 时，该音讯将会被投递给其余消费者。这种生产模式能够进步生产能力，但音讯无奈做到有序。
KeyShared 共享模式：基于共享模式；相当于对同一个topic中的音讯进行分组，同一分组内的音讯只能被同一个消费者有序生产。

第三种共享生产模式应该是应用最多的，当对音讯有程序要求时能够应用 KeyShared 模式。

SDK

官网反对的 SDK 十分丰盛；我也在官网的 SDK 的根底之上封装了一个外部应用的 SDK。

因为咱们应用了 dig 这样的轻量级依赖注入库，所以应用起来大略是这个样子：

    SetUpPulsar(lookupURL)
    container := dig.New()
    container.Provide(func() ConsumerConfigInstance {
        return NewConsumer(&pulsar.ConsumerOptions{
            Topic:            "persistent://core/order/create-order",
            SubscriptionName: "order-sub",
            Type:             pulsar.Shared,
            Name:             "consumer01",
        }, ConsumerOrder)

    })

    container.Provide(func() ConsumerConfigInstance {
        return NewConsumer(&pulsar.ConsumerOptions{
            Topic:            "persistent://core/order/update-order",
            SubscriptionName: "order-sub",
            Type:             pulsar.Shared,
            Name:             "consumer02",
        }, ConsumerInvoice)

    })

    container.Invoke(StartConsumer)

其中的两个 container.Provide() 函数用于注入 consumer 对象。

container.Invoke(StartConsumer) 会从容器中取出所有的 consumer 对象，同时开始生产。

这时以我无限的 Go 开发教训也在思考一个问题，在 Go 中是否须要依赖注入？

先来看看应用 Dig 这类库所带来的益处：

对象交由容器治理，很不便的实现单例。
当各个对象之前依赖关系简单时，能够缩小许多创立、获取对象的代码，依赖关系更清晰。

同样的害处也有：

跟踪浏览代码时没有那么直观，不能一眼看出某个依赖对象是如何创立的。
与 Go 所推崇的简洁之道不符。

对于应用过 Spring 的 Java 开发者来说必定直呼真香，毕竟还是相熟的滋味；但对于齐全没有接触过相似需要的 Gopher 来说貌似也不是刚需。

目前市面上各式各样的 Go 依赖注入库层出不穷，也不乏许多大厂出品，可见还是很有市场的。

我置信有很多 Gopher 十分恶感将 Java 中的一些简单概念引入到 Go，但我感觉依赖注入自身是不受语言限度，各种语言也都有本人的实现，只是 Java 中的 Spring 不仅仅只是一个依赖注入框架，还有许多简单性能，让许多开发者望而却步。

如果只是依赖注入这个细分需要，实现起来并不简单，并不会给带来太多复杂度。如果花工夫去看源码，在了解概念的根底上很快就能把握。

回到 SDK 自身来说，Go 的 SDK 现阶段要比 Java 版本的性能少（精确来说只有 Java 版的性能最丰盛），但外围的都有了，并不影响日常应用。

总结

本文介绍了 Pulsar 的一些基本概念与长处，同时顺便讨论一下 Go 的依赖注入；如果大家和咱们一样在做技术选型，无妨考虑一下 Pulsar。

后续会持续分享 Pulsar 的相干内容，有相干教训的敌人也能够在评论区留下本人的见解。

关于消息队列:Pulsar下一代消息引擎真的这么强吗

背景

架构

个性

多租户

Function 函数计算

利用

SDK

总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于消息队列:Pulsar下一代消息引擎真的这么强吗

背景

架构

个性

多租户

Function 函数计算

利用

SDK

总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复