讲真，应该选择RabbitMQ还是Kafka？

waitzkj

2020-03-24

作为一个有丰富经验的微服务系统架构师，经常有人问我，应该选择 RabbitMQ 还是 Kafka?

讲真，应该选择RabbitMQ还是Kafka？

图片来自 Pexels

基于某些原因，许多开发者会把这两种技术当做等价的来看待。的确，在一些案例场景下选择 RabbitMQ 还是 Kafka 没什么差别，但是这两种技术在底层实现方面是有许多差异的。

不同的场景需要不同的解决方案，选错一个方案能够严重的影响你对软件的设计，开发和维护的能力。

这篇文章会先介绍一下基本的异步消息模式，然后再介绍一下 RabbitMQ 和 Kafka 以及他们的内部结构信息。第二部分(未完成)主要介绍这两种技术的主要不同点以及他们各自的优缺点，最后我们会说明一下怎样选择这两种技术。

异步消息模式

异步消息可以作为解耦消息的生产和处理的一种解决方案。提到消息系统，我们通常会想到两种主要的消息模式——消息队列和发布/订阅模式。

消息队列

利用消息队列可以解耦生产者和消费者。多个生产者可以向同一个消息队列发送消息。

但是，一个消息在被一个消息者处理的时候，这个消息在队列上会被锁住或者被移除并且其他消费者无法处理该消息。也就是说一个具体的消息只能由一个消费者消费。

讲真，应该选择RabbitMQ还是Kafka？

消息队列

需要额外注意的是，如果消费者处理一个消息失败了，消息系统一般会把这个消息放回队列，这样其他消费者可以继续处理。

消息队列除了提供解耦功能之外，它还能够对生产者和消费者进行独立的伸缩(scale)，以及提供对错误处理的容错能力。

发布/订阅

发布/订阅(pub/sub)模式中，单个消息可以被多个订阅者并发的获取和处理。

讲真，应该选择RabbitMQ还是Kafka？

发布/订阅

例如，一个系统中产生的事件可以通过这种模式让发布者通知所有订阅者。在许多队列系统中常常用主题(topics)这个术语指代发布/订阅模式。

在 RabbitMQ 中，主题就是发布/订阅模式的一种具体实现(更准确点说是交换器(exchange)的一种)，但是在这篇文章中，我会把主题和发布/订阅当做等价来看待。

一般来说，订阅有两种类型：

临时(ephemeral)订阅，这种订阅只有在消费者启动并且运行的时候才存在。一旦消费者退出，相应的订阅以及尚未处理的消息就会丢失。
持久(durable)订阅，这种订阅会一直存在，除非主动去删除。消费者退出后，消息系统会继续维护该订阅，并且后续消息可以被继续处理。

RabbitMQ

RabbitMQ 作为消息中间件的一种实现，常常被当作一种服务总线来使用。RabbitMQ 原生就支持上面提到的两种消息模式。

其他一些流行的消息中间件的实现有 ActiveMQ，ZeroMQ，Azure Service Bus 以及 Amazon Simple Queue Service(SQS)。

这些消息中间件的实现有许多共通的地方；这边文章中提到的许多概念大部分都适用于这些中间件。

队列

RabbitMQ 支持典型的开箱即用的消息队列。开发者可以定义一个命名队列，然后发布者可以向这个命名队列中发送消息。最后消费者可以通过这个命名队列获取待处理的消息。

消息交换器

RabbitMQ 使用消息交换器来实现发布/订阅模式。发布者可以把消息发布到消息交换器上而不用知道这些消息都有哪些订阅者。

每一个订阅了交换器的消费者都会创建一个队列;然后消息交换器会把生产的消息放入队列以供消费者消费。消息交换器也可以基于各种路由规则为一些订阅者过滤消息。

讲真，应该选择RabbitMQ还是Kafka？

RabbitMQ 消息交换器

需要重点注意的是 RabbitMQ 支持临时和持久两种订阅类型。消费者可以调用 RabbitMQ 的 API 来选择他们想要的订阅类型。

根据 RabbitMQ 的架构设计，我们也可以创建一种混合方法——订阅者以组队的方式然后在组内以竞争关系作为消费者去处理某个具体队列上的消息，这种由订阅者构成的组我们称为消费者组。

按照这种方式，我们实现了发布/订阅模式，同时也能够很好的伸缩(scale-up)订阅者去处理收到的消息。

讲真，应该选择RabbitMQ还是Kafka？

发布/订阅与队列的联合使用

Apache Kafka

Apache Kafka 不是消息中间件的一种实现。相反，它只是一种分布式流式系统。

不同于基于队列和交换器的 RabbitMQ，Kafka 的存储层是使用分区事务日志来实现的。

Kafka 也提供流式 API 用于实时的流处理以及连接器 API 用来更容易的和各种数据源集成;当然，这些已经超出了本篇文章的讨论范围。

云厂商为 Kafka 存储层提供了可选的方案，比如 Azure Event Hubsy 以及 AWS Kinesis Data Streams 等。

对于 Kafka 流式处理能力，还有一些特定的云方案和开源方案，不过，话说回来，它们也超出了本篇的范围。

主题

Kafka 没有实现队列这种东西。相应的，Kafka 按照类别存储记录集，并且把这种类别称为主题。

Kafka 为每个主题维护一个消息分区日志。每个分区都是由有序的不可变的记录序列组成，并且消息都是连续的被追加在尾部。

当消息到达时，Kafka 就会把他们追加到分区尾部。默认情况下，Kafka 使用轮询分区器(partitioner)把消息一致的分配到多个分区上。

Kafka 可以改变创建消息逻辑流的行为。例如，在一个多租户的应用中，我们可以根据每个消息中的租户 ID 创建消息流。

IoT 场景中，我们可以在常数级别下根据生产者的身份信息(identity)将其映射到一个具体的分区上。

确保来自相同逻辑流上的消息映射到相同分区上，这就保证了消息能够按照顺序提供给消费者。

讲真，应该选择RabbitMQ还是Kafka？

Kafka 生产者

消费者通过维护分区的偏移(或者说索引)来顺序的读出消息，然后消费消息。

单个消费者可以消费多个不同的主题，并且消费者的数量可以伸缩到可获取的最大分区数量。

所以在创建主题的时候，我们要认真的考虑一下在创建的主题上预期的消息吞吐量。消费同一个主题的多个消费者构成的组称为消费者组。

通过 Kafka 提供的 API 可以处理同一消费者组中多个消费者之间的分区平衡以及消费者当前分区偏移的存储。

讲真，应该选择RabbitMQ还是Kafka？

Kafka 消费者

Kafka 实现的消息模式

Kafka 的实现很好地契合发布/订阅模式。生产者可以向一个具体的主题发送消息，然后多个消费者组可以消费相同的消息。每一个消费者组都可以独立的伸缩去处理相应的负载。

由于消费者维护自己的分区偏移，所以他们可以选择持久订阅或者临时订阅，持久订阅在重启之后不会丢失偏移而临时订阅在重启之后会丢失偏移并且每次重启之后都会从分区中最新的记录开始读取。

但是这种实现方案不能完全等价的当做典型的消息队列模式看待。当然，我们可以创建一个主题，这个主题和拥有一个消费者的消费组进行关联。

这样我们就模拟出了一个典型的消息队列。不过这会有许多缺点，我们会在第二部分详细讨论。

值得特别注意的是，Kafka 是按照预先配置好的时间保留分区中的消息，而不是根据消费者是否消费了这些消息。

这种保留机制可以让消费者自由的重读之前的消息。另外，开发者也可以利用Kafka的存储层来实现诸如事件溯源和日志审计功能。

结束语

尽管有时候 RabbitMQ 和 Kafka 可以当做等价来看，但是他们的实现是非常不同的。

所以我们不能把他们当做同种类的工具来看待;一个是消息中间件，另一个是分布式流式系统。

作为解决方案架构师，我们要能够认识到它们之间的差异并且尽可能的考虑在给定场景中使用哪种类型的解决方案。

消息队列 kafka rabbitmq text-align font-size

waitzkj

0 关注 0 粉丝 0 动态

相关推荐

面试 | 再有人问Kafka，别说你不会！

Kafka 是一个优秀的分布式消息中间件，许多系统中都会使用到 Kafka 来做消息通信。对分布式消息系统的了解和使用几乎成为一个后台开发人员必备的技能。今天就从常见的 Kafka 面试题入手和大家聊聊 Kafka 的那些事儿。生产者负责创建消息，然后将其

huangwei00 2020-10-14

RabbitMQ七战Kafka，差异立现！

作为一个有丰富经验的微服务系统架构师，经常有人问我，“应该选择RabbitMQ还是Kafka？”。基于某些原因，许多开发者会把这两种技术当做等价的来看待。的确，在一些案例场景下选择RabbitMQ还是Kafka没什么差别，但是这两种技术在底层实现方面是有

shenzhenzsw 2020-10-09

Kafka突然宕机了？稳住，莫慌！

问题要从一次 Kafka 的宕机开始说起。笔者所在的是一家金融科技公司，但公司内部并没有采用在金融支付领域更为流行的 RabbitMQ，而是采用了设计之初就为日志处理而生的 Kafka，所以我一直很好奇 Kafka 的高可用实现和保障。从 Kafka 部

guicaizhou 2020-09-30

九张图带你了解Kafka

现在，每个公司都在互联网系统中使用Kafka。Kafka似乎是解决分布式并提高系统吞吐量的最佳松耦合解决方案之一。我大约6年前开始使用Kafka。此时，Kafka诞生了，并提供了一个完美的解决方案。在了解Kafka之前，如果您不知道什么是Message Q

wangying 2020-06-28

【消息队列-Kafka】01-Kafka入门使用

private Producer<String, String> producer;producer = new KafkaProducer(props);public String sendSyncMessage(String topic,

猫咪的一生 2020-06-26

3.kafka学习

经过多年发展，Kafka已经由最初的日志分发系统的一个模块，发展为一个通用的分布式消息队列，大有发展成为一个流处理平台的趋势。目前主要应用于大数据实时处理领域，作为分布式消息队列来使用，因此本课程主要聚焦于Kafka作为分布式消息队列的方方面面。Kafka

sweetgirl0 2020-06-25

一文详解消息队列——Kafka如何实现高性能IO？

Kafka 是一个高性能的消息队列，在众多消息队列产品中，Kafka 的性能绝对是处于第一梯队的。我曾经在一台配置比较好的服务器上，对 Kafka 做过极限的性能压测，Kafka 单个节点的极限处理能力接近每秒钟 2000 万条消息，吞吐量达到每秒钟 60

猫咪的一生 2020-06-16

聊一聊高并发高可用那些事 - Kafka篇

偶尔推出一个优惠活动时，请求量极速上升。看了几个招聘网站，提到较多的消息队列有：RabbitMQ、RocketMQ、Kafka 以及 Redis 的消息队列和发布订阅模式。在高可用环境中，Kafka 需要部署多台，避免 Kafka 宕机后，服务无法访问。K

meilongwhpu 2020-06-08

面试官为什么喜欢拿 Kafka 考验求职者

小灰工作3年了，一直在一家初创公司做大数据架构师，最近几次大厂的面试经历都百般不顺，小灰心如死灰，想着如果一直跳槽无望，只能跟着时下最火的地摊儿大军一起去出摊儿谋生了。被问到了为什么要使用 Kafka，有哪种场景下需要使用 JMS，小灰一脸问号。工作几年来

东哥笔记 2020-06-05

一、kafka 介绍 && kafka-client

Kafka 是一个分布式消息引擎与流处理平台，经常用做企业的消息总线、实时数据管道，有的还把它当做存储系统来使用。早期 Kafka 的定位是一个高吞吐的分布式消息系统，目前则演变成了一个成熟的分布式消息引擎，以及流处理平台。高吞吐、低延时：这是 Kafka

sweetgirl0 2020-06-04

RabbitMQ是如何确定消息是否投递到队列中的

在使用RabbitMQ消息中间件时，因为消息的投递是异步的，默认情况下，RabbitMQ会删除那些无法路由的消息。为了能够检出消息是否顺利投递到队列，我们需要相应的处理机制。今天就来验证一下相关的验证机制。RabbitMQ消息会先到达指定的交换机，然后由交

shyoldboy 2020-09-27

RabbitMQ都写了，RocketMQ怎么能落下？

整体架构最近看到了我在Github上写的rabbitmq-examples陆续被人star了，就想着写个rocketmq-examples。对rabbitmq感兴趣的小伙伴可以看我之前的文章。下面把RocketMQ的各个特性简单介绍一下，这样在用的时候心里

ljcsdn 2020-07-27

RabbitMQ —— 介绍

AMQP，即 AMQP，一个提供统一消息服务的应用层标准高级消息队列协议，是应用层协议的一个开发标准，为面向消息的中间件设计。基于此协议的客户端与消息中间件可传递消息，并不受客户端中间件不同产品，不同的开发语言等条件的限制，Erlang 中的实现有 Rab

waitzkj 2020-07-25

Rabbitmq的使用四_Java Client方式使用Topic模式

topic交换机发送给队列的消息，通过routingkey进行匹配。　　* 号只能代替一个单词。　　# 号可以替换零个或多个单词。在这个例子中，我们将发送所有描述动物的信息。消息将与一个routingkey一起发送，routingkey由三个单词(两个点)

woaishanguosha 2020-07-18

RabbitMQ使用

那就表示一个工作队列，而工作队列的最大特征在于：若干个消费者一起完成工作。

waitzkj 2020-07-05

Rabbitmq应用场景

1）对于数据量大或者处理耗时长的操作，我们可以引入 MQ 实现异步通信，减少客户端的等待，提升响应速度。2）对于改动影响大的系统之间，可以引入 MQ 实现解耦，减少系统之间的直接依赖。1）系统可用性降低：原来是两个节点的通信，现在还需要独立运行一个服务

shenzhenzsw 2020-06-21

RabbitMQ存储模型

了解一些 RabbitMQ 的实现原理也是很有必要的，它可以让你在遇到问题时能透过现象看本质。比如一个队列的内部存储其实是由5个子队列来流转运作的，队列中的消息可以有4种不同的状态等，通过这些可以明白在使用 RabbitMQ 时尽量不要有过多的消息堆积，

OnMyHeart 2020-06-20

celery异步发送邮箱

它是消费-生产者模型的一个典型的代表，producer往消息队列中不断写入消息，而另一端consumer则可以读取或者订阅队列中的消息。业务上，可以实现服务提供者和消费者之间的数据解耦，提供高可用性的消息传输机制，在实际生产中应用相当广泛。AMQP，即Ad

waitzkj 2020-06-20

非常强悍的 RabbitMQ 总结，写得真好！

RabbitMQ是基于AMQP协议的，通过使用通用协议就可以做到在不同语言之间传递。channel：网络信道，几乎所有操作都在channel中进行，channel是消息读写的通道。客户端可以建立多个channel，每个channel表示一个会话任务。mes

OnMyHeart 2020-06-16

rabbitMQ第四种模型(Routing)

在Fanout模式中，一条消息，会被所有订阅的队列都消费。但是，在某种场景下，我们希望不同的消息被不同的队列消费。这是就要用到Direct类型的Exchange。消息的发送方在向Exchange发送消息时，也必须指定消息的RoutingKey。Excha

cj0 2020-06-07

RabbitMQ

Kafka追求高吞吐量和性能，但是不支持事务，以及对消息的重复和丢失没有严格要求，一开始主要用于日志收集和传输，适合大量数据收集。RabbitMQ使用Erlang语言开发，基于AMQP协议实现，AMQP主要特征是面向消息、队列、可靠性、安全。

Soongp 2020-06-07

RabbitMQ入门研究

将不需要同步处理的并且耗时长的操作由消息队列通知消息接收方进行异步处理。

liym 2020-06-07

RabbitMQ 第二课快速入门

　　RabbitMQ是开源的消息中间件，它是轻量级的，支持多种消息传递协议，可以部署在分布式和联合配置中，以满足高级别、高可用性需求。并且可在许多操作系统和云环境上运行，并为大多数流行语言提供了广泛的开发工具。　　1、异步处理，主要为了较少请求的响应时间和

cj0 2020-06-06

rabbitmq的基本使用

使用MQ的三大作用：1、同步变异步2、流量削峰3、解耦降低服务间的耦合性要不要使用MQ，需不需要使用MQ依据项目的需要做选择。监控应用中抛出的异常，邮件通知管理员。也就是增加监控功能，且一个消息服务可以监控无数个应用。例如，微信的抢红包，淘宝的订单，铁道部

cj0 2020-06-01

二、RabbitMQ客户端开发向导

一旦consume以后，channel会被置为接收模式，直到取消队列的订阅为止，这期间RabbitMQ会不断地推消息给消费者。如果只获取单条消息，建议使用拉的模式，但是持续消费的时候需要使用推的模式来提高吞吐量，用循环拉的模式会影响RabbitMQ的性能。

OnMyHeart 2020-05-27

删除rabbitmq的队列和队列中的数据

登录后访问http://{rabbitmq安装IP}:15672/#/queues，这里可以看到你创建的所有的Queue，选中某一个Queue，下方有个Delete/Purge，展开，选择purge即可。

xx0cw 2020-05-16

waitzkj

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号