标签 MQ 下的文章 - William's Blog - 记录与学习各种知识

登录

标签搜索

William

累计撰写 144 篇文章
累计收到 702 条评论

搜索到 1 篇与的结果

2022-03-05
MQ部分知识点 - 消息丢失、重复消费、消费顺序、堆积、事务、高可用消息队列的应用场景？答案：1、异步处理 2、流量削峰填谷 3、应用解耦 4、消息通讯异步处理。将一个请求链路中的非核心流程，拆分出来，异步处理，减少主流程链路的处理逻辑，缩短RT，提升吞吐量。如：注册新用户发短信通知。削峰填谷。避免流量暴涨，打垮下游系统，前面会加个消息队列，平滑流量冲击。比如：秒杀活动。生活中像电源适配器也是这个原理。应用解耦。两个应用，通过消息系统间接建立关系，避免一个系统宕机后对另一个系统的影响，提升系统的可用性。如：下单异步扣减库存消息通讯。内置了高效的通信机制，可用于消息通讯。如：点对点消息队列、聊天室。常用的消息框架有哪些？答案：ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaQ，RocketMQ、Pulsar 等MQ技术选型？答案：对比了 Kafka、RocketMQ 、Pulsar 三个框架，时耗、吞吐量、可靠性、事务、副本同步策略、多租户、动态扩容、故障恢复等评估指标。如果对于消息队列的功能和性能要求不是很高，那么RabbitMQ就够了，开箱即用。如果系统使用消息队列主要场景是处理在线业务，比如在交易系统中用消息队列传递订单，RocketMQ 的低延迟和金融级的稳定性就可以满足。要处理海量的消息，像收集日志、监控信息或是前端的埋点这类数据，或是你的应用场景大量使用了大数据、流计算相关的开源产品，那 Kafka 就是最合适的了。如果数据量很大，同时不希望有 Kafka 的高延迟，刚好业务场景是金融场景。RocketMQ 对 Topic 运营不太友好，特别是不支持按 Topic 删除失效消息，以及不具备宕机 Failover 能力。那么 Pulsar 可能就是你的一个选择了。消息模型有哪些？答案：1、点对点模式 2、发布/订阅模式如何保证 MQ 消息不丢失？答案：在了解消息中间件的运作模式后，主要从三个方面来考虑这个问题：1、生产端，不丢失消息2、MQ服务端，存储本身不丢失消息3、消费端，不丢失消息如何解决消息的重复消费？答案：生产端为了保证消息发送成功，可能会重复推送（直到收到成功ACK），会产生重复消息。但是一个成熟的MQ Server框架一般会想办法解决，避免存储重复消息（比如：空间换时间，存储已处理过的message_id），给生产端提供一个幂等性的发送消息接口。但是消费端却无法根本解决这个问题，在高并发标准要求下，拉取消息+业务处理+提交消费位移需要做事务处理，另外消费端服务可能宕机，很可能会拉取到重复消息。所以，只能业务端自己做控制，对于已经消费成功的消息，本地数据库表或Redis缓存业务标识，每次处理前先进行校验，保证幂等。如何保证 MQ消息是有序的？答案：有些业务有上下文要求，比如：电商行业的下单、付款、发货、确认收货，每个环节都会发送消息。而消费端拉取并消费消息时，也是希望按正常的状态机流程进行。所以对消息就有了顺序要求。解决思路：1、该 topic 强制采用一个分区，所有消息放到一个队列里，这样能达到全局顺序性。但是会损失高并发特性。2、局部有序，采用路由机制，将同一个订单的不同状态消息存储在一个分区 partition，单线程消费。比如Kafka就提供了一个接口扩展 org.apache.kafka.clients.Partitioner，方便开发人员按照自己的业务场景来定制路由规则。消息堆积如何处理？答案：主要是消息的消费速度跟不上生产速度，从而导致消息堆积。解决思路：1、可能是刚上线的业务，或者大促活动，流量评估不到位，这时需要增加消费组的机器数量，提升整体消费能力2、也可能是消费端的问题，正常情况，一条消息处理需要10ms，但是优化不到位或者线上bug，现在要500ms，那么消费端的整体处理速度会下降50倍。这时，我们就要针对性的排查业务代码。Tom哥之前带的团队就有小伙伴出现这个问题，当时是数据库的一条sql没有命中索引，导致单条消息处理耗时拉长，进而导致消息堆积，线上报警，不过凭我们丰富的经验，很快就定位解决了。如何保证数据一致性问题？答案：为了解耦，引入异步消息机制。先进行本地数据库操作，处理成功后，再发送MQ消息，由消费端进行后续操作。比如：电商订单下单成功后，要通知扣减库存。这两者一定要保证事务操作，否则就会出现数据不一致问题。这时候，我们就需要引入事务消息来解决这个问题。另外，在消费环节，也可能出现数据不一致情况。我们可以采用最终一致性原则，增加重试机制。事务消息是如何实现？答案：1、生产者先发送一条半事务消息到MQ2、MQ收到消息后返回ack确认3、生产者开始执行本地事务4、if 本地事务执行成功，发送commit到MQ；失败，发送rollback5、如果MQ⻓时间未收到生产者的二次确认commit或rollback，MQ对生产者发起反向回查6、生产者查询事务执行最终状态7、根据查询事务状态，再次提交二次确认MQ框架如何实现高吞吐量？答案：1、消息的批量处理2、消息压缩，节省传输带宽和存储空间3、零拷贝4、磁盘的顺序写入5、page cache 页缓存，由操作系统异步将缓存中的数据刷到磁盘，以及高效的内存读取6、分区设计，一个逻辑topic下面挂载N个分区，每个分区可以对应不同的机器消费消息，并发设计。Kafka 为什么不支持读写分离？答案：我们知道，生产端写入消息、消费端拉取消息都是与leader 副本交互的，并没有像mysql数据库那样，master负责写，slave负责读。这种设计主要是从两个方面考虑：1、数据一致性。一主多从，leader副本的数据同步到follower副本有一定的延时，因此每个follower副本的消息位移也不一样，而消费端是通过消费位移来控制消息拉取进度，多个副本间要维护同一个消费位移的一致性。如果引入分布式锁，保证并发安全，非常耗费性能。2、实时性。leader副本的数据同步到follower副本有一定的延时，如果网络较差，延迟会很严重，无法满足实时性业务需求。综上考虑，读写操作都是针对 leader 副本进行的，而 follower 副本主要是用于数据的备份。MQ框架如何做到高可用性？答案：以Kafka框架为例，其他的MQ框架原理类似。Kafka 由多个 broker 组成，每个 broker 是一个节点。你创建一个 topic，这个 topic 可以划分为多个 partition，每个 partition 存放在不同的 broker 上，每个 partition 存放一部分数据，每个 partition 有多个 replica 副本。写的时候，leader 会负责把数据同步到所有 follower 上去，读的时候就直接读 leader 上的数据即可。如果某个 broker 宕机了，没事儿，那个 broker 上面的 partition 在其他机器上都有副本，此时会从 follower 中重新选举一个新的 leader 出来，大家继续读写那个新的 leader 即可。这就是所谓的高可用性。
- 2022年03月05日
- 54 阅读
- 0 评论
- 0 点赞