目录

分布式前言

目录

分类:存储、计算、通信
优势:性能(并行)、容错
目标:抽象出一个接口,下层为分布式的基础设施,上层就像非分布式系统一样为用户提供服务(既用户无感知,对用户透明)

主题:

  1. 可伸缩性(scalability):增加减少机器
  2. 容错(tolerance):
  • 可用性(availability)
  • 可恢复性(recoverability)
    • 非易失性存储(non-volatile storage):磁盘
    • 复制(replication)
  1. 一致性(consistency)
  • 强一致性:通信开销大
  • 弱一致性

集群与分布式

集群:整个项目复制多份,每个机器一份
分布式:整个项目分为多个模块,每个机器一个模块

CAP

  1. consistency(一致性)
    1. 各个节点,数据都是一致的
  2. availability(可用性)
    1. 对于请求,能够返回正确结果
  3. partition tolerance(分区容错性)
    1. 网络不连通时,能够满足C或A

CAP理论就是说在分布式存储系统中,最多只能实现上面的两点。而由于网络硬件肯定会出现延迟丢包等问题,所以分区容错性是我们必须需要实现的。所以我们只能在一致性和可用性之间进行权衡,没有NoSQL系统能同时保证这三点。

消息队列

存放消息的容器:Kafka、ActiveMQ、RabbitMQ、RocketMQ
作用:1. 系统通过消息队列可进行异步处理;2. 降低系统的耦合性;3. 削峰,削平高峰期的并发事务
引入消息队列带来的问题:

  1. 系统可用性降低: 系统可用性在某种程度上降低,为什么这样说呢?在加入MQ之前,你不用考虑消息丢失或者说MQ挂掉等等的情况,但是,引入MQ之后你就需要去考虑了!
  2. 系统复杂性提高: 加入MQ之后,你需要保证消息没有被重复消费、处理消息丢失的情况、保证消息传递的顺序性等等问题!
  3. 一致性问题: 我上面讲了消息队列可以实现异步,消息队列带来的异步确实可以提高系统响应速度。但是,万一消息的真正消费者并没有正确消费消息怎么办?这样就会导致数据不一致的情况了!