前几章讲到rabbitmq单主机模式的搭建和使用,我们在实际生产环境中出于对性能还有可用性的考虑会采用集群的模式来部署rabbitmq。
rabbitmq集群基本概念
rabbit模式大概分为以下三种:单主机模式、普通集群模式、镜像集群模式。
单主机模式:
rabbitmq服务运行在单独的一台主机中,通常生产环境不使用该模式,性能有限,并且如果服务器宕机服务将完全不可用。
普通集群模式
一说到集群问题瞬间变得复杂多了。首先对于queue来说消息实体只存在于其中一个节点,集群中其他节点仅有相同的元数据,即队列结构。
当消息进入a节点的queue中后,consumer从b节点拉取消息时,rabbitmq会临时在两个节点间进行消息传输,把a中的消息实体取出并经过b发送给consumer。所以consumer应尽量连接每一个节点,从中取消息。即对于同一个逻辑队列,要在多个节点建立queue。否则consumer如果只连接一个节点区消息会造成该节点的性能瓶颈。
该模式存在一个问题就是当其中一个节点故障后,其他节点无法取到故障节点中还未消费的消息。如果做了消息持久化,那么得等a节点恢复,然后才可被消费;如果没有持久化的话,那就杯具了!
镜像集群模式
前面讲到rabbitmq的普通集群模式不同节点间只同步队列结构不同步消息。镜像模式会把队列结构和消息都存在于多个节点,属于rabbitmq的ha方案。其实质和普通模式不同之处在于,消息实体会主动在镜像节点间同步。该模式带来的副作用也很明显,除了降低系统性能外,如果镜像队列数量过多,加之大量的消息进入,集群内部的网络带宽将会被这种同步通讯大量消耗。所以这种模式应用于可靠性要求较高的场合中。
内存节点与磁盘节点
rabbitmq的集群节点包括内存节点、磁盘节点。顾名思义内存节点就是将所有数据放在内存,磁盘节点将数据放在磁盘。不过,如前文所述,如果在投递消息时,打开了消息的持久化,那么即使是内存节点,数据还是会放在磁盘。原则上一个集群至少有一个磁盘节点。在实际使用中会发现所谓的磁盘节点是只用来存储集群的配置信息,也就是说如果集群中没有磁盘节点,当所有节点关机后集群的配置信息就会丢失。在进行性能测试时两个模式的节点订阅发布消息的性能没有太大差距。
多节点负载分发
rabbitmq集群模式是没有中心节点的,并且在连接集群的时候实际上consumer是连接其中某一台节点,连接方法和单主机模式一致。那就遇到一个尴尬的问题,怎么保证consumer均匀的连接到多个节点。以下是我的一些思考,提供了两个思路。
1、通过负载均衡设备来实现流量分发。可以使用f5硬件负载均衡,如果没有f5的硬件负载均衡设备也可以使用想lvs等服务,当consumer连接集群时实际是先经过负载均衡。
虽然负载均衡设备通常都很稳定,但这样一来rabbitmq的集群就有了中心节点。我们在使用的时候是这样的,首先将集群中所以节点的ip放在一个数组中,app在连接rabbitmq的时候会从数组中随机选择一个ip来连接,然后把连接的节点的ip缓存到服务器,如果连接超时则重新随机选择其他节点来连接。通过这种方式来实现app流量的分发。
现在对集群的基本概念都有了了解,下面我们一起来搭建一个普通模式的集群。
rabbitmq集群部署
我用5台服务器来搭建一个5个节点的集群,其中192.168.63.134为磁盘节点,其他服务器为内存节点。对服务器的命名如下:
192.168.63.134 rmq_d_134
192.168.63.130 rmq_m_130
192.168.63.131 rmq_m_131
192.168.63.132 rmq_m_132
192.168.63.133 rmq_m_133
在前面第三章讲过单主机的rabbitmq如何安装http://blog.csdn.net/super_rd/article/details/70241007
先安装好5台单主机的rabbitmq。
修改每一台主机的host文件(每一台都要添加所有):
vi /etc/hosts
192.168.63.134 rmq_d_134
192.168.63.130 rmq_m_130
192.168.63.131 rmq_m_131
192.168.63.132 rmq_m_132
192.168.63.133 rmq_m_133
修改每一台主机的主机名:(我没有一一列出)
vi /etc/sysconfig/network networking=yes
networking_ipv6=no
hostname= rmq-d-xxx
打开每一台主机的相应端口:
firewall-cmd --permanent --add-port=25672/tcp
firewall-cmd --permanent --add-port=15672/tcp
firewall-cmd --permanent --add-port=5672/tcp
firewall-cmd --permanent --add-port=4369/tcp
systemctl restart firewalld.service
同步每个节点cookie(在134执行)
rabbitmq的集群是依赖于erlang的集群来工作的,所以必须先构建起erlang的集群环境。erlang的集群中各节点是通过一个magic cookie来实现的,这个cookie存放在 /var/lib/rabbitmq/.erlang.cookie 中,文件是400的权限。所以必须保证各节点cookie保持一致,否则节点之间就无法通信。
scp /root/.erlang.cookie root@192.168.63.130:/root/
scp /root/.erlang.cookie root@192.168.63.131:/root/
scp /root/.erlang.cookie root@192.168.63.132:/root/
scp /root/.erlang.cookie root@192.168.63.133:/root/
所有节点授予400权限
chmod 400 /root/.erlang.cookie
所有节点重启(最好服务器重启)
rabbitmqctl stop
rabbitmq-server -detached
使用命令 验证hosts解析ip是否正确
rabbitmqctl status -n rabbit@rmq_d_134
rabbitmqctl status -n rabbit@rmq_m_130
rabbitmqctl status -n rabbit@rmq_m_131
rabbitmqctl status -n rabbit@rmq_m_132
rabbitmqctl status -n rabbit@rmq_m_133
连接集群
rabbitmqctl stop_app(注意硬盘节点先不要执行)
rabbitmqctl join_cluster --ram rabbit@rmq_d_134(连接到任意一个已经加入集群的节点均可)
rabbitmqctl start_app
rabbitmqctl cluster_status //查看集群状态
//磁盘节点,join_cluster 命令去掉--ram参数即可。
//在rabbitmq集群里,必须至少有一个磁盘节点存在(磁盘节点用来存储集群状态)。
远程访问配置
配置集群之后需要重新添加账号
默认网页是不允许访问的,需要增加一个用户修改一下权限,代码如下:
rabbitmqctl add_user wyt wyt //添加用户
rabbitmqctl set_permissions -p / wyt ".*" ".*" ".*" //添加权限
rabbitmqctl set_user_tags wyt administrator //修改用户角色
这时候一个账号可以在多个rabbitmq平台使用
删除节点:
修改host和主机名,同之前的步骤。
在要脱离集群的节点执行:
rabbitmqctl stop_app
rabbitmqctl rest
rabbitmqctl start_app
或者在其他节点执行:(例如删除rmq_m_133节点)
rabbitmqctl stop_app
rabbitmqctl forget_cluster_node rabbit@rmq_m_133
增加节点:
在已有节点复制cookies到新的节点
scp /root/.erlang.cookie root@192.168.63.135:/root/ //在已有节点执行。
//以下在要新增的节点执行。
rabbitmqctl stop_app
rabbitmqctl join_cluster --ram rabbit@rmq_m_135
rabbitmqctl start_app
查看集群状态:
rabbitmqctl cluster_status
rabbitmq镜像集群配置
尽管我们部署好了普通模式的集群,但因为节点间只同步队列结构并不进行消息的同步,对于一些可靠性要求较高的场景需要对队列中的消息也同步到所以节点。
使用rabbit镜像功能,需要基于rabbitmq策略来实现,政策是用来控制和修改群集范围的某个vhost队列行为和exchange行为,在cluster中任意节点启用策略,策略会自动同步到集群节点。
策略的修改可以通过命令也可以通过web,如果我是通过web来修改的,非常简单。
pattern:“^” 表示所有匹配所有队列名称。”^log” 是指同步”log”开头的队列名称。
ha-mode:“all”代表同步到所以节点。
填写好后点击“add policy”应用配置策略。可以看到已经新建的策略。
新建一个队列,然后查看队列列表。可以看到一个“ 4”说明数据被保存了四份。
点击队列查看队列详情。可以看到队列是在150节点创建的,但是同步到了其余四个节点。