Colas de mensajes: RabbitMQ


Cuando se desarrolla una aplicación y ésta comienza a crecer, a menudo necesitamos interconectar distintos componentes. En estos casos se utiliza un middleware que nos permita comunicar las distintas piezas.

Una opción es usar una cola de mensajes. No es el mecanismo más rápido, pero probablemente sí el más sencillo, y permite realizar acciones de forma asíncrona.

Y un gestor de colas de mensajes sencillo, robusto y muy utilizado es RabbitMQ.

Instalando RabbitMQ

Esta aplicación Erlang es sencilla de instalar en Linux:

apt-get install rabbitmq-server

Y tendremos la aplicación funcionando, escuchando en el puerto 5672.

Es interesante instalar el plugin de gestión para poder ver qué está pasando ahí dentro. Para ello basta con hacer:

rabbitmq-plugins enable rabbitmq_management

Y automáticamente lo tendremos escuchando en http://localhost:15672/

Lo básico de RabbitMQ

Hay algunos conceptos que hay que tener claros de RabbitMQ:

Exchange
Es el punto de entrada de un mensaje. Pueden ser Direct, si entregan un mensaje en una cola, Fanout si se entregan copias del mensaje a todas las colas o Topic si se entregan copias del mensaje sólo a algunas colas.
Queue
Es el punto de lectura de un mensaje. Pueden ser durable o persistentes, si almacenan los mensajes para sobrevivir a un reinicio de RabbitMQ. También pueden ser exclusivas, si sólo un consumidor puede estar conectado a la vez.
Bindings
Son reglas que indican cómo llegar de un Exchange a las Queue asociadas.
Routing key
Filtro asociado a un Binging que permite seleccionar sólo algunos mensajes para dicho binding.
Producer o Productor
Programa que escribe en un Exchange
Consumer o Consumidor
Programa que escucha en una Queue
AMQP
Protocolo de comunicaciones utilizado por RabbitMQ. Lo usa tanto el Productor como el Consumidor.
Virtual host o vhost
Un entorno aislado, con sus propios grupos de usuarios, exchanges, queues, ...
mnesia
La base de datos interna de RabbitMQ

Una vez dicho esto, podemos describir el flujo básico de RabbitMQ:

b'\nn "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">\n\n\n\n\nrabbitmq_basic_flow\n\ncluster_0\n\nRabbitMQ\n\n\nExchange\n\nExchange\n\n\nQueue\n\nQueue\n\n\nExchange->Queue\n\n\nbinding\n\n\nConsumer\n\nConsumer\n\n\nQueue->Consumer\n\n\nlisten\n\n\nProducer\n\nProducer\n\n\nProducer->Exchange\n\n\nsend\n\n\n\n'

Claro, que esto puede evolucionar a entornos mucho más complejos:

b'\nn "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">\n\n\n\n\nrabbitmq_complex_flow\n\ncluster_0\n\nRabbitMQ\n\n\nExchange_1\n\nExchange_1\n\n\nQueue_1\n\nQueue_1\n\n\nExchange_1->Queue_1\n\n\n\n\nQueue_2\n\nQueue_2\n\n\nExchange_1->Queue_2\n\n\n\n\nExchange_2\n\nExchange_2\n\n\nExchange_2->Queue_2\n\n\n\n\nQueue_3\n\nQueue_3\n\n\nExchange_2->Queue_3\n\n\n\n\nConsumer_1\n\nConsumer_1\n\n\nQueue_1->Consumer_1\n\n\n\n\nConsumer_2\n\nConsumer_2\n\n\nQueue_2->Consumer_2\n\n\n\n\nConsumer_3\n\nConsumer_3\n\n\nQueue_3->Consumer_3\n\n\n\n\nConsumer_4\n\nConsumer_4\n\n\nQueue_3->Consumer_4\n\n\n\n\nProducer_1\n\nProducer_1\n\n\nProducer_1->Exchange_1\n\n\n\n\nProducer_2\n\nProducer_2\n\n\nProducer_2->Exchange_2\n\n\n\n\n\n'

En este entorno, y asumiendo que los Exchange están en modo Topic (es decir, que un mensaje llega a todas las colas):

  • Consumer_1 recibe todo lo que produzca Producer_1, pasando por Queue_1. Este tipo de escenario es igual que el básico.
  • Consumer_2 recibe todo lo que produzca tanto Producer_1 como Producer_2, pasando por Queue_2. Útil para procesar eventos que se producen en distintos lugares pero tienen un destino común. Ejemplo: guardar logs de distintas máquinas en base de datos.
  • Consumer_3 y Consumer_4 se repartirán lo producido por Producer_2, pasando por Queue_3. Útil cuando la carga producida es muy alta y se requieren muchos recursos para consimir cada mensaje. Ejemplo: Renderización de vídeo 3D.

Puertos y valores por defecto

Si no cambiamos nada, RabbitMQ escucha en el puerto 5672, y la interfaz de administración en el 15672.

Se crea un usuario guest/guest que nos permite acceder a ambas.

RabbitMQ consume mucha memoria. Recomiendo utilizar servidores dedicados, para que no se haga con toda y tengamos problemas.

Algunas tareas de administración

Crear un vhost

Con el fin de aislar un entorno, podemos crear un vhost. Nada más sencillo:

rabbitmqctl add_vhost /mi_vhost

Crear un usuario

Ahora podemos crear un usuario

rabbitmqctl add_user my_user my_pass

Y podemos asociarlo al vhost:

rabbitmqctl set_permissions -p /my_vhost my_user ".*" ".*" ".*"

Asignar permisos

Si queremos poder utilizar este usuario para entrar en la interfaz de administracción, necesitamos darle permisos de management y monitoring:

rabbitmqctl set_user_tags my_user management monitoring

Por tanto, los mensajes se escriben en un Exchange pero se leen de una Queue. Para llegar de un Exchange a una Queue se utilizan los Routes.

Crear un cluster

Una de las tareas típicas es crear un cluster de RabbitMQ. Esto nos permite mejorar la disponibilidad del sistema, ya que si uno de nuestros servidores cae, el otro seguirá atendiendo peticiones.

Esta tarea es algo más compleja. Supongamos que tenemos dos nodos: rabbit1 y rabbit2. Vamos a añadir Rabbit2, dejando Rabbit1 como maestro inicial. Lo primero que podemos hacer es ver el estado actual del sistema:

rabbit2$ rabbitmqctl cluster_status
[{nodes,[{disc,[rabbit@rabbit2]}]},{running_nodes,[rabbit@rabbit2]}]
...done.

Para crear un cluster, tenemos que parar uno de los RabbitMQ, pero debemos hacerlo con órdenes especiales:

rabbit2$ rabbitmqctl stop_app
Stopping node rabbit@rabbit2 ...done.

A continuación lo añadimos al cluster:

rabbit2$ rabbitmqctl join_cluster rabbit@rabbit1
Clustering node rabbit@rabbit2 with rabbit@rabbit1 ...done.

Y volvemos a arrancar:

rabbit2$ rabbitmqctl start_app
Starting node rabbit@rabbit2 ...done.

Ahora podemos comprobar que todo fue bien:

rabbit2$ rabbitmqctl cluster_status
Cluster status of node rabbit@rabbit2 ...
[{nodes,[{disc,[rabbit@rabbit1,rabbit@rabbit2]}]},
 {running_nodes,[rabbit@rabbit1,rabbit@rabbit2]}]
...done.

Aunque también podemos verlo desde la herramienta de administración (mucho más molona XD)

Es IMPORTANTE que todos los nodos de un cluster tengan la misma versión de RabbitMQ o podríamos tener problemas.

Si se va a gestionar un cluster, recomiendo encarecidamente leerse toda la documentación de RabbitMQ sobre clusters. Es poco y muy conveniente. Además, es bueno tenerlo siempre a mano.

Una vez creado el cluster se puede utilizar una VIp (Virtual IP), de manera que nos respondan ambos indistintamente. Si uno cae, la VIp se puede cambiar mediante Keepalive y, si preparamos nuestra aplicación para hacer reintentos, no se verá afectada por la caída.

En la interfaz de administración podemos ver cómo los mensajes estarán replicados en ambos nodos, el estado de los mismos, etc.

Programando

Para programar contra un RabbitMQ recomiendo usar una de las librerías AMQP. Hay otras opciones de más alto nivel. Por ejemplo, en Python está Kombu, que se abstrae de la cola de mensajes a usar, o incluso Celery, que permite usar una cola de mensajes para la gestión de tareas distribuidas.

Veamos unos ejemplillos sencillos. Recordad que hay muchas opciones y se pueden configurar bastantes historias, pero voy a ir a lo básico:

Python

Utilizaré la librería Pika (tomado de la propia documentación de la librería):

El consumidor:

import pika

connection = pika.BlockingConnection()
channel = connection.channel()
method_frame, header_frame, body = channel.basic_get('test')
if method_frame:
    print method_frame, header_frame, body
    channel.basic_ack(method_frame.delivery_tag)
else:
    print 'No message returned'
connection.close()

Y el productor:

import pika

parameters = pika.URLParameters('amqp://guest:guest@localhost:5672/%2F')
connection = pika.BlockingConnection(parameters)
channel = connection.channel()
channel.basic_publish('test_exchange',
                      'test_routing_key',
                      'Hello, world!',
                      pika.BasicProperties(content_type='text/plain',
                                           delivery_mode=1))
connection.close()

Java

Usando la rabbitmq-java-client, el consumidor:

import com.rabbitmq.client.Connection;
import com.rabbitmq.client.Channel;

class Consumer
{
    public static void main(){
        ConnectionFactory factory = new ConnectionFactory();
        factory.setUri("amqp://guest:guest@hostName:5672/");
        Connection conn = factory.newConnection();

        Channel channel = conn.createChannel();

        channel.basicConsume(queueName, false, "myConsumerTag",
            new DefaultConsumer(channel) {
                @Override
                public void handleDelivery(String consumerTag,
                                           Envelope envelope,
                                           AMQP.BasicProperties properties,
                                           byte[] body)
                    throws IOException
                {
                    System.out.println(body);
                }
            }
        });

        channel.close();
        conn.close();
    }
}

y el productor:

import com.rabbitmq.client.Connection;
import com.rabbitmq.client.Channel;

class Producer {
    public static void main(){
        ConnectionFactory factory = new ConnectionFactory();
        factory.setUri("amqp://guest:guest@hostName:5672/");
        Connection conn = factory.newConnection();

        Channel channel = conn.createChannel();

        byte[] messageBodyBytes = "Hello, world!".getBytes();
        channel.basicPublish("test_exchange", "test_routing_key", null, messageBodyBytes);

        channel.close();
        conn.close();
    }
}

Debo admitir que no los he probado... Así que si alguien encuentra algún fallo, que me lo diga XD

Conclusión

RabbitMQ es un canal de comunicaciones. Quizá no sea muy rápido, ya que no deja de ser un man-in-the-middle, pero permite integrarse fácilmente con cualquier sistema existente.

Además, como no fuerza ningún formato de mensaje, resulta muy sencillo crear conectores que permitan publicar/consumir mensajes e integrar distintos escenarios. Y en las últimas versiones han añadido soporte para mensajes prioritarios, lo que puede dar mucho juego para enviar mensajes de control.

De todas maneras, RabbitMQ es sólo un sistema de colas de mensajes, pero hay otros. También está Apache ActiveMQ, Apache Kafka, Apache Qpid, ZeroMQ, HornetQ, Sparrow, Starling, Amazon SQS, Beanstalkd, ...


Comentarios

Comments powered by Disqus