Selenium y QA Automation
En el mundo de la automatización de pruebas, Selenium arrasa. Existen otras alternativas, pero lo cierto es que todo el mundo utiliza Selenium.
Hay distintas formas de utilizarlo, y aquí veremos algunas de ellas. He elegido Python porque es mi lenguaje favorito y Java porque es el lenguaje en el que está hecho Selenium.
¿Qué es?
Selenium es un conjunto de herramientas que permiten la automatización de navegaciones Web. En general, esto tiene dos usos:
- Automatizar pruebas web.
- Automatizar tareas web muy repetitivas.
En general, y aunque puede usarse para navegar, llamaremos “Test” a cada uno de los scripts que usemos.
Probablemente leáis en la web acerca de otra opción, llamada Webdriver, pero éste es el nombre que recibe Selenium 2. A veces la información al respecto está un poco confusa.
¿Cómo funciona?
Existen distintas maneras de usarlo, algunas mejores y otras peores:
- Mediante el Selenium IDE.
- Usando el driver adecuado.
- Arrancando un servidor y conectándonos a él
- En modo Hub.
Veremos cada uno de ellos en las siguientes secciones.
Selenium IDE
Consiste en un plugin para Firefox que nos permitirá guardar las acciones que realicemos para después reproducirlas. Realmente lo que hace es guardar un script que después lanzará contra el servidor (ver siguiente apartado).
Ventajas:
- Es muy fácil para comenzar y realizar algunas pruebas básicas.
- Todo mediante clicks de ratón.
- No es necesario un aprendizaje previo.
Desventajas:
- Aunque al principio parece muy interesante, pronto se descubre que realizar las pruebas así es lento.
- No se puede reutilizar nada. Hay que comenzar desde el principio.
- No permite ningún tipo de organización, más allá de agrupar en módulos.
- Es necesario tener el navegador arrancado.
- Sólo funciona con Firefox.
- Las pruebas tienen que ser locales; no se pueden lanzar en remoto.
En general es un modo que puede ser interesante para aprender, para ver cómo hacer algo que no sabemos hacer a mano o para scriptar una navegación frecuente o dos sobre una página.
Driver especifico
Esta opción es NO usar Selenium, sino un driver a medida, como el ChromeDriver. La propia API ya puede utilizar el driver adecuado y así realizar la operación adecuada, sin necesidad de ejecutar servidores.
Ventajas:
- Fácil para comenzar a usar la API.
- Permite organizar el código.
- Abrirá el navegador adecuado.
- Ofrece una API común a todos los navegadores.
Desventajas:
- El código es dependiente del navegador.
- No se puede ejecutar remotamente.
Si usamos Chrome, usando el ChromeDriver tendríamos mucha más versatilidad, pero la API no sería común con otros navegadores.
Servidor
Al arrancar el servidor y usar una API podremos obtener mayor control y realizar las pruebas en remoto. En estas pruebas podremos indicarle al servidor qué navegador queremos arrancar para ejecutar las pruebas.
Luego veremos cómo usar esta API.
Ventajas:
- Se puede utilizar de forma remota.
- El servidor puede estar arrancado y abrirá el navegador adecuado.
- El código se puede organizar como si fuera de producción. Esto también permite guardarlo en un DVCS.
Desventajas:
- Sólo puede ejecutar un script simultáneamente.
- Perdemos parte de la potencia de cada API individual, a favor de una API común a todos los navegadores.
Modo Hub
En este caso lo que tenemos son servidores que se conectan a otro servidor principal, al que llamaremos Hub. Este Hub mantiene una lista ("pool") de tests que irá repartiendo entre sus “clientes”.
Esto permite utilizar distintas máquinas para ejecutar los tests de manera simultánea. Por lo demás, funciona igual que el modo servidor, y cualquier script que hayamos creado antes nos valdrá.
Ventajas:
- Todas las del modo servidor
- Puede ejecutar tantos scripts simultáneos como servidores se conecten a él.
Desventajas:
- Arquitectura un poco más compleja
- Seguimos perdiendo parte de la potencia de cada API individual.
Al lío
Pues ya sabemos lo que hay, así que vamos a hacer alguna cosa. Crearemos un script que se puede ejecutar en modo Hub o servidor. Por simplicidad, aquí contaremos cómo usar el modo servidor.
Lo primero es arrancar un servidor de selenium. Para ello, nos bajamos de la web la última versión y ejecutamos:
|
|
Y ahí se queda funcionando. He copiado una de las líneas de la salida para que veáis dónde estará escuchando: en localhost, usando el puerto 4444.
Ahora necesitamos algo que probar… Lo más sencillo es levantar un servidor en nuestra máquina y así podremos navegar por los directorios. Y hacer esto con python es muy sencillo. Los que no tengáis Python instalado, podéis usar cualquier web como ejemplo:
|
|
Ale, ya tenemos un servidor sirviendo algo que podemos probar. Espero que lo hayáis ejecutado en algún directorio que tenga algún fichero XD
Nuestro primer script
Vamos a hacer un script que abra un Chrome y que compruebe algo básico de la página: el título:
Java
|
|
Y el POM si usáis Maven:
|
|
NOTA: El código que quería mostraros es el comentado. De esa manera sólo dependíamos de una cadena para seleccionar el Browser a utilizar, sin embargo no he conseguido hacer que funcione. Si alguien sabe por qué, le estaría muy agradecido.
Python
En python necesitaremos instalar python-selenium, que es paquete Debian.
|
|
Y ya está.
Comentarios
Como podréis suponer, si en lugar de “firefox” queremos usar “chrome”, basta con cambiar el “browserName”. Para que funcione con Chrome, tendréis que descargaros el chromeDriver y dejarlo en el mismo directorio que esté el servidor.
Si no estuviéramos usando el modo servidor, podríamos haber usado “webdriver.Chrome” o “webdriver.Firefox”, lo que trataría de acceder directamente, tal y como he terminado haciendo en Java. Me parece que ya es limitar el código, así que he decidido usar la manera genérica, usando “webdriver.Remote”.
Es importante cerrar el driver, ya que si no lo hacemos, el navegador se quedará abierto. Con un único test no es crítico, pero con muchos puede afectar al rendimiento de la máquina.
Y aquí lo dejo. Ahora viene la tarea de buscar en la API aquello que queramos hacer: pulsar botones, ir a enlaces, acceder al DOM,… Pero eso ya os lo dejo a vosotros.
¡Me encanta!
Algunos de vosotros diréis: “¡Esto es la leche! Voy a usarlo para todo”… Pero no es así.
Aunque el sistema es muy potente y permite probar toda la página en distintos navegadores, la ejecución de pruebas es lenta. Abrir un navegador puede llevar varios segundos, incluso estando en caché, lo que hace que todo el proceso vaya lento.
Una solución es usar PhantomJS, que no abre navegadores, pero con esta opción no estaremos probando la web en un navegador real. Para nuestra desgracia, habrá muchas funcionalidades JavaScript que funcionarán de forma distinta dependiendo del navegador… y de PhantomJS.
Así que no es una solución que valga para todo. Sin embargo, sí es interesante para tests de aceptación y para automatizar ciertos procesos. Pero por favor, no lo uséis para probar corner-cases. Para eso existen otro tipo de herramientas más rápidas, como los tests de integración.
En este artículo he usado Selenium/Webdriver en modo Script. Más adelante trataré de mostrarlo para realizar tests.