Actualización de la plataforma de servidores del Interior

El jueves 16/1 actualizamos la plataforma de servidores del Interior de Proxmox VE 5.4 a la 6.1. Todo se desarrolló satisfactoriamente, los pocos imprevistos pudieron ser resueltos sin problema.
Added by Daniel Viñar Ulriksen 7 months ago

La plataforma de servidores de la UdelaR en el Interior corre con Proxmox VE, sistema operativo libre para virtualización, derivado de la Debian. Al ser puesta en producción a fines del 2018, instalamos la versión entonces estable, 5.4, basada en la Debian 9 stretch. Desde entonces, en julio 2019 fue publicada la versión Proxmox VE 6.0, y en diciembre la 6.1.

Se hacía necesario actualizar nuestra plataforma, tanto para mantenerla segura y estable a mediano plazo, como para poder crear en ella contenedores (máquinas virtuales livianas) que corran las últimas versiones de distribuciones linux, como Debian Buster. Si bien Debian y Proxmox tienen reputación de estabilidad, la actualización de servidores madres de una plataforma de virtualización siempre es una operación delicada, por tocar "las fundaciones del edificio".

En las últimas semanas, analizamos y probamos el proceso de actualización, que programamos para ayer 16/1, aprovechando el períodos estival en que baja la actividad. Por precaución, decidimos no correr ningún riesgo de pérdida de datos, por lo cual, previamente, en la madrugada del 15 al 16, programamos la detenciórestauración y verificaciónn de los servicios y la realización de respaldos en frío.

El proceso de actualización se desarrolló satisfactoriamente. Lo que tomó más tiempo fue simplemente la restauración y verificación de los respaldos y el único imprevisto que se presentó fue que ciertas interfaces de red de dos servidores cambiaron de nombre con la actualización, requiriendo ajustar algunas configuraciones para recuperar plenamente los servicios.

Aprovechamos la ocasión para separar la red del cluster, es decir que todas las tareas de sincronización locales a la plataforma puedan hacerse por la red local de 10Gb, dándoles mayor eficiencia y evitando saturar la red de acceso a internet (respectivamente red SAN y NUBE en este esquema).

Si bien en esta primer experiencia de actualización de Proxmox preferimos minimizar los riesgos, observamos claramente cómo los mecanismos de compartición, syncronización y migración de recursos pueden permitir realizar este tipo de operaciones manteniendo una casi continuidad del servicio. Si se van agregando más nodos y recursos redundantes a la plataforma, estas operaciones serán cada vez más fáciles.


Comments