Instalación y configuración de clúster de conmutación por error con Hyper-V

Información del reporte:

Licencia Creative Commons

El contenido de los textos es responsabilidad de los autores y no refleja forzosamente el punto de vista de los dictaminadores, o de los miembros del Comité Editorial, o la postura del editor y la editorial de la publicación.

Para citar este reporte técnico:

Martínez Sierra, L. (2024).Instalación y configuración de clúster de conmutación por error con Hyper-V. Cuadernos Técnicos Universitarios de la DGTIC, 2 (3). https://doi.org/10.22201/dgtic.ctud.2024.2.3.62

Laura Martínez Sierra

Dirección General de Cómputo y de
Tecnologías de Información y Comunicación
Universidad Nacional Autónoma de México

laura.martinez@unam.mx

ORCID: 0009-0004-2850-2384

Resumen:

Se realizó la instalación y configuración de un clúster de conmutación por error con Hyper-V para la Universidad Nacional Autónoma de México. Esta implementación surge de la necesidad de proveer máquinas virtuales a entidades y dependencias pertenecientes a la Universidad. Las máquinas virtuales proporcionadas deben estar disponibles el mayor tiempo posible. No obstante, dentro de la tecnología pueden existir fallos o errores, la instalación de un clúster de conmutación por error permite que, si un nodo falla, otro proporcione el servicio, lo que permite brindar alta disponibilidad. Sin embargo, alta disponibilidad se logra a través de toda una infraestructura de TI compuesta por hardware, software, elementos de red, centros de datos, por mencionar algunos. La instalación del clúster se realizó utilizando el modelo en cascada: se divide en distintas fases secuenciales y solo se puede avanzar a la siguiente fase hasta que se finalizó la anterior. Esta metodología permitió cumplir con las necesidades de cada fase y lograr la instalación exitosa del clúster de conmutación por error.

Palabras clave:

Clúster de conmutación por error, virtualización, máquinas virtuales, servidores, Hyper-V.

1. Introducción

En la actualidad el desarrollo de la tecnología ha introducido en nuestra realidad nuevos conceptos y herramientas, tal es el caso de la virtualización, que “es una tecnología que se puede usar para crear representaciones virtuales de servidores, almacenamiento, redes y otras máquinas físicas” (AWS, s.f). El uso de la virtualización tiene como beneficios la utilización eficiente de los recursos, reducción de costos de operación, administración sencilla, aprovisionamiento de máquinas virtuales rápido y eficiente. Valerio-Vargas, Martínez-Moreno y Pino-Herrera (2020) mencionan como beneficios de la virtualización, que reduce los tiempos de inactividad, elimina la limitante de recursos físicos y aumenta la disponibilidad de activos.

La virtualización es una práctica comúnmente utilizada en empresas, instituciones de gobierno e instituciones educativas, que utilizan esta tecnología para realizar implementaciones (Coro Fernández, W.D) obteniendo resultados exitosos. Tal es el caso de la Universidad Nacional Autónoma de México (UNAM), a través de la Dirección General de Cómputo y de Tecnologías de Información y Comunicación (DGTIC), donde se hace uso de la virtualización en el servicio de alojamiento de máquinas virtuales, el cual “proporciona recursos virtuales de cómputo, compuestos por procesamiento, memoria, red, disco duro, sistema operativo y configuración básica de seguridad informática” (DGTIC, 2024). Este servicio opera en todo momento para que académicos o investigadores pertenecientes a la Universidad realicen actividades de administración de servicios, así como trabajos de investigación y desarrollo haciendo uso de los recursos virtuales asignados, por lo que la UNAM estipula que el servicio de máquinas virtuales debe tener disponibilidad del 98.43% al año (DGTIC, 2022). Para satisfacer esta necesidad es preciso contar con un sistema que proporcione alta disponibilidad, que se define como “la capacidad que tiene un sistema de tecnologías de la información para ser accesible y confiable casi todo el tiempo, lo cual elimina o disminuye el tiempo de inactividad” (Red Hat, 2022). Es decir, la alta disponibilidad es la capacidad de seguir proporcionando un servicio continuo a pesar de interrupciones y otras fallas.

Para proveer la alta disponibilidad requerida por el servicio de alojamiento de máquinas virtuales, en DGTIC se decidió la implementación del primer clúster de conmutación por error:

Un clúster de conmutación por error es un grupo de equipos independientes que trabajan juntos para aumentar la disponibilidad y la escalabilidad de los roles en clúster (anteriormente denominados aplicaciones y servicios en clúster). Los servidores agrupados (denominados nodos) están conectados mediante cables físicos y mediante software. Si se produce un error en uno o más de los nodos del clúster, otro nodo comienza a dar servicio (proceso que se denomina conmutación por error) (Microsoft, 2023).

Se determinó el uso de la tecnología Hyper-V de Microsoft, ya que para la construcción de un clúster de conmutación por error se requiere del uso de un hipervisor, el cual se define como “un componente de software que administra varias máquinas virtuales en una computadora. Garantiza que cada máquina virtual reciba los recursos asignados y no interfiera con el funcionamiento de otras máquinas virtuales” (AWS, s.f).

Adicionalmente, y para lograr la alta disponibilidad, también se consideró el uso de servicios de energía eléctrica, sistema de aire acondicionado y redes de datos con redundancia; asimismo, se definió que se requiere que los sistemas se encuentren actualizados: sistemas operativos con versiones recientes, servicios y características con versiones actuales, y acceso al licenciamiento.

El objetivo del presente reporte técnico consiste en desarrollar el proceso para instalar y configurar un nuevo clúster de conmutación por error usando la tecnología Hyper-V de Microsoft.

2. Desarrollo técnico

Un clúster de conmutación por error en Windows server ofrece: alta disponibilidad, almacenamiento de recursos compartidos, administración centralizada, equilibrio de carga de máquinas virtuales, herramientas de administración a través de interfaz gráfica y línea de comandos, herramientas de conexión remota y uso de la tecnología Hyper-V como producto de virtualización de hardware de Microsoft.

“Hyper-V permite crear y ejecutar una versión de software de un equipo, denominadamáquina virtual. Cada máquina virtual actúa como un equipo completo, ejecutando un sistema operativo y programas” (Microsoft, 2023). Entre las características de la tecnología Hyper-V se encuentran:

Entorno informático:una máquina virtual de Hyper-V incluye los mismos componentes básicos que un equipo físico, como memoria, procesador, almacenamiento y redes.
Portabilidad: características como la migración en directo, la migración del almacenamiento y la importación o exportación facilitan el traslado o distribución de una máquina virtual.
Optimización: cada sistema operativo invitado compatible tiene un conjunto personalizado de servicios y controladores, denominado servicios de integración, que facilita el uso del sistema operativo en una máquina virtual de Hyper-V (Microsoft, 2023).

La revisión de características que brinda Hyper-V se consultó en la documentación oficial del fabricante, así como en otros reportes de implementación, en los cuales se encontraron ventajas del uso de Hyper-V; algunas de ellas se mencionan a continuación:

Ejecutar cada máquina virtual en su propio espacio aislado, con lo cual será posible ejecutar más de una máquina virtual en el mismo hardware físico de forma simultánea.
Hacer uso del hardware de forma más eficaz, ya que será posible consolidar servidores y cargas de trabajo en menos equipos físicos con mejores opciones de hardware, y así usar menos energía y espacio físico.
Establecer o expandir una infraestructura de escritorio virtual (VDI) (Niño Vásquez, 2020).

Otras herramientas importantes propias del sistema operativo Windows son, el uso de PowerShell y la administración remota a través del Protocolo de Escritorio Remoto (RDP, por sus siglas en inglés): “PowerShell es una solución de automatización de tareas multiplataforma formada por un shell de línea de comandos, un lenguaje de scripting y un marco de administración de configuración” (Microsoft, 2024). Destaca que PowerShell facilita la administración del clúster al poder ejecutar configuraciones a través de línea de comandos y así obtener información detallada de máquinas virtuales.

A su vez, “RDP, es unprotocolo, o estándar técnico, para usar un ordenador de escritorio a distancia” (Cloudflare, s,f). Como Huaillas García indica (2018), habilita “la capacidad de administrar de forma remota equipos Windows mediante la conexión en red a través del puerto 3389, permitiendo el acceso a archivos, programas y todos los recursos del equipo destino al que se conecta el usuario como si estuviese frente al mismo”. Esto permite que los usuarios puedan acceder a equipos Windows de manera rápida y en el momento que lo requieran.

2.1 Metodología

Para la construcción del clúster de conmutación por error con Hyper-V se utilizó como base el modelo en cascada. Las fases fueron las siguientes: requisitos, diseño, implementación, verificación y mantenimiento.

En la fase inicial se definieron los requerimientos para la implementación de un clúster de conmutación por error.
Para la fase de diseño, se determinaron los elementos que conformaron el clúster, así como especificaciones de hardware a utilizar.
Durante la fase de implementación, se realizó la instalación y configuración del clúster.
En la fase de verificación, se ejecutaron pruebas para comprobar la alta disponibilidad y se generaron servidores virtuales para constatar su correcto funcionamiento.
Finalmente, en la fase de mantenimiento se efectuaron las actualizaciones correspondientes del sistema operativo.

Utilizar el modelo en cascada permitió definir las fases del proyecto para dar seguimiento a cada etapa, y contar así con puntos de verificación.

2.2 Desarrollo

En la primera fase, se definieron los requerimientos para la construcción del clúster: se estableció la necesidad de tener alta disponibilidad, administración centralizada, almacenamiento compartido, versión del sistema operativo, acceso al licenciamiento, así como el uso de servidores físicos y virtuales.

En la fase de diseño, se determinaron los elementos del clúster de conmutación por error, así como las especificaciones de hardware. Se definió el uso de cuatro servidores físicos con el rol de Hyper-V, un servidor físico como Directorio Activo y un servidor virtual como Directorio Activo secundario para proporcionar alta disponibilidad en los servicios de Directorio Activo. Cada servidor físico cuenta con 256 GB de RAM y 2 procesadores a 2.60GHz. Se definió el uso de cinco servidores, que son el número de equipos que se tenían destinados en DGTIC para brindar servicio de alojamiento de máquinas virtuales.

La estructura del clúster se observa en el siguiente diagrama (figura 1). Se muestra la representación de los nodos del clúster, así como la representación de más máquinas virtuales (MV) alojadas en los nodos. Se muestra el Directorio físico (DA), el Directorio Activo virtualizado (ADV) y el almacenamiento. Adicionalmente se representan otros elementos que conforman la infraestructura, como elementos de red y de seguridad.

Figura 1

Componentes de clúster de conmutación por error

A partir del requerimiento de sistemas actualizados, se trabajó en implementar mejoras en la construcción del clúster de conmutación por error, estas consistieron en la generación de un Directorio Activo secundario para proporcionar alta disponibilidad, y la instalación de una versión reciente de sistema operativo, así como una versión de Hyper-V reciente.

En la etapa de implementación, se realizaron una serie de pasos técnicos para la instalación y configuración del clúster de conmutación por error: como primer paso se realizó la instalación del del sistema operativo Windows Server 2022 Datacenter en los cinco nodos físicos, y al finalizar este proceso se cambió el nombre a cada nodo, y se hizo la actualización de fecha y hora.

Posteriormente, se realizó la instalación de Hyper-V en cuatro nodos físicos. Este proceso se realizó a través del asistente para agregar funciones, el cual consiste en una secuencia de ventanas que indican los pasos a seguir; se seleccionó el rol de Hyper-V y se siguieron los pasos indicados por el asistente para concluir con la instalación.

El siguiente paso consistió en la instalación del Directorio Activo también conocido como AD, se configuraron los parámetros de red y se realizó la instalación del AD a través del asistente para agregar funciones, que permitió habilitar el rol de Directorio Activo y las características de administración.

Terminadas las instalaciones de los roles en cada servidor, se realizaron las configuraciones de red para los cuatro nodos con rol de Hyper-V, se generaron dos NIC Teaming y se asignaron las IP correspondientes.

A continuación, se incorporaron los nodos al Directorio Activo, este paso consistió en agregar cada equipo al dominio, lo que se verificó a través de pruebas de conexión.

Una vez agregados los nodos al Directorio Activo, se instalaron las características de Failover clúster y Multipath I/O por medio del asistente para agregar funciones (figura 2).

Figura 2

Instalación de características

Posteriormente se habilitó Multi-Pathing para iSCSI.

El siguiente paso consistió en agregar el almacenamiento, inicializar los discos y generar volúmenes en los cuatro nodos con rol de Hyper-V.

Una vez cumplidos los requerimientos, se realizó la validación de configuración para la instalación del clúster de conmutación por error por medio de la herramienta “Administrador de clúster de conmutación por error”. Esta herramienta permite validar si se cumplieron todos los requisitos necesarios para tener una instalación exitosa. Sin embargo, cuando se ejecutó por primera vez la herramienta se detectó un problema, un nodo del clúster no realizó el cambio de nombre correctamente, por lo que se realizó nuevamente el proceso en el nodo, se reinició el equipo y se ejecutó la validación de configuración por segunda vez, en esta ocasión el servidor ya estaba nombrado de manera correcta y se continuó el proceso.

Finalmente, se realizó la instalación del clúster utilizando la misma herramienta “Administrador de clúster de conmutación por error” (figura 3).

Figura 3

Administrador de clúster de conmutación por error

Posterior a la instalación del clúster, se generaron los switches virtuales para proporcionar acceso a la red a los servidores virtuales que se alojaron en el clúster.

Se inició la fase de verificación, que consistió en la generación de servidores virtuales de prueba, se asignaron los switches virtuales a los servidores virtuales y se comprobó que tuvieran acceso a la red. También se realizaron pruebas de alta disponibilidad en los nodos del clúster.

2.3 Resultados

Se realizó la instalación y configuración del clúster de conmutación por error en el periodo 2023-2024 como se definió en los requerimientos iniciales. El clúster se conformó por cuatro nodos físicos con el rol de Hyper-V para proporcionar alta disponibilidad, un nodo físico con rol de Directorio Activo y un nodo virtual como Directorio Activo secundario para tener redundancia en caso de que el Directorio Activo físico tuviese alguna falla.

Al término de la implementación se validó el correcto funcionamiento del clúster de conmutación por error realizando pruebas exitosas de alta disponibilidad, que consistieron en apagar o reiniciar un nodo para verificar que las máquinas virtuales se migraran automáticamente a un nodo operativo y continuaran activas. Otra de las pruebas realizadas consistió en la generación de máquinas virtuales, y que éstas tuvieran acceso a la red.

Es importante mencionar que, en la fase de implementación se presentó un problema en las validaciones para generar el clúster de conmutación por error, este consistió en que un nodo no se cambió de nombre correctamente, por lo que fue necesario modificar el nombre, reiniciar el servidor y se realizó por segunda vez la validación de configuración, al término de la validación se continuó con el proceso y se finalizó la fase de implementación con éxito.

A continuación, se presentan dos figuras con el tiempo de actividad de dos nodos del clúster en las que se muestra que el nodo uno se encuentra con operación continua (figura 4) y el nodo dos, que tuvo un reinicio por ventana de mantenimiento (figura 5).

Figura 4

Nodo con tiempo de actividad continua

Figura 5

Nodo con reinicio programado

Sin embargo, aunque uno de los nodos tuvo un reinicio programado, la operación del clúster no se vio afectada, por lo que se validó el correcto funcionamiento en producción. En ambas gráficas el eje horizontal hace referencia a los meses y el eje vertical, el número de días activos.

3. Conclusiones

En la implementación del clúster de conmutación por error con Hyper-V se realizaron mejoras, las cuales consistieron en asignar una versión de sistema operativo reciente, licenciamiento y se agregó redundancia al generar un Directorio Activo virtual. Esta implementación es escalable: se pueden agregar nodos para aumentar la capacidad de alojamiento de máquinas virtuales.

Algunas de las configuraciones que se deben validar para la construcción del clúster son: validar que el direccionamiento IP que se utilizará este bien definido, así como la correcta configuración de parámetros de red, revisar conexión entre nodos, instalar los roles y características de Hyper-V o de Directorio Activo según corresponda y configurar correctamente el almacenamiento, por mencionar algunos.

Es importante que todos los requisitos de instalación se cumplan para realizar una validación exitosa de la configuración para instalación del clúster a través del asistente, y se pueda instalar el clúster sin inconvenientes.

La construcción de un clúster de conmutación por error con Hyper-V permitió fortalecer el servicio de alojamiento de máquinas virtuales, que permite que académicos e investigadores realicen actividades de administración de servicios, así como trabajos de investigación y desarrollo, para lo que cuentan con beneficios como el almacenamiento de recursos compartidos, alta disponibilidad, tiempo de inactividad minimizado y conmutación por error automática.

Referencias

AWS. (s.f) ¿Qué es la virtualización? https://aws.amazon.com/es/what-is/virtualization/.

Cloudflare. (s,f). ¿Qué es el Protocolo de escritorio remoto (RDP)? https://www.cloudflare.com/es-es/learning/access-management/what-is-the-remote-desktop-protocol/#:~:text=El%20Protocolo%20de%20escritorio%20remoto%20(RDP)%20es%20un%20protocolo%2C,el%20m%C3%A1s%20usado%20es%20RDP.

Coro Fernández, W.D. (2022). Alta Disponibilidad para el aseguramiento de servicios en un Data Center virtual utilizando la tecnología Hyper-V de Microsoft. [Tesis de grado, Universidad Nacional de Chimborazo]. Repositorio digital de la Universidad Nacional de Chimborazo. http://dspace.unach.edu.ec/handle/51000/10065.

DGTIC. (2022). Política de uso y Acuerdo de Nivel de Servicio-Infraestructura como Servicio (IaaS). https://www.red-tic.unam.mx/content/politica-de-acuerdo-nivel-de-servicio-infraestructura-como-servicio-iaas

DGTIC.(2024). Alojamiento de máquinas virtuales. https://sistemas.tic.unam.mx/index.php/alojamiento-de-maquinas-virtuales/.

Huaillas García, G.A. (2018). Virtualización de Servidores con Hyper-V para la Gestión de la Continuidad del Servicio en la Red de Agencias MIBANCO [Tesis de grado, Universidad César Vallejo]. Repositorio digital institucional de la Universidad César Vallejo. https://repositorio.ucv.edu.pe/bitstream/handle/20.500.12692/36395/Huaillas_GGA.pdf?sequence=1&isAllowed=y

Microsoft. (2023). Clústeres de conmutación por error en Windows Server y Azure Stack HCI. https://learn.microsoft.com/es-es/windows-server/failover-clustering/failover-clustering-overview.

Microsoft. (2023). Información general sobre la tecnología Hyper-V. https://learn.microsoft.com/es-es/windows-server/virtualization/hyper-v/hyper-v-technology-overview.

Microsoft. (2024) ¿Qué es PowerShell? https://learn.microsoft.com/es-es/powershell/scripting/overview?view=powershell-7.4.

Niño Vásquez, D.F. (2020). Diseño de un modelo de virtualización para la implementación de un sistema de servidores en alta disponibilidad [Monografía de grado, Universidad Cooperativa de Colombia]. Repositorio institucional de la Universidad Cooperativa de Colombia. https://repository.ucc.edu.co/server/api/core/bitstreams/05245b2a-7449-4f06-ae67-4ef1ad0ccc1c/content.

Red Hat. (2022). ¿Qué es la alta disponibilidad? https://www.redhat.com/es/topics/linux/what-is-high-availability.

Valerio-Vargas, C. D., Martínez-Moreno, P., & Pino-Herrera, J. (2020). Virtualización de sistemas gestores de cómputo en las organizaciones.Vinculatégica EFAN,6(1), 587–596. https://doi.org/10.29105/vtga6.1-610.