Virtualización: ¿Qué es lo que provoca pérdidas de datos en sistemas virtuales?

jueves, 16 de abril de 2020 por Tilly Holland

La tecnología de virtualización domina el entorno empresarial. Según Gartner, la mayor parte de las compañías indican que cuentan con un 75% o más de virtualización. La mejora de los hipervisores ha reducido la complejidad de la configuración y el mantenimiento de los servidores físicos, ha mejorado inmensamente la utilización de los servidores y ha aumentado la flexibilidad de la IT y su capacidad de respuesta ante las necesidades de las compañías. No sorprende que la mayoría de los sistemas de IT modernos estén virtualizados. Aunque existe una potencial desventaja en la virtualización, ya sea que utilices VMware, Hyper-V, Citrix, Oracle o cualquiera de los demás hipervisores.

Las desventajas de la virtualización

Para poder transformar un servidor físico en muchas máquinas virtuales diferentes (VM), se agrega una capa adicional de software. La simplificación de la experiencia de usuario de admin aumenta la complejidad general del entorno de IT, ya que el hardware subyacente resulta ofuscado, lo que hace más difícil para los administradores saber cuál es el sistema físico que están ejecutando sus VM o cuál es el almacenamiento utilizado para una máquina en particular, en caso de ocurrir una pérdida de datos. Ya que son menos las personas requeridas para mantener y monitorear una cantidad mayor de máquinas virtuales (en comparación a los servidores físicos), aumentan las probabilidades de que ocurran problemas y pérdidas de datos.

Principales causas de pérdida de datos en entornos virtualizados

Los datos recopilados en todo el mundo por Ontrack Data Recovery revelan que los incidentes de pérdidas de datos en entornos virtualizados se producen por variadas causas. Las principales razones de pérdidas de datos en máquinas virtuales son el error del usuario, el ransomware, las fallas de hardware y el deterioro de la RAID. El propósito de este documento es el de exponer qué es lo que lleva a una pérdida de datos virtual y explicar de qué manera los proveedores de recuperación de datos globales son capaces de resolver un alto porcentaje de las situaciones de pérdida de datos en entornos virtualizados, aún en los casos más difíciles.

Problemas de hardware/RAID

Para evitar las pérdidas de datos, los sistemas modernos con frecuencia utilizan alguna forma de replicación de datos en múltiples unidades físicas (HDD o SSD), que luego se consolidan en una única unidad lógica. Esta protección de datos puede ocurrir a partir de una solución basada en software o en hardware. La RAID combina múltiples discos rígidos o bandas de datos para aumentar la redundancia, mejorar la confiabilidad de los datos y mejorar el desempeño de I/O (entrada/salida). La RAID fragmenta efectivamente los datos en muchos discos y los ensambla a partir de una solicitud del usuario o de una necesidad del sistema. Es necesario contar con un robusto sistema de RAID para monitorear todo y gestionar los datos.

Los problemas de hardware que deben resolver los sistemas virtuales son básicamente los mismos que los de los sistemas físicos, como los fallos en las unidades, las fallas de los controladores, el deterioro de los componentes de los servidores y los problemas de alimentación eléctrica. Aunque el deterioro de la RAID es un problema de más difícil solución en una VM debido a la naturaleza de la virtualización. Lamentablemente, no es infrecuente sufrir una pérdida de datos en un almacenamiento RAID. A las complejidades de las RAID por software y hardware modernas se les suman las de la compresión y desduplicación. Si agregamos la capa de virtualización adicional, la probabilidad de que ocurra una falla aumenta. Los controladores RAID son los responsables de mapear la localización de toda la información en todos los discos disponibles. Pero si se deteriora la configuración de RAID, no será posible reconstruir los archivos. Cuando eso ocurre, la interconectividad de los múltiples sistemas puede provocar pérdidas de datos y salidas de servicio significativas.

Problemas de formateo/software

El formateo de un disco, disco virtual, matriz, LUN, disco virtual, volumen, etc (o cualquier otro tipo de dispositivo de almacenamiento) y la instalación de software nuevo son otras de las causas de pérdidas de datos en entornos virtualizados. Específicamente en las VM, por ejemplo, es posible reformatear a nivel de Guest o de Host. El deterioro puede ocurrir también a partir de la implementación de actualizaciones y parches defectuosos si no se cuenta con una copia de respaldo offline, de una planificación deficiente de la implementación del nuevo software, de problemas de integración y del deterioro de las bases de datos. Estos problemas también pueden provocar el deterioro del archivo host y daños al sistema de archivos guest. También tenemos que tener en cuenta las pérdidas de datos por aprovisionamiento dinámico. En lugar de asignarle todos los datos que necesitará la VM y posicionar las estructuras de sistemas de archivos en sus ubicaciones físicas específicas, el aprovisionamiento dinámico solamente ofrece la cantidad de espacio necesaria de forma inmediata y agrega bloques adicionales al disco virtual a medida que aumenta su tamaño. Esto puede resultar en un disco o entorno virtual más complejo y más fragmentado. Si los indicadores de metadatos de los datos están dañados o faltan, será difícil localizar los distintos fragmentos y reconstruir el disco virtual. Por otro lado, la capa de mapeo dentro del disco virtual puede haber sufrido daños o haber sido sobrescrita, lo que tornará extremadamente difícil el reensamblado.

Deterioro de los Metadatos del Sistema de Archivos Virtuales

Y otra causa de pérdida de datos es el deterioro de los metadatos. Los metadatos cobran aun mayor importancia en los entornos virtualizados debido a la cantidad de capas y VM que existen. Un problema leve en los datos de VMFS puede tener repercusiones serias en la disponibilidad de los datos.

Error del Usuario

Es posible clasificar a muchas de estas causas de pérdida de datos como errores de usuario por parte de los administradores. Los privilegios de acceso les permiten a los administradores borrar VM, aún de forma involuntaria. De todos modos, incluso en caso de gestionar correctamente los accesos, los errores siguen ocurriendo frecuentemente. Un porcentaje sorprendentemente alto de fallas se debe a la eliminación involuntaria de discos virtuales, la sobrescritura de VM o la reasignación de su espacio. También es posible que ocurra un deterioro de la cadena de instantáneas (snapshots), por ejemplo, si una instantánea de la serie de instantáneas se deteriora, es eliminada o resulta inaccesible por alguna otra razón. Esto puede hacer defectuosas a las copias de respaldo y dificultar la recuperación de datos.

Irónicamente, la facilidad de uso de los hipervisores modernos está provocando que las organizaciones inviertan menos en capacitación. Se le asigna la responsabilidad de gestionar grandes entornos virtualizados y en constante crecimiento a personal con poca experiencia. Los medianos y pequeños proveedores de servicio gestionado (MSP) tal vez no cuenten con la cantidad suficiente de personal experimentado para monitorear frecuentemente los entornos virtuales, de manera de detectar problemas cuando se están desarrollando. En algunos casos, los administradores de IT tal vez no apliquen las medidas de seguridad adecuadas de una base de datos u omitan documentar los cambios. Si está activado el cifrado y se borra un volumen, por ejemplo, resultará difícil recuperar los datos. Otra fuente de inconvenientes es el recambio de personal. El personal nuevo tal vez no sea capaz de resolver las dificultades de las arquitecturas virtualizadas y tal vez borre algunas VM involuntariamente o realice cambios que provoquen pérdidas de datos.

En otros casos, es posible que el archivo plano original esté almacenado pero que nadie pueda localizarlo cuando ocurre una pérdida de datos. Otra causa frecuente de pérdida de datos virtuales en el descuido de las copias de respaldo. ¿Y qué ocurre cuando los distintos equipos de guest, hipervisor y almacenamiento trabajan aislados unos de otros? Es posible que un equipo cree un volumen, otro adjunte el hipervisor y un administrador de guest luego configure la máquina virtual. Este tipo de estructura organizativa ofrece oportunidades para que ocurran errores y fisuras. Resulta más fácil entonces que ocurran borrados, sobrescrituras y reformateos involuntarios. ¿Qué es lo que pueden hacer las compañías cuando sufren una pérdida de datos en un entorno virtualizado? No hay un botón “Deshacer” o “Volver”. Si se borra una VM, se pierde. ¿Copias de respaldo? Con frecuencia están deterioradas o incompletas.

Afortunadamente, con frecuencia es posible recuperar los datos a través de proveedores de servicio de recuperación de datos globales.

Obtén más información acerca de la recuperación a partir de entornos virtualizados en nuestro más reciente white paper.

El blog de la recuperación de datos

Si ha sufrido una pérdida de datos, contáctenos inmediatamente.