Top 6 de consejos para las pérdidas de datos en el RAID

lunes, 4 de enero de 2016 por Michael Nuncic

Desde la introducción del concepto “matriz redundante de discos independientes (o económicos)”, RAID por sus siglas en inglés, se ha redefinido la gestión y el almacenamiento de datos por parte de los sistemas de almacenamiento. El modo en que funciona esta tecnología es, de hecho, bastante sencillo: una matriz RAID es una configuración de varios discos duros físicos que en su conjunto crean una arquitectura RAID (p. ej., RAID 0, 1, 5, etc.). Esta arquitectura RAID distribuye, entonces, datos en todos los discos, ya que el sistema operativo la percibe como uno solo.

A pesar de que los distintos niveles RAID contienen mecanismos integrados que los protegen de pérdidas de datos provocadas por fallos físicos en uno o varios discos duros, esta tecnología todavía no es a prueba de balas. Por este motivo es aconsejable que, si usas una matriz RAID, te prepares para pérdidas de datos potenciales  considerando los siguientes consejos:

1. Las copias de seguridad son obligatorias, no “recomendables”

Hayas experimentado o no un fallo del sistema o una pérdida de datos causada por un error de usuario, ten siempre a mano una copia de seguridad actualizada de tus datos.

Muchos proveedores de sistemas de almacenamiento basados en RAID de clase baja, media o alta, los venden como un tipo de copia de seguridad física. ¡No te lo creas! Un RAID, independientemente de su nivel de implementación, no es una copia de seguridad. Si tu RAID sufre un fallo serio, es posible que se pierdan los datos. Una copia de seguridad es, por tanto (siempre que se almacene correctamente y se mantenga actualizada), la mejor herramienta para recuperar tus datos en un sistema reconstruido.

2. Elige la mejor configuración RAID

Las diferentes configuraciones RAID presentan distintas redundancias para prevenir las pérdidas de datos, así que es buena idea crear un diseño conceptual de tu sistema de almacenamiento (o incluso comprar uno) que cubra realmente tus provisiones de datos y de pérdidas.

Los discos duros individuales fallan en algún momento de su vida útil. Cuando esto ocurre, si se trata de un RAID 1 o superior, el disco defectuoso puede reemplazarse por uno nuevo y el mapa de almacenamiento de datos puede reconstruirse sin pérdidas.

Cuando tienes un gran volumen de datos no tiene sentido utilizar un RAID 0, en el que si falla algún disco duro te arriesgas a perder toda la información. La experiencia demuestra que al menos un disco duro fallará en algún momento y que en ese caso tu sistema se colapsará.

Si un fallo de disco duro excede la capacidad de redundancia de tu matriz RAID, no pongas en peligro tus datos más críticos y recurre a un especialista que te ayude a reconstruir la matriz y a recuperar tus datos. Si no lo haces, podrías arriesgarte a que la pérdida sea permanente.

3. No intentes reconstruir un sistema con varios discos con fallos, ya que tu nivel RAID no lo soportará

Si experimentas un fallo en dos discos de un sistema basado en un RAID5, no tiene sentido reemplazar uno de los discos defectuosos y ejecutar una reconstrucción, ya que lo más probable es que esto convierta la pérdida de datos en permanente.

La operación de reconstrucción, como su propio nombre indica, hace referencia a la reconstrucción de la matriz RAID en caso de un fallo en el disco duro. Muchos discos ofrecen el “botón de conexión en caliente” que permite extraer y reemplazar el disco duro sin tener que desconectar todo el sistema, y, por tanto, terminar el servicio.

La operación de reconstrucción suele llevar mucho tiempo, pero una solución podría ser reconstruir el RAID tras reemplazar el disco con fallos por uno nuevo. Si algo falla en el procedimiento de reconstrucción, no obstante, podrían generarse daños adicionales. Recuerda que la ejecución de una reconstrucción entraña riesgos y que debería llevarse a cabo solamente si cuentas con una copia de seguridad actualizada y que funciona correctamente.

4. Siempre debes estar preparado para un fallo del sistema o de hardware

Tal como he señalado anteriormente, uno o varios discos duros del controlador RAID pueden fallar en cualquier momento. Si has adquirido un sistema basado en RAID de un fabricante, es muy probable que todos los otros discos duros integrados en el sistema procedan del mismo lote y tengan la misma fecha de producción. Esto significa que no es improbable o inusual que comiencen a fallar y a alcanzar el fin de su vida útil casi al mismo tiempo, por lo que son absolutamente necesarios el examen y el seguimiento periódicos del estado de los discos duros.

Si un disco duro de un RAID5 falla, no dudes en reemplazarlo inmediatamente. Si esta fase se prolonga demasiado, pueden producirse graves pérdidas de datos, ya que existe una mayor posibilidad de que falle también otro disco. Es imprescindible llevar un seguimiento del uso de los discos duros de la matriz de almacenamiento RAID, y esto debería incluirse en el plan de recuperación de datos y continuidad empresarial que toda compañía debería tener. Además, estos planes deberían también incluir los pasos a seguir cuando una matriz de almacenamiento RAID falla y se produce una pérdida de datos.

En los casos más graves, las funciones de recuperación integradas no marchan y pueden incluso llegar a causar daños adicionales que podrían destruir los datos de manera permanente. Especialmente para esos casos recomiendo tener a mano los datos de contacto de un proveedor de servicios de recuperación de datos profesional y de confianza.

5. Si quieres reconstruir tú mismo un disco duro con fallos, etiqueta los discos duros y haz una imagen del contenido de la matriz de almacenamiento completa antes de empezar

Si cuentas con una imagen de todos los discos duros, amplías las probabilidades de una recuperación posterior de los datos en caso de que falle la reconstrucción. Imagina, por ejemplo, un escenario en el que la reconstrucción se detiene al 5 %, se produce una pérdida de datos y el contenido original se sobrescribe y causa la destrucción permanente de los datos: ¡no tendrías la más minima oportunidad de recuperarlos!

Si cuentas con las imágenes, los profesionales expertos en recuperación de datos pueden reconstruir los datos reconstruyendo el sistema RAID y la estructura de datos originales.

Recuerda: para facilitar la reconstrucción, los discos de imagen deben etiquetarse en el mismo orden que en la matriz de almacenamiento.

6.  Si no tienes claro por qué se ha producido un fallo en la matriz y se ha producido una pérdida de datos, no intentes tú mismo una reconstrucción o una recuperación de datos

Lo óptimo es buscar ayuda profesional. No hay nada malo en no saber cómo hacer que el sistema funcione de nuevo, qué procedimientos deben iniciarse o cómo acceder a los datos que se han perdido. ¡Mejor solicitar ayuda profesional que arriesgarte a una destrucción permanente de datos valiosos!

Complicando el RAID

Aunque sigas estos consejos, esto no quiere decir que estés completamente a salvo de futuras pérdidas de datos. Cuanto más complejos se vuelven los sistemas de almacenamiento (y no hablo solo de sistemas de almacenamiento basados en RAID que se almacenan, duplican o dividen en discos duros físicos múltiples), más complicado es recuperar los datos tras sufrir una pérdida.

Hoy en día, las matrices RAID se combinan con diversas tecnologías complejas en los sistemas para facilitarte virtualización, niveles RAID, deduplicación y mucho más. La combinación de dichas tecnologías puede fallar y no puede solucionarse con una función de software operativo. Bien puede suceder que los datos solo puedan recuperarse tras un análisis en profundidad por parte de expertos en recuperación de datos que decidirán qué capa de complejidad debe recuperarse primero para poder acceder a los datos.

Cuando no estés seguro de si dispones de los conocimientos necesarios para recuperar los datos perdidos de tu RAID (y de otros sistemas de almacenamiento basados en tecnología), lo mejor es que te pongas en contacto con un especialista en recuperación de datos como Kroll Ontrack. Cuando se trata de datos sensibles ¡no quieres arriesgar empeorar una situación ya de por sí compleja!

El blog de la recuperación de datos

Si ha sufrido una pérdida de datos, contáctenos inmediatamente.