Grupo/matriz redundante de discos independientes (RAID) es un término utilizado para los sistemas de almacenamiento de datos informáticos que reparten y/o replican los datos en varias unidades. La tecnología RAID ha revolucionado el almacenamiento de datos en las empresas que se diseñó con dos objetivos clave: aumentar la fiabilidad de los datos y aumentar el rendimiento de I/O (entrada/salida).
No obstante, el almacenamiento RAID no es una tecnología perfecta, por lo que pueden producirse pérdidas de datos al utilizar estos sistemas. En este post veremos cómo funcionan los niveles RAID y cómo pueden almacenarse (y perderse) los datos utilizando este tipo de almacenamiento.
Un RAID combina los discos físicos en una sola unidad lógica mediante el uso de hardware o software especial. Las soluciones de RAID por hardware pueden ser de varios tipos, desde las integradas en la placa base o las tarjetas complementarias hasta los grandes servidores NAS o SAN para empresas. El sistema operativo (SO) de este tipo de configuración desconoce el funcionamiento técnico del RAID, por lo que las soluciones de software suelen implementarse dentro del SO.
El RAID se utiliza tradicionalmente en servidores, pero también puede utilizarse en estaciones de trabajo. Esto último es típico en los ordenadores que hacen un uso intensivo del almacenamiento, como los que se utilizan para la edición de vídeo y audio, donde se requieren grandes capacidades de almacenamiento y velocidades de transferencia de datos.
Veamos algunos de los términos técnicos que se suelen utilizar para describir aspectos del almacenamiento RAID:
Ahora vamos a examinar los tres conceptos clave de RAID (espejo, seccionado y corrección de errores) y a explorar cómo funcionan algunas de las configuraciones de nivel estándar.
Como se ha mencionado anteriormente, la duplicación implica la copia de datos en más de un disco, la división en secciones se produce cuando los datos se reparten en más de un disco y la corrección de errores se produce cuando se almacenan datos redundantes como medio para permitir que los problemas se detecten y posiblemente se solucionen (lo que se conoce como tolerancia a fallos). Una o varias de estas técnicas pueden utilizarse en diferentes configuraciones RAID, en función de los requisitos del sistema.
La configuraciones RAID estándar se denominan niveles. Originalmente se desarrollaron cinco niveles, pero han surgido muchas más variantes, incluyendo varios niveles anidados y muchos niveles no estándar (en su mayoría propietarios). El sector ya ha visto cómo se amplían los niveles de RAID 0 a RAID 51 (y más allá). Dado que los diferentes niveles tienen diferentes tipos de redundancia, normalmente hay es necesario hacer una compensación entre la tolerancia a los fallos y el rendimiento, dependiendo de la aplicación.
Hay muchas formas de sacar más partido a su sistema RAID. Sin embargo, dada la naturaleza altamente complicada y técnica de las matrices modernas (y la forma en que pueden utilizarse con otros sistemas complejos para obtener importantes beneficios de eficiencia y coste, como la virtualización), no es raro que una de estas tecnologías sufra un fallo. Esto puede causar una importante pérdida de datos debido a la interconectividad de múltiples sistemas y como resultado puede costar a las empresas millones en tiempo de inactividad.
Las matrices RAID modernas también pueden utilizar varios sistemas de archivos, como BTRFS o ZFS a nivel de hardware, con NTFS o HFS superpuestos para el soporte de aplicaciones a través de la virtualización.
Las matrices RAID son muy complejas. Esto suele intensificarse en las infraestructuras informáticas de las empresas, ya que los sistemas RAID se utilizan sobre todo para aplicaciones críticas para el negocio, donde la disponibilidad y la eficiencia son factores cruciales. Las tecnologías complementarias, como la virtualización o las aplicaciones de bases de datos, también pueden suponer un desastre para la empresa si el sistema falla.
Desde el punto de vista de la recuperación de datos, normalmente sería necesario reconstruir el sistema de archivos RAID y evitar cualquier fallo físico, así como evaluar cualquier arquitectura virtualizada que pueda existir. Este proceso a menudo puede hacer que un intento de recuperación sea extremadamente complejo y lleve mucho tiempo; sin embargo, en muchos casos la recuperación de datos puede tener mucho éxito.
Desafortunadamente, las unidades pueden (y lo harán) fallar en algún momento de su vida útil. Si se produce un fallo que afecte a unidades individuales (suponiendo que se trate de un RAID 1 o superior), basta con sustituir la unidad defectuosa por una nueva y el mapa de almacenamiento de datos puede reconstruirse sin pérdida de datos. Sin embargo, si un fallo de la unidad supera la capacidad de redundancia del RAID, se debe contactar inmediatamente con un especialista en recuperación de datos RAID con el fin de tener la mayor posibilidad de recuperar sus datos. Es imprescindible asegurarse de que el proveedor elegido cuenta con las herramientas y la experiencia necesarias en la recuperación de cualquier configuración o situación de pérdida de datos. También debe evaluar si tienen asociaciones directas con proveedores de almacenamiento y capacidades de desarrollo para alojar configuraciones nuevas o personalizadas.
¿Ha experimentado recientemente la pérdida de datos de un RAID? Póngase en contacto con los expertos de Ontrack para que le ayuden a recuperar sus datos de misión crítica. Nuestro personal está disponible las 24 horas del día, los 365 días del año, para ayudarle con sus necesidades, desde las cotidianas hasta las situaciones de pérdida de datos que se producen una vez en la vida.