Cómo funciona el almacenamiento RAID

Escrito por Ontrack | 09/15/2022

Grupo/matriz redundante de discos independientes (RAID) es un término utilizado para los sistemas de almacenamiento de datos informáticos que reparten y/o replican los datos en varias unidades. La tecnología RAID ha revolucionado el almacenamiento de datos en las empresas que se diseñó con dos objetivos clave: aumentar la fiabilidad de los datos y aumentar el rendimiento de I/O (entrada/salida).

No obstante, el almacenamiento RAID no es una tecnología perfecta, por lo que pueden producirse pérdidas de datos al utilizar estos sistemas. En este post veremos cómo funcionan los niveles RAID y cómo pueden almacenarse (y perderse) los datos utilizando este tipo de almacenamiento.

¿Cómo funciona RAID?

Un RAID combina los discos físicos en una sola unidad lógica mediante el uso de hardware o software especial. Las soluciones de RAID por hardware pueden ser de varios tipos, desde las integradas en la placa base o las tarjetas complementarias hasta los grandes servidores NAS o SAN para empresas. El sistema operativo (SO) de este tipo de configuración desconoce el funcionamiento técnico del RAID, por lo que las soluciones de software suelen implementarse dentro del SO.

El RAID se utiliza tradicionalmente en servidores, pero también puede utilizarse en estaciones de trabajo. Esto último es típico en los ordenadores que hacen un uso intensivo del almacenamiento, como los que se utilizan para la edición de vídeo y audio, donde se requieren grandes capacidades de almacenamiento y velocidades de transferencia de datos.

Términos de almacenamiento RAID más utilizados

Veamos algunos de los términos técnicos que se suelen utilizar para describir aspectos del almacenamiento RAID:

RAID -Una tecnología que admite varias configuraciones de disco duro para lograr un mayor rendimiento, fiabilidad y mayores tamaños de volumen mediante el uso de la consolidación de los recursos de disco y los cálculos de paridad.
Paridad – Información descentralizada que permite recrear los datos almacenados en una matriz RAID, incluso si falla un disco.
Espejo – Cuando los datos de 1 o más discos duros se duplican en otro(s) disco(s) físico(s).
Seccionado – Un método en el que los datos pueden escribirse en varios discos. En el siguiente ejemplo, los datos se escriben a través de las unidades en un orden secuencial hasta que llegan a la última unidad. A continuación, salta de nuevo a la primera unidad e inicia una segunda secuencia, etc.
Block – Un bloque es el espacio lógico de cada disco donde se escriben los datos; la cantidad de espacio la establece la controladora RAID.

Simetría izquierda / derecha – La simetría en un RAID controla cómo se distribuyen los datos y la paridad entre las unidades. Hay cuatro estilos principales de simetría que se pueden utilizar dependiendo del proveedor de RAID. Algunas empresas también fabrican estilos propios en función de sus necesidades comerciales.

Hot Spare – Hay diferentes métodos para tratar los fallos de las unidades dentro de un RAID. Uno de los métodos es el uso de un "hot spare", que es un disco de repuesto que puede utilizarse en lugar de un disco que ha fallado.
Modo degradaddo – Esto ocurre cuando una unidad del RAID se vuelve ilegible. La unidad se considera mala y se retira del RAID. Los nuevos datos y la paridad se escriben entonces en las unidades restantes del RAID. Si se requiere algún dato de la unidad que ha fallado, se trabaja con la paridad de las otras. Esta disminución de las unidades de disco degrada el rendimiento del RAID.

Ahora vamos a examinar los tres conceptos clave de RAID (espejo, seccionado y corrección de errores) y a explorar cómo funcionan algunas de las configuraciones de nivel estándar.

Niveles de almacenamineto RAID

Como se ha mencionado anteriormente, la duplicación implica la copia de datos en más de un disco, la división en secciones se produce cuando los datos se reparten en más de un disco y la corrección de errores se produce cuando se almacenan datos redundantes como medio para permitir que los problemas se detecten y posiblemente se solucionen (lo que se conoce como tolerancia a fallos). Una o varias de estas técnicas pueden utilizarse en diferentes configuraciones RAID, en función de los requisitos del sistema.

La configuraciones RAID estándar se denominan niveles. Originalmente se desarrollaron cinco niveles, pero han surgido muchas más variantes, incluyendo varios niveles anidados y muchos niveles no estándar (en su mayoría propietarios). El sector ya ha visto cómo se amplían los niveles de RAID 0 a RAID 51 (y más allá). Dado que los diferentes niveles tienen diferentes tipos de redundancia, normalmente hay es necesario hacer una compensación entre la tolerancia a los fallos y el rendimiento, dependiendo de la aplicación.

Los niveles básicos de RAID incluyen:

RAID 0 – A menudo llamado "seccionado, se considera el ninel RAID más básico. No ofrece ninguna redundancia pero sí un excelente rendimiento. Los datos se dividen como mínimo en dos discos y, con cada disco que se añade, el rendimiento de lectura/escritura y la capacidad de almacenamiento aumentan con respecto a una sola unidad.
RAID 1 – Este nivel también se llama "espejo", que (como su nombre indica) refleja los mismos datos en dos discos, proporcionando el nivel más bajo de redundancia RAID. Este nivel ofrece hasta el doble de rendimiento de lectura con respecto a una unidad simple, pero no aumenta la velocidad de escritura. Los datos almacenados son siempre accesibles si un disco sigue funcionando.
RAID 5 – Esta es una configuración común que ofrece una solución de compromiso satisfactoria entre la seguridad y el rendimiento. Requiere al menos tres discos y proporciona una mejora en la velocidad de lectura, pero no aumenta el rendimiento de escritura. RAID 5 introduce "paridad" a la matriz, que ocupa el espacio de un disco en total. Este nivel también puede tolerar un fallo de disco.
RAID 6 – Esto lleva el concepto de RAID 5 un paso más allá; se requiere un mínimo de cuatro discos y se introduce la doble paridad, lo que significa que los datos se pueden recrear incluso si dos discos fallan dentro de la matriz.

Matrices RAID modernas

Hay muchas formas de sacar más partido a su sistema RAID. Sin embargo, dada la naturaleza altamente complicada y técnica de las matrices modernas (y la forma en que pueden utilizarse con otros sistemas complejos para obtener importantes beneficios de eficiencia y coste, como la virtualización), no es raro que una de estas tecnologías sufra un fallo. Esto puede causar una importante pérdida de datos debido a la interconectividad de múltiples sistemas y como resultado puede costar a las empresas millones en tiempo de inactividad.

Las matrices RAID modernas también pueden utilizar varios sistemas de archivos, como BTRFS o ZFS a nivel de hardware, con NTFS o HFS superpuestos para el soporte de aplicaciones a través de la virtualización.

Retos de la recuperación de datos RAID

Las matrices RAID son muy complejas. Esto suele intensificarse en las infraestructuras informáticas de las empresas, ya que los sistemas RAID se utilizan sobre todo para aplicaciones críticas para el negocio, donde la disponibilidad y la eficiencia son factores cruciales. Las tecnologías complementarias, como la virtualización o las aplicaciones de bases de datos, también pueden suponer un desastre para la empresa si el sistema falla.

Desde el punto de vista de la recuperación de datos, normalmente sería necesario reconstruir el sistema de archivos RAID y evitar cualquier fallo físico, así como evaluar cualquier arquitectura virtualizada que pueda existir. Este proceso a menudo puede hacer que un intento de recuperación sea extremadamente complejo y lleve mucho tiempo; sin embargo, en muchos casos la recuperación de datos puede tener mucho éxito.

Prepararse para un fallo de la unidad

Desafortunadamente, las unidades pueden (y lo harán) fallar en algún momento de su vida útil. Si se produce un fallo que afecte a unidades individuales (suponiendo que se trate de un RAID 1 o superior), basta con sustituir la unidad defectuosa por una nueva y el mapa de almacenamiento de datos puede reconstruirse sin pérdida de datos. Sin embargo, si un fallo de la unidad supera la capacidad de redundancia del RAID, se debe contactar inmediatamente con un especialista en recuperación de datos RAID con el fin de tener la mayor posibilidad de recuperar sus datos. Es imprescindible asegurarse de que el proveedor elegido cuenta con las herramientas y la experiencia necesarias en la recuperación de cualquier configuración o situación de pérdida de datos. También debe evaluar si tienen asociaciones directas con proveedores de almacenamiento y capacidades de desarrollo para alojar configuraciones nuevas o personalizadas.

¿Ha experimentado recientemente la pérdida de datos de un RAID? Póngase en contacto con los expertos de Ontrack para que le ayuden a recuperar sus datos de misión crítica. Nuestro personal está disponible las 24 horas del día, los 365 días del año, para ayudarle con sus necesidades, desde las cotidianas hasta las situaciones de pérdida de datos que se producen una vez en la vida.

Ver post completo