Introducción al RAID

martes, 12 de mayo de 2015 por Nick Green

El acrónimo RAID, originalmente del inglés Redundant Array of Inexpensive Disks (Conjunto Redundante de Discos Baratos) o también conocido en la actualidad como Redundant Array of Independent Disks (Conjunto Redundante de Discos Independientes), hace referencia al sistema de almacenamiento que utiliza múltiples discos duros entre los que distribuye o replica los datos. Las ventajas de un RAID frente a un único disco son una mayor integridad, mayor tolerancia a los fallos, mayor rendimiento y más capacidad.

La especificación RAID original sugería cierto número de «niveles RAID» o combinaciones diferentes de discos. Cada una tenía ventajas y desventajas teóricas. Con el paso de los años, han aparecido diferentes implementaciones del concepto RAID. La mayoría difieren sustancialmente de los niveles RAID originales aunque se ha conservado la costumbre de llamarlas con números.

En el nivel más simple, un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAIDS suelen usarse en servidores y normalmente (aunque no es necesario) se implementan con unidades de disco de la misma capacidad.

Existen tres conceptos básicos o técnicas a tener en cuenta cuando hablamos de RAID: “mirroring”, crea una copia exacta (o espejo) de un conjunto de datos en dos o más discos; “striping”, divide los datos equitativamente entre dos o más discos; “error correction”, donde datos redundantes son almacenados para permitir la detección y solución de posibles problemas (conocido como tolerancia de error). Una o más de estas técnicas pueden ser usadas por los diferentes niveles de RAID dependiendo de los requerimientos del sistema.

Los RAID son usados tradicionalmente en servidores aunque también pueden usarse en estaciones de trabajo (especialmente en computadoras de almacenamiento intensivo usadas principalmente para editar video y audio).

Términos y definiciones usados comúnmente

  • RAID: Sistema de almacenamiento que utiliza múltiples discos duros entre los que distribuye o replica los datos con el fin de obtener una mayor integridad, mayor tolerancia a los fallos, mayor rendimiento y más capacidad.
  • ParidadOperación matemática que permite a los discos duros que forman un RAID fallar sin sufrir pérdidas de datos. La forma más simple de explicarlo es mediante la siguiente ecuación:

A + B = C

Si eliminamos cualquiera de los elementos de la ecuación todavía podremos averiguar su valor a partir de los otros dos restantes:

A = C - B

  • Mirroring: Los datos de uno o más discos duros son duplicados (se crea un espejo) en otro disco o discos duros.
  • Striping: Distribuye los datos entre dos o más discos sin información de paridad que proporcione redundancia. En el ejemplo siguiente los datos son almacenados en los discos en orden secuencial hasta llegar al último disco; una vez los datos son escritos en el último disco, el sistema vuelve al primero para empezar una nueva “stripe” o división y así sucesivamente.
  • Block: Un block (bloque) es el espacio lógico en cada disco donde los datos son escritos, dicha cantidad de espacio es determinada por el controlador del RAID y comúnmente suele ser 16KB a 256KB. Los datos llenarán el espacio hasta que se llegue al límite de capacidad y así sucesivamente con todos los discos. Una vez se haya llenado de datos el último disco, el sistema volverá a empezar de nuevo por el primer disco.
  • Simetría: La simetría en un RAID se encarga de controlar como los datos y la paridad son distribuidos entre los discos duros. Existen 4 estilos principales de simetría, los cuales son usados dependiendo de la empresa que distribuya el RAID. Algunas empresas crean estilos de simetría exclusivos dependiendo de las necesidades del cliente.
  • Hot Swapping (sustitución en caliente): Existen diferentes formas de lidiar con los fallos de discos duros en un RAID, una de ellas es usar el “Hot swapping” que permite que los discos duros que fallen puedan ser reemplazados sin necesidad de detener el sistema.

Modo Degradado: Ocurre cuando uno de los discos del RAID se vuelve ilegible, entonces es considerado corrupto y se extrae del RAID. Los datos y la paridad de dicho disco son almacenados en los discos restantes en el RAID, de tal forma, que si en algún momento se requieren datos del disco que ha fallado estos podrán ser recuperados mediante la paridad de los restantes discos. Este sistema degrada el rendimiento del RAID, de ahí que se llame Modo Degradado.

El blog de la recuperación de datos

Si ha sufrido una pérdida de datos, contáctenos inmediatamente.