El almacenamiento de la matriz redundante de discos independientes (originalmente económicos) (RAID) ha revolucionado la tecnología de almacenamiento de datos empresariales, creando la tranquilidad de la redundancia (de RAID 1 y superior) que puede minimizar en gran medida el tiempo de inactividad causado por fallas de unidades individuales.

Sin embargo, desafortunadamente, el almacenamiento RAID no es una tecnología perfecta y, como resultado, la pérdida de datos aún puede ocurrir.

Sistema RAID: Historia y presentación

¿Qué es un sistema de almacenamiento RAID?

La definición de RAID está en el nombre del propio sistema. RAID, que representa una matriz redundante de discos independientes, significa literalmente un paquete redundante de discos independientes, un grupo de discos duros múltiples para obtener una única partición lógica. Dependiendo del propósito, RAID aumenta el rendimiento de acceso y escritura de datos, al tiempo que mejora la seguridad de la información.

RAID es una tecnología que admite el uso de 2 o más discos duros en diversas configuraciones con el fin de lograr un mayor rendimiento, confiabilidad y volúmenes de mayor volumen mediante el uso de la consolidación de los recursos de disco y los cálculos de paridad.

Se diseñaron varias configuraciones estándar que se conocen como niveles. Originalmente, se crearon cinco niveles de RAID, pero han evolucionado muchas más variaciones, en particular varios niveles anidados y muchos niveles no estándar (en su mayoría propietarios).

Entonces, ¿qué significan los niveles RAID? Los números simplemente se refieren a la configuración del RAID. Sabiendo que todos los sistemas RAID almacenan datos de manera eficiente, la elección del sistema se basará en sus propias necesidades personales. El RAID 1, por ejemplo, satisface las necesidades de rendimiento y fiabilidad. El RAID 5 es una buena opción si está buscando rendimiento y tolerancia a fallas.

Historial del sistema RAID

RAID es el acrónimo de Redundant Array of Barato Disks (Redundant Array of Independent Disks). El concepto nació en la Universidad de California, Berkeley, donde David A. Patterson, Garth Gibson y Randy H. Katz colaboraron para producir prototipos operativos de cinco niveles de sistemas de almacenamiento RAID. El resultado de su investigación ha formado la base de los complejos sistemas de almacenamiento RAID que existen en la actualidad. Hoy IBM tiene los derechos de propiedad intelectual sobre RAID 5.

El diseño del sistema de almacenamiento RAID tenía como objetivo mejorar el rendimiento, la recuperación, la confiabilidad y la escalabilidad del almacenamiento. El resultado fue un concepto de redundancia único que ofrece capacidades de recuperación de datos en caso de que una unidad falle en el sistema. De hecho, las tarjetas controladoras RAID han adquirido la capacidad de continuar leyendo y escribiendo datos incluso si un disco está "fuera de línea".

Visión general del sistema RAID

RAID es un término usado para esquemas de almacenamiento de datos de computadora que se propagan o replican datos entre múltiples unidades de disco duro. RAID se diseñó con dos objetivos clave: aumentar la confiabilidad de los datos y aumentar el rendimiento de E / S (entrada / salida).

Un RAID combina discos duros físicos en una sola unidad lógica utilizando hardware o software especial. Las soluciones de hardware RAID pueden venir en una variedad de estilos, desde integradas a la placa base o agregar tarjetas, hasta servidores NAS o SAN de grandes empresas. Con estas configuraciones, el sistema operativo desconoce el funcionamiento técnico o el RAID. Las soluciones de software normalmente se implementan en el sistema operativo.

Hay tres conceptos clave en RAID:

  • duplicación, la copia de datos a más de un disco
  • striping, la división de datos en más de un disco
  • corrección de errores, donde se almacenan datos redundantes para permitir que los problemas se detecten y posiblemente se solucionen (conocido como tolerancia a fallas)

Los diferentes niveles de RAID utilizan una o más de estas técnicas, según los requisitos del sistema.

RAID se usa tradicionalmente en servidores, pero también se puede usar en estaciones de trabajo. Esto último es especialmente cierto en las computadoras con uso intensivo de almacenamiento, como las que se utilizan para la edición de audio y video.

Configuraciones RAID

La configuración del sistema lógico divide los datos en cintas en todos los discos físicos. Esto hace posible tener una velocidad de datos equilibrada en todos los discos; En lugar de tener un disco que haga todo el trabajo de leer y escribir los datos, todos los discos funcionan juntos. Por lo tanto, los datos se distribuyen en todos los discos físicos.

Configuraciones RAID

Operaciones redundantes o tolerantes a fallos

La redundancia en una configuración RAID 5 actual es el resultado del uso de una función matemática booleana llamada "OR exclusivo" (XOR). Esto se conoce comúnmente como paridad. La función XOR es un proceso binario lógico. Es mejor considerar la paridad como una combinación de los bloques de datos del otro disco. Cada byte que se escribe en un bloque de datos se calcula en relación con los otros bloques de datos. La paridad obtenida se escribe en el bloque de paridad para esta banda dada. Este cálculo siempre funcionará, independientemente de que falte un bloque de datos. Sin embargo, el cálculo no funcionará si faltan dos bloques, una de las limitaciones de RAID 5, no proporcionará la redundancia adecuada si fallan dos o más discos.

Como se indicó anteriormente, la placa del controlador divide los datos en cintas y también realiza la función XOR en esos datos. La cantidad de cálculos lógicos realizados por el controlador cada segundo es impresionante. Los controladores RAID actuales son sistemas de hardware altamente sofisticados, que incluyen procesadores SDRAM y bancos de memoria diseñados específicamente para el rendimiento y la redundancia.

Recuperación de datos RAID

Aunque los sistemas de almacenamiento RAID están diseñados para ser tolerantes a fallos, algunos fallos de hardware u otros pueden hacer que sus datos sean inaccesibles. Si su sistema encuentra problemas con su matriz RAID, Ontrack Data Recovery es un experto en procedimientos y técnicas de recuperación de datos RAID.

Nuestros ingenieros están de acuerdo en que la recuperación de matrices RAID es uno de los aspectos técnicos más difíciles de la recuperación de datos. La evaluación de una recuperación del sistema RAID es en realidad la combinación de dos pasos muy importantes:

  1. El primero, y el más largo, es el reensamblaje de la matriz. Cuando los ingenieros de Ontrack Data Recovery vuelven a ensamblar el sistema lógico, investigan a fondo cómo se organizan los datos en todos los discos. Luego conocen el orden de los discos y la disposición de los bloques de datos y paridad. Esta inversión en tiempo es necesaria para determinar la configuración original y obtener una recuperación de calidad,

  2. El segundo paso es trabajar en el sistema de archivos lógico. Los sistemas de archivos de registro empresariales actuales son extremadamente complejos. Si la matriz RAID está inactiva, habrá miles de errores dentro del sistema de archivos. Los ingenieros de Ontrack Data Recovery verificarán y confirmarán que la matriz esté estructurada correctamente antes de copiar cualquier información. Este paso extra garantiza una recuperación de calidad.

Recuperación de datos RAID

Vocabulario de RAID de uso común

RAID: RAID es una tecnología que admite el uso de 2 o más unidades de disco duro en diversas configuraciones con el fin de lograr un mayor rendimiento, confiabilidad y volúmenes de mayor tamaño mediante el uso de la consolidación de los recursos de disco y los cálculos de paridad.
Paridad: un cálculo matemático que permite que las unidades dentro de una matriz RAID fallen sin la pérdida de datos. La forma más sencilla de mostrar esto es la ecuación: A + B = C. Puede eliminar cualquiera de las letras de arriba y calcular su valor a partir de las 2 restantes. Es decir. si B se quitó, entonces la ecuación se veía como A +? = C, entonces el valor de B se puede calcular moviendo A, entonces B = C - A. Obviamente, esta es una forma simplista de describirlo, para comprenderlo completamente en un sentido RAID, se requiere el conocimiento de binario y la expresión lógica XOR.
Reflejo: los datos de 1 o más discos duros se duplican en otro (s) disco (s) físico (es).
Striping: el método por el cual los datos y la paridad se pueden escribir en varios discos. En el siguiente ejemplo, los datos se escriben en las unidades en un orden secuencial hasta la última unidad, luego saltan a la primera y comienzan una segunda franja.
Bloque: un bloque es el espacio lógico en cada disco donde se escriben los datos, el controlador RAID establece la cantidad de espacio y lo más común es que tenga un tamaño de 16 KB a 256 KB. Los datos llenarán el espacio hasta que se alcance el límite y luego pasarán a la siguiente unidad, hasta la última unidad cuando saltará al inicio de la siguiente franja.
Simetría izquierda / derecha: la simetría en un RAID controla cómo se distribuyen los datos y la paridad entre las unidades. Hay cuatro estilos principales de simetría, uno de los cuales depende del vendedor RAID. Algunas compañías también hacen estilos de propiedad dependiendo de sus necesidades comerciales.
Hot Spare: hay algunos métodos diferentes para tratar las fallas de la unidad dentro de un RAID, uno es el uso de un repuesto dinámico. Es un disco de repuesto que se puede utilizar en lugar del disco defectuoso.
Modo degradado: esto sucede cuando una unidad en el RAID se vuelve ilegible, la unidad se considera defectuosa y se retira del RAID. Los nuevos datos y la paridad se escriben en las unidades restantes dentro del RAID, si se solicita algún dato de la unidad que falla, se resuelve con la paridad de las otras. Esto degrada el rendimiento del RAID, por lo tanto, el modo degradado.

Contáctenos inmediatamente si ha sufrido una pérdida de datos

Llame al 34900838188 Solicite un presupuesto