Lección sobre historial de datos: tecnología RAID

jueves, 4 de noviembre de 2021 por Ontrack

DST_image_970x300_hero-virtualization

Cuando se trata de la industria de tecnología de la información, no es frecuente que una tecnología desarrollada hace muchas décadas todavía se considere lo suficientemente importante como para que se utilice ampliamente por administradores y otros usuarios. Incluso los servidores y sistemas de almacenamiento modernos están funcionando con tecnología RAID, principalmente en empresas, pero también se ha vuelto más frecuente en los sistemas NAS de consumo. La tecnología RAID ha sobrevivido durante más de 30 años y todavía desempeña un papel importante en el almacenamiento de datos en la actualidad.

¿Por qué es eso? Me alegro de que lo pregunte.

Empecemos desde el principio.

En 1987, David Patterson, Garth A. Gibson y Randy Katz inventaron el término RAID mientras estaban en la Universidad de California en Berkeley. Al año siguiente, publicaron un artículo sobre el «Caso para matrices redundantes de discos económicos» en la conferencia SIGMOD en junio de 1988. En ese momento, los discos duros todavía eran bastante caros y tratar de mantener el almacenamiento de datos de forma «eficiente» no solo era común, sino también una necesidad. Además, las empresas estaban usando enormes equipos de sistemas complejos, ya que los equipos de escritorio no se habían introducido ampliamente en el entorno laboral. Sin embargo, todo esto comenzó a cambiar a medida que la aceptación y el uso de los PC ganaban popularidad.

Como consecuencia, las unidades de disco duro para los primeros equipos que no eran con sistemas complejos eran mucho más baratos que los utilizados en los sistemas complejos. Esto fue la razón por la que Garth, Gibson y Katz desarrollaron el concepto de RAID. Argumentaron que varios discos duros conectados y menos costosos superarían a un solo disco duro de sistema complejo superior en términos de rendimiento. Y aunque el uso de muchos discos duros significaba que la tasa de fallas aumentaría, era posible configurarlos para la redundancia, de modo que la fiabilidad de dicha matriz pudiera exceder con creces la de cualquier unidad grande y única de sistema complejo.

Explicación del almacenamiento RAID

RAID se basa en el concepto de que los datos se propagan o se replican en varias unidades independientes o económicas. Las unidades dentro del sistema están configuradas para que los datos se puedan dividir o replicar en dos o más unidades con el fin de distribuir la carga o para ayudar a recuperar datos si falla una unidad. Hay dos formas técnicas de lograrlo: mediante una solución de hardware (un controlador RAID dedicado) o una solución de software, que normalmente está incluida en los sistemas operativos modernos. Los sistemas basados en hardware gestionan el RAID de forma independiente desde el equipo host mediante un controlador RAID, por lo que el sistema operativo desconoce el funcionamiento técnico del RAID y ve todo el sistema de almacenamiento como si fuera un solo volumen conectado al equipo host.

Además de estas implementaciones técnicas, el concepto RAID se basa en estos tres principios fundamentales:

  1. Paridad: una forma de distribuir información a través de un sistema RAID que permite restaurar los datos en caso de fallo en la unidad.
  2. Redundancia: la duplicación de componentes críticos en la arquitectura del sistema para aumentar la fiabilidad y actuar en modo a prueba de errores. En esencia, permite que se produzcan fallos de varios componentes antes de que falle todo el sistema y, en el caso de los sistemas RAID, los componentes son las unidades.
  3. Reflejo: cuando los mismos datos se duplican de un disco a otro. El seccionado es otro método en el que los datos se escriben en varios discos. Distintas configuraciones RAID utilizan una o más de estas técnicas, en función de los requisitos del sistema.

Con base en estos principios, se han desarrollado los siguientes niveles RAID estándar:

  • RAID 0 utiliza seccionado y es el nivel RAID más básico. No ofrece redundancia, pero aumenta el rendimiento. Los datos se seccionan como mínimo en dos discos y, con cada disco que se añade, el rendimiento de lectura/escritura y la capacidad de almacenamiento aumentan con respecto a una sola unidad. Si una unidad falla, no hay forma de que el controlador RAID la reconstruya.
  • RAID 1utiliza el reflejo, que, como su nombre indica, refleja los mismos datos en dos discos, por lo que proporciona el nivel más bajo de redundancia RAID. RAID 1 puede duplicar el rendimiento de lectura en una sola unidad, pero no aumenta la velocidad de escritura. Este nivel permite que falle una unidad.
  • RAID 5es una configuración común y ofrece un compromiso decente entre fiabilidad y rendimiento. Proporciona una ganancia en la velocidad de lectura, pero no un aumento en el rendimiento de escritura. RAID 5 introduce paridad a la matriz, que ocupa el espacio de un disco en total. Este nivel puede hacer frente al fallo de un disco. Si tiene una reserva activa (hot spare) configurada como una quinta unidad, esta puede establecerse como una unidad inactiva en el sistema sin datos guardados en ella. Si falla un disco, los datos se pueden reconstruir en la reserva activa utilizando los datos en la paridad en las otras unidades. Una vez que los datos hayan terminado de reconstruirse, puede quitar la unidad defectuosa y reemplazarla por una nueva, la cual se convierte en la nueva «reserva activa».
  • RAID 6 parte del concepto de RAID 5 y añade más redundancia con paridad dual. Esto permite que los datos se vuelvan a crear incluso en el caso de que dos discos fallen dentro de la matriz. La paridad dual se distribuye en todos los discos y ocupa el espacio de dos unidades.

A lo largo de los años, los fabricantes de sistemas RAID han desarrollado muchos más niveles de RAID principalmente. En la actualidad, tenemos niveles de RAID que van desde RAID 0 hasta RAID 61 y más allá, con empresas más grandes que crean niveles de RAID personalizados para admitir diferentes aplicaciones y requisitos de infraestructura.

Fallos de unidad y peligros de RAID

Si se produce un fallo de disco en una configuración de RAID 1 o RAID 5, el usuario no debe reemplazar la unidad defectuosa hasta asegurarse de que tiene una copia de seguridad de todos los datos de los discos restantes. En muchos casos, especialmente cuando la solución utilizó discos que salieron de la misma producción, la posibilidad de que otro disco también falle pronto es bastante alta. Y aquí es donde radica el peligro de este concepto:

incluso con todos los beneficios que ofrece la tecnología RAID, incluido un mejor rendimiento y seguridad de los datos, los usuarios a menudo olvidan de que RAID no es una copia de seguridad.RAID se puede utilizar en combinación con copias de seguridad, lo que hace que todo el sistema de almacenamiento sea mucho más seguro, no obstante, un RAID nunca debe usarse como sustitución de una copia de seguridad. Por el contrario, cuando un sistema RAID falla como consecuencia de un mal funcionamiento del controlador RAID de hardware, por ejemplo, es mucho más complicado poner el RAID en funcionamiento y recuperar los datos perdidos.

Los sistemas NAS se han vuelto más asequibles para los usuarios domésticos. Utilizan las configuraciones RAID integradas en combinación con otras tecnologías de almacenamiento avanzadas, como la deduplicación, para obtener la mayor cantidad de espacio posible de su sistema. Sin embargo, esto tiene un precio, ya que en muchos casos, estos sistemas están configurados incorrectamente y cuando surge un fallo, todo el sistema se descompone.

Ya sea que sea un usuario doméstico o un administrador de TI empresarial, es importante considerar cuidadosamente qué nivel de RAID se adapta mejor a sus necesidades, o si la tecnología RAID es necesaria. Recuerde, la negligencia al principio puede ocasionar problemas graves, elevados costes y una posible pérdida de datos al final. 

Se continuarán explorando, inventando y evolucionando nuevas formas de almacenar datos con el tiempo, pero dado su historial, es probable que la tecnología RAID no desaparezca pronto.

Si necesita la recuperación de datos RAID, no dude en contactar con los expertos de Ontrack.