Skrót RAID tłumaczony z języka agielskiego (Redundant Array of Independent Disks) jako redundantna macierz niezależnych dysków wykorzystuje koncepcję nadmiarowości systemowej (od RAID 1 i wyższych), która w znacznym stopniu minimalizuje przestoje spowodowane awariami poszczególnych dysków.
Niestety, pamięć masowa RAID nie jest technologią idealną i nadal może dochodzić do utraty danych.
Macierze RAID to technologia, która umożliwia wykorzystanie dwóch lub więcej dysków twardych w różnych konfiguracjach w celu uzyskania większej wydajności, niezawodności oraz większych wolumenów dzięki zastosowaniu konsolidacji zasobów dyskowych i obliczeń parzystości.
Zaprojektowano szereg standardowych konfiguracji, które są określane jako poziomy. Pierwotnie utworzono pięć poziomów macierzy RAID, ale pojawiło się wiele innych wariantów, w szczególności kilka poziomów zagnieżdżonych i wiele poziomów niestandardowych (w większości zastrzeżonych). Wyróżniamy kilka podstawowych poziomów RAID - od RAID 0, RAID 1, … , RAID 5, RAID 0+1, RAID 10.
Lecz co oznaczają poziomy RAID? Liczby te odnoszą się po prostu do konfiguracji macierzy. Wiedząc, że wszystkie systemy RAID skutecznie przechowują dane, wybór systemu będzie opierać się na potrzebach osobistych lub organizacyjnych. Na przykład, macierz RAID 1 spełnia wymagania dotyczące bezpieczeństwa. Macierze RAID 5 to dobry wybór, jeśli szukasz zarówno wydajności, jak i odporności na błędy.
Konstrukcja systemu pamięci masowej RAID miała na celu poprawę wydajności, odzyskiwania danych, niezawodności i skalowalności pamięci masowej. W rezultacie opracowano unikalną koncepcję nadmiarowości, która oferuje możliwości odzyskiwania danych w przypadku awarii dysku w systemie. W rzeczywistości, karty kontrolerów RAID uzyskały możliwość kontynuowania odczytu i zapisu danych nawet w przypadku, gdy dysk jest w trybie offline.
Macierze RAID łączą fizyczne dyski twarde w jedną jednostkę logiczną przy użyciu specjalnego sprzętu lub oprogramowania. Sprzętowe rozwiązania macierzy RAID mogą być dostępne w różnych wersjach, od tych wbudowanych na płycie głównej lub kart rozszerzeń, aż po duże korporacyjne serwery NAS lub SAN. Przy takich ustawieniach system operacyjny nie jest świadomy działania technicznego ani obecności macierzy RAID. Rozwiązania programowe są zazwyczaj wdrażane w systemie operacyjnym.
W macierzy RAID istnieją trzy kluczowe pojęcia:
Różne poziomy RAID wykorzystują jedną lub więcej z tych technik, w zależności od wymagań systemowych.
RAID jest tradycyjnie stosowana na serwerach, ale może być również stosowana na stacjach roboczych. Ta ostatnia jest szczególnie przydatna w komputerach intensywnie korzystających z pamięci masowej, takich jak te używane do edycji obrazu i dźwięku.
Nasi inżynierowie są zgodni, że odzyskiwanie danych z macierzy RAID jest jednym z najtrudniejszych aspektów technicznych odzyskiwania danych. Ocena systemu odzyskiwanie danych z macierzy RAID jest w rzeczywistości połączeniem dwóch bardzo ważnych kroków:
Pierwszym, i najdłuższym, jest ponowny montaż macierzy. Kiedy inżynierowie Odzyskiwania Danych w macierzy RAID ponownie składają system logiczny, dokładnie badają, jak dane są zorganizowane na wszystkich dyskach. Następnie znają kolejność dysków oraz układ bloków danych i bloków parzystości. Ta inwestycja czasu jest niezbędna do określenia oryginalnej konfiguracji i uzyskania wysokiej jakości odzyskiwania danych,
Drugim krokiem jest praca nad logicznym systemem plików. Obecne systemy plików logicznych przedsiębiorstwa są niezwykle złożone. W przypadku awarii macierzy RAID, w systemie plików wystąpią tysiące błędów. Inżynierowie Ontrack Data Recovery sprawdzą i potwierdzą, że macierz jest prawidłowo skonstruowana przed skopiowaniem macierzy.
Redundancja w obecnej konfiguracji macierzy RAID 5 jest wynikiem zastosowania logicznej funkcji matematycznej o nazwie "Exclusive OR" (XOR). Jest ona powszechnie określana jako parytet. Funkcja XOR jest logicznym procesem binarnym. Najlepiej jest rozważyć parytet jako kombinację bloków danych drugiego dysku. Każdy bajt, który zostanie zapisany do bloku danych, jest obliczany względem pozostałych bloków. Uzyskany parytet jest zapisany w bloku parytetu dla danego pasma. To wyliczenie zawsze będzie działać, niezależnie od brakującego bloku danych. Obliczenie nie będzie jednak działać w przypadku braku dwóch bloków, co jest jednym z ograniczeń macierzy RAID 5; nie zapewni odpowiedniej redundancji w przypadku awarii dwóch lub więcej dysków.
Jak wspomniano wcześniej, karta kontrolera dzieli dane na kasety i wykonuje na nich również funkcję XOR. Ilość obliczeń logicznych wykonywanych przez kontroler co sekundę jest imponująca. Obecne kontrolery RAID są bardzo zaawansowanymi systemami sprzętowymi, w tym procesorami SDRAM i bankami pamięci zaprojektowanymi specjalnie pod kątem wydajności i nadmiarowości.