Czy SMART pozwolą przewidzieć awarię dysku twardego?

wtorek, 26 maja 2015 przez Sam Wiltshire

Na początku warto wspomnieć, iż najbardziej znane metody służące do przewidywania awarii dysków twardych nie są zbyt wiarygodne. Z kolei odgłosy pukania i chrobotania, które są bardziej pewnymi oznakami, że dysk wkrótce wyzionie ducha, z oczywistych względów nie mogą służyć do diagnozy napędów znajdujących się w odległym centrum danych.

Jednocześnie producenci dysków twardych często zdają się celowo przekłamywać szacowaną żywotność swoich napędów. Korzystają oni z parametru MTBF (Mean Time Between Failure), który określa średni czas między awariami danego modelu, określany na podstawie obserwacji dużej liczby dysków działających przez całe tygodnie i miesiące. W przypadku dysków twardych klasy korporacyjnej wartość tego parametru może dochodzić nawet do 1,5 miliona godzin, czyli prawie dwustu lat. Choć samej metodologii nie można nic zarzucić, to wyniki takich testów mają niewiele wspólnego ze średnią żywotnością dysków w praktyce.

Jednak większość tych producentów oferuje także inne, bardziej zaawansowane metody przewidywania awarii. Ich dyski mają wbudowany system SMART (Self Monitoring, Analysis and Reporting Technology), który przekazuje parametry pracy urządzenia do systemu operacyjnego. Parametry te można następnie przeglądać i analizować za pomocą odpowiedniego oprogramowania, dzięki czemu administratorzy mają wgląd w stan nośników danych.

Zestaw parametrów monitorowanych przez system SMART – zwanych atrybutami – różni się w zależności od producenta, ale do najczęściej spotykanych należy liczba godzin pracy dysku, czas rozruchu talerzy do pełnej prędkości oraz liczba realokowanych sektorów.

Jak sprawdzić atrybuty SMART?

Jest to zwykle bardzo proste. W tym celu warto nabyć specjalne oprogramowanie, które pozwoli dokładnie analizować dane, choć nie jest to konieczne: jeśli korzystasz z systemu Windows, możesz uzyskać szybkie (choć niezbyt czytelne) podsumowanie atrybutów SMART z poziomu wiersza poleceń.

Jednak jeśli chcesz śledzić i analizować dane SMART w sposób bardziej proaktywny, istnieją do tego odpowiednie narzędzia, dostępne dla różnych platform i w różnych cenach. Jednym z nich jest  Ontrack EasyRecovery – program polecany dla osób, które chcą poważnie podejść do korzystania z narzędzi SMART w celu monitorowania stanu dysków i planowania ich wymiany.

Wiarygodność narzędzi SMART

Nie omówiliśmy jeszcze, czy narzędzia SMART dają wiarygodny ogląd stanu technicznego dysku. Trudno jednak jednoznacznie odpowiedzieć na to pytanie. Powszechnie uważa się, że atrybuty SMART pomagają przewidywać awarie dysków twardych, ale równie powszechnie wskazuje się na ograniczenia tego rozwiązania.

Przede wszystkim analiza atrybutów SMART nie pozwala przewidzieć każdej awarii, ponieważ nie każda jest w ogóle przewidywalna. Odczyty tych atrybutów wskazują błędy wynikające z normalnego zużycia mechanicznego dysku, ale nie ostrzegają przed nagłymi awariami elektroniki lub komponentów urządzenia. Przykładowo badanie 100 000 dysków klasy konsumenckiej przeprowadzone przez Google w 2007 r. wykazało, że w okresie dziewięciu miesięcy narzędzia SMART nie zasygnalizowały prawie dwóch trzecich (64%) awarii.

Innym czynnikiem ograniczającym użyteczność atrybutów SMART są różnice w ich implementacji u różnych producentów. Różnice te niekiedy dotyczą nawet sposobu obliczania tych samych parametrów. Z tego powodu dwa dyski o porównywalnym stanie technicznym, lecz różnych marek – Seagate i Western Digital – mogą dawać zupełnie różne odczyty np. dla atrybutu częstotliwość błędów wyszukiwania.

W listopadzie ubiegłego roku firma Backblaze, świadcząca usługi tworzenia kopii zapasowych w chmurze, opublikowała bardzo ciekawe badanie na temat różnic w użyteczności poszczególnych atrybutów SMART. Na podstawie atrybutów uzyskanych z niemal 40 tysięcy dysków twardych, na których znajdowało się 100 petabajtów danych klientów, firma doszła do wniosku, że tylko pięć spośród siedemdziesięciu dostępnych atrybutów pozwala w wiarygodny sposób przewidywać nadchodzącą awarię dysku. „Bardzo chcielibyśmy mieć do dyspozycji więcej parametrów, a najlepiej, gdyby producenci dokładnie informowali, co oznaczają dane atrybuty SMART” – stwierdził Brian Beach, inżynier z firmy Backblaze.

Parametry SMART – polegać czy nie?

Korzystanie z narzędzi SMART nie daje stuprocentowej pewności, że uda się przewidzieć kres życia dysku twardego. Jeśli wiemy, na co zwrócić uwagę, to owszem, pozwalają one przewidywać niektóre rodzaje awarii, ale inne mogą nastąpić bez choćby jednego błędnego odczytu SMART.

Dlatego też żaden rozsądny użytkownik pamięci masowych nie powinien polegać wyłącznie na systemie SMART – ani innych systemach tego typu – by zapobiegać utracie danych i zapewnić ciągłość biznesową. Ze względu na charakter urządzeń elektromechanicznych najlepiej zawsze korzystać z kombinacji różnych zabezpieczeń: analizy atrybutów SMART, redundantnych napędów, kopii zapasowych i odzyskiwania danych.

img_600x600_shirtontrack

Poproś o bezpłatną wycenę:
32 630 48 65Darmowa konsultacja