Go to Top

„Bug Data”? Pierwsze słyszę!

bug data

Tego, czym jest Big Data, chyba nikomu nie trzeba wyjaśniać (dla przypomnienia zapraszamy do naszego innego wpisu). A co z „Bug Data”? Nie, to nie błąd w pisowni. Tak właśnie określa się stare, nieaktualne, zarchiwizowane informacje, które nie mają żadnej wartości.

W związku z ogromnym wzrostem ilości danych firmy zaczęły stosować szereg narzędzi ułatwiających zbieranie, analitykę i magazynowanie danych. We współczesnych realiach to dane stanowią największą wartość dla firmy (według niektórych opinii nawet większą niż kapitał ludzki). Są one niezbędne do działania każdego przedsiębiorstwa. Można się o tym przekonać zwłaszcza wtedy, gdy dane giną. Liczba danych z roku na rok rośnie, a według raportu „The Value of Our Digital Identity” wartość anonimowych informacji zgromadzonych o internautach z obszaru Unii Europejskiej w 2020 roku wyniesie bilion euro!

Jednak w związku z gromadzeniem tak ogromnych ilości danych przez przedsiębiorstwa pojawia się pewien istotny problem – rośnie ilość zarchiwizowanych, nieaktualnych i niepotrzebnych informacji. Coraz więcej firm ma problemy z zarządzaniem takimi ilościami danych, weryfikowaniem ich przydatności i aktualności. Już ponad 60% wszystkich danych przechowywanych przez przedsiębiorstwa stanowi „Bug Data” – kopie zapasowe nieaktualnych danych. Zgodnie z Data Geonomics Index 41% informacji przechowywanych przez przedsiębiorstwa nie było modyfikowanych od 3 lat, natomiast aż 12% z nich od 7 lat nawet nie było otwartych. Koszty związane z utrzymaniem i zarządzaniem tymi danymi w ciągu roku mogą wynieść aż 20,5 mln! Widać zatem, że przechowywanie bezużytecznych danych generuje spore koszty. Warto więc, by firmy regularnie dokonywały selekcji magazynowanych informacji.

Odróżnij „Big” od „Bug”

W czym tkwi największy problem? W odróżnieniu i zdecydowaniu, które dane to jeszcze „Big Data”, a które stały się już „Bug Data”. Ocena wiarygodności danych pochodzących z zewnętrznych źródeł oraz ocena ich przydatności również stanowi dla firm nie lada wyzwanie. Co więcej, w stale rosnącej dżungli danych trudno jest odnaleźć przydatne, aktualne informacje i odseparować je od tych przeterminowanych. Dlatego tak istotne jest, by zachować rozdzielczość danych. Przechowywane dane powinny odzwierciedlać aktualny stan wiedzy o klientach, konkurencji i całym rynku.

Badanie Kroll Ontrack

Wyniki ostatniego badania przeprowadzonego przez Kroll Ontrack potwierdzają powyższe założenia. Badanie dotyczyło przechowywania i zarządzania taśmami i archiwami taśmowymi. Respondenci (819 dostawców usług IT z całego świata) zostali zapytani między innymi o to, ile lat ma najstarsza przechowywana w ich archiwum taśma, jak często spotykają się z prośbami o przywrócenie danych z taśm, jak długo przechowują zarchiwizowane dane oraz czy wiedzą, co właściwie znajduje się na przechowywanych taśmach. Jednym z kluczowych pytań było pytanie o to, jaki jest średni roczny koszt utrzymania starszych bądź rzadko używanych rozwiązań taśmowych. Respondenci zostali również poproszeni o wskazanie, które koszty związane z utrzymaniem rozwiązań taśmowych są dla nich największe.

Wnioski?

Z badania płynie dość oczywisty wniosek – przechowywanie wielu starych taśm znacznie zwiększa koszty zarządzania nimi, a przedsiębiorstwa nadal mają problem z zarządzaniem archiwami taśmowymi. Aż jedna trzecia badanych nie wie, co znajduje się na przechowywanych przez nich taśmach. Niepokojący jest fakt, iż dotychczasowe koszty utrzymania dostępnych danych wahają się od 10 tysięcy do miliona złotych! Magazynowanie i utrzymanie takich zasobów generuje największe koszty.

Rośnie liczba firm, które mają coraz większe problemy z zarządzaniem archiwami cyfrowymi. Przechowują na serwerach nieaktualne i nieprzydatne dane, za co niejednokrotnie płacą krocie. We współczesnym świecie dane stały się walutą, wraz ze wzrostem ich ilości rośnie także ich wartość. Pod warunkiem jednak, że są przydatne. Jeżeli nie, rosną jedynie koszty zarządzania nimi.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *