Gwiazdka nieaktywnaGwiazdka nieaktywnaGwiazdka nieaktywnaGwiazdka nieaktywnaGwiazdka nieaktywna
 

RAID 5 odzyskiwanie danych

Macierz RAID to bardzo dobre i wydajne rozwiązanie zarówno do serwerów biznesowych jak i domowych. Ma jednak swoje ograniczenia ze względu na konstrukcję i awaryjność podzespołów, z których się składa i wtedy zachodzi konieczność odzyskania danych.

Macierz RAID5 ma specjalne rozwiązania jeżeli chodzi o nadmiarowość. Czyli jest odporna na awarię jednego nośnika, gdyż dane mogą być odtworzone z pozostałych dysków macierzy. To przeświadcza użytkowników o bezpieczeństwie tego rozwiązania. Niestety rzeczywistość pokazuje, że często się mylą.

Oto przykład z życia - Klienta, który mimo zastosowania RAIDu 5 (w istocie rozwiązania nadmiarowego i tak stracił dostęp do danych):

Witam

„Mam macierz RAID5 pracującą pod Ubuntu. Macierz składa się z 4 dysków po 3TB (WD GREEN z wyłączonym IntelliPark). Problemy zaczęły się od tego, że jeden z dysków zgłaszał w SMART błędy C5, więc zdecydowałem się go wymienić. Próba klonowania na nowy dysk zakończyła się błędem odczytu, więc odbudowałem macierz z pozostałych 3 dysków. Odbudowa się powiodła ale po 2 godzinach wypadł kolejny dysk z macierzy, a po kolejnych 2 kolejny. Tym razem dyski jakby zniknęły z systemu. Po restarcie dyski już nie są widoczne i macierz się nie podnosi. Wiem w jakiej kolejności dyski wypadały. Co mogę teraz zrobić? System mam teraz uruchomiony z live-usb, bo inny nie uruchamia się”.

Rzeczywiście te dyski Klienta były mocno wyeksploatowane. Z parametrów SMART dało się odczytać, ze miały w granicach 36000 godzin, to jest 1500 dni ciągłej pracy, a w tym czasie były tylko 19 razy wyłączane. Biorąc pod uwagę średni czas między awariami masowa destrukcja macierzy mogła się zdarzyć w każdej chwili. Oczywiście klient nie miał żadnego backupu, ani kopii zapasowej, stąd poprosił nas o interwencję.

W tym przypadku błędy w SMART świadczą o dużej ilości błędów sektorów. Stąd poszczególne dyski mogły przechodzić w tryb off-line w RAIDzie. Niestety stała się rzecz najgorsza z możliwych. Kolejne dyski zaczęły się uszkadzać podczas odbudowy macierzy. Zapewne dlatego, że podczas odbudowy, zaczęły korzystać z sektorów, które do tej pory były nie używane, jako że macierz pracowała non stop.

Taka awaria to destrukcja macierzy i oczywiście utrata dostępu do danych.

Głównym zadaniem dla nas było odbudowanie macierzy przy wykorzystaniu uszkodzonych dysków i odtworzenie bloków parzystości. Tylko w takim przypadku jest szansa na interpretację obrazów dysków i danych z macierzy. Nie ukrywam, że było to dla nas nieco trudne zadanie, bowiem awarii uległy trzy dyski z czterech. Na szczęście uszkodzone sektory były w większości poza obszarem użytecznych danych. Udało się więc odtworzyć dane parzystości i poskładać macierz do stanu pozwalającego na zgranie danych.

W tym miejscu chcielibyśmy przestrzec użytkowników macierzy, że błędy mogą zdarzyć się w każdym urządzeniu. Zarówno z przyczyn sprzętowych jak i ludzkich. Niejednokrotnie wystarczy awaria zasilania, czy przypadek losowy, by taka macierz zawiodła. Jedynym sprawdzonym sposobem na zagwarantowanie dostępu do danych macierzy jest wykonywanie regularnych backupów.

Współczesne bardziej zaawansowane macierze mają możliwości podłączenia dodatkowych dysków oraz zaprogramowania backupu. Warto korzystać z tej funkcji, żeby zabezpieczyć swoje zbiory przed nieodwracalnymi problemami.

W tym przypadku klient miał dużo szczęścia w nieszczęściu, że żaden z dysków nie miał poważnych uszkodzeń oraz , że struktura danych nie została przebudowana z uszkodzeniami. Dane wtedy zostałby bezpowrotnie nadpisane z błędami.