Składowanie danych
 
Ilość składowanych danych w systemach IT i centrach danych ciągle rośnie. O ile zwiększa się też pojemność i szybkość nośników, a także prędkość sieci, interfejsów czy magistral, to jednak nie rozwiązuje to problemu z jakim co jakiś czas każdy z nas musi się zmierzyć. Użytkownicy generują coraz więcej danych, nie zważając na to co udostępnia im w danej chwili infrastruktura. Też generowanie danych jest dla nich mniej kosztowne czasowo, niż utrzymywanie porządku i usuwanie tych, które są już zbędne. Poza tym z punktu użytkownika, nigdy nie wiadomo co kiedy się przyda, a też lepiej mieć kopię czy nawet dwie i czuć się bezpieczniej.
 
 
Decyzje o uruchomieniu kolejnego projektu czy zbioru danych potrafią być bardzo szybkie. Niestety, nie zawsze bierze się w nich pod uwagę aktualnie dostępną i potrzebną przestrzeń dyskową. A też często zapomina się o bezpieczeństwie i ich kopii zapasowej. Wszystko narzuca biznes i po prostu dane trzeba gdzieś zmieścić.

Pomimo tego, że z roku na rok nośniki są coraz większe i szybsze, a rozwiązania coraz bardziej skalowalne i wydajne, to zapomina się o tym, że co kilka lat trzeba zrobić modernizację, a na nią potrzebne są zarówno środki, jak i czas.

W wielu miejscach zapomina się też o globalnej polityce bezpieczeństwa i składowania danych. Mieliśmy styczność już z nie jedną organizacją, w której wykorzystywane były dziesiątki dysków sieciowych, nad którymi nikt nie panował. Nikt ich nie aktualizował, nikt nie kontrolował dostępu do znajdujących się tam danych, nikt nie sprawdzał czy używane są do tego bezpieczne protokoły i czy połączenia są szyfrowane, nikt nie zajmował się ich kopią zapasową, ani też nikt nie wiedział gdzie się tak naprawdę znajdują w danej chwili i co konkretnie zawierają.

Co gdy taki dysk sieciowy zostanie wyniesiony poza organizację, spadnie z biurka, zostanie zalany, zaszyfrowany lub przez brak aktualizacji ktoś się do niego włamie? Jak wtedy sprawdzić, które dane zostały utracone czy wyciekły? Jak w ogóle w takim środowisku dojść do tego czy coś zostało utracone lub wyciekło, a jeżeli tak, to przez kogo i kiedy? Inna rzecz, to jak takie dane teraz odzyskać i kto odpowiadał za ich kopie zapasowe?

Powodem takiego stanu jest najczęściej zapotrzebowanie na dodatkową przestrzeń i niemożliwość łatwej rozbudowy obecnego systemu pamięci masowej czy dyskowego. Prowadzi to do tego, że użytkownicy zaczynają radzić sobie samodzielnie, często po "domowemu", co nie zawsze jest dobre z punktu widzenia całej organizacji, ochrony czy bezpieczeństwa danych oraz dalszego ich utrzymania i zarządzania nimi.

Wybierając rozwiązanie pamięci masowej czy dyskowej, warto spisać i pogrupować swoje wymagania, a następnie zderzyć je z tym co dostępne jest na rynku lub This email address is being protected from spambots. You need JavaScript enabled to view it. się z nami.

Rozwiązania do składowania danych umożliwiają rozbudowę scale-up i/lub scale-out. W macierzach dyskowych stosuje się scale-up, poprzez dokładnie kolejnych dysków lub półek dyskowych. Oczywiście, jest to możliwe tylko do pewnego stopnia. Ich minusem jest wąskie gardło, którym jest jeden lub dwa kontrolery oraz ich karty sieciowe. Więc, o ile dzięki scale-up zwiększamy ilość powierzchni dyskowej, to dostęp do tych danych nadal odbywa się poprzez tą samą ilość "rurek" o tej samej średnicy co wcześniej. Również niezawodność w takim modelu nie rośnie jak powinna, gdyż ciągle jesteśmy uzależnieni od awarii jednego lub dwóch kontrolerów oraz połączeń do nich. Zatem w modelu scale-up niezawodność i dostępne pasmo per GB danych się zmniejsza wraz z rozbudową.
 
 
Rozwiązania SDS (Software-Defined Storage) umożliwiają rozbudowę scale-up i scale-out. Podobnie jak w macierzach dyskowych, rozbudowa scale-up polega na dokładaniu kolejnych dysków i półek dyskowych do już działających węzłów. Kiedy osiągnie się limit, to dodaje się kolejne węzły, co nazywane jest scale-out. Zatem scale-up to rozbudowa w ramach już działających węzłów, a scale-out to dokładanie kolejnych węzłów do klastra SDS.

O ile w rozwiązaniach SDS do każdego z węzłów można też dokładać kolejne półki dyskowe (zależne od wybranego kontrolera RAID), to najczęściej się tego nie robi. Powodem tego są podobne minusy, jak w przypadku macierzy dyskowych. Nie zwiększa się wtedy niezawodność, a też zwiększamy przestrzeń do której prowadzi taka sama ilość "rurek" o tej samej średnicy. Dlatego przy SDS rozbudowa scale-up polega najczęściej tylko na dokładaniu kolejnych dysków, a następnie realizowane jest scale-out o kolejne węzły.

Dzięki rozwiązaniom SDS możemy wygodnie zwiększać zarówno przestrzeń dyskową, jak i ilość "rurek", która do nich prowadzi. Z każdym kolejnym węzłem zwiększa się niezawodność, jak i przepustowość całego klastra. Klastry SDS mogą być odporne na awarię zarówno pojedynczych dysków w ramach węzła, jak i nawet kilku całych węzłów. Wszystko zależy od wybranego poziomu niezawodności.

Dostęp do danych wewnątrz SDS najczęściej realizowany jest poprzez kilka węzłów klastra równocześnie, stąd każdy kolejny zwiększa ilość "rurek" czy też sumaryczną średnicę "rurki", jaka prowadzi do danych.

Wybierając rozwiązanie pamięci masowej czy dyskowej, warto spisać i pogrupować swoje wymagania, a następnie zderzyć je z tym co dostępne jest na rynku lub This email address is being protected from spambots. You need JavaScript enabled to view it. się z nami.

Pomimo plusów SDS, niektórzy wolą "rozwiązanie sprzętowe" do składowania danych. Prawda jest taka, że zarówno typowe macierze dyskowe, jak i węzły klastra SDS korzystają z podobnego sprzętu, jak procesor, pamięć, dyski HDD/SSD, interfejsy SATA/SAS/PCIe czy różnej jakości interfejsy HBA (Host Bus Adapter) i NIC (Network Interface Card). Jeżeli chodzi o sprzęt, to główna różnica leży w redundancji kontrolerów macierzy dyskowej, którą o ile można by zrealizować w ramach serwera czy serwerów, to wyszłoby to znacząco drożej. Z założenia, w ramach klastra SDS znajduje się wiele węzłów, stąd redundancja kontrolerów wewnątrz serwera nie jest nikomu potrzebna.
 

Macierze dyskowe też posiadają system operacyjny i oprogramowanie. Dla przykładu Dell CLARiiON wykorzystywał Microsoft Windows XP w wersji Embedded, Dell/EMC Unity wykorzystuje SUSE Linux, a NetApp FAS system ONTAP, który jestem systemem Unix z rodziny BSD. Stąd duże różnice pomiędzy różnymi rozwiązaniami będą jednak leżeć w oprogramowaniu oraz obsłudze różnych protokołów i to na nie trzeba zwracać uwagę.

Zwykle macierze dyskowe będą bardziej zamknięte i mniej elastyczne, co niektórzy mogą uznać za plus. Z drugiej strony, wiele rozwiązań SDS budowanych jest na bazie systemu GNU/Linux, do którego nikt nam nie zamyka dostępu. W ten sposób możemy korzystać zarówno z interfejsu danego rozwiązania SDS, jak i uniwersalnych oraz dobrze znanych poleceń do weryfikacji i diagnozy systemu GNU/Linux.

Nowe systemy operacyjne, jak RHEL8 posiadają obsługę zarówno zaawansowane algorytmy kolejkowania danych do dysków, jak i obsługę replikacji, kompresji, deduplikacji czy eliminacji bloków zerowych. Obsługują też protokoły iSCSI, FC, FCoE, NVMe, NVMe-oF, CIFS, SMB, AFP, NFS, Swift czy S3. Dzięki temu z powodzeniem są stosowane do budowy SDS i udostępniania przestrzeni blokowej, obiektowej i plikowej. Nawet jednocześnie.

Oczywiście, zawsze dużo będzie zależeć od wybranego sprzętu czy jego jakości. Niemniej, każde z rozwiązań będzie miało do niego nieco inne wymagania. Też niekoniecznie to co z punktu jednego rozwiązania jest niezbędne dla innych będzie znaczące. Na pewno przy macierzach dyskowych wybór ten jest prostszy czy nawet czasem go nie ma. Przy rozwiązaniach SDS wybór jest większy, ale zarówno producenci tych rozwiązań, jak i partnerzy producentów pomagają w doborze sprzętu. Często nawet oferują takie rozwiązania w pakiecie sprzęt plus oprogramowanie. Dzięki temu przy SDS również możemy otrzymać wsparcie i pomoc dla całego rozwiązania.

Wybierając rozwiązanie pamięci masowej czy dyskowej, warto spisać i pogrupować swoje wymagania, a następnie zderzyć je z tym co dostępne jest na rynku lub This email address is being protected from spambots. You need JavaScript enabled to view it. się z nami.

Wybór macierzy dyskowej jest zwykle prostszy, a też są one bardziej znane na rynku. Stąd przygotowaliśmy na naszej stronie bardziej szczegółowe opisy działania poszczególnych rozwiązań SDS (Software-Defined Storage), jak LINBIT SDS, Red Hat Gluster Storage, Red Hat Ceph Storage, VMware vSAN czy Cisco HyperFlex.
 
Na koniec nie można zapomnieć o wygodnym dostępie do składowanych danych. To właśnie dzięki niemu zyskały swoją popularność takie usługi, jak Google Drive, Dropbox czy Microsoft OneDrive. Niemniej, korzystając z nich nie mamy pewności co dzieje się z naszymi danymi i gdzie się one znajdują. Dlatego do takich zastosowań polecamy Nextcloud, które umożliwia uruchomienie podobnych usług we własnej chmurze prywatnej

Zapraszamy do kontaktu drogą mailową This email address is being protected from spambots. You need JavaScript enabled to view it. lub telefonicznie +48 797 004 932.