Co oznacza TIER według Uptime Institute?

Na świecie znajduje się kilka standardów klasyfikujących infrastrukturę DataCenter m.in. Uptime Institute, ANSI/TIA, Syska Hennessy Criticality Levels, BICSI Classes. Od 1980 operatorzy DataCenter nie mieli żadnych wytycznych aby określić poziom niezawodności dla ich obiektu. W 1993 roku powstała stroną Uptime Network stworzona przez Uptime Institute która w klarowny sposób przedstawiła wytyczne dotyczące dostępności infrastruktury tego typu obiektów jak zasilanie, chłodzenie oraz infrastruktura środowiska. Aktualnie Uptime Institute i ich klasyfikacja TIER jest najbardziej znana i uważana na świecie.

Uptime_tierUptime Institute to bezstronna, niezależna organizacja z sektora badań, edukacji i doradztwa ds. centrów danych, która w swej działalności skupia się na podnoszeniu wydajności i skuteczności takich centrów. Jako jedyna tego typu jednostka, wydaje certyfikaty zgodności z wytycznymi TIER i wytycznymi stabilności operacyjnej. Uptime Institute Professional Services obsługuje klientów na całym świecie, oferując usługi z zakresu doradztwa, certyfikacji i akredytacji w ponad 50 krajach. Wytyczne stanowią obiektywną informację do porównywania możliwości ochrony infrastruktury IT w tego typów obiektach.

Na rynku dostępne są dodatkowe wytyczne wskazane w opracowaniu ANSI/TIA 942-2 opisanej jako Telekomunikacyjne standardy Infrastruktury dla Data Center. Dokument w bazował na kilku wybranych aspektach wytycznych Uptime Institute, ale nie należy go traktować jako spójne i identyczne wymagania. Generalnie ANSI/TIA jest o wiele szerszym standardem i jedynym tak kompleksowym dokumentem. Oddzielnie odniosę się do tego elementu w innych wpisach.

The Uptime Institute (UI) zdefiniował klasyfikację systemów zasilania serwerowni wg poziomu dostępności.

  • Poziom Tier I – określany w pierwszych publikacjach jako system podstawowy zapewniający 99,671% dostępności
  • Poziom Tier II – określany w pierwszych publikacjach, jako system podstawowy z redundancją zapewniający 99,741% dostępności
  • Poziom Tier III – określany w pierwszych publikacjach, jako system zapewniających współbieżność serwisu i konserwacji (Concurrently Maintainable) zapewnia 99,982% dostępności
  • Poziom Tier IV – określany w pierwszych publikacjach, jako system odporny na uszkodzenia (Fault Tolerant) zapewnia 99,995% dostępności

Tabelarycznie wytyczne Uptime przedstawiają się następująco:

TIER I TIER II TIER III TIER IV
Źródło zasilania IT System System System System + system
Zasilanie z sieci energetycznych nie wymagane nie wymagane nie wymagane nie wymagane
Tory zasilania 1 1 1 podstawowy + 1 rezerwowy 2 tory jednocześnie aktywne
Redundancja dla całości kluczowej infrastruktury N N+1 N+1 Minimum N+1
Brak ograniczeń uruchomieniowych dla agregatów prądotwórczych Nie Nie Tak Tak
Kompartamentalizacja Nie Nie Nie Tak
Równoczesność serwisowania/konserwowania Nie Nie Tak Tak
Ciągłe chłodzenie Nie Nie Nie Tak
Odporność na błędy (pojedyńcze zdarzenia) Nie Nie Nie Tak, automatyczna odpowiedź na błąd
Pojedyńcze punkty awarii Liczne + błędy ludzkie Liczne + błędy ludzkie Kilka + błędy ludzkie Brak + pożar, EPO

Należy jednak pamiętać, że procenty dostępności są estymacją i nigdy nie zostało wykazana prawidłowość tych wyliczeń. Wiele ekspertów podnosiło fakt o braku danych do określenia takich procentów dostępności. Jest wiele obiektów TIER I lub TIER II, które działają bez żadnej przerwy już ponad 10 lat i dłużej zapewniając dostępność o wartość 99,999%. Należy także pamiętać, że w najnowszych opracowaniach sam Uptime Institute wycofał te cyferki ze swoich opracowań. W powoływaniu się na wytyczne warto więc pisać dokładnie o wytycznych a nie o procentach.

Szczegółowo poziomy można zdefiniować następująco:

Poziom dostępności TIER I

Klasyczny system stosowany w małych serwerowniach dla wewnętrznych potrzeb. Jeden tor zasilania transformator lub obwód, główna rozdzielnia z podstawowym SZR-em główne odbiory IT są zabezpieczone poprzez urządzenia zasilania awaryjnego UPS i w przypadku zaniku mają zadanie utrzymać zasilanie dla odbiorów IT do czasu uruchomienia agregatu prądotwórczego. Instalacje klimatyzacji i wentylacji zasilane są z rozdzielni głównej i rezerwowane zasilaniem z agregatu prądotwórczego. W systemie nie ma stosowania redundancji w zakresie elementów zasilania, redundantne jest tylko źródło zasilania w jednym przypadku zasilanie podstawowe w drugim z agregatu prądotwórczego. Taki system nie pozwala na konserwacje bez utraty funkcjonowania całości systemu co wymusza przerwy w zasilaniu na konserwacje systemów. Dodatkowo całość systemu posiada wiele punktów awarii co przy kalkulacji niezawodności daje godzinną niedostępność systemu miesięcznie. Przy dodaniu konserwacji można powiedzieć, że system nie będzie działał w ciągu roku co najmniej 24 godziny.

Poziom dostępności TIER II

System bazujący na TIER I ale z dodatkowymi urządzeniami redundantnymi. Układ zasilania bazuje na jednym torze, ale posiada redundantne komponenty w celu wyeliminowania błędów i awarii. W tym wypadku redundantne są zasilacze UPS  i agregaty prądotwórcze pracujące równolegle w systemie n+1 oraz instalację chłodniczą pracującą w tym samym systemie. Takie rozwiązanie posiada zamienne urządzenia pozwalające na utrzymanie funkcjonalności w przypadku awarii elementów zasilających posiadających elektronikę. System tak jak poprzedni nie umożliwia wykonywania bezprzerwowych konserwacji, serwisów systemów, jak i posiada wiele punktów awarii.

Poziom dostępności TIER III

Tier3System zbudowany na dwóch torach zasilania. Całość infrastruktury jest redundantna. Posiada wiele aktywnych instalacji zasilających, tylko jedna z nich ma elementy zapewniające redundancję oraz jest utrzymywana konkurencyjnie. W praktyce oznacza zasilanie układu z podstawowego źródła a zapasowego źródło służy do ewentualnych serwisów i konserwowania. Założeniem tego systemu jest utrzymanie tylko jednej linii zasilania aktywnej, druga może być uruchomiona lub uruchamiana podczas prac konserwacyjnych i serwisowych. W przypadku braku podstawowego źródła zasilania cały układ podtrzymywany jest z zasilaczy UPS i załączany jest agregat. W tym miejscu także dubluje się instalacje energetyczną przez dodatkowe rozdzielnie lub wyłączniki jak i pozostałą infrastrukturę niezbędną do poprawnego działania systemów IT. System pozwala na konserwacje i serwis bez utraty zasilania i systemu chłodzenia dla odbiorów IT. Zapisy współbieżności konserwacji dotyczą każdej kluczowej z punktu widzenia IT instalacji i odnoszą się do poszczególnych elementów systemów, ilość błędów i usterek jest ograniczona do kilku miejsc co znacznie podnosi dostępność całości systemu.

Poziom dostępności TIER IV

Najbardziej rozbudowany system infrastruktury. Są to dwa systemy zbudowane równolegle i działające równolegle. Cały redundantny układ podstawowy i rezerwowy posiada redundantne elementy działają jednocześnie i zasilają odbiory IT. W układzie poprzez rozbudowanie struktury jest możliwe osiągnięcie braku pojedynczego punktu awarii jak i dostępność na poziomie 99,995%. System jest pełny dwutorowy z pełnym zabezpieczeniem i zdublowanie wszystkich systemów infrastruktury. Dodatkowymi wymaganiami jest zapewnienie odpowiedniego rozdziału całości instalacji na obiekcie jak i ciągłego chłodzenia dla obiektu pomimo utraty jakiegokolwiek zasilania. Każda awaria nie będzie odczuwalna dla odbiorów końcowych i system musi automatycznie na nią odpowiedzieć. Takie rozwiązanie jest kosztowne, ale spełnia oczekiwania najbardziej wymagających klientów.

Na koniec należy zwrócić uwagę, że każdy obiekt budujemy na własne potrzeby dostosowany do naszych wymagań. Nie powinniśmy ustawiać sobie wysoko poprzeczki, jeśli nasza organizacja lub cele jakie chcemy osiągnąć tego nie wymagają. Różnice pomiędzy kosztami TIER I a TIER III sa znaczne. Różnice do TIER IV ogromne. Ważne by stwierdzić, że obiektów realnych spełniających TIER IV na świecie jest nie więcej niż 40 obiektów. Wybierając, więc swoje standardy trzeba mocno uważać by budżet naszej inwestycji nie stał się naszym największym problemem.

 

2 komentarze to “Co oznacza TIER według Uptime Institute?

  • Prośba o weryfikację informacji „na świecie jest nie więcej niż 40 obiektów”, sam znam kilkadziesiąt obiektów zbudowanych wg tier IV w Polsce. Swoje Data Center mają energetycy (np. PSE, TAURON, Energa itd), operatorzy telekomunikacyjni, banki oraz firmy ubezpieczeniowe.

    • Author Image
      Robert Berliński
      4 miesiące ago

      Zajmuje się certyfikowaniem tego typu obiektów i to co Pan napisał nie pokrywa się z rzeczywistością. Znam wiele z tych obiektów co Pan pisze i niestety żaden z nich w mojej wiedzy nie spełnia klasy TIER IV. Wystarczy podnieść kilka elementów które nie są zazwyczaj spełnione. Pierwszy z nich to automatyczna odpowiedź na awarię. Nie chodzi tutaj o system SZR czyli załączenie awaryjnego zasilania. Jednym z elementów jest wyciek wody lodowej, wyciek gazu, inna awaria unieruchamiająca jeden z torów. Wynika z tego, że większość zaworów na układzie musi posiadać siłowniki i systemy ich sterowania. Takich systemów zazwyczaj nie ma. Drugim elementem jest zbudowanie układu 2N systemu zasilania i chłodzenia. Nie mówimy o N+1 a systemie 2N zdublowaniu źródła zasilania i chłodzenia. Oczywiście nie odnosi się to do komór IT a do źródeł zasilania i chłodzenia. Ten wymóg to nic innego niż konieczność budowy dwóch systemów zasilania (dwa agregaty 2N). dwóch systemów chłodzenia (dwa razy więcej drycoller-ów, dwa razy więcej chiller-ów itp.). Kolejnym elementem którego najwięcej obiektów nie spełnia to wymóg określony jako compertmalization. Ten wymóg jest niezrozumiały dla większości projektantów. Tłumaczy się to w następujący sposób. Żadna z instalacji toru A nie może być zainstalowana w tej samej przestrzeni fizycznej wraz z torem B. Tak więc każda instalacja z 2N musi mieć swój szacht, oddzielną trasę prowadzącą innymi korytarzami. Kable energetyczne np. do agregatów 2N nie mogą się nigdzie krzyżować czy też łączyć. Kolejnym jest Continuous cooling. Przy awariach systemu chłodzenia czy zasilania nie ma możliwości wzrostu temperatury w komorze serwerowni. Dopuszczalne są znikome zmiany w ramach tolerancji.
      Reasumując to tylko część wybranych wymogów. Jest ich o wiele więcej i bardziej restrykcyjnych. Spełnienie ich jest tylko możliwe budując od początku obiekt z pełną wiedzą, że ma spełniać dany standard. Niestety wiele obiektów chwali się spełnieniem tych standardów bez odpowiedniej wiedzy. W moich licznych pracach audytorskich już po 15 minutach audytu mogę odpowiedzieć na pytanie czy obiekt spełnia ten standard czy też nie. W ponad 95% przypadków niestety nie.
      W razie pytań pozostaję w dyspozycji. Zapraszam do dalszej dyskusji w tym zakresie na moim email robert@berlinski.eu lub tutaj w komentarzach.
      Robert

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *