10 najczęściej popełnianych błędów w administrowaniu systemami IT i jak im zapobiec

Szanowni czytelnicy,

Rozpoczynamy współpracę z p. Mariuszem Siek – autorem wielu artykułów poświęconych zarządzaniu usługami informatycznymi. W związku z tym, od dziś na naszym blogu będą gościć również artykuły dotyczące branży IT. Życzymy miłej lektury!

 

  1. Brak miejsca na dyskach lub systemach plików

To chyba największa zmora administratorów systemów informatycznych. Wiadomo, że każde miejsce na dysku lub systemie plików się skończy i przeważnie kończy się w najmniej oczekiwanym momencie. Skutki są przeważnie bardzo poważne ponieważ brak miejsca oznacza w większości przypadków zatrzymanie serwera aplikacyjnego, bazy danych lub innej aplikacji, która zapisuje jakieś dane na dysku i bez możliwości zapisu przestaje działać.

Najlepszym sposobem przeciwdziałania takim zdarzeniom jest codzienne monitorowanie za pomocą narzędzia wykorzystania wszystkich zasobów dyskowych i podejmowanie przez administratorów proaktywnych działań, zapobiegających całkowitemu zapchaniu się dysków lub systemów plików.

Szczególnym przypadkiem jest przyrastanie logów aplikacyjnych. Dobrze napisana aplikacja powinna zarządzać wielkością logów, do których zapisuje dane. Częściej jednak zdarza się, że plik z logiem aplikacyjnym przyrasta do czasu aż zapełni dany zasób dyskowy lub system plików, powodując tym samym zatrzymanie działania aplikacji.

Jeżeli programiści nie zadbali o kontrolę wielkości logu aplikacyjnego to administratorzy IT mogą ten błąd naprawić konfigurując odpowiednie rotowanie logu aplikacyjnego oraz jego archiwizację.

  1. Brak weryfikacji wykonywanych kopii zapasowych

W każdym systemie wykonywane są kopie zapasowe i często do tego celu wykorzystywane są złożone systemu do backupu. W nie wielu jednak przypadkach wykonuje się weryfikację, czy z tak wykonanej kopii zapasowej można odtworzyć dane. O ile w przypadku kopii zapasowej plików płaskich weryfikacja odtworzenia jest mało pracochłonna i łatwa do wykonania o tyle odtworzenie systemów operacyjnych (całych hostów) lub bazy danych to już wyzwanie, ponieważ wymaga dodatkowych zasobów.

Najważniejsze aby weryfikacji odtwarzania kopii zapasowych wykonywać regularnie. Dla plików płaskich wystarczy raz na miesiąc a dla obrazów systemów operacyjnych i baz danych raz na kwartał.

  1. Nie znajomość przez administratorów biznesu wspieranego przez IT

W wielu organizacjach uważa się, że administratorzy nie muszą wiedzieć ani rozumieć jak działa biznes, który usługi IT wspierają, tylko dobrze wykonywać swoje zadania. Ja nie zgadzam się z tym podejściem. Według mnie administratorzy powinni wiedzieć na czym polega biznes aby mieć poczucie, że są częścią większej całości, której prawidłowe działanie w znacznej mierze zależy od nich. Ta świadomość pozwoli im lepiej wykonywać swoje zadania i bardziej utożsamiać się z systemem, którym administrują na co dzień. Pokaże również, że ewentualne problemy w działaniu danej usługi IT, to nie tylko nie działająca aplikacja czy baza danych ale również brak możliwości np. sprzedaży jakiś produktów a tym samym straty dla organizacji.

  1. Wykonanie operacji, komendy, polecenia nie na tym środowisku

Nie znam systemu informatycznego, w którym by administrator nie wykonał jakiegoś polecenia lub komendy na środowisku produkcyjnym, podczas gdy myślał, że robi to na testowym. Mnogość zadań, ciągły pośpiech i zadania na wczoraj powodują, że każdy może popełnić błąd i w ferworze walki zrobić coś na środowisku produkcyjnym zamiast na testowym. Duża ilość środowisk i ich tożsama konfiguracji tylko sprzyja takim zdarzeniom, przyprawiając administratorów o drżenie serca podczas ich pracy.

Prostym sposobem na systemach Windows jest ustawienie innych kolorów tła pulpitu i samych okienek na środowisku produkcyjnym i testowych. W ten sposób administrator, który w większości przypadków jest facetem, czyli wzrokowcem, będzie mógł łatwo zorientować się na jakim jest środowisku. W systemach unix’owych trzeba w nazwie hosta zawierać przedrostek lub przyrostek wskazujący jakie to jest środowisko.

  1. Nie korzystanie z narzędzi do monitorowania

W każdym systemie IT jest wdrożone narzędzie do monitorowania jego elementów infrastrukturalno-software’owy. Nie ważne czy jest to narzędzie darmowe czy płatne bardzo często nie jest dobrze skonfigurowane i zamiast pomagać administratorom może wprowadzać ich w błąd. Większość administratorów traktuje powiadomienia mailowe z narzędzia monitorowania jako spam i nie zwraca uwagi na treść komunikatów. Często do tego przyczynia się niewystarczająco dobrze skonfigurowanie powiadomień w narzędziu monitorowania.

Nawet jeśli narzędzie monitorowania jest dobrze skonfigurowane to administratorzy wiedzą lepiej i nie używają narzędzia monitorowania w codzienne pracy.

Jak przekonać administratorów do codzienne korzystania z narzędzia monitorowania? Nie jest to łatwe ale pokazanie korzyści z używania narzędzia może chociaż w pewnym stopniu zachęcić administratorów używania takiego narzędzia.

  1. Nie wykonywanie kopii zapasowych przed rozpoczęciem wprowadzania zmian

Wprowadzanie zmian na środowiskach/systemach powinno być poprzedzone wykonaniem kopii zapasowej danych w bazie danych, systemów plików, obrazów hostów wirtualnych itp. Nawet jeśli zmiana wydaje się prosta i nie mająca wpływu na wskazane elementy, lepiej mieć kopię zapasową jakby coś poszło nie tak.

Niestety często pośpiech sprawia, że administrator nie wykonuje kopii zapasowej i wprowadza zmianę, podczas której w wyniku błędu w pakiecie (wydaniu) lub jego pomyłki tracone są jakieś dane, których nie można odzyskać, ponieważ nie ma wykonanej kopii zapasowej. Rozwiązaniem tego problemu, może być umieszczenie w instrukcji instalacji zmiany kroków związanych z wykonaniem kopii zapasowej, tak aby administrator nie zapomniał jej wykonać.

  1. Wprowadzanie zmian bez zgody i akceptacji Klienta (biznesu)

Kolejnym z błędów w administrowaniu systemami IT jest wprowadzanie zmian bez zgody i akceptacji Klienta. Każda zmiana wprowadzana w środowisku produkcyjnym musi być wprowadzona w ramach procesu zarządzania zmianą a w szczególności uzyskać zgodę Klienta (biznesu). Często zdarza się, że administratorzy w dobrej wierze, wprowadzają jakąś zmianę administracyjno-konfiguracyjną, która według nich „nie jest zmianą”, bez wiedzy i zgody Klienta. Jest to praktyka, która nie powinna mieć miejsca w dobrze zarządzanych systemach IT. Zgoda Klienta na wprowadzenie zmiany jest polisą ubezpieczeniową dla wykonawcy, jakby wystąpiły jakieś problemy podczas wprowadzania zmiany.

Rozwiązaniem w takich sytuacjach jest jednoznaczne komunikownie administratorom, że wprowadzanie każdej zmiany na środowisku produkcyjnym wymaga wniosku o zmianę i uzyskania na niego zgody ze strony Klienta (biznesu), który jest właścicielem lub odbiorcą systemu informatycznego.

  1. Brak komunikacji pomiędzy administratorami rozproszonymi w różnych lokalizacjach

Często obecnie zdarza się, że administratorzy pracujący na danym systemie IT, siedzą w różnych lokalizacjach (oddziały firmy, praca zdalna, u klienta). Takie działanie wymaga szczególnej organizacji ich pracy. Jednym z najważniejszych elementów jest komunikacja pomiędzy sobą aby nie przeszkadzać sobie w pracy poprzez np. zabieranie konsoli lub działania, które spowodują utratę pracy jednego z administratorów, w wyniku działania innego kolegi.

Administratorzy muszą wyrobić sobie nawyk, sprawdzania czy ktoś inny nie pracuje na danym serwerze oraz komunikować się poprzez telefon lub komunikator w celu zweryfikowania czy nie przeszkadzamy sobie w pracy.

  1. Brak dokumentowania wiedzy o konfiguracji poszczególnych elementów systemu

Jedną z największych bolączek administratorów i jednocześnie och największym błędem jest nie dokumentowanie informacji i wiedzy o konfiguracji elementów systemu. Większość wiedzy jest w głowach ludzi administrujących systemami IT. Jest to poważne zagrożenie dla działania systemu IT, ponieważ brak danej osoby (choroba, urlop, odejście z pracy) oznacza, że nie wiemy co i jak zostało zrobione i dochodzenie jaka jest konfiguracja zajmuje bardzo dużo czasu. Nawet jeżeli już administrator zapisuje informacje o konfiguracji to w większości przypadków robi to tylko na swoje potrzeby i nie dzieli się tą wiedzą z innymi kolegami lub koleżankami.

Przeciwdziałać temu można udostępniając miejsce do dzielenia się wiedzą (np. wiki, współdzielony zasób sieciowy, dokument współdzielony) aby wszystkie ważne informacje nie wysyłać mailami ale udostępniać innym osobom za pomocą tych narzędzi.

  1. Nie działanie według opracowanych i obowiązujących procedur

Większość administratorów nie lubi działać według przygotowanych i obowiązujących procedur. Wydaje im się, że zrobią wymagane zadanie lepiej i szybciej bez korzystania z „jakiś” tam procedur. Jeżeli system jest mały i procedur jest niewiele to może i to być prawda ale w dużych, złożonych systemach już tak nie jest. Gdy mamy do czynienia z różnymi aplikacjami w różnych wersjach, począwszy od systemów operacyjnych, przez middleware a skończywszy na bazach danych a serwerów mamy dziesiątki lub setki nie jest to możliwe i łatwiej jest popełnić błąd.

W takiej sytuacji procedury i instrukcje pomagają i zdejmują z administratora obowiązek pamiętania wszystkich detali, które np. mogą być specyficzne dla jednego z wielu hostów.

 

Ten artykuł oraz wersję video znajdziecie pod adresem:

http://mariuszsiek.pl/10-najczesciej-popelnianych-bledow-w-administrowaniu-systemami-it-cz1/

http://mariuszsiek.pl/10-najczesciej-popelnianych-bledow-w-administrowaniu-systemami-it-cz2/

 

 

One Response to “10 najczęściej popełnianych błędów w administrowaniu systemami IT i jak im zapobiec

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *