Zarządzanie kryzysowe w obliczu katastrofy: The Planet, Twitter
Podstawowymi zasadami zarządzania kryzysowego jest przewidzieć, zapobiegać, przygotować się, ale jeśli już zdarzy się katastrofa, wówczas sprawnie reagować. Reagowanie to nie tylko odbudowa, ale również sprawna komunikacja, a tym wykazało się w ostatni weekend The Planet.
The Planet to jedna z największych na świecie firm oferujących hosting serwerów dedykowanych. W swoich sześciu serwerowniach w Teksasie utrzymuje prawie 50 tys. serwerów, na których klienci firmy utrzymują ponad 3 miliony witryn. W ostatni weekend w jednej z serwerowni miała miejsce poważna eksplozja oraz pożar instalacji zasilających, w wyniku czego kompletnie odcięto zasilanie w jednej z data center, w której znajduje się 9 tys. serwerów. Pożar został błyskawicznie opanowany i żaden z serwerów nie ucierpiał, jednak sytuacja była bardzo poważna – zniszczeniu uległa znaczna część infrastruktury zasilającej. Jak się później okazało, przerwa w działaniu serwerowni trwała ponad dobę. Ponowny rozruch tak dużego obiektu jest wbrew pozorom procesem skomplikowanym – nie wystarczy naprawić uszkodzenia i przetestować wszystkie podsystemy, przed włączeniem 9 tys. maszyn należy jeszcze ponownie schłodzić pomieszczenia o ogromnej przecież kubaturze, i tak dalej.
Po pierwsze: komunikacja
Firma już od pierwszych minut zaczęła informować klientów o przebiegu sytuacji – założono odpowiedni wątek na forum a wkrótce potem uruchomiono również specjalną stronę ze statusem, gdzie regularnie informowano o postępach – na początku nawet co pół godziny.
O ile wielu z klientów rwało włosy z głowy i wieszało psy na usługodawcy, to na pewno nie mogli narzekać na brak informacji. Jeśli można sobie wyobrazić coś gorszego od zupełnego zniknięcia Twoich serwerów, to jest nim chyba ich zniknięcie przy Twoim braku wiedzy co się z nimi stało. The Planet zachowało się w tej sytuacji znakomicie.
Po drugie: naprawianie szkód
Gdy tylko sytuacja została opanowana, The Planet zapowiedziało refundację całego miesięcznego abonamentu dla wszystkich serwerów, które były niedostępne z powodu awarii. To oczywiście nie naprawi szkód klientów, których biznesy z powodu trwającej ponad dobę przerwy mogły stracić znacznie więcej niż miesięczna opłata za serwer – ale mowa tu o naprawianiu szkód jakie ponosi The Planet.
W ramach naprawiania tych szkód, zaoferowali też klientom, którzy ucierpieli, dodatkowo jeszcze jeden darmowy miesiąc (grudzień 2008) oraz zniżkę 25% na wszystkie nowe nowo zamawiane serwery od teraz aż do końca roku. Zniżka – tak jak i wszystkie promocje w The Planet – obowiązywać będzie dożywotnio, czyli wystarczy w tym okresie zamówić serwer, a 25% niższy abonament pozostanie wraz z nim już na zawsze, nie tylko do końca roku.
Zwiększanie zaangażowania klientów zamiast ich ucieczki
To sprytny ruch, który na pewno choć trochę pomoże zahamować odpływ niezadowolonych klientów. Jeśli czyjeś ciśnienie w trakcie niedawnej awarii było na tyle wysokie, że planował już przejście do konkurencji, to mając w perspektywie darmowy miesiąc oraz rabat na nowe serwery, być może jednak zostanie. Haczyk polega na tym, że żeby zrealizować ten darmowy miesiąc trzeba pozostać z The Planet do grudnia – a jeśli ktoś do tego czasu nie przejdzie do konkurencji to już tego nie zrobi (przynajmniej nie z powodu awarii z przełomu maja i czerwca).
Rabat na nowe serwery również jest przynętą na zwiększenie zaangażowania klientów. Nawet jeśli przeszła Ci przez głowę myśl o wyprowadzce z The Planet, to być może połakomisz się na apetyczny rabat, a jeśli z niego skorzystasz to rzecz jasna wpadłeś już na dobre – zamiast zabrać swoje serwery Ty kupiłeś ich jeszcze więcej.
Te wszystkie działania – wzorowa komunikacja już od pierwszych minut awarii, bonusy i rabaty dla poszkodowanych klientów – nie naprawią może w dużym stopniu szkód jakich doznała reputacja The Planet, ale na pewno mocno wpłyną na zminimalizowanie odpływu klientów.
Jeszcze o The Planet
Swoją drogą ja korzystam z The Planet już jakieś pięć lat i jestem z ich usług zadowolony. Niech ta gigantyczna awaria i równie kolosalna przerwa w działaniu (choć oczywiście nie wszystkich, tylko około 20% serwerów obsługiwanych przez firmę, niestety dotyczyło to też jednej z moich maszyn) Was nie zrazi. Z moich doświadczeń i z monitoringu serwerów hostowanych u nich wynika, że jak dotąd, przez te wszystkie lata, działali powyżej progu 99,9% dostępności, co przy ich cenach stawia ich w moich oczach na pierwszej pozycji wśród serwerowni w tej kategorii cenowej (raczej budżetowych).
Twitter wreszcie komunikje
Zmieńmy trochę temat, choć wciąż na pokrewny. Ulubionym tematem w maju na anglojęzycznych blogach branżowych były problemy Twittera, który “częściej był offline niż online”. Problemy z utrzymaniem funkcjonowania serwisu były spore, a przerwy w działaniu częste. Użytkowników denerwowało zwłaszcza to, że nigdy nie wiedzieli co się dzieje. Czy jest to znów przerwa dziesięciominutowa czy ponownie będzie dwugodzinna? Jeśli używasz serwisu jako narzędzia komunikacji, to chciałbyś takie rzeczy wiedzieć. A jeśli jesteś od niego uzależniony, to tym bardziej chciałbyś wiedzieć.
W efekcie narzekań roznoszących się po sieci, Twitter wreszcie uruchomił stronę statusu, na której od niedawna informuje o wszelkich problemach. Użytkownicy dzięki temu po prostu czują się lepiej – wiedzą co się dzieje, w pewien sposób uczestniczą w tym wszystkim, a czasami również znają przewidywany czas usunięcia problemów.
Grześka z Antyweb dziwi, że Twitter do stworzenia strony statusu użył produktu konkurencji (Tumblr) – ale Twitter zrobił to właśnie tak, jak należałoby to zrobić. Zaiste specjalny profil na Twitterze mógłby kiepsko spełniać rolę informowania o awariach w trakcie trwania owych.
Strona statusu dla startupu
Myślę, że dobrą praktyką jest, żeby każdy startup webowy posiadał taką stronę statusu, na przykład w formie bloga lub minibloga. Jeśli macie wystarczające zasoby, żeby tak jak nawiększe serwisy na rynku, zapewnić dostępność powyżej 99,9%, to możecie się obejść bez tego – ale jeśli zdarzają się Wam przestoje albo jeśli posiadacie Single Point of Failure (np. jeden jedyny serwer dedykowany, który zazwyczaj działa, ale w przypadku pożaru w serwerowni może zniknąć na dobę), warto zadbać o to, żeby użytkownicy nie trwali w niewiedzy w obliczu awarii.
Uruchomcie w tym celu specjalnego bloga lub minibloga i adres do niego dodajcie do stopki serwisu. Koniecznie niech będzie zupełnie niezależny od Waszej witryny. Nie umieszczajcie go na swoim serwerze ani nawet u tego samego dostawcy. Niech to będzie nawet któraś z powszechnie dostępnych platform blogowych typu Blogger czy Blox, albo miniblogowy jak Tumblr – dzięki temu jest wysoce prawdopodobne, że będzie dostępny nawet wówczas, gdy z Waszą witryną będą się dziać najstraszniejsze rzeczy.
Dobra praktyka rzadko stosowana
A teraz konkurs bez nagród. Czy znacie jakieś polskie witryny, które coś podobnego stosują?
Przeczytaj także:
- Jak Twitter może ratować życie – czyli masowa komunikacja w sytuacjach emergency
- Infrastruktura w formie usługi
- Jak skutecznie wypromować startup w niestandardowy sposób
- Rok mobi(lizacji)
- Amazon CloudFront, czyli proste CDN “dla ubogich”


@Barek – czy ty specjalnie tak interpretujesz to co ja napisałem?
ja znam ;)
@hazan: No może faktycznie nie każdy miałby jaja, żeby korzystać z produktu konkurencji, ale mnie to jednak jakoś aż tak nie dziwi. Zresztą, Tumblr to nie jest wcale bezpośrednia konkurencja dla Twittera – oba te serwisy jednak wykorzystuje się w innym celu.
@Marcin: podziel się tą wiedzą! :)
a patrząc z zupełnie innej perspektywy – co mogło spowodować awarię? trudno w to uwierzyć, ale… mrówki!
http://www.przekroj.pl/cywilizacja_spoleczenstwo_artykul,2191.html