Die Sache mit den Verfügbarkeiten…

Immer wieder stellen wir fest, dass bei Anfragen zu Angeboten über IT Dienstleistungen nur recht vage Vorstellungen in Bezug auf  Verfügbarkeiten von IT Services existieren. Nur zu verständlich ist der Wunsch, eine möglichst hohe bis sehr hohe Verfügbarkeit zu erhalten, es wird aber außer Acht gelassen, dass ohne konkrete Benennungen von Bezugspunkten eine rein prozentuale Aussage wenig Wert hat. Das ist immer dann der Fall, wenn nicht genau festgelegt wird, ob sich Ausfallzeiten auf ein Jahr oder einen Monat beziehen. Unklar ist oft auch, dass bei gleichzeitigem Bezug mehrerer kombinierter Serviceleistungen die Gesamtverfügbarkeit maximal nur so hoch wie der niedrigste Wert aller zugrunde liegenden Serviceverfügbarkeiten sein kann. So kann ein Server durchaus eine einzelne Verfügbarkeit von 99,5% / Jahr haben, die Gesamtverfügbarkeit aber weit darunter liegen (wenn beispielsweise der Netzwerkservice nur eine Verfügbarkeit von 98% / Jahr hat).

Nicht zuletzt entsteht Verwirrung, weil nicht konkret beschrieben wird, auf welchen konkreten Service die Verfügbarkeit sich nun tatsächlich bezieht. Die Formulierung “Der Server ist 99,5% verfügbar” würde zuallererst nur bedeuten, dass der Server auch dann noch als verfügbar gelten würde, wenn die Netzanbindung oder die Firewall wegbrechen und der Server von außen nicht mehr erreichbar wäre. Das ist aber mit Sicherheit nicht der Wunsch, welcher hinter der Formulierung steht.

Wenn man nachfolgende kurze Übersicht über Verfügbarkeiten anschaut, so wird schnell klar, dass bei einer jährlichen Verfügbarkeit eines Servers von 99,5% selbst ein Ausfall von einem ganzen Tag noch keine Verletzung des Service Level Agreements darstellt. Daher ist es sicher sinnvoll, je nach Kritikalität des Service auch die Häufigkeit oder die Maximaldauer eines Ausfalls vertraglich festzulegen. Dabei könnte ein Server mit 99,5% Verfügbarkeit durchaus mehrere Male pro Jahr ausfallen, dann aber mit einer maximalen Ausfallzeit von beispielsweise 4h am Stück. Eine weitere Alternative wäre, gerade bei kritischen Projekten, die Festlegung des zeitlichen Bezuges auf den Monat. Hier ergäben sich dann weit strengere Service Level, beispielsweise beträgt die Downtime bei einer Verfügbarkeit von 99,0 % / Monat lediglich 7 h 12 min gegenüber 3 Tage 15 h 36 min bei 99,0% / Jahr.

 

prozentuale
Verfügbarkeit
Minimale
Verfügbarkeit (in h)
maximale
Ausfallzeit (in h)
99,0% 8672,40 87,60
99,1% 8681,16 78,84
99,2% 8689,92 70,08
99,3% 8698,68 61,32
99,4% 8704,44 52,56
99,5% 8716,20 43,80
99,6% 8724,96 35,04
99,7% 8733,72 26,28
99,8% 8742,48 17,52
99,9% 8751,24 8,76

Abb. 1 Verfügbarkeitstabelle

Worauf bezieht sich die Verfügbarkeit?

Was passiert nun, wenn Verfügbarkeiten nur pauschal pro Server oder Virtueller Maschine angegeben werden? Folgendes Szenario: Auf einem Server läuft ein Internetshop, der über den Browser des Kunden aufgerufen wird. Selbstverständlich muss so ein Shop rund um die Uhr für die Onlinekunden erreichbar sein, zu groß ist die Gefahr von Geschäftsverlust, wenn Ausfälle das Einkaufen erschweren oder ganz verhindern. Nun wird ein Service Level von 99,9% Verfügbarkeit/Jahr erwartet. Aus Sicht des Betreibers ist dieser SLA gehalten, so lange der Server einwandfrei läuft. Es kann jedoch vorkommen, dass ein applikationsspezifischer Dienst des Webshops auf diesem Server nicht mehr richtig funktioniert und die Benutzung des Shops dadurch nicht möglich ist. Aus Kundensicht wäre nun der SLA nicht mehr gehalten, da ja die Kernapplikation – der Internetshop – nicht mehr benutzbar ist. Dieses Beispiel zeigt auf, dass es wichtig ist, den konkreten jeweiligen Service auf den sich die Verfügbarkeit beziehen soll, genau zu definieren.

In diesem Fall muss also nicht nur auf eine rein physische Verfügbarkeit, sondern ebenso auf die Verfügbarkeit der Applikation abgestellt werden. Dies hat wiederum zur Folge, dass nicht nur die grundlegenden Serverdienste, sondern auch die spezifischen Dienste der Applikation überwacht werden müssen, um die Verfügbarkeit sicherzustellen. In besonders kritischen Fällen bietet sich darüber hinaus ein Ende-zu-Ende-Monitoring an, welches sicherstellt, dass bestimmte Prozesse in der Applikation funktionieren. Im Falle des Webshops wäre das beispielsweise die periodische Überprüfung des Einkaufsvorganges – von Artikelauswahl, Hinzufügen zum Warenkorb bis zum Abschließen des Bestellvorganges – durch einen Dummyvorgang, der transparent im Hintergrund läuft und so rechtzeitig auftretende Probleme erkennen kann.

Vorsicht bei Verknüpfung von Verfügbarkeiten

Ein weites Feld für Mißverständnisse bietet die Verknüpfung von Verfügbarkeiten. Ein Gesamtservice für einen Kunden besteht in der Regel nicht nur aus einem IT Service, sondern mehrere Services werden parallel erbracht. Ein jeder für sich unterliegt dabei seiner spezifischen Fehleranfälligkeit, daher muss bei der Betrachtung der Gesamtverfügbarkeit das Ausfallrisiko der einzelnen Services addiert werden. Um bei unserem Webshop zu bleiben: nehmen wir an, dass der Server, das zugrunde liegende Netzwerk und die mit der Applikation verbundene Datenbank jeweils eine Einzelverfügbarkeit von 99,98% haben. Das Ausfallrisiko liegt hier bei 3 x 0,02% = 0,06%. Die Gesamtverfügbarkeit des Webshops beträgt in diesem Falle 100% – 0,06% = 99,94%. Hinzu kommt noch das Risiko der Applikation, welches wir hier ja noch gar nicht betrachtet haben. Vermeiden lassen sich die Ausfallrisiken durch den Aufbau von Redundanzen, so dass im Notfall von einer betroffenen Ressource auf eine andere umgeschaltet werden kann. Dadurch wird ein möglichst unterbrechungsfreier Betrieb gewährleistet, der technische Aufwand steigt jedoch ebenfalls an. Zugleich wird deutlich, dass sehr hohe Verfügbarkeiten jenseits der 99,9% nur mit wesentlich mehr  Aufwänden (und den damit verbundenen Kosten) realisierbar sind.

Fazit
Verfügbarkeit von IT Services lassen sich in den meisten Fällen nicht pauschal vereinbaren – zu hoch ist das Risiko, dass am eigentlichen Gegenstand des Interesses vorbei agiert wird. Eine genaue Definition des zu betrachtenden Service ist daher unerläßlich. Dabei ist immer eine gezielte Risikobetrachtung notwendig und daraus muss eine IT Architektur abgeleitet werden, welche unter Kosten-Nutzen-Aspekten die bestmögliche Verfügbarkeit gewährleistet.

Autor: Jochen Dedek
Erschienen am 19. August 2014
Original Blogbeitrag: http://blog.professionalservice.de/2014/08/die-sache-mit-den-verfuegbarkeiten/

Ähnliche Beiträge